【记录】论文写作常用语料收集(长期施工中)
【干货】浅述单目3D目标检测(长期施工中)
序
三维目标检测是一个相对上游、比较基础却又新兴的任务领域。得益于自动驾驶和2D目标检测的发展,如何从单目图像中,或附加一些额外信息来检测出一个三维的bounding box,是三维目标检测的主要任务范畴。
根据任务的输入不同,三维目标检测可以主要分为三个任务流派:首先,所有流派均输入单目RGB图像和相机参数;额外使用LiDAR信息(或称velodyne)的激光雷达三维目标检测;额外使用多目图像(主要是双目视觉)的多目三维目标检测;以及不额外使用其他信息的单目三维目标检测。当然,也有一些工作关注无监督的三维目标检测,或是使用其他数据集研究迁移性能的工作,这些工作也都应根据输入情况归属于相应的任务领域中。
这三个任务流派的SOTA(2021年11月)评估指标大致在82%、52%、15%左右(AP 3D R40 @0.7 )
本篇小综述着重关注单目三维目标检测领域在KITTI 3D Object上的工作的发展脉络。覆盖论文则着重关注于2018年(该数据集创立于2017年,大致是此领域研究兴起时期)以来的CV顶会,随缘附加一些其他会议的论文。
希望读完这篇浅述后,大家可以对单目3D目标检测有着初步的了解和认识。笔者才疏学浅,欢迎各位带着批判的眼光审读,如有任何理解不到位之处,欢迎讨论和指正。
【杂文】聊一个自装1200元的主机配置经历
【干货】谈一谈CS.CV方向如何阅读论文?
【记录】服务器使用
SSH连接服务器
通过SSH连接一个账户为user的一个最简单的命令是:
1 | ssh user@***.**.**.** |
其中,@前面的是用户名,一般来讲管理员账户是user,后面是ip地址,这里我就隐去了。注意这里默认了SSH的端口是22。
如果你使用局域网,只需要在服务器上ifconfig
一下,得到局域网ip地址(192.168.1.***),进行SSH连接即可;一般我们会做穿透,具体过程不做展开,大致可以理解为租用一个服务器作为映射的跳板。总之会获得一个公网的ip地址和端口号,所以一个更全面的命令是:
1 | ssh -L 29999:127.0.0.1:6006 -p ***** user@***.**.**.** |
这里-L表示本地地址端口号映射,由于tensorboard默认是在6006端口,SSH又没有图形界面,所以我只要在本地浏览器上访问127.0.0.1:29999,就会相当于在服务器上访问127.0.0.1:6006,就可以看到tensorboard的内容了。
-p后面跟的内容是映射后的端口号,这样也会一定程度上减少公网上对于SSH的攻击。
【记录】在Ubuntu上实现科学上网
先扯几句
终于开始了博客之旅。
从最早写公众号,到后来写$\LaTeX$,到现在使用GitHub静态托管页面拥有自己的“博客”,反倒是有些返璞归真,让我想到了自己小时候真·灌水论坛的日子。
现在终于具有了些许自主性。比如「科学上网」这种话题,肯定就不能写在公众号上;而且就前几年的公众号体验来讲,输入公式和排版,以及代码框的体验,肯定不如markdown和latex来的舒服;而latex又和html的兼容性不好,最终折中地选择了GitHub+markdown的这种方式。
其实一直早就想写很多东西,比如三原色、田忌赛马等问题都用长图发在了朋友圈当中,还比如从去年就想写的《神奇的哥尼斯堡》,大概这和此篇一样都该被归为“杂文”之中;学术性的博客也很想写,从最早看机器学习、多视几何、ROS等,包括之后Parzen窗的理解等,就很想作为优质博客补充一下现在网络上的缺失;很多时候也应该停下来思考思考人生,写一写收获与感悟,所以总的来说内容可能会很杂——所以我也并不指望能有什么引流,或者一些学术文章可能会发在知乎上?总之也有许多问题没有想好,但总要先吃一次螃蟹再说,于是便有了此篇文章。
工程性比较强,算是一种归档吧,以防日后自己忘了(毕竟在网上没有看到太多博客把着这个事情讲的很好)。当然,也或许是Ubuntu之间本身也会有体制差异,可能实验室这破电脑本身就不太行,所以才让我摸索了许久。
下面进入正文。
Hello World
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.