【散装论文】DETR3D：将DETR用于3D目标检测

发表于 2021-11-04 更新于 2021-11-10 Waline：阅读次数：

本文字数： 6.9k 阅读时长 ≈ 6 分钟

序

前几天被导师扔了一篇DETR3D，让我看一下transformer能否应用在这个领域（凡事与transformer挂钩了他就很激动）。作为鲜有的在3D目标检测中应用transformer的文章，于是决定还是来写一写吧。

我也不知道写散装论文总结要花多少的精力，索性先来试一试，不一定长期更单篇。【毕竟，简单写几句躺在我的文献管理excel里不香吗】【嗯！但发出来可以知识共享，让更多的人获得快乐QAQ】

阅读全文 »

【记录】论文写作常用语料收集（长期施工中）

发表于 2021-11-03 更新于 2021-11-10 分类于记录 Waline：阅读次数：

本文字数： 2.3k 阅读时长 ≈ 2 分钟

序

启发于中式教育的思维，我们写英语作文时会有很多的模板可以套，那么写顶会论文能否也“套模板”呢~

所以笔者尝试在阅读论文的过程中收集一些常用的语料素材，用于论文写作。内容可能比较零散，但应该不妨碍使用。

阅读全文 »

【干货】浅述单目3D目标检测（长期施工中）

发表于 2021-11-02 更新于 2021-11-10 分类于干货 Waline：阅读次数：

本文字数： 1.6k 阅读时长 ≈ 1 分钟

序

三维目标检测是一个相对上游、比较基础却又新兴的任务领域。得益于自动驾驶和2D目标检测的发展，如何从单目图像中，或附加一些额外信息来检测出一个三维的bounding box，是三维目标检测的主要任务范畴。

根据任务的输入不同，三维目标检测可以主要分为三个任务流派：首先，所有流派均输入单目RGB图像和相机参数；额外使用LiDAR信息（或称velodyne）的激光雷达三维目标检测；额外使用多目图像（主要是双目视觉）的多目三维目标检测；以及不额外使用其他信息的单目三维目标检测。当然，也有一些工作关注无监督的三维目标检测，或是使用其他数据集研究迁移性能的工作，这些工作也都应根据输入情况归属于相应的任务领域中。

这三个任务流派的SOTA（2021年11月）评估指标大致在82%、52%、15%左右（AP 3D R40 @0.7 ）

本篇小综述着重关注单目三维目标检测领域在KITTI 3D Object上的工作的发展脉络。覆盖论文则着重关注于2018年（该数据集创立于2017年，大致是此领域研究兴起时期）以来的CV顶会，随缘附加一些其他会议的论文。

希望读完这篇浅述后，大家可以对单目3D目标检测有着初步的了解和认识。笔者才疏学浅，欢迎各位带着批判的眼光审读，如有任何理解不到位之处，欢迎讨论和指正。

阅读全文 »

【杂文】聊一个自装1200元的主机配置经历

发表于 2021-11-01 更新于 2021-11-03 分类于杂文 Waline：阅读次数：

本文字数： 6k 阅读时长 ≈ 5 分钟

背景

大致在两三周前吧，我老家的表姐让我给她装一个台式机用，但是她对电脑可以说一窍不通，目前家里坏了的电脑也是几年前「电脑城」的产物。

硬件圈的人大概都清楚，「电脑城」意味着什么，不过好在硬盘还没坏可以捞出来接着用，剩下的东西都需要配一下了。

根据我姐的需求：

可以亮机
经常修图
低预算

我想了想，以当今（2021年10月中旬）这个显卡溢价且不见降的世道，需求①肯定是要用CPU集显了；对于②，那是显示器的问题，PS一类修图软件是不需要CUDA加速的；至于需求③……

嗯，于是我决定挑战一下自己，以最低价格装一台电脑需要多少钱？

阅读全文 »

【干货】谈一谈CS.CV方向如何阅读论文？

发表于 2021-07-28 更新于 2021-08-03 分类于干货 Waline：阅读次数：

本文字数： 8k 阅读时长 ≈ 7 分钟

序

作为一个CV、泛AI方向的一年级生，目前也就读了几十篇论文，在这里简单谈一谈如何阅读一篇论文。这里主要关注CVPR、E(I)CCV、AAAI等视觉领域顶会文章，对于其他领域文章不保证泛用性。

以及如果有更好的论文阅读经验，欢迎一起讨论。

阅读全文 »

【记录】服务器使用

发表于 2021-07-24 分类于记录 Waline：阅读次数：

本文字数： 4k 阅读时长 ≈ 4 分钟

SSH连接服务器

通过SSH连接一个账户为user的一个最简单的命令是：

1	ssh user@*...

其中，@前面的是用户名，一般来讲管理员账户是user，后面是ip地址，这里我就隐去了。注意这里默认了SSH的端口是22。

如果你使用局域网，只需要在服务器上ifconfig一下，得到局域网ip地址(192.168.1.***)，进行SSH连接即可；一般我们会做穿透，具体过程不做展开，大致可以理解为租用一个服务器作为映射的跳板。总之会获得一个公网的ip地址和端口号，所以一个更全面的命令是：

1	ssh -L 29999:127.0.0.1:6006 -p *** user@...*

这里-L表示本地地址端口号映射，由于tensorboard默认是在6006端口，SSH又没有图形界面，所以我只要在本地浏览器上访问127.0.0.1:29999，就会相当于在服务器上访问127.0.0.1:6006，就可以看到tensorboard的内容了。

-p后面跟的内容是映射后的端口号，这样也会一定程度上减少公网上对于SSH的攻击。

阅读全文 »

【记录】在Ubuntu上实现科学上网

发表于 2021-05-18 更新于 2021-07-24 分类于记录 Waline：阅读次数：

本文字数： 8.6k 阅读时长 ≈ 8 分钟

先扯几句

终于开始了博客之旅。

从最早写公众号，到后来写$\LaTeX$，到现在使用GitHub静态托管页面拥有自己的“博客”，反倒是有些返璞归真，让我想到了自己小时候真·灌水论坛的日子。

现在终于具有了些许自主性。比如「科学上网」这种话题，肯定就不能写在公众号上；而且就前几年的公众号体验来讲，输入公式和排版，以及代码框的体验，肯定不如markdown和latex来的舒服；而latex又和html的兼容性不好，最终折中地选择了GitHub+markdown的这种方式。

其实一直早就想写很多东西，比如三原色、田忌赛马等问题都用长图发在了朋友圈当中，还比如从去年就想写的《神奇的哥尼斯堡》，大概这和此篇一样都该被归为“杂文”之中；学术性的博客也很想写，从最早看机器学习、多视几何、ROS等，包括之后Parzen窗的理解等，就很想作为优质博客补充一下现在网络上的缺失；很多时候也应该停下来思考思考人生，写一写收获与感悟，所以总的来说内容可能会很杂——所以我也并不指望能有什么引流，或者一些学术文章可能会发在知乎上？总之也有许多问题没有想好，但总要先吃一次螃蟹再说，于是便有了此篇文章。

工程性比较强，算是一种归档吧，以防日后自己忘了（毕竟在网上没有看到太多博客把着这个事情讲的很好）。当然，也或许是Ubuntu之间本身也会有体制差异，可能实验室这破电脑本身就不太行，所以才让我摸索了许久。

下面进入正文。

阅读全文 »

渲染测试

发表于 2021-04-02 更新于 2021-07-24 Waline：阅读次数：

本文字数： 2.9k 阅读时长 ≈ 3 分钟

本文用于测试博客显示

markdown渲染测试

这是加粗的文字
这是倾斜的文字
这是斜体加粗的文字
~~这是加删除线的文字~~
超链接：百度

阅读全文 »

Hello World

发表于 2021-04-01 更新于 2021-07-24 Waline：阅读次数：

本文字数： 367 阅读时长 ≈ 1 分钟

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.

阅读全文 »