Think different

Here’s to the crazy ones. The misfits. The rebels. The troublemakers. The round pegs in the square holes. The ones who see things differently. They’re not fond of rules. And they have no respect for the status quo. You can quote them, disagree with them, glorify or vilify them. About the only thing you can’t do is ignore them. Because they change things. They push the human race forward. And while some may see them as the crazy ones, we see genius. Because people who are crazy enough to think they can change the world are the ones who do.

阅读全文

C++11 新特性解析与应用

这是我这阵子学习 C++11 做的一些记录,材料大多来自《深入理解 C++11 新特性解析与应用》这本书。

阅读全文

卡尔曼滤波算法,永远滴神!

鲁道夫 • 卡尔曼在一次访问 NASA 埃姆斯研究中心时,发现他的卡尔曼滤波算法能帮助解决阿波罗计划的轨道预测问题,最终,飞船正确驶向月球,完成了人类历史上的第一次登月。卡尔曼因而一举成名,后来还被美国总统奥巴马授予了国家科学勋章。

阅读全文

理解英伟达 TensorRT 的 INT8 加速原理

目前的神经网络推理大部分是利用 32bit float 类型的数据进行计算的,bit 位数的多少直接限制了数据类型能够表达的数据范围,比如 float 32 的数据是由 1bit 表示符号,8bit 表示整数部,23 位表示分数部组成。但是这种运算比较耗时和消耗计算资源,因此诞生了 int8 量化算法。

int8 量化是将数据保存为 int8 格式,这样一样计算时间和占用内存大大减小。目前量化有两种方式:一种是通过训练量化finetune原来的模型,另一种是直接对模型和计算进行量化。后者的代表便是英伟达的方案了,目前 PPT 已经公开,但是代码并没有开源。

阅读全文

 去年阅读 《C++ Primer 中文版(第5版)》 的印象笔记

去年5月份我一个人从上海跳槽来广州,在这半年多的独居生活里我利用零碎的时间读了这本久负盛名 《C++ Primer 中文版(第5版)》。当时每周双休的时候坚持读大概二十页,竟不知不觉也读了一半多。但我觉得还是第六版写得更好,否则我也不会读了七八遍。而这本书还尚未读完,惭愧!

今天整理文档的时候发现了这份宝藏笔记,于是乎拿出来晒一晒。

阅读全文

修改 YOLOv5 源码在 DOTAv1.5 遥感数据集上进行旋转目标检测

YOLOv5 发布已经有一段时间了,但是我一直还没有怎么去用过它。机会终于来了,最近需要做一个「旋转目标检测」的项目。于是我想到用它来进行魔改,使其能输出目标的 rotated bounding boxes

阅读全文

用 Python 手撸一个单目视觉里程计的例子

最近因工作需要,开始接触到一些关于 SLAM(Simultaneous Localization and Mapping)的研究。网上关于 slam 的资料有很多,譬如高博的十四讲,github 上的 VINS 等等。但是他们大多是用 C++ 写的,并且环境依赖复杂。今天, 我使用 Python 手撸了一个简单的单目 slam,对 slam 有了一个初步的认识。完整的代码在这里

阅读全文

2D人体姿态估计的总结和梳理

最近在虎牙直播做了一些关于人体姿态估计的工作,也看了蛮多这方面的文章,于是对这个内容做了一些总结和梳理,希望能抛砖引玉吧。我们不妨先把问题抛出来,人体姿态估计是做什么?从名字的角度来看,可以理解为对“人体”的姿态(关键点,比如头,左手,右脚等)的位置估计。根据 RGB 图片里人体的数量,又可以分为单人姿态估计多人姿态估计

阅读全文

人脸识别之人脸矫正

一般来说,使用 mtcnn 网络检测到人脸后,都需要进行矫正。而对于人脸矫正,最简单的可以通过使用仿射变换来实现。

阅读全文

TensorFlow 的多卡 GPU 训练机制

武汉疫情还没过去,这几天窝在家里琢磨了下 TensorFlow 的多卡 GPU 分布式训练的机制。本文将使用流行的 MNIST 数据集上训练一个 MobileNetV2 模型,并利用 tf.distribute.Strategy 函数实现多卡 GPU 对训练方式。 详细代码见 TensorFlow2.0-Example

阅读全文