Papers

DSSMs: Deep Structured Semantic Models

2018-01-20

DSSM这篇论文是在13年被首次提出,14,15经过两年的发展,分别演化出了基于卷积网络的C-DSSM(Convolutional DSSM)、基于循环神经网络的R-DSSM(Recurrent DSSM)、针对不同信息来源的MV-DSSM(Multi-View DSSM)、最后还有一个专门针对Caption的DMSM(Deep Multimodal Similarity Model)。

DLToolBox

TFrecord & QueueRunner

2017-09-26

python不支持多线程(伪多线程,虽然启动multi-thread,但是所有启用线程的处理能力加起来等于一个核的处理能力),多进程如果是任务可分,不用和主线程交互的情况下是可用的,但是对于tensorflow的训练来说,肯定需要使用多(线程、进程)与主(线程、进程)交互。Tensorflow使用黑箱的方式为数据的解析提供支持,相比于自己写multi-process然后共享变量来说在代码实现 ...

Papers

Papers on Deep Learning(Learning Structured Sparsity in Deep Neural Networks)

2017-02-23

如果弄过机器学习或者数据挖掘等,相信大家对l1,l2正则化一定不会陌生,l1正则的特点是可以在一定程度上使学习出来的参数趋向于0,l2正则在一定程度上可以防止过拟合。所以很多人使用l1正则使学习出来的模型尽量稀疏,但是学习出来的稀疏模型,并不能对模型进行很好的加速,因为为0的参数太过均匀,不能批量的规避掉运算,这篇论文就是解决这种为0参数分布不均的情况。

Papers

Papers on Deep Learning(FCN for Semantic Segmentation)

2017-01-12

CNN对图像的分类任务已经非常精准(实验室数据下),但是怎么样才能识别图片中特定部分的物体,在2015年之前还是一个很有挑战性的任务,这篇论文就给它指明了一个方向。

Papers

Papers on Deep Learning(R-FCN)

2016-12-16

目标检测领域,从rbg大神提出之后,到目前逐渐分化出2大阵营,一种是以Proposal+classification为主的multi-stage的方法,另一种是以YOLO为代表的End2End的模型,前一种模型特点就是精度高,后一种的特点是速度快,但是后面肯定end2end也会达到multi-stage的精度。