Papers

Papers on Deep Learning(XNOR-Net Binary Convolutional Neural Networks)

这篇论文引入了一种对filter,feature map进行二值化的算法,从而避免了传统CNN中卷积操作的实数乘运算。论文提到,单纯对filter参数二值化,会有2X效率的提升,如果再对feature map的值进行二值化会有58X提升,并提升27X的内存利用率,但是会有一定的准确度损失,但是这篇论文仍然堪称解决CPU训练深度网络效率低的良药。

DataMining

天池阿里音乐流行趋势预测大赛——初赛

为期两个月的天池阿里音乐大数据竞赛终于落下帷幕,两个月走来无数次的激动,无数次绝望,好在一路走来,所有已经尘埃落定,第六名的尴尬成绩,让我等既参加不了决赛,也没有什么好值得吹牛逼的。本着程序猿的分享精神,我会结合团队中队友的思路,将整个比赛的结题方法share给大家,望各位太君去粗取精,有不正确的地方还望批评指正。

Papers

Papers on Deep Learning(Deep Embedding with Contextual Evidences)

使用基于SIFT的局部特征以及基于CNN提取的全局特征对图片进行索引。文中提到SIFT局部特征在图片检索领域具有里程碑式的影响,但是受限于其局部而没考虑到全局的线索,由此带来了mAP的损失,虽然后面的研究工作也提出了基于color和boundary的特征,但这些都是启发式的,没有理论依据。因此作者提出了使用CNN的region以及global特征来弥补SIFT的不足,同时针对这3中特征建立索 ...

Papers

Papers on Deep Learning(Batch Normalization)

Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift. 使用BN正则化之后的网络可以拥有更高的learning rate, 可以减少drop out的限制,或者不使用drop out。而且由于正则化之后相应的lr的提高,可以极大的减少训练的时间。

ToolBox

数据分析工具包pandas学习笔记(一)

Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。