PCA算法

PCA是一种很重要的降维方法,在数据压缩、可视化等领域应用广泛。在机器学习中,当特征维度过高时,可以选择Feature elimination或Feature extraction等方式降维。Feature elimination直接丢弃信息量低的特征,Feature extraction则从现有特征组合出一系列新特征,消除数据冗余,PCA数据Feature extraction。

Published: 13 Aug 2018

Vim实用技巧

最近利用碎片时间重新看了一遍《Vim实用技巧》一书,记录超实用的技能点,提升编辑效率。

Published: 11 Aug 2018

很赞的开源小工具

最近整理了一些在用的,感觉还不错的开源小工具,有的仅适用MacOS,但多数跨平台。

Published: 26 Aug 2017

Mac必备软件

Mac上有很多优秀的软件,可以极大地提升效率和工作体验。

Published: 22 Jul 2017

数据科学十篇

本系列由《数据科学中的R语言》一书作者肖凯老师所著,现已开源,托管在Github上。共包含了以下十个主题,从基本的机器学习模型,到特征工程,到深度学习都有详细的介绍。淡化繁琐的公式推导,用例子+代码演示的方式,深入浅出。

Published: 05 Apr 2017

Python操作数据库

前几天数据库课程的一个小project,需要接入MySQL数据库,导入数据,写了个脚本,做简单的CRUD操作,用Python实现,简单地记录一下。

Published: 10 Oct 2016

Python itertools模块详解

该模块包含了一系列处理可迭代对象(sequence-like)的函数,从此迭代更任性。

Published: 10 Sep 2016

Python Collections模块解析

collections模块提供了一些python内置数据类型的扩展,比如OrderedDictdefaultdictnamedtupledequecounter等,简单实用,非常值得学习了解。

Published: 19 Aug 2016