PCA是一种很重要的降维方法,在数据压缩、可视化等领域应用广泛。在机器学习中,当特征维度过高时,可以选择Feature elimination或Feature extraction等方式降维。Feature elimination直接丢弃信息量低的特征,Feature extraction则从现有特征组合出一系列新特征,消除数据冗余,PCA数据Feature extraction。
数据科学十篇
本系列由《数据科学中的R语言》一书作者肖凯老师所著,现已开源,托管在Github上。共包含了以下十个主题,从基本的机器学习模型,到特征工程,到深度学习都有详细的介绍。淡化繁琐的公式推导,用例子+代码演示的方式,深入浅出。
Published:
05 Apr 2017
Python操作数据库
前几天数据库课程的一个小project,需要接入MySQL数据库,导入数据,写了个脚本,做简单的CRUD操作,用Python实现,简单地记录一下。
Published:
10 Oct 2016
Python Collections模块解析
collections
模块提供了一些python
内置数据类型的扩展,比如OrderedDict
,defaultdict
,namedtuple
,deque
,counter
等,简单实用,非常值得学习了解。
Published:
19 Aug 2016