Pandas核心概述

Pandas是Python数据科学生态中重要的基础成员,功能强大,用法灵活,简单记录之。

Published: 30 Jan 2019

NumPy核心概念

NumPy是Python数据科学生态中重要的基础成员,其中有几个概念比较tricky,简单记录之。

Published: 28 Jan 2019

Ranking Metric

评估排序效果时,经常用到几个指标,简单记录之。

Published: 02 Jan 2019

马尔科夫链

马尔可夫链(Markov Chain),描述了一种状态序列,其每个状态值取决于前面有限个状态。

Published: 22 Dec 2018

一些函数

策略、算法工作中,读论文或设计算法,经常会遇到一些性质很棒的函数,满足特定的需求,持续汇总积累。

Published: 20 Dec 2018

ROC分析

算法工作中,经常要对模型进行评估,由此衍生出很多指标。比如Accuracy、Precision、Recall、F1-score、AUC等等。准确理解各指标的内涵、使用场景及局限,还挺有挑战。

Published: 16 Dec 2018

指标体系设计

最近要设计一套推荐系统的指标体系,目的是支持以下需求

Published: 14 Dec 2018

一些分布

统计学中有各种各样的分布,工作中经常遇到,简单总结一下。

Published: 12 Dec 2018