06 Theory of Generalization - ~~~

06 Theory of Generalization

Published: 11 Sep 2018 Category: ml-foundations

如果有Break Point，$m_H(N)$上限如何进一步简化，见详细课件。

脉络回顾

回顾之前一步步推演脉络。

Bin of Marbles从$\nu$估算$\mu$，引入概率
引入Hoeffding不等式，理论上保证坏事情概率有上界
用一个假设，类比Bin of Marbles例子，某特定假设可学习
算法$A$从假设中选，引入Union Bound，Hoeffding不等式引入$M$
Union Bound太loose，引入数据集Dichotomy，$M$替换为$2^N$
$2^N$依然很大，引入Growth Function $m_H(N)$，进一步精确
引入Break Point，找到$m_H(N)$的上界，且摆脱对数据依赖
$N^{k-1}$使有效假设数量降到多项式级(如果break point非无穷大)
证明$m_H(N)$可以替换$M$，泛化问题得证
学习是可行的！

Bounding Function

如果存在break point，可以找到growth function上界，从而摆脱对特定数据集的依赖，且不用给出其具体表达式。

$m_H(N)$ is $poly(N)$ if break point exists.

ml-foundations-bounding-function

A Pictorial Proof

Theory of Generalization最后的证明：

$P[|E_{in}(g) -E_{out}(g)|>\epsilon] \le 2M e^{-2\epsilon^2N}$

如何用$m_H(N)$替换上式中的$M$，完成理论的最后一跃？

ml-foundations-vc-bound-proof-1

ml-foundations-vc-bound-proof-1

ml-foundations-vc-bound-proof-1

ml-foundations-vc-bound-proof-1

About me

耐心~

Recent Posts

Friends

~~~