Loading...
本节主要为以下内容的笔记:https://zh-v2.d2l.ai/chapter_multilayer-perceptrons/environment.html 训练到底在做什么? 训练其实是在最小化通过数据集得到的经验风险: 也就能得到权重 $\beta$.
Preface 证明思路 Q&A 网络流的定义 网络流的性质 最大流解决的问题 Ford-Fulkerson方法 残存网络 增广路径 网络流的切割 最大流最小割定理 Ford-Fulkerson 算法 Preface 本文为我初三下时学习网络流的笔记整理,大多源自算法导论。当时学习的是网络流代数法建模。(手动@金牌教练) 证明思路 明确 Ford-Fulkerson 算法的...
为什么要正则化? 在探讨这个问题之前,我们需要先引入欠拟合和过拟合的概念。 左侧:欠拟合,high bias, $error_{train} \gg error_{dev}$ 右侧:过拟合,high variance, $error_{train} \rightarrow 0\%$ 在过拟合的时候我们需要引入正则化,来避免过拟合。 这里介绍两种正则化方式: 权重衰减 (weight ...
注:本节内容为《具体数学》(原书第二版) 第五章 二项式系数 5.1 基本恒等式 的旁注,但可以独立阅读。 多项式推理法 对于多项式 $A(x)$ 与 $B(x)$ 而言。我们设其都是关于 $x$ 的不高于 $n$ 次多项式。 现在,我们求 $A(x)$ 与 $B(x)$ 的差,记作 $C(x)$: 其中,$C(x)$ 为一个不高于 $n$ 次的多项式,也就是说 $C(x)$ 有不多于 $...
注:本节内容为《具体数学》(原书第二版) 第五章 二项式系数 5.1 基本恒等式 的旁注。 P129 关于超出范围的整数 $k$ 的讨论 组合意义: 先在 $\sum_{k=1}^ma_k$ 中选出 $a_1$ 个,作为 $x_1$ 的幂的贡献 再在 $\sum_{k=2}^{m}a_k$ 中选出 $a_{2}$ 个,作为 $x_{2}$ 的幂的贡献 $\cdots$ 最后在 $\sum...
Softmax 运算 softmax 运算用于将实数序列映射为和为一的概率序列,换句话说,softmax 运算用于将实数值规格化,使其和为一,映射成一个合理的概率分布。 下面是 softmax 的定义: Reference https://zh-v2.d2l.ai/chapter_linear-networks/softmax-regression-concise.html https:...