日期:2020年2月14日

[动手学深度学习DAY3]:过拟合、欠拟合和梯度消失、梯度爆炸

Part1.过拟合、欠拟合 训练误差 模型在训练数据集上的误差。 泛化误差 模型在任意一个测试数据样本上的误差,一般通过测试集上的误差进行近似。 过拟合 模型的训练误差远远小于模型的泛化误差,即模型过度拟合了训练集上的数据分布,而该数据分布并不能很好的近似数据的原始分布,导致测试数据的误差很大。 欠拟合 模型无法获得较低的训练误差,说明模型不能学习拟合训练集上的数据分布。 模型复杂度 模型复杂度一…

Read More »