作者信息:
学院:计算机学院
作者:李野
作者:周预演
论文简介:
深度神经网络的泛化能力对于算法模型的大范围应用推广起着决定性作用。本文提出了一种“最优转移”的方法,通过简单的线性代数变换,能够在保持损失函数值不变的情形下,让损失函数的景观变得更为平坦,从而具有更好的泛化能力,并在图像分类、回归等任务中进行了验证。
论文链接:
https://doi.org/10.1609/aaai.v39i10.33181
期刊名:《 AAAI Technical Track on Computer Vision IX》