深度学习中训练自己的模型的时候该如何设置学习率呢?
2024-01-09 14:53:58
前言
我们在看完论文之后,想要自己动手在自己家的数据集上试一试模型的效果。但是训练中有太多的超参数需要设置,而且我们的算力资源不一定会和论文作者恰好一样,故而可能设置不同的batch_size这写参数。
batch_size还是很好设置的,估计一个算力能承受的极限即可,当然最好要注意是4的倍数。
但是学习率这个参数往往让人犯了难,无从下手。我们可以借助一个公式来计算我们应该设置的学习率
公式讲解
学习率计算的公式如下:
lr[new]=
lr[default]*(batch_size[new]*gpu_number[new])/
(batch_size[default]*gpu_number[default])
这里带default的超参数就是论文原作者使用的超参数了。
文章来源:https://blog.csdn.net/qq_52095705/article/details/135424398
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!