首页 >> 大全

论文笔记:Dorefa

2023-10-04 大全 28 作者:考证青年

-Net由FACE++提出,论文地址:

1、背景:

训练神经网络需要大量的时间,为了减少这些时间,对模型进行量化是个不错的选择。但是,以往的工作没有对梯度/激活函数进行低bit量化并取得好的结果的先例。所以,-Net被提了出来。

2、贡献: 3、方法: 3.1

在用bit运算来加速网络上,-Net使用了和以前工作相似的方式:

3.2

STE:

这种STE加入了噪声,文章说这对网络性能的提升很关键。同时,上图的12式将梯度的范围限制到了[0,1]。

3.3

总的运行框架:

4.结果

事实上,的在W=1,A=1,G=32时表现并没有Xnor-Net好,其中原因值得进一步探讨。事实上,读者感觉这篇文章的方向有点跑偏,或者是没做得足够好。出于减少训练时间而量化梯度的本意是好的,但是这以不可接受的精度损失为代价是不可行的。本文的主要贡献可能在于其提出了一种分层量化权重,激活和梯度的思想。

关于我们

最火推荐

小编推荐

联系我们


版权声明:本站内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 88@qq.com 举报,一经查实,本站将立刻删除。备案号:桂ICP备2021009421号
Powered By Z-BlogPHP.
复制成功
微信号:
我知道了