手机浏览器扫描二维码访问
在神经网络里,梯度消失的问题就是这种感觉,网络不知道该如何继续改进。
而梯度爆炸又是另外的一个极端。
假设这次你站在一座非常陡的悬崖边,一不小心就滚下去了!
因为坡度太陡了,你的速度变得非常快,失控了。
在神经网络中,这种情况也被称为“梯度爆炸”
当梯度太大时,参数的调整会变得过于剧烈,网络的学习变得不稳定,甚至会导致训练失败。
这就像你在陡峭的悬崖边滑落,一下子失去了控制。
网络的参数变化过大,导致结果变得很不稳定,甚至完全错误。
概括地说:
梯度消失就像在一座越来越平的山坡上,梯度变得很小,神经网络不知道该怎么调整,进而学习变得很慢,甚至无法进步。
梯度爆炸就像从悬崖边滚下去,梯度变得很大,网络的学习变得过于剧烈,结果会非常不稳定,训练过程变得不可控。
这两个问题经常会出现在深层神经网络中。
而这也是马库斯所要倾诉的困扰。
“说起来,最近的研究还卡在了‘梯度消失’的问题上。”
马库斯苦笑着说道,靠在沙发上,“我们在训练一些更深层次的神经网络时,发现模型一旦超过一定的深度,反向传播算法中的梯度会逐渐趋近于零,根本无法有效更新权重。
深度越大,梯度就越容易消失,整个网络的学习效率大幅下降。”
马库斯知道林枫硕士是麻省理工学院的计算机硕士,因此也就全都用专业术语表述了。
对于这些林枫当然能听明白,非但能听明白,而且作为一个资深的人工智能从业人员。
林枫也清楚知道马库斯面临的难题。
林枫对AI的发展也有所了解,涉及到梯度问题在2014年是深度学习研究中的一个巨大挑战。
甚至可以说解决不了梯度问题就很难有真正的深度学习,也就不会有后来的人工智能成果的一系列井喷。
林枫心说,自己这是一不小心站在了技术发展的最前沿了吗?
不得不说,这种举手投足之间就能影响时代命运的感觉是真的无比美妙。
“梯度消失的问题一直存在,尤其是深层网络。
梯度爆炸倒是相对好解决,但梯度消失会直接导致学习过程停滞不前。”
林枫沉思片刻,补充道,“这不仅是你们实验室的问题,也是整个领域的瓶颈。
反向传播的基本原理决定了,当信号在网络中层层传递时,梯度的变化会以指数级缩小。”
马库斯脑海中泛起了大大的问号,梯度爆炸问题好解决吗?
他怎么觉得梯度爆炸问题也挺麻烦的?
不过聊天本来就是求同存异,既然林同样认为梯度消失难以解决就够了。
马库斯也没纠结为什么林说梯度爆炸容易解决,而是继续就梯度消失发表观点说道:“是啊,哪怕有了ReLU(修正线性单元)激活函数的引入,虽然能在一定程度上减轻梯度消失,但对深层网络还是不够。”
林枫想了想,说道:“你们有考虑过改进网络结构吗?”
赚钱,练功唔,还有养军队。养军队干嘛?看哪个诸侯强大了就给他按死,还不让他死彻底,等他缓过来继续按死。一本‘大洛内经’包罗万象,且看一个小人物如何混迹在这个弱肉强食的武侠世界。大洛内经读者群287618582欢迎加入...
谁言情深不悔是喻若暖宫凌夜精心创作的玄幻小说,79中文网实时更新谁言情深不悔最新章节并且提供无弹窗阅读,书友所发表的谁言情深不悔评论,并不代表79中文网赞同或者支持谁言情深不悔读者的观点。...
简介玩家您好,欢迎来到模拟神仙体验服沈略(迷惑脸)模拟人生我玩过,这模拟神仙是什么鬼?可解锁角色死亡之神可解锁信徒灭霸可解锁副本泰坦星的危机祝您游戏愉快大家好,我是沈略!玩这款沙雕游戏有一段时间了,体验还不错吧,就是经常浪死。不过作为玩家,复活应该是基本操作吧?为什么这些NPC见到我就跑呢书友群1084420500...
穿越大唐,张诺只想安安稳稳地经营好酒馆,到时候经济改善了就买个丫鬟,娶个漂亮媳妇过上好日子,结果,他营业的第一天就来了一位特殊的客人李世民。作为穿越者,他拥有着远超这个时代的目光与见识,随口闲扯两句,听在李世民的耳中都是振聋发聩。不久后,张诺发现,自己随便说说的东西,居然就变成了大唐的治国方针...
作者新书已发,书名总裁他又在飙戏了敬请关注!双双被算计,一昔欢好。他说结婚吧!不过我是私生子!她说正好,我是私生女!别人只知道他是傅家不受待见能力低下的私生子,不知道他是国际财团QG的创始人,坐拥万亿身家。别人只知道她是黎家名不见经传的私生女,不知道她是惊才绝绝的金融操盘手,坐拥客户万家。当身份被揭晓,狂蜂浪蝶蜂拥而至。他说日落西山你不陪,东山再起你是谁?她说穷时执手夕阳,富时方可相拥黎明!(这是一个男女主双洁,男强女强的故事,欢迎入坑!)...
本应是集三千宠爱于一身的相府嫡长女,却因为一个无稽的预言落得个冻死的下场一朝穿越重生,灵魂易主,从此懦弱不再,死气尽去比容貌?等咱先解了毒先比财富?等咱先偷你个一穷二白先比天赋?咱神器傍身神火相随,你算老几?比魅力?咳咳,那边的美男,该你上啦!看咱穿越之偷王之王,玩转异世,偷天偷地偷美男...