时间: 2024-01-11 04:05:59 来源:自动穿提手机械
但是,这样的一种情况下,神经网络其实成了“黑匣子”——具有必定的功用,但看不见是怎样起作用的。
假如只做简略的图画分类,其实还好;但假如用在医学方向,对疾病进行猜测,那么神经网络下的“判别”就不行轻信。
在这篇论文中,她将这些“黑匣子”一个个翻开,对神经网络原理进行了详细的解说。
事实上,神经网络之所以起作用,最直观的原因是,它由很多非线性函数组成。
但是,也正是由于神经网络中的这些非线性函数,使得人类往往难以了解,它们是怎么起作用的。
医师和法令相关的研讨者往往更愿意选用可解说模型,例如线性回归、决策树,由于神经网络在疾病猜测中确实出过问题:
人们使用神经网络猜测肺炎患者的病况开展,其间一项患者特征为是否有哮喘病史。
之所以数据标明哮喘患者较少死于肺炎,往往是由于哮喘能被及早发现,所以患者得肺炎后能被及早医治。
为了让神经网络应用于更多的方向,也为了让我们更好地学习它的原理,作者从两个方向对神经网络进行了解说。
榜首种办法,称之为根据特征的解说办法,又名“过后再解说”——由于这种办法,是在神经网络训练好后,才对其输入特征进行解说的。
这种办法针对文本的词(token)、或是针对图画的超像素(super pixels),进行“过后”解说。
这儿的底子原理,是研讨外部解说办法给出的解说、与模型自身生成的自然语言解说之间,是不是真的存在相关性,而相关性详细又是什么。
这是论文说到的第二种办法,即在模型中植入一个生成猜测解说的模块,对猜测的成果进行解说。
在这儿面,作者相同引入了一种判别办法,对模型自己生成的解说进行判别,然后得出神经网络解说的成果。
高中时期,Oana-Maria Camburu曾获IMO(世界奥数比赛)银牌。她曾经在马普所、谷歌实习,读博期间,论文被ACL、EMNLP、IJCNLP等顶会录入。
本文系网易新闻•网易号特征内容鼓励方案签约账号【量子位】原创内容,未经账号授权,制止随意转载。
原标题:《神经网络“炼丹炉”内部结构长啥样?牛津大学博士小姐姐用论文解读》
本文为汹涌号作者或组织在汹涌新闻上传并发布,仅代表该作者或组织观念,不代表汹涌新闻的观念或态度,汹涌新闻仅供给信息发布渠道。请求汹涌号请用电脑拜访。







