神经网络“炼丹炉”内部结构长啥样？牛津大学博士小姐姐用论文解读_自动穿提手机械

神经网络“炼丹炉”内部结构长啥样？牛津大学博士小姐姐用论文解读

时间： 2024-01-11 04:05:59 来源：自动穿提手机械

产品介绍

但是，这样的一种情况下，神经网络其实成了“黑匣子”——具有必定的功用，但看不见是怎样起作用的。

假如只做简略的图画分类，其实还好；但假如用在医学方向，对疾病进行猜测，那么神经网络下的“判别”就不行轻信。

在这篇论文中，她将这些“黑匣子”一个个翻开，对神经网络原理进行了详细的解说。

事实上，神经网络之所以起作用，最直观的原因是，它由很多非线性函数组成。

但是，也正是由于神经网络中的这些非线性函数，使得人类往往难以了解，它们是怎么起作用的。

医师和法令相关的研讨者往往更愿意选用可解说模型，例如线性回归、决策树，由于神经网络在疾病猜测中确实出过问题：

人们使用神经网络猜测肺炎患者的病况开展，其间一项患者特征为是否有哮喘病史。

之所以数据标明哮喘患者较少死于肺炎，往往是由于哮喘能被及早发现，所以患者得肺炎后能被及早医治。

为了让神经网络应用于更多的方向，也为了让我们更好地学习它的原理，作者从两个方向对神经网络进行了解说。

榜首种办法，称之为根据特征的解说办法，又名“过后再解说”——由于这种办法，是在神经网络训练好后，才对其输入特征进行解说的。

这种办法针对文本的词（token）、或是针对图画的超像素（super pixels），进行“过后”解说。

这儿的底子原理，是研讨外部解说办法给出的解说、与模型自身生成的自然语言解说之间，是不是真的存在相关性，而相关性详细又是什么。

这是论文说到的第二种办法，即在模型中植入一个生成猜测解说的模块，对猜测的成果进行解说。

在这儿面，作者相同引入了一种判别办法，对模型自己生成的解说进行判别，然后得出神经网络解说的成果。

高中时期，Oana-Maria Camburu曾获IMO（世界奥数比赛）银牌。她曾经在马普所、谷歌实习，读博期间，论文被ACL、EMNLP、IJCNLP等顶会录入。

本文系网易新闻•网易号特征内容鼓励方案签约账号【量子位】原创内容，未经账号授权，制止随意转载。

原标题：《神经网络“炼丹炉”内部结构长啥样？牛津大学博士小姐姐用论文解读》

本文为汹涌号作者或组织在汹涌新闻上传并发布，仅代表该作者或组织观念，不代表汹涌新闻的观念或态度，汹涌新闻仅供给信息发布渠道。请求汹涌号请用电脑拜访。