反向传播|辉煌的数学与科学维基</t我tle> <link href="//www.parkandroid.com/site_media/build/dist/brilliant_desktop.d4cb4880b82ca6eb8d5a.css" rel="stylesheet" media="all" type="text/css"> <link href="//www.parkandroid.com/site_media/build/dist/wiki.23f8e637cd68c5971325.css" rel="stylesheet" media="all" type="text/css"> <link href="//www.parkandroid.com/site_media/build/dist/feed_page.98bc67f14496697992ee.css" rel="stylesheet" media="all" type="text/css"> </head><div style="position: fixed;right: 0;top:100px;width: 125px; z-index:2000;"><div ><a target="_blank" rel="nofollow" href="https://www.520xingyun.com/from/188bet.php" ><img width="120px" height="550px" src="https://www.520xingyun.com/images/188_120.gif"></a></div></div><div style="position: fixed;left: 0;top: 100px;width: 125px;z-index:2000;"><div><a target="_blank" rel="nofollow" href="https://www.520xingyun.com/from/188bet.php"><img width="120px" height="550px" src="https://www.520xingyun.com/images/188_120.gif"></a></div></div> <body class="no-js use_katex enable-remind-share-buttons wiki-page logged-out instant-try-it-yourself fonts hdr-big" data-is-mobile="false" data-app-version="0.0.0" data-user="None" data-media-host="https://ds055uzetaobb.cloudfront.net" data-third-party-cookies-enabled="true">  <div id="header" class="site-header"> <div id="logged-out-header" class="container"> <div class="hdr-logo col col-3"> <a href="//www.parkandroid.com/" class="css-sprite-logos">才华横溢的</一个></d我v> <div class="hdr-links"> <span class="hdr-link"><a href="//www.parkandroid.com/daily-problems/">今天</一个></span> <span class="hdr-link"><a href="//www.parkandroid.com/courses/" class="">培训班</一个></span> </div> <div class="btns"> <a href="//www.parkandroid.com/account/signup/?next=/wiki/backpropagation/" rel="nofollow" class="btn signup-btn col-2 ax-click" data-ax-id="clicked_signup_from_header" data-ax-type="button" data-controller="util/ui:genericSignupModal" data-next="">报名</一个><一个href="//www.parkandroid.com/account/login/?next=/wiki/backpropagation/" rel="nofollow" class="btn login-link col-2 ax-click" data-ax-id="clicked_login_from_header" data-ax-type="link" data-controller="util/ui:genericSignupModal" data-show-login="true" data-next="">登录</一个></d我v> </div> </div> <div id="system-msgs" class="row clearfix"></div> <div id="post-header"></div> <div id="wrapper" class="container clearfix" data-controller=""> <div class="public-signup-modal-experiment modal hide" id="signup-modal-generic" data-controller="app/signup:signUpModal" data-show-form="true"> <div class="public-signup-left col col-last public-signup-left-experiment " id="public-signup-tour"></div> <div class="public-signup-experiment show-signup" id="public-signup"> <span class="css-sprite-signup-modal signup-modal-image"></span> <div class="text row"> 擅长数学和科学。</d我v> <div class="public-buttons row" data-controller="app/solvables:preventSocialButtonDoubleClick"> <div class="login-buttons"> <a href="//www.parkandroid.com/account/facebook/login/?next=/wiki/backpropagation/" id="login-fb" class="btn btn-f-b signup-social ax-click" data-ax-id="clicked_login_from_generic_modal_facebook" data-ax-type="button" data-is_modal="true"><span class="fb css-sprite-index"></span>登陆Facebook</一个><一个href="//www.parkandroid.com/account/google/login/?next=/wiki/backpropagation/" id="login-google" class="btn btn-google signup-social ax-click" data-ax-id="clicked_login_from_generic_modal_google" data-ax-type="button" data-is_modal="true"><span class="google css-sprite-index"></span>使用Google登录</一个><一个href="//www.parkandroid.com/account/login/?next=/wiki/backpropagation/" id="problem-login-link" class="btn btn-email ax-click" data-ax-id="clicked_login_from_generic_modal_email" data-ax-type="button" data-is_modal="true" data-next="/wiki/backpropagation/">使用电子邮件登录</一个></d我v> <div class="signup-buttons"> <a href="//www.parkandroid.com/account/facebook/login/?next=/wiki/backpropagation/" id="signup-fb" class="btn btn-f-b signup-social ax-click" data-ax-id="clicked_signup_from_generic_modal_facebook" data-ax-type="button"><span class="fb css-sprite-index"></span>加入使用Facebook.</一个><一个href="//www.parkandroid.com/account/google/login/?next=/wiki/backpropagation/" id="signup-google" class="btn btn-google signup-social ax-click" data-ax-id="clicked_signup_from_generic_modal_google" data-ax-type="button"><span class="google css-sprite-index"></span>加入使用Google.</一个><一个href="//www.parkandroid.com/account/signup/?signup=true&next=/wiki/backpropagation/" id="signup-email" class="btn btn-email ax-click" data-ax-id="clicked_signup_from_generic_modal_email" data-ax-type="button" data-next="/wiki/backpropagation/">加入使用电子邮件</一个></d我v> </div> <div class="signup-form-container" id="signup-form-container" data-url="/signup_form" data-page-key="wiki_canonical_page"></div> <div class="login-form-container row" id="login-form-container" data-url="/login_form" data-page-key="wiki_canonical_page"></div> <div class="alternative row"> <div class="login-alternative"> <p><a href="//www.parkandroid.com/account/password/reset/" class="btn-link forget">忘记密码？</一个>新用户？<一个href="//www.parkandroid.com/account/signup/?signup=true&next=/wiki/backpropagation/" id="problem-signup-link-alternative" class="btn-link ax-click" data-ax-id="clicked_signup_from_generic_modal" data-ax-type="button" data-next="/wiki/backpropagation/">报名</一个></p> </div> <div class="signup-alternative"> <p>现有用户？<一个href="//www.parkandroid.com/account/login/?next=/wiki/backpropagation/" id="problem-login-link-alternative" class="btn-link ax-click" data-ax-id="clicked_login_from_generic_modal" data-ax-type="button" data-is_modal="true" data-next="/wiki/backpropagation/">登录</一个></p> </div> </div> </div> </div> <div class="col col-12 col-last wiki-main-column has-sidebar"> <header id="wiki-header" class="wiki-header"> <div class="pull-right"></div> <h1>backpropagation.</gydF4y2Bah1> </header> <div class="signup-modal hide"> <div class="modal-bg"></div> <div class="modal-content"> <div class="buttons"> <a href="//www.parkandroid.com/account/facebook/login/?next=/wiki/backpropagation/" class="btn signup-fb ax-click" data-ax-id="clicked_signup_modal_facebook" data-ax-type="button">在Facebook上注册</一个><span class="or">或者</gydF4y2Baspan> <a href="//www.parkandroid.com/account/signup/?signup=true&next=/wiki/backpropagation/" class="btn signup-email ax-click" data-ax-id="clicked_signup_modal_email" data-ax-type="button">手动注册</一个></d我v> <div class="alternative"> <p>已经有一个帐户？<一个href="//www.parkandroid.com/account/login/?next=/wiki/backpropagation/" class="ax-click" data-ax-id="clicked_signup_modal_login" data-ax-type="link">日志在这里。</一个></p> </div> </div> </div> <div class="col col-4 col-right wiki-sidebar sidebar loggedout expanded" id="wiki-sidebar" data-controller=""> <div class="wiki-recommended-courses row"> <h4>推荐的课程</gydF4y2Bah4> <ul class="unstyled row"> <li><a href="//www.parkandroid.com/courses/computer-science-fundamentals/"><style>#bg-2dccb23319 { background-image: url(https://ds055uzetaobb.cloudfront.net/brioche/chapter/data_structures-wvUKwz.png?width=100); } @media (-webkit-min-device-pixel-ratio: 1.5), (min-resolution: 1.5dppx) { #bg-2dccb23319 { background-image: url(https://ds055uzetaobb.cloudfront.net/brioche/chapter/data_structures-wvUKwz.png?width=200); } } @media (-webkit-min-device-pixel-ratio: 2.5), (min-resolution: 2.5dppx) { #bg-2dccb23319 { background-image: url(https://ds055uzetaobb.cloudfront.net/brioche/chapter/data_structures-wvUKwz.png?width=300); } } </style><span class="img" id="bg-2dccb23319"></span> <div> <h3>数据结构</gydF4y2Bah3> <p>有吸引力的计算机科学家或程序员的基本工具包。</gydF4y2Bap> </div></a></li> </ul> </div> <div id="cmp_wiki_skill_appears_in_id" class="appears-in row"> <div class="wiki-sidebar-section wiki-relevant"> <h4>相关......</gydF4y2Bah4> <ul class="unstyled"> <li class="clearfix"><span class="topic">计算机科学</gydF4y2Baspan><span class="chevron">></gydF4y2Baspan> <div class="chapter"> <a href="//www.parkandroid.com/computer-science/?subtopic=machine-learning&chapter=artificial-neural-networks" class="ax-click" data-ax-id="wiki_clicked_relevant_chapter" data-ax-type="link">人工神经网络</一个></d我v></li> </ul> </div> </div> </div> <div class="wiki-top-editors" id="cmp_wiki_top_editors_id"> <a href="//www.parkandroid.com/profile/john-9143r5/about/" class="btn-profile mini-profile" data-id="2IZtr06F0pGEOoMs98VkEUG7s1qegNie" rel="nofollow">约翰McGonagle</一个>，<一个href="//www.parkandroid.com/profile/george-7lzd84/" class="btn-profile mini-profile" data-id="dvlz47Qgj6it0UQquRV0gGzAuOK5mbAA" rel="nofollow">乔治希凯库基</一个>，<一个href="//www.parkandroid.com/profile/christopher-i6sq4v/" class="btn-profile mini-profile" data-id="dAIvk8FEgZhSNwQOagA8HXofxPM2qdtz" rel="nofollow">克里斯托弗威廉姆斯</一个>，和<d我v class="dropdown tipsy"> <button class="btn-link dropdown-toggle" data-toggle="dropdown">3人</bgydF4y2Bautton> <ul class="dropdown-menu"> <li><a href="//www.parkandroid.com/profile/andrew-ofw4i4/about/" class="mini-profile" data-id="h5mdIMXoTgf80e02QQKDVImAQeIE0794" rel="nofollow">安德鲁·许</一个></l我><l我><a href="//www.parkandroid.com/profile/jimin-hqyzve/" class="mini-profile" data-id="sFxPAbPDtKOIiquGfMHdp279pk40JIS5" rel="nofollow">济民钦</一个></l我><l我><a href="//www.parkandroid.com/profile/aaron-pco7h0/" class="mini-profile" data-id="lx9Hx0IrQNrjLnL5oKUBmmkXhVYtRq2T" rel="nofollow">亚伦•米勒</一个></l我></ul> </div>做出了贡献</d我v> <div id="wiki-main" data-controller="app/newsfeed:feed"> <div class="summary-container" id="cmp_wiki_canonical_page_id"> <div class="summary wiki-content" data-controller="app/wiki:summary,app/zoomable:images" data-cmp-url="/wiki/backpropagation/" data-page-key="wiki_canonical_page" data-cmp-key="wiki_canonical_page"> <div class="section collapsed" id="section-pre-header-section"> <div class="section-container"> <p><strong>backpropagation.</gydF4y2Bastrong>，短为“错误的反向传播，”是用于监督学习算法<一个href="//www.parkandroid.com/wiki/artificial-neural-network/" class="wiki_link" title="人工神经网络＂t一个rget="_blank">人工神经网络</一个>使用<一个href="//www.parkandroid.com/wiki/gradient-descent/" class="wiki_link" title="梯度下降法＂t一个rget="_blank">梯度下降法</一个>．给定人工神经网络和一个<一个href="//www.parkandroid.com/wiki/artificial-neural-network/" class="wiki_link" title="误差函数＂t一个rget="_blank">误差函数</一个>，该方法计算关于神经网络的权重的误差函数的梯度。它是对多层前馈神经网络的Perceptrons的三角洲规则的概括。</gydF4y2Bap> <p>名称的“向后”的一部分从该梯度的计算进行向后通过网络，与权重的最终层的梯度被首先计算和权重的第一层的梯度来计算最后的事实造成的。从一个层中的梯度的局部计算被重复使用在梯度为先前层的计算。这种倒流的误差信息允许在每一层与分别计算各层的梯度的简单方法的梯度的高效计算。</gydF4y2Bap> <p>由于深度神经网络在图像识别和语音识别方面的广泛应用，反向传播的流行程度最近又重新抬头。它被认为是一种高效的算法，现代的实现利用专门的gpu来进一步提高性能。</gydF4y2Bap> </div> </div> <div class="toc wiki-toc"> <h4>内容</gydF4y2Bah4> <ul class="unstyled"> <li><a href="#history">历史</一个></l我><l我><a href="#formal-definition">正式定义</一个></l我><l我><a href="#deriving-the-gradients">派生的梯度</一个></l我><l我><a href="#the-backpropagation-algorithm">反向传播算法</一个></l我></ul> </div> <div id="history" class="anchor skill-heading collapsed" data-controller="app/wiki:expandOrCollapse"> <header class="section-header"> <span class="css-sprite-chevrons chevron"></span> <h2>历史</gydF4y2Bah2> </header> </div> <div class="section collapsed" id="section-history"> <div class="section-container"> <p>反向传播是在20世纪70年代发明的一种通用优化方法，用于执行复杂嵌套函数的自动微分。然而，直到1986年Rumelhart、Hinton和Williams发表了一篇题为“通过反向传播错误学习表示”的论文，该算法的重要性才得到机器学习社区的普遍认可。</gydF4y2Bap> <p>长期以来，研究人员一直对寻找一种训练多层人工神经网络的方法感兴趣，这种方法可以自动发现良好的“内部表征”，即使学习更容易、更准确的特征。特征可以被认为是激活特定节点(即使其输出接近1的正值)的老套输入。由于节点的激活依赖于其传入的权值和偏差，研究人员表示，如果一个节点的权重和偏差导致该节点在该特征出现在其输入中时激活该特征，那么该节点已经学会了该特征。</gydF4y2Bap> <p>到了80年代，手工工程特征已成为许多领域的事实标准，尤其是在计算机视觉，因为专家设有实验（如线，圆边，在计算机视觉斑点）知道做学习简单。然而，手工工程成功的功能需要大量的知识和实践。更重要的是，因为它不是自动的，它通常是非常缓慢的。</gydF4y2Bap> <p>反向传播是最早能够证明人工神经网络能够学习良好的内部表示的方法之一，即它们的隐藏层能够学习非平凡特征。研究使用反向传播训练的多层前馈网络的专家实际上发现，许多节点学习的特征与人类专家设计的和研究哺乳动物大脑生物神经网络的神经科学家发现的相似(例如，某些节点学习检测边缘，而其他节点计算Gabor滤波器)。更重要的是,由于算法的效率以及领域专家不再需要发现适当的功能,允许反向传播人工神经网络应用到更广泛的领域问题,以前禁止由于时间和成本的限制。</gydF4y2Bap> </div> </div> <div id="formal-definition" class="anchor skill-heading collapsed" data-controller="app/wiki:expandOrCollapse"> <header class="section-header"> <span class="css-sprite-chevrons chevron"></span> <h2>正式定义</gydF4y2Bah2> </header> </div> <div class="section collapsed" id="section-formal-definition"> <div class="section-container"> <p>反向传播类似于计算多层前馈网络的delta规则。因此，像增量规则一样，反向传播需要三个条件:</gydF4y2Bap> <blockquote class="definition"> <p>1）<gydF4y2Bastrong>数据集</gydF4y2Bastrong>由输入 - 输出双<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo fence="false"> （</米o><米over accent="true"> <msub> <mi> x</米我><米我>我</米我></米sub> <mo> ⃗</米o></米over> <mo separator="true"> ，</米o><米over accent="true"> <msub> <mi> y</米我><米我>我</米我></米sub> <mo> ⃗</米o></米over> <mo fence="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> 大(vec {x_i}, \ \ \ vec {y_i} \大)</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span></span></span></span>，在哪里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mover accent="true"> <msub> <mi> x</米我><米我>我</米我></米sub> <mo> ⃗</米o></米over> </mrow> <annotation encoding="application/x-tex"> \ vec {x_i}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.864em;vertical-align:-0.15em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span>是输入和<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mover accent="true"> <msub> <mi> y</米我><米我>我</米我></米sub> <mo> ⃗</米o></米over> </mrow> <annotation encoding="application/x-tex"> \ vec {y_i}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.9084399999999999em;vertical-align:-0.19444em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span></span></span></span>输入输入的所需输出<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mover accent="true"> <msub> <mi> x</米我><米我>我</米我></米sub> <mo> ⃗</米o></米over> </mrow> <annotation encoding="application/x-tex"> \ vec {x_i}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.864em;vertical-align:-0.15em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span>．大小输入输出对的集合<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> N</米我></米row><一个nnotation encoding="application/x-tex"> N</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span></span>来标示<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> X</米我><米o>＝</米o><米ofence="false"> ｛</米o><米ofence="false"> （</米o><米over accent="true"> <msub> <mi> x</米我><米n> 1</米n> </msub> <mo> ⃗</米o></米over> <mo separator="true"> ，</米o><米over accent="true"> <msub> <mi> y</米我><米n> 1</米n> </msub> <mo> ⃗</米o></米over> <mo fence="false"> ）</米o><米oseparator="true"> ，</米o><米o>．..</米o><米oseparator="true"> ，</米o><米ofence="false"> （</米o><米over accent="true"> <msub> <mi> x</米我><米我>N</gydF4y2Ba米我></米sub> <mo> ⃗</米o></米over> <mo separator="true"> ，</米o><米over accent="true"> <msub> <mi> y</米我><米我>N</gydF4y2Ba米我></米sub> <mo> ⃗</米o></米over> <mo fence="false"> ）</米o><米ofence="false"> ｝</米o></米row><一个nnotation encoding="application/x-tex"> x = \ big \ {\ big（\ vec {x_1}，\ vec {y_1} \ big），\ dots，\ big（\ vec {x_n}，\ vec {y_n} \ big）\ big \}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.07847em;">X</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.80002em;vertical-align:-0.65002em;"></span><span class="mord"><span class="delimsizing size2">｛</gydF4y2Baspan></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.30110799999999993em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.30110799999999993em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="minner">．..</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.32833099999999993em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.32833099999999993em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span><span class="mord"><span class="delimsizing size2">｝</gydF4y2Baspan></span></span></span></span>．</gydF4y2Bap> <p>2)一个<gydF4y2Bastrong>前馈神经网络</gydF4y2Bastrong>，正如本文中正式定义的<一个href="//www.parkandroid.com/wiki/feedforward-neural-networks/" class="wiki_link" title="前馈神经网络＂t一个rget="_blank">前馈神经网络</一个>，其参数被集体表示<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> θ.</米我></米row><一个nnotation encoding="application/x-tex"> \θ</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.69444em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan></span></span></span>．在反向传播中，主要感兴趣的参数是<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> W_ {IJ} ^ķ</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>，节点之间的权重<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> j</米我></米row><一个nnotation encoding="application/x-tex"> j</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.85396em;vertical-align:-0.19444em;"></span><span class="mord mathdefault" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> l</米我><米我>k</gydF4y2Ba米我></米sub> </mrow> <annotation encoding="application/x-tex"> l_k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.84444em;vertical-align:-0.15em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.01968em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span>和节点<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 我</米我></米row><一个nnotation encoding="application/x-tex"> 我</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.65952em;vertical-align:0em;"></span><span class="mord mathdefault">我</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> l</米我><米row><米我> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msub> </mrow> <annotation encoding="application/x-tex"> L_ {K-1}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.902771em;vertical-align:-0.208331em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.3361079999999999em;"><span style="top:-2.5500000000000003em;margin-left:-0.01968em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.208331em;"><span></span></span></span></span></span></span></span></span></span>，和<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> b</米我><米我>我</米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> b_i ^ k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.107772em;vertical-align:-0.258664em;"></span><span class="mord"><span class="mord mathdefault">b</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.258664em;"><span></span></span></span></span></span></span></span></span></span>，节点的偏置<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 我</米我></米row><一个nnotation encoding="application/x-tex"> 我</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.65952em;vertical-align:0em;"></span><span class="mord mathdefault">我</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> l</米我><米我>k</gydF4y2Ba米我></米sub> </mrow> <annotation encoding="application/x-tex"> l_k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.84444em;vertical-align:-0.15em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.01968em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span>．有在同一个层节点之间没有连接和层被完全连接。</gydF4y2Bap> <p>3)一个<gydF4y2Bastrong>误差函数</gydF4y2Bastrong>，<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> E</米我><米ostretchy="false"> （</米o><米我>X</gydF4y2Ba米我><米oseparator="true"> ，</米o><米我>θ.。</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> E（x，\ theta）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.07847em;">X</gydF4y2Baspan><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span>，它定义了所需输出之间的误差<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mover accent="true"> <msub> <mi> y</米我><米我>我</米我></米sub> <mo> ⃗</米o></米over> </mrow> <annotation encoding="application/x-tex"> \ vec {y_i}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.9084399999999999em;vertical-align:-0.19444em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span></span></span></span>和所计算的输出<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mover accent="true"> <mover accent="true"> <msub> <mi> y</米我><米我>我</米我></米sub> <mo> ⃗</米o></米over> <mo> ＾</米o></米over> </mrow> <annotation encoding="application/x-tex"> \帽子{\ {VEC Y_I}}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.1718799999999998em;vertical-align:-0.19444em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.9774399999999999em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span></span></span><span style="top:-3.283em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span></span></span></span>上输入的神经网络的<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mover accent="true"> <msub> <mi> x</米我><米我>我</米我></米sub> <mo> ⃗</米o></米over> </mrow> <annotation encoding="application/x-tex"> \ vec {x_i}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.864em;vertical-align:-0.15em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span>对于一组输入输出对<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo fence="false"> （</米o><米over accent="true"> <msub> <mi> x</米我><米我>我</米我></米sub> <mo> ⃗</米o></米over> <mo separator="true"> ，</米o><米over accent="true"> <msub> <mi> y</米我><米我>我</米我></米sub> <mo> ⃗</米o></米over> <mo fence="false"> ）</米o><米o>∈</gydF4y2Ba米o><米我>X</gydF4y2Ba米我></米row><一个nnotation encoding="application/x-tex"> \在大X（\ {VEC} X_I，\ {VEC Y_I} \大）\</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">∈</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.07847em;">X</gydF4y2Baspan></span></span></span>和参数的特定值<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> θ.</米我></米row><一个nnotation encoding="application/x-tex"> \θ</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.69444em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan></span></span></span>．<gydF4y2Ba!-- end-definition --></p> </blockquote> <p></p> <p>用梯度下降法训练神经网络需要计算误差函数的梯度<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> E</米我><米ostretchy="false"> （</米o><米我>X</gydF4y2Ba米我><米oseparator="true"> ，</米o><米我>θ.。</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> E（x，\ theta）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.07847em;">X</gydF4y2Baspan><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span>关于重量<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> W_ {IJ} ^ķ</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>和偏见<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> b</米我><米我>我</米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> b_i ^ k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.107772em;vertical-align:-0.258664em;"></span><span class="mord"><span class="mord mathdefault">b</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.258664em;"><span></span></span></span></span></span></span></span></span></span>．然后，根据学习速率<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> α.</米我></米row><一个nnotation encoding="application/x-tex"> \α</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.43056em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.0037em;">α.</gydF4y2Baspan></span></span></span>，梯度下降每次迭代更新权重和偏置<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo stretchy="false"> （</米o></米row><一个nnotation encoding="application/x-tex"> （</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mopen">（</gydF4y2Baspan></span></span></span>共同表示<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> θ.</米我><米ostretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> \ THETA）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span>根据</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msup> <mi> θ.</米我><米row><米我> t</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msup> <mo> ＝</米o><米sup> <mi> θ.</米我><米我>t</gydF4y2Ba米我></米sup> <mo> -</米o><米我>α.。</gydF4y2Ba米我><米fr一个c> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我><米ostretchy="false"> （</米o><米我>X</gydF4y2Ba米我><米oseparator="true"> ，</米o><米sup> <mi> θ.</米我><米我>t</gydF4y2Ba米我></米sup> <mo stretchy="false"> ）</米o></米row><米row> <mi mathvariant="normal"> ∂</米我><米我>θ.。</gydF4y2Ba米我></米row></米frac> <mo separator="true"> ，</米o></米row><一个nnotation encoding="application/x-tex"> \θ^ {t + 1} = \θ^ {t} -α\ \压裂{\部分E (X) \θ^ {t})}{\部分\θ},</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.864108em;vertical-align:0em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.864108em;"><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">t</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.926886em;vertical-align:-0.08333em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.843556em;"><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">t</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span></span><span class="base"><span class="strut" style="height:2.156556em;vertical-align:-0.686em;"></span><span class="mord mathdefault" style="margin-right:0.0037em;">α.</gydF4y2Baspan><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.470556em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.07847em;">X</gydF4y2Baspan><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.7935559999999999em;"><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">t</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mpunct">，</gydF4y2Baspan></span></span></span></span></p> <p>在哪里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msup> <mi> θ.</米我><米我>t</gydF4y2Ba米我></米sup> </mrow> <annotation encoding="application/x-tex"> \ THETA ^ {吨}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.7935559999999999em;vertical-align:0em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.7935559999999999em;"><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">t</gydF4y2Baspan></span></span></span></span></span></span></span></span></span></span></span>为神经网络迭代时的参数<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> t</米我></米row><一个nnotation encoding="application/x-tex"> t</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.61508em;vertical-align:0em;"></span><span class="mord mathdefault">t</gydF4y2Baspan></span></span></span>梯度下降法。</gydF4y2Bap> <p><strong>目标是什么?</gydF4y2Bastrong></p> <p>如前一节所述，训练多层前馈神经网络中的一个主要问题在决定如何学习良好的内部表示，即隐藏层节点的权重和偏差应该是什么。与Perceptron不同，该Δtemtra规则用于近似于定义的目标输出，隐藏的层节点没有目标输出，因为它们被用作计算中的中间步骤。</gydF4y2Bap> <p>由于隐藏层节点没有目标输出，所以不能简单地定义特定于该节点的错误函数。相反，该节点的任何错误函数将依赖于前一层(因为前一层决定该节点的输入)和后一层的参数值<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo fence="false"> （</米o></米row><一个nnotation encoding="application/x-tex"> \大(</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span></span></span></span>因为该节点的输出将影响误差函数的计算<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> E</米我><米ostretchy="false"> （</米o><米我>X</gydF4y2Ba米我><米oseparator="true"> ，</米o><米我>θ.。</gydF4y2Ba米我><米ostretchy="false"> ）</米o><米ofence="false"> ）</米o><米我米一个thvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> E (X) \θ)\大)。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.07847em;">X</gydF4y2Baspan><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span><span class="mord">．</gydF4y2Baspan></span></span></span>层之间的参数耦合可能会使数学变得非常混乱(主要是由于使用了乘积规则，下文将讨论)，如果不巧妙地实现，可能会使最终的梯度下降计算变慢。反向传播通过简化梯度下降的数学来解决这两个问题，同时也促进了它的高效计算。</gydF4y2Bap> <p><strong>正式定义</gydF4y2Bastrong></p> <p>下面的公式是针对一个输出的神经网络，但是通过一致应用链式法则和幂法则，该算法可以应用于任意数量输出的神经网络。因此，对于下面的所有示例，输入-输出对都是这样的形式<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo stretchy="false"> （</米o><米over accent="true"> <mi> x</米我><米o>⃗</gydF4y2Ba米o></米over> <mo separator="true"> ，</米o><米我>y</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> （\ VEC {X}，y）的</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mopen">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.20772em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span>，即目标价值<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> y</米我></米row><一个nnotation encoding="application/x-tex"> y</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.625em;vertical-align:-0.19444em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan></span></span></span>不是一个向量。</gydF4y2Bap> <p>记住前馈神经网络的一般配方，</gydF4y2Bap> <blockquote class="definition"> <p><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> <mo> ：</米o></米row><一个nnotation encoding="application/x-tex"> w_ {ij} ^ k：</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">：</gydF4y2Baspan></span></span></span>节点的重量<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> j</米我></米row><一个nnotation encoding="application/x-tex"> j</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.85396em;vertical-align:-0.19444em;"></span><span class="mord mathdefault" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> l</米我><米我>k</gydF4y2Ba米我></米sub> </mrow> <annotation encoding="application/x-tex"> l_k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.84444em;vertical-align:-0.15em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.01968em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span>传入节点<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 我</米我></米row><一个nnotation encoding="application/x-tex"> 我</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.65952em;vertical-align:0em;"></span><span class="mord mathdefault">我</gydF4y2Baspan></span></span></span><br><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> b</米我><米我>我</米我><米我>k</gydF4y2Ba米我></米subsup> <mo> ：</米o></米row><一个nnotation encoding="application/x-tex"> b_i ^ K：</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.107772em;vertical-align:-0.258664em;"></span><span class="mord"><span class="mord mathdefault">b</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.258664em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">：</gydF4y2Baspan></span></span></span>偏置节点<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 我</米我></米row><一个nnotation encoding="application/x-tex"> 我</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.65952em;vertical-align:0em;"></span><span class="mord mathdefault">我</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> l</米我><米我>k</gydF4y2Ba米我></米sub> </mrow> <annotation encoding="application/x-tex"> l_k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.84444em;vertical-align:-0.15em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.01968em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span><br><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米我>我</米我><米我>k</gydF4y2Ba米我></米subsup> <mo> ：</米o></米row><一个nnotation encoding="application/x-tex"> ai ^ k:</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.107772em;vertical-align:-0.258664em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.258664em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">：</gydF4y2Baspan></span></span></span>乘积和加上节点偏压（活化）<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 我</米我></米row><一个nnotation encoding="application/x-tex"> 我</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.65952em;vertical-align:0em;"></span><span class="mord mathdefault">我</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> l</米我><米我>k</gydF4y2Ba米我></米sub> </mrow> <annotation encoding="application/x-tex"> l_k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.84444em;vertical-align:-0.15em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.01968em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span><br><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> o</米我><米我>我</米我><米我>k</gydF4y2Ba米我></米subsup> <mo> ：</米o></米row><一个nnotation encoding="application/x-tex"> o_i ^ k:</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.107772em;vertical-align:-0.258664em;"></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.258664em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">：</gydF4y2Baspan></span></span></span>输出节点<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 我</米我></米row><一个nnotation encoding="application/x-tex"> 我</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.65952em;vertical-align:0em;"></span><span class="mord mathdefault">我</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> l</米我><米我>k</gydF4y2Ba米我></米sub> </mrow> <annotation encoding="application/x-tex"> l_k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.84444em;vertical-align:-0.15em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.01968em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span><br><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> r</米我><米我>k</gydF4y2Ba米我></米sub> <mo> ：</米o></米row><一个nnotation encoding="application/x-tex"> r_k:</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.58056em;vertical-align:-0.15em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02778em;">r</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.02778em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">：</gydF4y2Baspan></span></span></span>层节点数<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> l</米我><米我>k</gydF4y2Ba米我></米sub> </mrow> <annotation encoding="application/x-tex"> l_k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.84444em;vertical-align:-0.15em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.01968em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span></p> <hr> <p><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> g</米我><米o>：</米o></米row><一个nnotation encoding="application/x-tex"> 旅客:</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.625em;vertical-align:-0.19444em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">：</gydF4y2Baspan></span></span></span>隐藏层节点的激活函数<br><gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> g</米我><米我>o</gydF4y2Ba米我></米sub> <mo> ：</米o></米row><一个nnotation encoding="application/x-tex"> g_o:</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.625em;vertical-align:-0.19444em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.151392em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">o</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">：</gydF4y2Baspan></span></span></span>输出层节点激活函数</gydF4y2Bap>  </blockquote> <p>在经典的反向传播的误差函数是均方误差</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> E</米我><米ostretchy="false"> （</米o><米我>X</gydF4y2Ba米我><米oseparator="true"> ，</米o><米我>θ.。</gydF4y2Ba米我><米ostretchy="false"> ）</米o><米o>＝</米o><米fr一个c> <mn> 1</米n> <mrow> <mn> 2</米n> <mi> N</米我></米row></米frac> <munderover> <mo> σ.</米o><米row><米我>我</米我><米o>＝</米o><米n> 1</米n> </mrow> <mi> N</米我></米underover> <msup> <mrow> <mo fence="true"> （</米o><米over accent="true"> <msub> <mi> y</米我><米我>我</米我></米sub> <mo> ＾</米o></米over> <mo> -</米o><米sub> <mi> y</米我><米我>我</米我></米sub> <mo fence="true"> ）</米o></米row><米n> 2</米n> </msup> <mo separator="true"> ，</米o></米row><一个nnotation encoding="application/x-tex"> e（x，\ theta）= \ frac {1} {2n} \ sum_ {i = 1} ^ n \ left（\ hat {y_i} - y_i \ over）^ 2，</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.07847em;">X</gydF4y2Baspan><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.106005em;vertical-align:-1.277669em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.32144em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">2</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.8283360000000002em;"><span style="top:-1.872331em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.050005em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.3000050000000005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.277669em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="minner"><span class="minner"><span class="mopen delimcenter" style="top:0em;">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mclose delimcenter" style="top:0em;">）</gydF4y2Baspan></span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.954008em;"><span style="top:-3.2029em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">2</gydF4y2Baspan></span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mpunct">，</gydF4y2Baspan></span></span></span></span></p> <p>在哪里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> y</米我><米我>我</米我></米sub> </mrow> <annotation encoding="application/x-tex"> 义</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.625em;vertical-align:-0.19444em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span>为输入 - 输出对的目标值<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo stretchy="false"> （</米o><米over accent="true"> <msub> <mi> x</米我><米我>我</米我></米sub> <mo> ⃗</米o></米over> <mo separator="true"> ，</米o><米sub> <mi> y</米我><米我>我</米我></米sub> <mo stretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> （\ {VEC} X_I，Y_I）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mopen">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan></span></span></span>和<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mover accent="true"> <msub> <mi> y</米我><米我>我</米我></米sub> <mo> ＾</米o></米over> </mrow> <annotation encoding="application/x-tex"> 帽子\ {y_i}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.8888799999999999em;vertical-align:-0.19444em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span></span></span></span>网络的计算输出是否与输入一致<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mover accent="true"> <msub> <mi> x</米我><米我>我</米我></米sub> <mo> ⃗</米o></米over> </mrow> <annotation encoding="application/x-tex"> \ vec {x_i}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.864em;vertical-align:-0.15em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span>．同样，也可以使用其他误差函数，但均方误差与反向传播的历史关联及其方便的数学性质使其成为学习方法的一个很好的选择。</gydF4y2Bap> </div> </div> <div id="deriving-the-gradients" class="anchor skill-heading collapsed" data-controller="app/wiki:expandOrCollapse"> <header class="section-header"> <span class="css-sprite-chevrons chevron"></span> <h2>派生的梯度</gydF4y2Bah2> </header> </div> <div class="section collapsed" id="section-deriving-the-gradients"> <div class="section-container"> <p>反向传播算法的推导相当简单。它是由微分学中链式法则和乘积法则的应用得出的。这些规则的应用依赖于激活函数的微分，这是不使用粗阶跃函数的原因之一(是不连续的，因此不可微)。</gydF4y2Bap> <p><strong>预赛</gydF4y2Bastrong></p> <p>在本节的其余部分，函数的衍生物<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> f</米我><米ostretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> f（x）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord mathdefault" style="margin-right:0.10764em;">f</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span>将被表示为<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msup> <mi> f</米我><米o米一个thvariant="normal"> ”</米o></米sup> <mo stretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> ˚F^ {\素}（x）的</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.001892em;vertical-align:-0.25em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.10764em;">f</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.751892em;"><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span>，使Sigmoid函数的衍生品是<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msup> <mi> σ.</米我><米o米一个thvariant="normal"> ”</米o></米sup> <mo stretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> \西格玛^ {\素}（x）的</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.001892em;vertical-align:-0.25em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">σ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.751892em;"><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span>．</gydF4y2Bap> <p>为了进一步简化数学，偏差<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> b</米我><米我>我</米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> b_i ^ k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.107772em;vertical-align:-0.258664em;"></span><span class="mord"><span class="mord mathdefault">b</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.258664em;"><span></span></span></span></span></span></span></span></span></span>节点<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 我</米我></米row><一个nnotation encoding="application/x-tex"> 我</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.65952em;vertical-align:0em;"></span><span class="mord mathdefault">我</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> k</米我></米row><一个nnotation encoding="application/x-tex"> k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.69444em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span>将被纳入重量<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米n> 0</米n> <mi> 我</米我></米row><米我> k</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> W_ {0I} ^ķ</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.107772em;vertical-align:-0.258664em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">0</gydF4y2Baspan><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.258664em;"><span></span></span></span></span></span></span></span></span></span>用的固定输出<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> o</米我><米n> 0</米n> <mrow> <mi> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mo> ＝</米o><米n> 1</米n> </mrow> <annotation encoding="application/x-tex"> O_0 ^ {K-1} = 1</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.1555469999999999em;vertical-align:-0.266308em;"></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8892389999999999em;"><span style="top:-2.433692em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">0</gydF4y2Baspan></span></span><span style="top:-3.1031310000000003em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.266308em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">1</gydF4y2Baspan></span></span></span>节点<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mn> 0</米n> </mrow> <annotation encoding="application/x-tex"> 0</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">0</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> <annotation encoding="application/x-tex"> K-1</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.77777em;vertical-align:-0.08333em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">1</gydF4y2Baspan></span></span></span>．因此，</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米n> 0</米n> <mi> 我</米我></米row><米我> k</米我></米subsup> <mo> ＝</米o><米subsup> <mi> b</米我><米我>我</米我><米我>k</gydF4y2Ba米我></米subsup> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> 我w_ {0} ^ k = b_i ^ k。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.146108em;vertical-align:-0.247em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.4530000000000003em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">0</gydF4y2Baspan><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.146108em;vertical-align:-0.247em;"></span><span class="mord"><span class="mord mathdefault">b</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p> <p>要知道这与原始公式是等价的，请注意</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米我>我</米我><米我>k</gydF4y2Ba米我></米subsup> <mo> ＝</米o><米subsup> <mi> b</米我><米我>我</米我><米我>k</gydF4y2Ba米我></米subsup> <mo> +</米o><米underover> <mo> σ.</米o><米row><米我>j</米我><米o>＝</米o><米n> 1</米n> </mrow> <msub> <mi> r</米我><米row><米我> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msub> </munderover> <msubsup> <mi> w</米我><米row><米我> j</米我><米我>我</米我></米row><米我> k</米我></米subsup> <msubsup> <mi> o</米我><米我>j</gydF4y2Ba米我><米row><米我> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mo> ＝</米o><米underover> <mo> σ.</米o><米row><米我>j</米我><米o>＝</米o><米n> 0</米n> </mrow> <msub> <mi> r</米我><米row><米我> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msub> </munderover> <msubsup> <mi> w</米我><米row><米我> j</米我><米我>我</米我></米row><米我> k</米我></米subsup> <msubsup> <mi> o</米我><米我>j</gydF4y2Ba米我><米row><米我> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mo separator="true"> ，</米o></米row><一个nnotation encoding="application/x-tex"> A_I ^ K = b_i ^ K + \ sum_ {J = 1} ^ {R_ {K-1}} W_ {吉} ^ķo_j ^ {K-1} = \ sum_ {J = 0} ^ {R_ {ķ-1}} {W_ジ} ^ķo_j ^ {K-1}，</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.146108em;vertical-align:-0.247em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.146108em;vertical-align:-0.247em;"></span><span class="mord"><span class="mord mathdefault">b</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">+</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span></span><span class="base"><span class="strut" style="height:3.1236990000000002em;vertical-align:-1.4137769999999998em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.7099220000000006em;"><span style="top:-1.872331em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.050005em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.35853em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02778em;">r</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.34480000000000005em;"><span style="top:-2.3487714285714287em;margin-left:-0.02778em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.21074999999999994em;"><span></span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.4137769999999998em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999999em;"><span style="top:-2.4330050000000005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.403103em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.1236990000000002em;vertical-align:-1.4137769999999998em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.7099220000000006em;"><span style="top:-1.872331em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">0</gydF4y2Baspan></span></span></span><span style="top:-3.050005em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.35853em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02778em;">r</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.34480000000000005em;"><span style="top:-2.3487714285714287em;margin-left:-0.02778em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.21074999999999994em;"><span></span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.4137769999999998em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999999em;"><span style="top:-2.4330050000000005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.403103em;"><span></span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan></span></span></span></span></p> <p>左边是原配方，右边是新配方。</gydF4y2Bap> <p>使用上面，反向传播的尝试相对于神经网络的权重最小化以下误差函数的符号：</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> E</米我><米ostretchy="false"> （</米o><米我>X</gydF4y2Ba米我><米oseparator="true"> ，</米o><米我>θ.。</gydF4y2Ba米我><米ostretchy="false"> ）</米o><米o>＝</米o><米fr一个c> <mn> 1</米n> <mrow> <mn> 2</米n> <mi> N</米我></米row></米frac> <munderover> <mo> σ.</米o><米row><米我>我</米我><米o>＝</米o><米n> 1</米n> </mrow> <mi> N</米我></米underover> <msup> <mrow> <mo fence="true"> （</米o><米over accent="true"> <msub> <mi> y</米我><米我>我</米我></米sub> <mo> ＾</米o></米over> <mo> -</米o><米sub> <mi> y</米我><米我>我</米我></米sub> <mo fence="true"> ）</米o></米row><米n> 2</米n> </msup> </mrow> <annotation encoding="application/x-tex"> E (X) \θ)= \压裂{1}{2 N} \ sum_ {i = 1} ^ N \离开(\帽子{y_i} - y_i \右)^ {2}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.07847em;">X</gydF4y2Baspan><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.106005em;vertical-align:-1.277669em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.32144em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">2</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.8283360000000002em;"><span style="top:-1.872331em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.050005em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.3000050000000005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.277669em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="minner"><span class="minner"><span class="mopen delimcenter" style="top:0em;">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mclose delimcenter" style="top:0em;">）</gydF4y2Baspan></span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.954008em;"><span style="top:-3.2029em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">2</gydF4y2Baspan></span></span></span></span></span></span></span></span></span></span></span></span></p> <p>通过计算，对于每一个重<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> <mo separator="true"> ，</米o></米row><一个nnotation encoding="application/x-tex"> w_ {ij} ^ k,</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan></span></span></span>的价值<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> </mrow> <annotation encoding="application/x-tex"> \压裂{\局部Ê} {\局部W_ {IJ} ^ķ}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.6015079999999997em;vertical-align:-0.7213999999999998em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8801079999999999em;"><span style="top:-2.60142em;"><span class="pstrut" style="height:3em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8408285714285714em;"><span style="top:-2.177714285714286em;margin-left:-0.02691em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-2.8448em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.46117142857142857em;"><span></span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.394em;"><span class="pstrut" style="height:3em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.7213999999999998em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span></span></span></span>．由于误差函数可被分解成的总和超过为每个单独的输入 - 输出对个体误差项，所述衍生物可以相对于每个输入 - 输出对在端部单独地和然后合并来计算（因为的总和的衍生物功能是各功能的衍生物）的总和：</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我><米ostretchy="false"> （</米o><米我>X</gydF4y2Ba米我><米oseparator="true"> ，</米o><米我>θ.。</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mo> ＝</米o><米fr一个c> <mn> 1</米n> <mi> N</米我></米fr一个c> <munderover> <mo> σ.</米o><米row><米我>d</米我><米o>＝</米o><米n> 1</米n> </mrow> <mi> N</米我></米underover> <mfrac> <mi mathvariant="normal"> ∂</米我><米row><米我米athvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mrow> <mo fence="true"> （</米o><米fr一个c> <mn> 1</米n> <mn> 2</米n> </mfrac> <msup> <mrow> <mo fence="true"> （</米o><米over accent="true"> <msub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> <mo> ＾</米o></米over> <mo> -</米o><米sub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> <mo fence="true"> ）</米o></米row><米n> 2</米n> </msup> <mo fence="true"> ）</米o></米row><米o>＝</米o><米fr一个c> <mn> 1</米n> <mi> N</米我></米fr一个c> <munderover> <mo> σ.</米o><米row><米我>d</米我><米o>＝</米o><米n> 1</米n> </mrow> <mi> N</米我></米underover> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米sub> <mi> E</米我><米我>d</gydF4y2Ba米我></米sub> </mrow> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \ frac {\ partial e（x，\ theta）} {\ partial w_ {ij} ^ k} = \ frac {1} {n} \ sum_ {d = 1} ^ n \ frac {\ partial} {\ partialw_ {ij} ^ k} \ left（\ frac {1} {2}左（\ hat {y_d} - y_d \ revion）^ {2} \右）= \ frac {1} {n} \ sum_ {d = 1} ^ n \ frac {\ partial e_d} {\ partial w_ {ij} ^ k}。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:2.56088em;vertical-align:-1.13388em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.427em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.07847em;">X</gydF4y2Baspan><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.1304490000000005em;vertical-align:-1.302113em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.32144em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.8283360000000002em;"><span style="top:-1.8478869999999998em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.0500049999999996em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.300005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.302113em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="minner"><span class="mopen delimcenter" style="top:0em;"><span class="delimsizing size3">（</gydF4y2Baspan></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.32144em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">2</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="minner"><span class="minner"><span class="mopen delimcenter" style="top:0em;">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mclose delimcenter" style="top:0em;">）</gydF4y2Baspan></span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.954008em;"><span style="top:-3.2029em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">2</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mclose delimcenter" style="top:0em;"><span class="delimsizing size3">）</gydF4y2Baspan></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.1304490000000005em;vertical-align:-1.302113em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.32144em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.8283360000000002em;"><span style="top:-1.8478869999999998em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.0500049999999996em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.300005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.302113em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.05764em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p> <p>因此，推导的目的，BP算法将涉及本身仅具有一个输入 - 输出对。一旦这被导出，在所有的输入 - 输出对的一般形式<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> X</米我></米row><一个nnotation encoding="application/x-tex"> X</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.07847em;">X</gydF4y2Baspan></span></span></span>可以由单独的梯度组合来生成。因此，问题的误差函数推导</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> E</米我><米o>＝</米o><米fr一个c> <mn> 1</米n> <mn> 2</米n> </mfrac> <msup> <mrow> <mo fence="true"> （</米o><米over accent="true"> <mi> y</米我><米o>＾</米o></米over> <mo> -</米o><米我>y</gydF4y2Ba米我><米ofence="true"> ）</米o></米row><米n> 2</米n> </msup> <mo separator="true"> ，</米o></米row><一个nnotation encoding="application/x-tex"> ^{2}，</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:2.00744em;vertical-align:-0.686em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.32144em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">2</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="minner"><span class="minner"><span class="mopen delimcenter" style="top:0em;">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.19444em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="mclose delimcenter" style="top:0em;">）</gydF4y2Baspan></span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.954008em;"><span style="top:-3.2029em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">2</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mpunct">，</gydF4y2Baspan></span></span></span></span></p> <p>其中，下标<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> d</米我></米row><一个nnotation encoding="application/x-tex"> d</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.69444em;vertical-align:0em;"></span><span class="mord mathdefault">d</gydF4y2Baspan></span></span></span>在<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> E</米我><米我>d</gydF4y2Ba米我></米sub> </mrow> <annotation encoding="application/x-tex"> 文e_d</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.83333em;vertical-align:-0.15em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.05764em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span>，<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mover accent="true"> <msub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> <mo> ＾</米o></米over> </mrow> <annotation encoding="application/x-tex"> \ {帽子} y_d</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.8888799999999999em;vertical-align:-0.19444em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span></span></span></span>，和<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> </mrow> <annotation encoding="application/x-tex"> y_d.</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.625em;vertical-align:-0.19444em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span>省略简化。</gydF4y2Bap> <p><strong>误差函数导数</gydF4y2Bastrong></p> <p>BackPropagation算法的推导通过将链规则应用于误差函数部分导数来开始</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mo> ＝</米o><米fr一个c> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> </mfrac> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mo separator="true"> ，</米o></米row><一个nnotation encoding="application/x-tex"> \ frac {\ partial e} {\ partial w_ {ij} ^ k} = \ frac {\ partial e} {\ filac {\ partial a_j ^ k} {\ partial w_ {ij} ^ k}，</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:2.50532em;vertical-align:-1.13388em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:2.76776em;vertical-align:-1.13388em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.63388em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.7847720000000002em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mpunct">，</gydF4y2Baspan></span></span></span></span></p> <p>在哪里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> a_j ^ k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>是节点的激活（积和加偏压）<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> j</米我></米row><一个nnotation encoding="application/x-tex"> j</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.85396em;vertical-align:-0.19444em;"></span><span class="mord mathdefault" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> k</米我></米row><一个nnotation encoding="application/x-tex"> k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.69444em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span>在将非线性激活函数（在这种情况下，SIGMOID函数）之前以产生输出。部分衍生物的分解基本上说，由于权重导致的误差函数的变化是误差函数变化的乘积<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> E</米我></米row><一个nnotation encoding="application/x-tex"> E</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span>由于激活<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> a_j ^ k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>激活的变化<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> a_j ^ k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>由于重量<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> W_ {IJ} ^ķ</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>．</gydF4y2Bap> <p>第一项通常被称为<gydF4y2Bastrong>错误</gydF4y2Bastrong>，其原因下面讨论。它记</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo> ≡</米o><米fr一个c> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> </mfrac> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \ delta_j ^ k \ Equiv \ frac {\ partial e} {\ partial a_j ^ k}。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.282216em;vertical-align:-0.383108em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">≡</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:2.50532em;vertical-align:-1.13388em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p> <p>第二项可由式求出<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> a_j ^ k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>以上：</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mo> ＝</米o><米fr一个c> <mi mathvariant="normal"> ∂</米我><米row><米我米athvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mrow> <mo fence="true"> （</米o><米underover> <mo> σ.</米o><米row><米我>l</米我><米o>＝</米o><米n> 0</米n> </mrow> <msub> <mi> r</米我><米row><米我> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msub> </munderover> <msubsup> <mi> w</米我><米row><米我> l</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> <msubsup> <mi> o</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mo fence="true"> ）</米o></米row><米o>＝</米o><米subsup> <mi> o</米我><米我>我</米我><米row><米我> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \压裂{\局部a_j-1K-} {\局部W_ {IJ} ^ķ} = \压裂{\局部} {\局部W_ {IJ} ^ķ} \左（\ sum_ {1 = 0} ^ {R_ {K-1}} {W_ LJ} ^ķo_l ^ {K-1} \右）= o_i ^ {K-1}。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:2.76776em;vertical-align:-1.13388em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.63388em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.7847720000000002em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.0521130000000003em;vertical-align:-1.302113em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="minner"><span class="mopen delimcenter" style="top:0em;"><span class="delimsizing size4">（</gydF4y2Baspan></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.7099220000000002em;"><span style="top:-1.8478869999999998em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">0</gydF4y2Baspan></span></span></span><span style="top:-3.0500049999999996em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.35853em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02778em;">r</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.34480000000000005em;"><span style="top:-2.3487714285714287em;margin-left:-0.02778em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.21074999999999994em;"><span></span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.302113em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.408561em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.2914389999999999em;"><span></span></span></span></span></span></span><span class="mclose delimcenter" style="top:0em;"><span class="delimsizing size4">）</gydF4y2Baspan></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.1661029999999997em;vertical-align:-0.266995em;"></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.433005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.266995em;"><span></span></span></span></span></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p> <p>因此，误差函数的部分导数<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> E</米我></米row><一个nnotation encoding="application/x-tex"> E</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span>相对于一个重量<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> W_ {IJ} ^ķ</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>是</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mo> ＝</米o><米subsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <msubsup> <mi> o</米我><米我>我</米我><米row><米我> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \压裂{\部分E}{\部分w_ {ij} ^ k} = \ delta_j ^ k o_i ^ {k - 1}。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:2.50532em;vertical-align:-1.13388em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.282216em;vertical-align:-0.383108em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.433005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.266995em;"><span></span></span></span></span></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p> <p>因此，权重的偏导数是误差项的积<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> \ delta_j-1K-</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>在节点<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> j</米我></米row><一个nnotation encoding="application/x-tex"> j</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.85396em;vertical-align:-0.19444em;"></span><span class="mord mathdefault" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> k</米我></米row><一个nnotation encoding="application/x-tex"> k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.69444em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span>，输出<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> o</米我><米我>我</米我><米row><米我> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> </mrow> <annotation encoding="application/x-tex"> o_i ^ {K-1}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.166103em;vertical-align:-0.276864em;"></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8892389999999999em;"><span style="top:-2.4231360000000004em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.1031310000000003em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.276864em;"><span></span></span></span></span></span></span></span></span></span>节点<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 我</米我></米row><一个nnotation encoding="application/x-tex"> 我</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.65952em;vertical-align:0em;"></span><span class="mord mathdefault">我</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> <annotation encoding="application/x-tex"> K-1</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.77777em;vertical-align:-0.08333em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">1</gydF4y2Baspan></span></span></span>．这使得直观的感觉，因为重量<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> W_ {IJ} ^ķ</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>连接节点的输出<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 我</米我></米row><一个nnotation encoding="application/x-tex"> 我</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.65952em;vertical-align:0em;"></span><span class="mord mathdefault">我</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> <annotation encoding="application/x-tex"> K-1</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.77777em;vertical-align:-0.08333em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">1</gydF4y2Baspan></span></span></span>到节点的输入<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> j</米我></米row><一个nnotation encoding="application/x-tex"> j</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.85396em;vertical-align:-0.19444em;"></span><span class="mord mathdefault" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> k</米我></米row><一个nnotation encoding="application/x-tex"> k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.69444em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span>在计算图中。</gydF4y2Bap> <p>的是要注意重要的是，上述的偏导数都被没有任何考虑一个特定的误差函数或激活函数的计算。然而，由于误差项<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> \ delta_j-1K-</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>仍然需要计算，并且依赖于误差函数<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> E</米我></米row><一个nnotation encoding="application/x-tex"> E</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span>在这一点上，有必要引入特定功能为这两种。如前面提到的，经典的反向传播使用均方误差函数（其是单输入 - 输出对的情况下的平方误差函数）和乙状结肠激活功能。</gydF4y2Bap> <p>所述误差的计算<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> \ delta_j ^ {k}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>将显示依赖于下一层中的错误术语的值。因此，错误术语的计算将向后向后向后向后地向后向后行进。这是BackProjagation或错误传播错误，获取其名称。</gydF4y2Bap> <p><strong>输出层</gydF4y2Bastrong></p> <p>从最后一层开始，反向传播尝试定义值<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米n> 1</米n> <mi> 米</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> m \ delta_1 ^</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.9425479999999999em;vertical-align:-0.24810799999999997em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.664392em;"><span style="top:-2.4518920000000004em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.24810799999999997em;"><span></span></span></span></span></span></span></span></span></span>，在哪里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 米</米我></米row><一个nnotation encoding="application/x-tex"> 米</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.43056em;vertical-align:0em;"></span><span class="mord mathdefault">米</gydF4y2Baspan></span></span></span>是最终的层<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo stretchy="false"> （</米o></米row><一个nnotation encoding="application/x-tex"> （</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mopen">（</gydF4y2Baspan></span></span></span>下标是<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mn> 1</米n> </mrow> <annotation encoding="application/x-tex"> 1</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">1</gydF4y2Baspan></span></span></span>并不是<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> j</米我></米row><一个nnotation encoding="application/x-tex"> j</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.85396em;vertical-align:-0.19444em;"></span><span class="mord mathdefault" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span>因为这个推导涉及到一个输出神经网络，所以只有一个输出节点<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> j</米我><米o>＝</米o><米n> 1</米n> <mo stretchy="false"> ）</米o><米我米一个thvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> j = 1）。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.85396em;vertical-align:-0.19444em;"></span><span class="mord mathdefault" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord">1</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan><span class="mord">．</gydF4y2Baspan></span></span></span>例如，一个四层神经网络将有<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 米</米我><米o>＝</米o><米n> 3.</米n> </mrow> <annotation encoding="application/x-tex"> m = 3</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.43056em;vertical-align:0em;"></span><span class="mord mathdefault">米</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">3.</gydF4y2Baspan></span></span></span>对于最后一层，<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 米</米我><米o>＝</米o><米n> 2</米n> </mrow> <annotation encoding="application/x-tex"> m = 2</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.43056em;vertical-align:0em;"></span><span class="mord mathdefault">米</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">2</gydF4y2Baspan></span></span></span>对于第二层，等等。表达错误功能<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> E</米我></米row><一个nnotation encoding="application/x-tex"> E</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span>在价值方面<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米n> 1</米n> <mi> 米</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> A_1 ^米</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.9125em;vertical-align:-0.24810799999999997em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.664392em;"><span style="top:-2.4518920000000004em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.24810799999999997em;"><span></span></span></span></span></span></span></span></span></span><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo fence="false"> （</米o></米row><一个nnotation encoding="application/x-tex"> \大(</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span></span></span></span>自从<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米n> 1</米n> <mi> 米</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> m \ delta_1 ^</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.9425479999999999em;vertical-align:-0.24810799999999997em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.664392em;"><span style="top:-2.4518920000000004em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.24810799999999997em;"><span></span></span></span></span></span></span></span></span></span>是一个关于偏衍生物<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米n> 1</米n> <mi> 米</米我></米subsup> <mo fence="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> a_1 ^ \大)</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.664392em;"><span style="top:-2.4518920000000004em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.24810799999999997em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span></span></span></span>给</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> E</米我><米o>＝</米o><米fr一个c> <mn> 1</米n> <mn> 2</米n> </mfrac> <msup> <mrow> <mo fence="true"> （</米o><米over accent="true"> <mi> y</米我><米o>＾</米o></米over> <mo> -</米o><米我>y</gydF4y2Ba米我><米ofence="true"> ）</米o></米row><米n> 2</米n> </msup> <mo> ＝</米o><米fr一个c> <mn> 1</米n> <mn> 2</米n> </mfrac> <mo fence="false"> （</米o><米sub> <mi> g</米我><米我>o</gydF4y2Ba米我></米sub> <mo stretchy="false"> （</米o><米subsup> <mi> 一个</米我><米n> 1</米n> <mi> 米</米我></米subsup> <mo stretchy="false"> ）</米o><米o>-</gydF4y2Ba米o><米我>y</gydF4y2Ba米我><米sup> <mo fence="false"> ）</米o><米n> 2</米n> </msup> <mo separator="true"> ，</米o></米row><一个nnotation encoding="application/x-tex"> E = \压裂{1} {2} \左（\帽子{Y} - Y \右）^ {2} = \压裂{1} {2} \大（g_o（A_1 ^米） - Y \大）^ {2}，</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:2.00744em;vertical-align:-0.686em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.32144em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">2</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="minner"><span class="minner"><span class="mopen delimcenter" style="top:0em;">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.19444em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="mclose delimcenter" style="top:0em;">）</gydF4y2Baspan></span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.954008em;"><span style="top:-3.2029em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">2</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:2.00744em;vertical-align:-0.686em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.32144em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">2</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.151392em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">o</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.7143919999999999em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span></span><span class="base"><span class="strut" style="height:1.404018em;vertical-align:-0.35001em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="mord"><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:1.054008em;"><span style="top:-3.3029em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">2</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan></span></span></span></span></p> <p>在哪里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> g</米我><米我>o</gydF4y2Ba米我></米sub> <mo stretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> g_o（x）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.151392em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">o</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span>是输出层的激活函数。</gydF4y2Bap> <p>因此，应用部分导数和使用链规则给出</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米n> 1</米n> <mi> 米</米我></米subsup> <mo> ＝</米o><米row><米ofence="true"> （</米o><米sub> <mi> g</米我><米n> 0</米n> </msub> <mo stretchy="false"> （</米o><米subsup> <mi> 一个</米我><米n> 1</米n> <mi> 米</米我></米subsup> <mo stretchy="false"> ）</米o><米o>-</gydF4y2Ba米o><米我>y</gydF4y2Ba米我><米ofence="true"> ）</米o></米row><米subsup> <mi> g</米我><米我>o</gydF4y2Ba米我><米o米一个thvariant="normal"> ”</米o></米subsup> <mo stretchy="false"> （</米o><米subsup> <mi> 一个</米我><米n> 1</米n> <mi> 米</米我></米subsup> <mo stretchy="false"> ）</米o><米o>＝</米o><米row><米ofence="true"> （</米o><米over accent="true"> <mi> y</米我><米o>＾</米o></米over> <mo> -</米o><米我>y</gydF4y2Ba米我><米ofence="true"> ）</米o></米row><米subsup> <mi> g</米我><米我>o</gydF4y2Ba米我><米o米一个thvariant="normal"> ”</米o></米subsup> <mo stretchy="false"> （</米o><米subsup> <mi> 一个</米我><米n> 1</米n> <mi> 米</米我></米subsup> <mo stretchy="false"> ）</米o><米我米一个thvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \ delta_1 ^ m = \离开(g_0 (a_1 ^ m) - y \右)g_o ^ {\ '} (a_1 ^ m) = \离开(\帽子{y} - y \右)g_o ^ {\ '} (a_1 ^米)。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.9613919999999999em;vertical-align:-0.247em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.7143919999999999em;"><span style="top:-2.4530000000000003em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.051892em;vertical-align:-0.25em;"></span><span class="minner"><span class="mopen delimcenter" style="top:0em;">（</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.30110799999999993em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">0</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.7143919999999999em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="mclose delimcenter" style="top:0em;">）</gydF4y2Baspan></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8018919999999999em;"><span style="top:-2.4530000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">o</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.7143919999999999em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.051892em;vertical-align:-0.25em;"></span><span class="minner"><span class="mopen delimcenter" style="top:0em;">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.19444em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="mclose delimcenter" style="top:0em;">）</gydF4y2Baspan></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8018919999999999em;"><span style="top:-2.4530000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">o</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.7143919999999999em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan><span class="mord">．</gydF4y2Baspan></span></span></span></span></p> <p>将其放在一起，误差函数的部分导数<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> E</米我></米row><一个nnotation encoding="application/x-tex"> E</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span>相对于最后一层的重量<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> 我</米我><米n> 1</米n> </mrow> <mi> 米</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> W_ {I1} ^米</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.923056em;vertical-align:-0.258664em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.664392em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.258664em;"><span></span></span></span></span></span></span></span></span></span>是</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米n> 1</米n> </mrow> <mi> 米</米我></米subsup> </mrow> </mfrac> <mo> ＝</米o><米subsup> <mi> δ.</米我><米n> 1</米n> <mi> 米</米我></米subsup> <msubsup> <mi> o</米我><米我>我</米我><米row><米我> 米</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mo> ＝</米o><米row><米ofence="true"> （</米o><米over accent="true"> <mi> y</米我><米o>＾</米o></米over> <mo> -</米o><米我>y</gydF4y2Ba米我><米ofence="true"> ）</米o></米row><米subsup> <mi> g</米我><米我>o</gydF4y2Ba米我><米o米一个thvariant="normal"> ”</米o></米subsup> <mo stretchy="false"> （</米o><米subsup> <mi> 一个</米我><米n> 1</米n> <mi> 米</米我></米subsup> <mo stretchy="false"> ）</米o><米text></mtext> <msubsup> <mi> o</米我><米我>我</米我><米row><米我> 米</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \压裂{\局部Ê} {\局部W_ {I1} ^ M} = \ delta_1 ^ M o_i ^ {M-1} = \左（\帽子{Y} -y \右）g_o ^ {\素}（A_1 ^ M）\ o_i ^ {M-1}。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:2.334304em;vertical-align:-0.9628639999999999em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.6461920000000001em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.27686399999999994em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.9628639999999999em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.131103em;vertical-align:-0.266995em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.7143919999999999em;"><span style="top:-2.4530000000000003em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8641079999999999em;"><span style="top:-2.433005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.266995em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.131103em;vertical-align:-0.266995em;"></span><span class="minner"><span class="mopen delimcenter" style="top:0em;">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.19444em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="mclose delimcenter" style="top:0em;">）</gydF4y2Baspan></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8018919999999999em;"><span style="top:-2.4530000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">o</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.7143919999999999em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan><span class="mspace"></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8641079999999999em;"><span style="top:-2.433005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.266995em;"><span></span></span></span></span></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p> <p><strong>隐藏层</gydF4y2Bastrong></p> <p>现在的问题是如何计算比输出层以外的层的偏导数。幸运的是，对于多元函数的链式法则就派上用场了一次。观察的误差项下列公式<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> \ delta_j-1K-</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mn> 1</米n> <mo> ≤.</米o><米我>k</gydF4y2Ba米我><米o><</gydF4y2Ba米o><米我>米</米我><米o>：</米o></米row><一个nnotation encoding="application/x-tex"> 1 \ lek \lt m:</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.78041em;vertical-align:-0.13597em;"></span><span class="mord">1</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">≤.</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.73354em;vertical-align:-0.0391em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel"><</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.43056em;vertical-align:0em;"></span><span class="mord mathdefault">米</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">：</gydF4y2Baspan></span></span></span></p> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo> ＝</米o><米fr一个c> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> </mfrac> <mo> ＝</米o><米underover> <mo> σ.</米o><米row><米我>l</米我><米o>＝</米o><米n> 1</米n> </mrow> <msup> <mi> r</米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msup> </munderover> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> 一个</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> </mrow> </mfrac> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> 一个</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> </mrow> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> </mfrac> <mo separator="true"> ，</米o></米row><一个nnotation encoding="application/x-tex"> \ delta_j ^ k = \ frac {\ partial e} {\ partial a_j ^ k} = \ sum_ {l = 1} ^ {r ^ {k + 1}} \ frac {\ partial e} {\ partial a_l ^ {k + 1}} \ frac {\ partial a_l ^ {k + 1}} {\ partial a_j ^ k}，</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.282216em;vertical-align:-0.383108em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:2.50532em;vertical-align:-1.13388em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.301038em;vertical-align:-1.302113em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.998925em;"><span style="top:-1.8478869999999998em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.0500049999999996em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.300005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02778em;">r</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.9270285714285714em;"><span style="top:-2.931em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.302113em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.2207610000000004em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8892389999999999em;"><span style="top:-2.3986920000000005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.1031310000000003em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.3013079999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.0805469999999997em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.5805469999999997em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.6913080000000003em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8892389999999999em;"><span style="top:-2.3986920000000005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.1031310000000003em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.3013079999999999em;"><span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mpunct">，</gydF4y2Baspan></span></span></span></span></p> <p>在哪里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> l</米我></米row><一个nnotation encoding="application/x-tex"> l</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.69444em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span></span>范围从<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mn> 1</米n> </mrow> <annotation encoding="application/x-tex"> 1</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">1</gydF4y2Baspan></span></span></span>到<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msup> <mi> r</米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msup> </mrow> <annotation encoding="application/x-tex"> R 2 {K + 1}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.8491079999999999em;vertical-align:0em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02778em;">r</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.8491079999999999em;"><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span></span></span></span></span></span></span></span>（下一层中的节点数）。注意，因为偏置输入<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> o</米我><米n> 0</米n> <mi> k</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> O_0-1K-</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.097216em;vertical-align:-0.24810799999999997em;"></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.4518920000000004em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">0</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.24810799999999997em;"><span></span></span></span></span></span></span></span></span></span>对应于<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米n> 0</米n> <mi> j</米我></米row><米row> <mi> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> </mrow> <annotation encoding="application/x-tex"> j w_ {0} ^ {k + 1}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.3022109999999998em;vertical-align:-0.412972em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8892389999999999em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">0</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.1031310000000003em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.412972em;"><span></span></span></span></span></span></span></span></span></span>是固定的，其值不依赖于上一层的输出，从而依赖于<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> l</米我></米row><一个nnotation encoding="application/x-tex"> l</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.69444em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span></span>不承担价值吗<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mn> 0</米n> </mrow> <annotation encoding="application/x-tex"> 0</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">0</gydF4y2Baspan></span></span></span>．</gydF4y2Bap> <p>代入错误项<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> </mrow> <annotation encoding="application/x-tex"> \ delta_l ^ {K + 1}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.1905469999999998em;vertical-align:-0.3013079999999999em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8892389999999999em;"><span style="top:-2.3986920000000005em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.1031310000000003em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.3013079999999999em;"><span></span></span></span></span></span></span></span></span></span>给出如下方程:</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo> ＝</米o><米underover> <mo> σ.</米o><米row><米我>l</米我><米o>＝</米o><米n> 1</米n> </mrow> <msup> <mi> r</米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msup> </munderover> <msubsup> <mi> δ.</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> 一个</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> </mrow> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> </mfrac> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \ delta_j ^ k = \ sum_ {l = 1} ^ {r ^ {k + 1}} \ delta_l ^ {k + 1} \ frac {\ partial a_l ^ {k + 1}} {k + 1}} {k部分a_j ^ k}．</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.282216em;vertical-align:-0.383108em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.301038em;vertical-align:-1.302113em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.998925em;"><span style="top:-1.8478869999999998em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.0500049999999996em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.300005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02778em;">r</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.9270285714285714em;"><span style="top:-2.931em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.302113em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.408561em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.2914389999999999em;"><span></span></span></span></span></span></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.5805469999999997em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.6913080000000003em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8892389999999999em;"><span style="top:-2.3986920000000005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.1031310000000003em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.3013079999999999em;"><span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p> <p>记住的定义<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> </mrow> <annotation encoding="application/x-tex"> a_l ^ {k + 1}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.1905469999999998em;vertical-align:-0.3013079999999999em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8892389999999999em;"><span style="top:-2.3986920000000005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.1031310000000003em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.3013079999999999em;"><span></span></span></span></span></span></span></span></span></span></p> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mo> ＝</米o><米underover> <mo> σ.</米o><米row><米我>j</米我><米o>＝</米o><米n> 1</米n> </mrow> <msup> <mi> r</米我><米我>k</gydF4y2Ba米我></米sup> </munderover> <msubsup> <mi> w</米我><米row><米我> j</米我><米我>l</gydF4y2Ba米我></米row><米row> <mi> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mi> g</米我><米ofence="false"> （</米o><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo fence="false"> ）</米o><米oseparator="true"> ，</米o></米row><一个nnotation encoding="application/x-tex"> a_l ^ {k + 1} = \ sum_ {j = 1} ^ {r ^ k} w_ {jl} ^ {k + 1} g \大(a_j ^ k \大),</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.1905469999999996em;vertical-align:-0.2914389999999999em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.408561em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.2914389999999999em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.4127020000000003em;vertical-align:-1.4137769999999998em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.9989250000000003em;"><span style="top:-1.872331em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.050005em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.3000050000000005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02778em;">r</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.9270285714285713em;"><span style="top:-2.931em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.4137769999999998em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999999em;"><span style="top:-2.4085610000000006em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4275469999999999em;"><span></span></span></span></span></span></span><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span><span class="mpunct">，</gydF4y2Baspan></span></span></span></span></p> <p>在哪里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> g</米我><米ostretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> G（X）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span>为隐含层的激活函数，</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> 一个</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> </mrow> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> </mfrac> <mo> ＝</米o><米subsup> <mi> w</米我><米row><米我> j</米我><米我>l</gydF4y2Ba米我></米row><米row> <mi> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <msup> <mi> g</米我><米o米一个thvariant="normal"> ”</米o></米sup> <mo fence="false"> （</米o><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo fence="false"> ）</米o><米我米一个thvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \ frac {\ partial a_l ^ {k + 1}} {\ partial a_j ^ k} = w_ {jl} ^ {k + 1} g ^ {\ prime} \ big（a_j ^ k \ big）。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:2.7144269999999997em;vertical-align:-1.13388em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.5805469999999997em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.6913080000000003em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8892389999999999em;"><span style="top:-2.3986920000000005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.1031310000000003em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.3013079999999999em;"><span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.326655em;vertical-align:-0.4275469999999999em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999999em;"><span style="top:-2.4085610000000006em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4275469999999999em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.801892em;"><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p> <p>将其代入上面的方程，得到误差项的最终方程<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> \ delta_j-1K-</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>在隐藏的层中，称为<gydF4y2Bastrong>反向传播公式</gydF4y2Bastrong>：</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo> ＝</米o><米underover> <mo> σ.</米o><米row><米我>l</米我><米o>＝</米o><米n> 1</米n> </mrow> <msup> <mi> r</米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msup> </munderover> <msubsup> <mi> δ.</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <msubsup> <mi> w</米我><米row><米我> j</米我><米我>l</gydF4y2Ba米我></米row><米row> <mi> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <msup> <mi> g</米我><米o米一个thvariant="normal"> ”</米o></米sup> <mo fence="false"> （</米o><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo fence="false"> ）</米o><米o>＝</米o><米sup> <mi> g</米我><米o米一个thvariant="normal"> ”</米o></米sup> <mo fence="false"> （</米o><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo fence="false"> ）</米o><米underover> <mo> σ.</米o><米row><米我>l</米我><米o>＝</米o><米n> 1</米n> </mrow> <msup> <mi> r</米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msup> </munderover> <msubsup> <mi> w</米我><米row><米我> j</米我><米我>l</gydF4y2Ba米我></米row><米row> <mi> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <msubsup> <mi> δ.</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \ delta_j ^ K = \ sum_ {1 = 1} ^ {R ^ {K + 1}} \ delta_l ^ {K + 1} W_ {JL} ^ {K + 1} G ^ {\素} \大（a_j-1K-\大）= G ^ {\素} \大（a_j-1K-\大）\ sum_ {1 = 1} ^ {R ^ {K + 1}} W_ {JL} ^ {K + 1} \ delta_l^ {K + 1}。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.282216em;vertical-align:-0.383108em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.301038em;vertical-align:-1.302113em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.998925em;"><span style="top:-1.8478869999999998em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.0500049999999996em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.300005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02778em;">r</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.9270285714285714em;"><span style="top:-2.931em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.302113em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.408561em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.2914389999999999em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999999em;"><span style="top:-2.4085610000000006em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4275469999999999em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.801892em;"><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.301038em;vertical-align:-1.302113em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.801892em;"><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.998925em;"><span style="top:-1.8478869999999998em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.0500049999999996em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.300005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02778em;">r</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.9270285714285714em;"><span style="top:-2.931em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.302113em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999999em;"><span style="top:-2.4085610000000006em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4275469999999999em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.408561em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.2914389999999999em;"><span></span></span></span></span></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p> <p>将其放在一起，误差函数的部分导数<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> E</米我></米row><一个nnotation encoding="application/x-tex"> E</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span>相对于隐藏层的权重<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> W_ {IJ} ^ķ</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>为<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mn> 1</米n> <mo> ≤.</米o><米我>k</gydF4y2Ba米我><米o><</gydF4y2Ba米o><米我>米</米我></米row><一个nnotation encoding="application/x-tex"> 1 \文件ķ\ LT米</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.78041em;vertical-align:-0.13597em;"></span><span class="mord">1</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">≤.</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.73354em;vertical-align:-0.0391em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel"><</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.43056em;vertical-align:0em;"></span><span class="mord mathdefault">米</gydF4y2Baspan></span></span></span>是</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mo> ＝</米o><米subsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <msubsup> <mi> o</米我><米我>我</米我><米row><米我> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mo> ＝</米o><米sup> <mi> g</米我><米o米一个thvariant="normal"> ”</米o></米sup> <mo fence="false"> （</米o><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo fence="false"> ）</米o><米subsup> <mi> o</米我><米我>我</米我><米row><米我> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <munderover> <mo> σ.</米o><米row><米我>l</米我><米o>＝</米o><米n> 1</米n> </mrow> <msup> <mi> r</米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msup> </munderover> <msubsup> <mi> w</米我><米row><米我> j</米我><米我>l</gydF4y2Ba米我></米row><米row> <mi> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <msubsup> <mi> δ.</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \ frac {\ partial e} {\ partial w_ {ij} ^ k} = \ delta_j ^ k o_i ^ {k-1} = g ^ {\ prime} \ big（a_j ^ k \ big）o_i ^ {k-1} \ sum_ {l = 1} ^ {r ^ {k + 1}} w_ {jl} ^ {k + 1} \ delta_l ^ {k + 1}。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:2.50532em;vertical-align:-1.13388em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.282216em;vertical-align:-0.383108em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.433005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.266995em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.301038em;vertical-align:-1.302113em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.801892em;"><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.433005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.266995em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.998925em;"><span style="top:-1.8478869999999998em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.0500049999999996em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.300005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02778em;">r</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.9270285714285714em;"><span style="top:-2.931em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.302113em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999999em;"><span style="top:-2.4085610000000006em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4275469999999999em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.408561em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.2914389999999999em;"><span></span></span></span></span></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p> <p><strong>反向传播作为反向计算</gydF4y2Bastrong></p> <p>此等式是BackProjagation获取其名称的位置。即，错误<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> \ delta_j-1K-</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>在层<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> k</米我></米row><一个nnotation encoding="application/x-tex"> k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.69444em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span>取决于错误<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>k</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> </mrow> <annotation encoding="application/x-tex"> \ delta_k ^ {K + 1}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.1905469999999998em;vertical-align:-0.3013079999999999em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8892389999999999em;"><span style="top:-2.3986920000000005em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span><span style="top:-3.1031310000000003em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.3013079999999999em;"><span></span></span></span></span></span></span></span></span></span>下一层<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> <annotation encoding="application/x-tex"> K + 1</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.77777em;vertical-align:-0.08333em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">+</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">1</gydF4y2Baspan></span></span></span>．因此，错误倒灌，从最后层到第一层。所有需要的是基于计算的输出来计算第一误差项<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mover accent="true"> <mi> y</米我><米o>＾</米o></米over> <mo> ＝</米o><米sub> <mi> g</米我><米我>o</gydF4y2Ba米我></米sub> <mo stretchy="false"> （</米o><米subsup> <mi> 一个</米我><米n> 1</米n> <mi> 米</米我></米subsup> <mo stretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> 帽子\ {y} = g_o (a_1 ^)</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.8888799999999999em;vertical-align:-0.19444em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.19444em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.151392em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">o</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.664392em;"><span style="top:-2.4518920000000004em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.24810799999999997em;"><span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan></span></span></span>和目标输出<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> y</米我></米row><一个nnotation encoding="application/x-tex"> y</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.625em;vertical-align:-0.19444em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan></span></span></span>．然后，前一层的误差项通过执行乘积和来计算<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo fence="false"> （</米o></米row><一个nnotation encoding="application/x-tex"> \大(</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span></span></span></span>加权的<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> j</米我><米我>l</gydF4y2Ba米我></米row><米row> <mi> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mo fence="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> w_ {jl} ^ {k + 1} \ big）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.3266549999999997em;vertical-align:-0.4374159999999999em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8892389999999999em;"><span style="top:-2.3986920000000005em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span></span><span style="top:-3.1031310000000003em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4374159999999999em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span></span></span></span>的下一个层中的误差项和通过缩放它<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msup> <mi> g</米我><米o米一个thvariant="normal"> ”</米o></米sup> <mo fence="false"> （</米o><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo fence="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> G ^ {\素} \大（a_j-1K-\大）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.244772em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.751892em;"><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span></span></span></span>，重复直到达到输入层。</gydF4y2Bap> <p>这种倒退的错误的传播是非常相似的，计算神经网络的输出正向计算。因此，计算输出通常被称为<gydF4y2Bastrong>发展阶段</gydF4y2Bastrong>在计算误差时，常称项和导数<gydF4y2Bastrong>向后阶段</gydF4y2Bastrong>．当向前移动时，输入被反复地重新组合<gydF4y2Baem>第一层到最后一个</gydF4y2Baem>乘积和取决于权重<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> W_ {IJ} ^ķ</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>和通过非线性激活函数变换<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> g</米我><米ostretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> G（X）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span>和<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> g</米我><米我>o</gydF4y2Ba米我></米sub> <mo stretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> g_o（x）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.151392em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">o</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span>．在向后方向上，“输入”是最终层的错误术语，其重复从中重新组合<gydF4y2Baem>最后层到所述第一</gydF4y2Baem>乘积和取决于权重<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> j</米我><米我>l</gydF4y2Ba米我></米row><米row> <mi> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> </mrow> <annotation encoding="application/x-tex"> w_ {jl} ^ {k + 1}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.3266549999999997em;vertical-align:-0.4374159999999999em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8892389999999999em;"><span style="top:-2.3986920000000005em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span></span><span style="top:-3.1031310000000003em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4374159999999999em;"><span></span></span></span></span></span></span></span></span></span>和通过非线性缩放因子转化<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> g</米我><米我>o</gydF4y2Ba米我><米o米一个thvariant="normal"> ”</米o></米subsup> <mo fence="false"> （</米o><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>米</米我></米subsup> <mo fence="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> g_o ^ {\黄金} \大（a_j ^ M \大）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.244772em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.751892em;"><span style="top:-2.4530000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">o</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.664392em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span></span></span></span>和<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msup> <mi> g</米我><米o米一个thvariant="normal"> ”</米o></米sup> <mo fence="false"> （</米o><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo fence="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> G ^ {\素} \大（a_j-1K-\大）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.244772em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.751892em;"><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span></span></span></span>．</gydF4y2Bap> <p>此外，因为用于向后相位的计算依赖于激活<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> a_j ^ k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>和输出<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> o</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> o_j-1K-</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>在前面的（对于所有层中的非误差项）和下一个层（隐藏层中的误差项）的节点的，所有这些值必须被计算的向后阶段之前可以开始。因此，前向相对于之前的梯度下降每次迭代后向相。在前进阶段，激活<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> a_j ^ k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>和输出<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> o</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> o_j-1K-</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>将被记住在向后阶段使用。一旦向后阶段完成并且已知部分衍生物，重量<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo fence="false"> （</米o></米row><一个nnotation encoding="application/x-tex"> \大(</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span></span></span></span>和相关的偏见<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> b</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo> ＝</米o><米subsup> <mi> w</米我><米row><米n> 0</米n> <mi> j</米我></米row><米我> k</米我></米subsup> <mo fence="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> j b_j ^ k = w_ {0} ^ k \大)</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault">b</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.244772em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">0</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span></span></span></span>可以通过梯度下降来更新。重复该过程，直到找到局部最小值或满足收敛标准。</gydF4y2Bap> </div> </div> <div id="the-backpropagation-algorithm" class="anchor skill-heading collapsed" data-controller="app/wiki:expandOrCollapse"> <header class="section-header"> <span class="css-sprite-chevrons chevron"></span> <h2>反向传播算法</gydF4y2Bah2> </header> </div> <div class="section collapsed" id="section-the-backpropagation-algorithm"> <div class="section-container"> <p>使用标题为标题的正式定义的部分中定义的术语和在标题为渐变的部分中导出的方程式，BackProjagation算法取决于以下五个方程：</gydF4y2Bap> <blockquote class="definition"> <p>对于部分的衍生物，</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米sub> <mi> E</米我><米我>d</gydF4y2Ba米我></米sub> </mrow> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mo> ＝</米o><米subsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <msubsup> <mi> o</米我><米我>我</米我><米row><米我> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \ frac {\ partial e_d} {\ partial w_ {ij} ^ k} = \ delta_j ^ k o_i ^ {k-1}。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:2.50532em;vertical-align:-1.13388em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.05764em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.282216em;vertical-align:-0.383108em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.433005em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">-</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.266995em;"><span></span></span></span></span></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p>  </blockquote> <blockquote class="definition"> <p>对于最终图层的错误术语，</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米n> 1</米n> <mi> 米</米我></米subsup> <mo> ＝</米o><米subsup> <mi> g</米我><米我>o</gydF4y2Ba米我><米o米一个thvariant="normal"> ”</米o></米subsup> <mo stretchy="false"> （</米o><米subsup> <mi> 一个</米我><米n> 1</米n> <mi> 米</米我></米subsup> <mo stretchy="false"> ）</米o><米row><米ofence="true"> （</米o><米over accent="true"> <msub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> <mo> ＾</米o></米over> <mo> -</米o><米sub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> <mo fence="true"> ）</米o></米row><米我米athvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \ delta_1 ^ m = g_o ^ {\ '} (a_1 ^ m) \左(\帽子{y_d} -y_d \右)。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.9613919999999999em;vertical-align:-0.247em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.7143919999999999em;"><span style="top:-2.4530000000000003em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.051892em;vertical-align:-0.25em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8018919999999999em;"><span style="top:-2.4530000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">o</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.7143919999999999em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="minner"><span class="mopen delimcenter" style="top:0em;">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mclose delimcenter" style="top:0em;">）</gydF4y2Baspan></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p>  </blockquote> <blockquote class="definition"> <p>对于隐藏的图层错误术语，</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo> ＝</米o><米sup> <mi> g</米我><米o米一个thvariant="normal"> ”</米o></米sup> <mo fence="false"> （</米o><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo fence="false"> ）</米o><米underover> <mo> σ.</米o><米row><米我>l</米我><米o>＝</米o><米n> 1</米n> </mrow> <msup> <mi> r</米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msup> </munderover> <msubsup> <mi> w</米我><米row><米我> j</米我><米我>l</gydF4y2Ba米我></米row><米row> <mi> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <msubsup> <mi> δ.</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \ delta_j ^ K = G ^ {\素} \大（a_j-1K-\大）\ sum_ {1 = 1} ^ {R ^ {K + 1}} W_ {JL} ^ {K + 1} \ delta_l ^{K + 1}。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.282216em;vertical-align:-0.383108em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.301038em;vertical-align:-1.302113em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.801892em;"><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.998925em;"><span style="top:-1.8478869999999998em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.0500049999999996em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.300005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02778em;">r</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.9270285714285714em;"><span style="top:-2.931em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.302113em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999999em;"><span style="top:-2.4085610000000006em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4275469999999999em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.408561em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.2914389999999999em;"><span></span></span></span></span></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p>  </blockquote> <blockquote class="definition"> <p>用于组合每个输入输出对的部分衍生工具，</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我><米ostretchy="false"> （</米o><米我>X</gydF4y2Ba米我><米oseparator="true"> ，</米o><米我>θ.。</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mo> ＝</米o><米fr一个c> <mn> 1</米n> <mi> N</米我></米fr一个c> <munderover> <mo> σ.</米o><米row><米我>d</米我><米o>＝</米o><米n> 1</米n> </mrow> <mi> N</米我></米underover> <mfrac> <mi mathvariant="normal"> ∂</米我><米row><米我米athvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mrow> <mo fence="true"> （</米o><米fr一个c> <mn> 1</米n> <mn> 2</米n> </mfrac> <msup> <mrow> <mo fence="true"> （</米o><米over accent="true"> <msub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> <mo> ＾</米o></米over> <mo> -</米o><米sub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> <mo fence="true"> ）</米o></米row><米n> 2</米n> </msup> <mo fence="true"> ）</米o></米row><米o>＝</米o><米fr一个c> <mn> 1</米n> <mi> N</米我></米fr一个c> <munderover> <mo> σ.</米o><米row><米我>d</米我><米o>＝</米o><米n> 1</米n> </mrow> <mi> N</米我></米underover> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米sub> <mi> E</米我><米我>d</gydF4y2Ba米我></米sub> </mrow> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \ frac {\ partial e（x，\ theta）} {\ partial w_ {ij} ^ k} = \ frac {1} {n} \ sum_ {d = 1} ^ n \ frac {\ partial} {\ partialw_ {ij} ^ k} \ left（\ frac {1} {2}左（\ hat {y_d} - y_d \ revion）^ {2} \右）= \ frac {1} {n} \ sum_ {d = 1} ^ n \ frac {\ partial e_d} {\ partial w_ {ij} ^ k}。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:2.56088em;vertical-align:-1.13388em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.427em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.07847em;">X</gydF4y2Baspan><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.1304490000000005em;vertical-align:-1.302113em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.32144em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.8283360000000002em;"><span style="top:-1.8478869999999998em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.0500049999999996em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.300005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.302113em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="minner"><span class="mopen delimcenter" style="top:0em;"><span class="delimsizing size3">（</gydF4y2Baspan></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.32144em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">2</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="minner"><span class="minner"><span class="mopen delimcenter" style="top:0em;">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mclose delimcenter" style="top:0em;">）</gydF4y2Baspan></span><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.954008em;"><span style="top:-3.2029em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">2</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mclose delimcenter" style="top:0em;"><span class="delimsizing size3">）</gydF4y2Baspan></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.1304490000000005em;vertical-align:-1.302113em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.32144em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.8283360000000002em;"><span style="top:-1.8478869999999998em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.0500049999999996em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.300005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.302113em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.05764em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p>  </blockquote> <blockquote class="definition"> <p>更新权重，</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi mathvariant="normal"> δ.</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> <mo> ＝</米o><米o>-</gydF4y2Ba米o><米我>α.。</gydF4y2Ba米我><米fr一个c> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我><米ostretchy="false"> （</米o><米我>X</gydF4y2Ba米我><米oseparator="true"> ，</米o><米我>θ.。</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \德尔塔W_ {IJ} ^ K = - \阿尔法\压裂{\部分E（X，\ THETA）} {\局部W_ {IJ} ^ķ}。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.282216em;vertical-align:-0.383108em;"></span><span class="mord">δ.</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:2.56088em;vertical-align:-1.13388em;"></span><span class="mord">-</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.0037em;">α.</gydF4y2Baspan><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.427em;"><span style="top:-2.279092em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.830908em;"><span style="top:-2.4231360000000004em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.0448000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4129719999999999em;"><span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.07847em;">X</gydF4y2Baspan><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord mathdefault" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.13388em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p>  </blockquote> <p><strong>一般的算法</gydF4y2Bastrong></p> <p>反向传播算法进行在下面的步骤，假定合适的学习速率<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> α.</米我></米row><一个nnotation encoding="application/x-tex"> \α</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.43056em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.0037em;">α.</gydF4y2Baspan></span></span></span>参数的随机初始化<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> <mo> ：</米o></米row><一个nnotation encoding="application/x-tex"> w_ {ij} ^ k：</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">：</gydF4y2Baspan></span></span></span></p> <blockquote class="definition"> <p>1）<gydF4y2Bastrong>计算正相位</gydF4y2Bastrong>对于每个输入输出对<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo stretchy="false"> （</米o><米over accent="true"> <msub> <mi> x</米我><米我>d</gydF4y2Ba米我></米sub> <mo> ⃗</米o></米over> <mo separator="true"> ，</米o><米sub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> <mo stretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> （\ vec {x_d}，y_d）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mopen">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan></span></span></span>并存储结果<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mover accent="true"> <msub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> <mo> ＾</米o></米over> </mrow> <annotation encoding="application/x-tex"> \ {帽子} y_d</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.8888799999999999em;vertical-align:-0.19444em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span></span></span></span>，<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> a_j ^ k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>，和<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> o</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> o_j-1K-</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>为每个节点<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> j</米我></米row><一个nnotation encoding="application/x-tex"> j</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.85396em;vertical-align:-0.19444em;"></span><span class="mord mathdefault" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> k</米我></米row><一个nnotation encoding="application/x-tex"> k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.69444em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span>通过从图层进行<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mn> 0</米n> </mrow> <annotation encoding="application/x-tex"> 0</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">0</gydF4y2Baspan></span></span></span>，输入层，到图层<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 米</米我></米row><一个nnotation encoding="application/x-tex"> 米</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.43056em;vertical-align:0em;"></span><span class="mord mathdefault">米</gydF4y2Baspan></span></span></span>，输出层。</gydF4y2Bap> <p>2）<gydF4y2Bastrong>计算落后阶段</gydF4y2Bastrong>对于每个输入输出对<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo stretchy="false"> （</米o><米over accent="true"> <msub> <mi> x</米我><米我>d</gydF4y2Ba米我></米sub> <mo> ⃗</米o></米over> <mo separator="true"> ，</米o><米sub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> <mo stretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> （\ vec {x_d}，y_d）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mopen">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan></span></span></span>并存储结果<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米sub> <mi> E</米我><米我>d</gydF4y2Ba米我></米sub> </mrow> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> </mrow> <annotation encoding="application/x-tex"> \压裂{\局部E_D} {\局部W_ {IJ} ^ķ}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.6233679999999997em;vertical-align:-0.7213999999999998em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.9019679999999999em;"><span style="top:-2.60142em;"><span class="pstrut" style="height:3em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8408285714285714em;"><span style="top:-2.177714285714286em;margin-left:-0.02691em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-2.8448em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.46117142857142857em;"><span></span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.41586em;"><span class="pstrut" style="height:3em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.3448em;"><span style="top:-2.3487714285714287em;margin-left:-0.05764em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15122857142857138em;"><span></span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.7213999999999998em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span></span></span></span>对于每种重量<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> W_ {IJ} ^ķ</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>连接节点<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 我</米我></米row><一个nnotation encoding="application/x-tex"> 我</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.65952em;vertical-align:0em;"></span><span class="mord mathdefault">我</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> k</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> <annotation encoding="application/x-tex"> K-1</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.77777em;vertical-align:-0.08333em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">1</gydF4y2Baspan></span></span></span>节点<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> j</米我></米row><一个nnotation encoding="application/x-tex"> j</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.85396em;vertical-align:-0.19444em;"></span><span class="mord mathdefault" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span>在层里<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> k</米我></米row><一个nnotation encoding="application/x-tex"> k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.69444em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span>通过从图层进行<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> 米</米我></米row><一个nnotation encoding="application/x-tex"> 米</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.43056em;vertical-align:0em;"></span><span class="mord mathdefault">米</gydF4y2Baspan></span></span></span>，输出层，到图层<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mn> 1</米n> </mrow> <annotation encoding="application/x-tex"> 1</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">1</gydF4y2Baspan></span></span></span>中，输入层。</gydF4y2Bap> <p><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mspace width="1em"></mspace> <mspace width="1em"></mspace> </mrow> <annotation encoding="application/x-tex"> \四\四</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0em;vertical-align:0em;"></span><span class="mspace" style="margin-right:1em;"></span><span class="mspace" style="margin-right:1em;"></span></span></span></span>a)评估最后一层的误差项<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米n> 1</米n> <mi> 米</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> m \ delta_1 ^</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.9425479999999999em;vertical-align:-0.24810799999999997em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.664392em;"><span style="top:-2.4518920000000004em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.24810799999999997em;"><span></span></span></span></span></span></span></span></span></span>通过使用第二方程。<br><gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mspace width="1em"></mspace> <mspace width="1em"></mspace> </mrow> <annotation encoding="application/x-tex"> \四\四</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0em;vertical-align:0em;"></span><span class="mspace" style="margin-right:1em;"></span><span class="mspace" style="margin-right:1em;"></span></span></span></span>b)反向传播隐藏层的错误项<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> \ delta_j-1K-</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>，从最终隐藏层向后工作<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> k</米我><米o>＝</米o><米我>米</米我><米o>-</gydF4y2Ba米o><米n> 1</米n> </mrow> <annotation encoding="application/x-tex"> k = m-1</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.69444em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.66666em;vertical-align:-0.08333em;"></span><span class="mord mathdefault">米</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">1</gydF4y2Baspan></span></span></span>，通过反复使用第三个方程。<br><gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mspace width="1em"></mspace> <mspace width="1em"></mspace> </mrow> <annotation encoding="application/x-tex"> \四\四</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0em;vertical-align:0em;"></span><span class="mspace" style="margin-right:1em;"></span><span class="mspace" style="margin-right:1em;"></span></span></span></span>c)求个别误差的偏导数<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msub> <mi> E</米我><米我>d</gydF4y2Ba米我></米sub> </mrow> <annotation encoding="application/x-tex"> 文e_d</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.83333em;vertical-align:-0.15em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.05764em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span>关于<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> W_ {IJ} ^ķ</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>通过使用第一个等式。</gydF4y2Bap> <p>3）<gydF4y2Bastrong>结合各个梯度</gydF4y2Bastrong>对于每个输入输出对<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米sub> <mi> E</米我><米我>d</gydF4y2Ba米我></米sub> </mrow> <mrow> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> </mrow> <annotation encoding="application/x-tex"> \压裂{\局部E_D} {\局部W_ {IJ} ^ķ}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.6233679999999997em;vertical-align:-0.7213999999999998em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.9019679999999999em;"><span style="top:-2.60142em;"><span class="pstrut" style="height:3em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8408285714285714em;"><span style="top:-2.177714285714286em;margin-left:-0.02691em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-2.8448em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.46117142857142857em;"><span></span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.41586em;"><span class="pstrut" style="height:3em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.3448em;"><span style="top:-2.3487714285714287em;margin-left:-0.05764em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15122857142857138em;"><span></span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.7213999999999998em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span></span></span></span>得到总的梯度<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我><米ostretchy="false"> （</米o><米我>X</gydF4y2Ba米我><米oseparator="true"> ，</米o><米我>θ.。</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> </mrow> <annotation encoding="application/x-tex"> \frac{E(X， \theta)}{w_{ij}^k}的偏导</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.7313999999999998em;vertical-align:-0.7213999999999998em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.01em;"><span style="top:-2.60142em;"><span class="pstrut" style="height:3em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8408285714285714em;"><span style="top:-2.177714285714286em;margin-left:-0.02691em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-2.8448em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.46117142857142857em;"><span></span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.485em;"><span class="pstrut" style="height:3em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="mopen mtight">（</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.07847em;">X</gydF4y2Baspan><span class="mpunct mtight">，</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="mclose mtight">）</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.7213999999999998em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span></span></span></span>对于整个输入输出对<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> X</米我><米o>＝</米o><米ofence="false"> ｛</米o><米ostretchy="false"> （</米o><米over accent="true"> <msub> <mi> x</米我><米n> 1</米n> </msub> <mo> ⃗</米o></米over> <mo separator="true"> ，</米o><米sub> <mi> y</米我><米n> 1</米n> </msub> <mo stretchy="false"> ）</米o><米oseparator="true"> ，</米o><米o>．..</米o><米oseparator="true"> ，</米o><米ostretchy="false"> （</米o><米over accent="true"> <msub> <mi> x</米我><米我>N</gydF4y2Ba米我></米sub> <mo> ⃗</米o></米over> <mo separator="true"> ，</米o><米sub> <mi> y</米我><米我>N</gydF4y2Ba米我></米sub> <mo stretchy="false"> ）</米o><米ofence="false"> ｝</米o></米row><一个nnotation encoding="application/x-tex"> X = \大\ {（\ {VEC X_1}，Y_1），\点，（\ {VEC} x_N，y_N）\大\}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.07847em;">X</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord"><span class="delimsizing size1">｛</gydF4y2Baspan></span><span class="mopen">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.30110799999999993em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.30110799999999993em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="minner">．..</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mopen">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.32833099999999993em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.32833099999999993em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.10903em;">N</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan><span class="mord"><span class="delimsizing size1">｝</gydF4y2Baspan></span></span></span></span>通过使用第四个方程(单个梯度的简单平均值)。</gydF4y2Bap> <p>4）<gydF4y2Bastrong>更新权重</gydF4y2Bastrong>根据学习速率<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> α.</米我></米row><一个nnotation encoding="application/x-tex"> \α</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.43056em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.0037em;">α.</gydF4y2Baspan></span></span></span>和总渐变<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mfrac> <mrow> <mi mathvariant="normal"> ∂</米我><米我>E</gydF4y2Ba米我><米ostretchy="false"> （</米o><米我>X</gydF4y2Ba米我><米oseparator="true"> ，</米o><米我>θ.。</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><米row> <mi mathvariant="normal"> ∂</米我><米subsup> <mi> w</米我><米row><米我> 我</米我><米我>j</gydF4y2Ba米我></米row><米我> k</米我></米subsup> </mrow> </mfrac> </mrow> <annotation encoding="application/x-tex"> \frac{E(X， \theta)}{w_{ij}^k}的偏导</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.7313999999999998em;vertical-align:-0.7213999999999998em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.01em;"><span style="top:-2.60142em;"><span class="pstrut" style="height:3em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8408285714285714em;"><span style="top:-2.177714285714286em;margin-left:-0.02691em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight">我</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span></span><span style="top:-2.8448em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.46117142857142857em;"><span></span></span></span></span></span></span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.485em;"><span class="pstrut" style="height:3em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.05764em;">E</gydF4y2Baspan><span class="mopen mtight">（</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.07847em;">X</gydF4y2Baspan><span class="mpunct mtight">，</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.02778em;">θ.</gydF4y2Baspan><span class="mclose mtight">）</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.7213999999999998em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span></span></span></span>通过使用第五方程（负梯度的方向移动）。</gydF4y2Bap>  </blockquote> <p><strong>Sigmoidal神经网络中的BackProjagation</gydF4y2Bastrong></p> <p>经典的BP算法是专为回归问题与S形激活单位。而反向传播可应用于分类问题以及网络与非S形激活函数，S形函数具有方便的数学性质，当与适当的输出激活函数相结合，大大简化了算法的理解。因此，在经典制剂，隐藏节点的激活函数是S形<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo fence="false"> （</米o><米我>g</gydF4y2Ba米我><米ostretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o><米o>＝</米o><米我>σ.。</gydF4y2Ba米我><米ostretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o><米ofence="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> \大（G（X）= \西格玛（X）\大）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">σ.</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span></span></span></span>和输出活化功能恒等函数<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo fence="false"> （</米o><米sub> <mi> g</米我><米我>o</gydF4y2Ba米我></米sub> <mo stretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o><米o>＝</米o><米我>x</gydF4y2Ba米我><米ofence="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> \大(g_o (x) = x \大)</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.151392em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">o</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord mathdefault">x</gydF4y2Baspan><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span></span></span></span>(网络输出只是其隐含层的加权和，即激活)。</gydF4y2Bap> <p>由于其方便的衍生物，BackPropagation实际上是历史使用术语中的主要动机因素：</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msup> <mi> g</米我><米o米一个thvariant="normal"> ”</米o></米sup> <mo stretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o><米o>＝</米o><米fr一个c> <mrow> <mi mathvariant="normal"> ∂</米我><米我>σ.。</gydF4y2Ba米我><米ostretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><米row> <mi mathvariant="normal"> ∂</米我><米我>x</gydF4y2Ba米我></米row></米frac> <mo> ＝</米o><米我>σ.。</gydF4y2Ba米我><米ostretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o><米ofence="false"> （</米o><米n> 1</米n> <mo> -</米o><米我>σ.。</gydF4y2Ba米我><米ostretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o><米ofence="false"> ）</米o><米我米一个thvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> g ^ {\ '} (x) = \压裂{\部分\σ(x)} {x} \部分σ(x) = \ \大(1 -σ(x) \ \大)。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.051892em;vertical-align:-0.25em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.801892em;"><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:2.113em;vertical-align:-0.686em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.427em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault" style="margin-right:0.03588em;">σ.</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">σ.</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord">1</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span></span><span class="base"><span class="strut" style="height:1.20001em;vertical-align:-0.35001em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">σ.</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p> <p>因此，在计算S形函数的导数需要无非记住输出<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> σ.</米我><米ostretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> \ sigma（x）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">σ.</gydF4y2Baspan><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span>代入上面的方程。</gydF4y2Bap> <p>此外，输出激活函数的导数也很简单：</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> g</米我><米我>o</gydF4y2Ba米我><米o米一个thvariant="normal"> ”</米o></米subsup> <mo stretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o><米o>＝</米o><米fr一个c> <mrow> <mi mathvariant="normal"> ∂</米我><米sub> <mi> g</米我><米我>o</gydF4y2Ba米我></米sub> <mo stretchy="false"> （</米o><米我>x</gydF4y2Ba米我><米ostretchy="false"> ）</米o></米row><米row> <mi mathvariant="normal"> ∂</米我><米我>x</gydF4y2Ba米我></米row></米frac> <mo> ＝</米o><米fr一个c> <mrow> <mi mathvariant="normal"> ∂</米我><米我>x</gydF4y2Ba米我></米row><米row> <mi mathvariant="normal"> ∂</米我><米我>x</gydF4y2Ba米我></米row></米frac> <mo> ＝</米o><米n> 1。</米n> </mrow> <annotation encoding="application/x-tex"> g_o ^ {\素}（X）= \压裂{\局部g_o（X）} {\部分X} = \压裂{\局部X} {\部分X} = 1。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.051892em;vertical-align:-0.25em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8018919999999999em;"><span style="top:-2.4530000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">o</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:2.113em;vertical-align:-0.686em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.427em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.151392em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">o</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mopen">（</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan><span class="mclose">）</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:2.05744em;vertical-align:-0.686em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.37144em;"><span style="top:-2.314em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.677em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord" style="margin-right:0.05556em;">∂</gydF4y2Baspan><span class="mord mathdefault">x</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.686em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">1</gydF4y2Baspan><span class="mord">．</gydF4y2Baspan></span></span></span></span></p> <p>因此，使用这两个激活函数删除需要记住激活值的需要<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米n> 1</米n> <mi> 米</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> A_1 ^米</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.9125em;vertical-align:-0.24810799999999997em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.664392em;"><span style="top:-2.4518920000000004em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.24810799999999997em;"><span></span></span></span></span></span></span></span></span></span>和<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> a_j ^ k</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>除了输出值<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> o</米我><米n> 1</米n> <mi> 米</米我></米subsup> </mrow> <annotation encoding="application/x-tex"> O_1 ^ M.</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.9125em;vertical-align:-0.24810799999999997em;"></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.664392em;"><span style="top:-2.4518920000000004em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.24810799999999997em;"><span></span></span></span></span></span></span></span></span></span>和<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> o</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> </mrow> <annotation encoding="application/x-tex"> o_j-1K-</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.2438799999999999em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span></span></span></span>，大大减少了算法的内存占用量。这是因为，在向后相位乙状结肠激活函数的导数只需要回顾一下在正程阶段该函数的输出，并且不依赖于实际的激活值，这是在向传播，其中的更一般的配方中的情况下<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msup> <mi> g</米我><米o米一个thvariant="normal"> ”</米o></米sup> <mo fence="false"> （</米o><米subsup> <mi> 一个</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo fence="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> G ^ {\素} \大（a_j-1K-\大）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.244772em;vertical-align:-0.394772em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">g</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.751892em;"><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">”</gydF4y2Baspan></span></span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord"><span class="mord mathdefault">一个</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.849108em;"><span style="top:-2.441336em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.063em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.394772em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span></span></span></span>必须计算。类似地，恒等激活函数的导数不依赖于任何东西因为它是常数。</gydF4y2Bap> <p>因此，对于具有S形隐藏单元和身份输出单元的前馈神经网络，误差项方程如下：</gydF4y2Bap> <blockquote class="definition"> <p>对于最终图层的错误术语，</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米n> 1</米n> <mi> 米</米我></米subsup> <mo> ＝</米o><米over accent="true"> <msub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> <mo> ＾</米o></米over> <mo> -</米o><米sub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \ delta_1 ^ m = \ hat {y_d} -y_d。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.9613919999999999em;vertical-align:-0.247em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.7143919999999999em;"><span style="top:-2.4530000000000003em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight">1</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">米</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.247em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.8888799999999999em;vertical-align:-0.19444em;"></span><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.69444em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.25em;">＾</gydF4y2Baspan></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.19444em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span></span><span class="base"><span class="strut" style="height:0.625em;vertical-align:-0.19444em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p>  </blockquote> <blockquote class="definition"> <p>对于隐藏的图层错误术语，</gydF4y2Bap> <p><span class="katex-display"><span class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <msubsup> <mi> δ.</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo> ＝</米o><米subsup> <mi> o</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo fence="false"> （</米o><米n> 1</米n> <mo> -</米o><米subsup> <mi> o</米我><米我>j</gydF4y2Ba米我><米我>k</gydF4y2Ba米我></米subsup> <mo fence="false"> ）</米o><米underover> <mo> σ.</米o><米row><米我>l</米我><米o>＝</米o><米n> 1</米n> </mrow> <msup> <mi> r</米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msup> </munderover> <msubsup> <mi> w</米我><米row><米我> j</米我><米我>l</gydF4y2Ba米我></米row><米row> <mi> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <msubsup> <mi> δ.</米我><米我>l</gydF4y2Ba米我><米row><米我> k</米我><米o>+</gydF4y2Ba米o><米n> 1</米n> </mrow> </msubsup> <mi mathvariant="normal"> ．</米我></米row><一个nnotation encoding="application/x-tex"> \ delta_j ^ K = o_j-1K-\大（1 - o_j-1K-\大）\ sum_ {1 = 1} ^ {R ^ {K + 1}} W_ {JL} ^ {K + 1} \ delta_l ^ {K + 1}。</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1.282216em;vertical-align:-0.383108em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">＝</gydF4y2Baspan><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:1.282216em;vertical-align:-0.383108em;"></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">（</gydF4y2Baspan></span><span class="mord">1</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">-</gydF4y2Baspan><span class="mspace" style="margin-right:0.2222222222222222em;"></span></span><span class="base"><span class="strut" style="height:3.301038em;vertical-align:-1.302113em;"></span><span class="mord"><span class="mord mathdefault">o</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.899108em;"><span style="top:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan></span></span><span style="top:-3.1130000000000004em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.383108em;"><span></span></span></span></span></span></span><span class="mord"><span class="delimsizing size1">）</gydF4y2Baspan></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.998925em;"><span style="top:-1.8478869999999998em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan><span class="mrel mtight">＝</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span><span style="top:-3.0500049999999996em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">σ.</gydF4y2Baspan></span></span><span style="top:-4.300005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.02778em;">r</gydF4y2Baspan><span class="msupsub"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.9270285714285714em;"><span style="top:-2.931em;margin-right:0.07142857142857144em;"><span class="pstrut" style="height:2.5em;"></span><span class="sizing reset-size3 size1 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span></span></span></span></span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.302113em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.02691em;">w</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999999em;"><span style="top:-2.4085610000000006em;margin-left:-0.02691em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.05724em;">j</gydF4y2Baspan><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.4275469999999999em;"><span></span></span></span></span></span></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03785em;">δ.</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.8991079999999998em;"><span style="top:-2.408561em;margin-left:-0.03785em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.01968em;">l</gydF4y2Baspan></span></span><span style="top:-3.113em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mathdefault mtight" style="margin-right:0.03148em;">k</gydF4y2Baspan><span class="mbin mtight">+</gydF4y2Baspan><span class="mord mtight">1</gydF4y2Baspan></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.2914389999999999em;"><span></span></span></span></span></span></span><span class="mord">．</gydF4y2Baspan></span></span></span></span></p>  </blockquote> <p><strong>代码示例</gydF4y2Bastrong></p> <p>下面的代码示例为S形神经网络作为在前面的小节中描述。它有一个隐含层和输出层一个输出节点。该代码是写在Python3，并就执行矩阵数学大量使用NumPy的库。因为梯度为个别的输入 - 输出对的计算<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mo stretchy="false"> （</米o><米over accent="true"> <msub> <mi> x</米我><米我>d</gydF4y2Ba米我></米sub> <mo> ⃗</米o></米over> <mo separator="true"> ，</米o><米sub> <mi> y</米我><米我>d</gydF4y2Ba米我></米sub> <mo stretchy="false"> ）</米o></米row><一个nnotation encoding="application/x-tex"> （\ vec {x_d}，y_d）</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mopen">（</gydF4y2Baspan><span class="mord accent"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.2355em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span><span class="mpunct">，</gydF4y2Baspan><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.33610799999999996em;"><span style="top:-2.5500000000000003em;margin-left:-0.03588em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">d</gydF4y2Baspan></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mclose">）</gydF4y2Baspan></span></span></span>可以并行完成，许多计算是基于两个向量的点积，矩阵是表示输入数据、输出数据和层权重的自然方法。NumPy对矩阵产品的高效计算和使用现代gpu(为矩阵操作进行了优化)的能力，可以在计算的前向和后向阶段提供显著的速度提升。</gydF4y2Bap> <div class="codex-static-code" data-controller="app/codex/controllers:expandableCode"> <button class="codex-expand-toggle" style="display:none;"></button> <table class="has-lang codehilitetable"> <tbody> <tr> <td class="linenos"> <div class="linenodiv"> <pre>1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 5051 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71</gydF4y2Bapre> </div></td> <td class="code"> <div class="has-lang codehilite"> <pre><span></span><code data-lang="Python"><span class="kn">进口</gydF4y2Baspan><span class="nn">numpy的</gydF4y2Baspan><span class="k">作为</gydF4y2Baspan><span class="nn">NP.</gydF4y2Baspan><span class="c1">#定义函数</gydF4y2Baspan><span class="k">def</gydF4y2Baspan><span class="nf">sigmoid.</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="n">x</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="n">衍生物</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="kc">假</gydF4y2Baspan><span class="p">）：</gydF4y2Baspan><span class="k">如果</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="n">衍生物</gydF4y2Baspan><span class="o">==.</gydF4y2Baspan><span class="kc">真的</gydF4y2Baspan><span class="p">）：</gydF4y2Baspan><span class="k">返回</gydF4y2Baspan><span class="n">sigmoid.</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="n">x</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="n">衍生物</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="kc">假</gydF4y2Baspan><span class="p">）</gydF4y2Baspan><span class="o">＊</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="o">-</gydF4y2Baspan><span class="n">sigmoid.</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="n">x</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="n">衍生物</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="kc">假</gydF4y2Baspan><span class="p">））</gydF4y2Baspan><span class="k">其他的</gydF4y2Baspan><span class="p">：</gydF4y2Baspan><span class="k">返回</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="o">/</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="o">+</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">exp.</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="o">-</gydF4y2Baspan><span class="n">x</gydF4y2Baspan><span class="p">））</gydF4y2Baspan><span class="c1">＃选择可重复结果的随机种子</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">随机</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">种子</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">）</gydF4y2Baspan><span class="c1">＃学习率</gydF4y2Baspan><span class="n">α</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="c1">＃隐藏层中的节点数</gydF4y2Baspan><span class="n">num_hidden.</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="mi">3.</gydF4y2Baspan><span class="c1">＃输入</gydF4y2Baspan><span class="n">X</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">大批</gydF4y2Baspan><span class="p">（[</gydF4y2Baspan><span class="p">［</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">]，</gydF4y2Baspan><span class="p">［</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">]，</gydF4y2Baspan><span class="p">［</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">]，</gydF4y2Baspan><span class="p">［</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">]，</gydF4y2Baspan><span class="p">［</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">]，</gydF4y2Baspan><span class="p">［</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">]，</gydF4y2Baspan><span class="p">]）</gydF4y2Baspan><span class="c1">＃输出</gydF4y2Baspan><span class="c1">t是x的转置，使它成为列向量</gydF4y2Baspan><span class="n">y</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">大批</gydF4y2Baspan><span class="p">（[[</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">]])</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">T</gydF4y2Baspan><span class="c1">＃随机用平均值0和范围初始化权重[-1,1]</gydF4y2Baspan><span class="c1">在权矩阵的第1维中+1表示偏置权</gydF4y2Baspan><span class="n">Hidden_weights.</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="mi">2</gydF4y2Baspan><span class="o">＊</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">随机</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">随机</gydF4y2Baspan><span class="p">（（</gydF4y2Baspan><span class="n">X</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">形状</gydF4y2Baspan><span class="p">［</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">］</gydF4y2Baspan><span class="o">+</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="n">num_hidden.</gydF4y2Baspan><span class="p">））</gydF4y2Baspan><span class="o">-</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="n">output_weights</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="mi">2</gydF4y2Baspan><span class="o">＊</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">随机</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">随机</gydF4y2Baspan><span class="p">（（</gydF4y2Baspan><span class="n">num_hidden.</gydF4y2Baspan><span class="o">+</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="n">y</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">形状</gydF4y2Baspan><span class="p">［</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">]））</gydF4y2Baspan><span class="o">-</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="c1">＃梯度下降的迭代次数</gydF4y2Baspan><span class="n">num_念堂</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="mi">10000</gydF4y2Baspan><span class="c1">＃为梯度下降每次迭代</gydF4y2Baspan><span class="k">为</gydF4y2Baspan><span class="n">我</gydF4y2Baspan><span class="ow">在</gydF4y2Baspan><span class="nb">范围</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="n">num_念堂</gydF4y2Baspan><span class="p">）：</gydF4y2Baspan><span class="c1">#发展阶段</gydF4y2Baspan><span class="c1">＃np.hstack（（np.ones（...），X）增加了1的固定输入偏置重量</gydF4y2Baspan><span class="n">input_layer_outputs</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">hstack</gydF4y2Baspan><span class="p">（（</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">那些</gydF4y2Baspan><span class="p">（（</gydF4y2Baspan><span class="n">X</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">形状</gydF4y2Baspan><span class="p">［</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">]，</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">）），</gydF4y2Baspan><span class="n">X</gydF4y2Baspan><span class="p">））</gydF4y2Baspan><span class="n">hidden_layer_outputs</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">hstack</gydF4y2Baspan><span class="p">（（</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">那些</gydF4y2Baspan><span class="p">（（</gydF4y2Baspan><span class="n">X</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">形状</gydF4y2Baspan><span class="p">［</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">]，</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">）），</gydF4y2Baspan><span class="n">sigmoid.</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">点</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="n">input_layer_outputs</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="n">Hidden_weights.</gydF4y2Baspan><span class="p">））））</gydF4y2Baspan><span class="n">output_layer_outputs.</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">点</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="n">hidden_layer_outputs</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="n">output_weights</gydF4y2Baspan><span class="p">）</gydF4y2Baspan><span class="c1">＃向后阶段</gydF4y2Baspan><span class="c1">#输出层错误项</gydF4y2Baspan><span class="n">output_error</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="n">output_layer_outputs.</gydF4y2Baspan><span class="o">-</gydF4y2Baspan><span class="n">y</gydF4y2Baspan><span class="c1">＃隐藏层错误术语</gydF4y2Baspan><span class="c1">＃[：，1：]从BackProjagation中删除偏置术语</gydF4y2Baspan><span class="n">hidden_error</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="n">hidden_layer_outputs</gydF4y2Baspan><span class="p">(:,</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">：]</gydF4y2Baspan><span class="o">＊</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="o">-</gydF4y2Baspan><span class="n">hidden_layer_outputs</gydF4y2Baspan><span class="p">(:,</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">:])</gydF4y2Baspan><span class="o">＊</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">点</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="n">output_error</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="n">output_weights</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">T</gydF4y2Baspan><span class="p">(:,</gydF4y2Baspan><span class="mi">1</gydF4y2Baspan><span class="p">:])</gydF4y2Baspan><span class="c1">#偏导数</gydF4y2Baspan><span class="n">Hidden_pd.</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="n">input_layer_outputs</gydF4y2Baspan><span class="p">(:,</gydF4y2Baspan><span class="p">：，</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">newaxis</gydF4y2Baspan><span class="p">］</gydF4y2Baspan><span class="o">＊</gydF4y2Baspan><span class="n">hidden_error</gydF4y2Baspan><span class="p">[：</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">newaxis</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="p">：]</gydF4y2Baspan><span class="n">output_pd</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="n">hidden_layer_outputs</gydF4y2Baspan><span class="p">(:,</gydF4y2Baspan><span class="p">：，</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">newaxis</gydF4y2Baspan><span class="p">］</gydF4y2Baspan><span class="o">＊</gydF4y2Baspan><span class="n">output_error</gydF4y2Baspan><span class="p">(:,</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">newaxis</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="p">：]</gydF4y2Baspan><span class="c1">＃平均总梯度</gydF4y2Baspan><span class="n">total_hidden_gradient</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">平均</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="n">Hidden_pd.</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="n">轴</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">）</gydF4y2Baspan><span class="n">total_output_gradient</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="n">NP.</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">平均</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="n">output_pd</gydF4y2Baspan><span class="p">，</gydF4y2Baspan><span class="n">轴</gydF4y2Baspan><span class="o">＝</gydF4y2Baspan><span class="mi">0</gydF4y2Baspan><span class="p">）</gydF4y2Baspan><span class="c1">＃更新权重</gydF4y2Baspan><span class="n">Hidden_weights.</gydF4y2Baspan><span class="o">+ =</gydF4y2Baspan><span class="o">-</gydF4y2Baspan><span class="n">α</gydF4y2Baspan><span class="o">＊</gydF4y2Baspan><span class="n">total_hidden_gradient</gydF4y2Baspan><span class="n">output_weights</gydF4y2Baspan><span class="o">+ =</gydF4y2Baspan><span class="o">-</gydF4y2Baspan><span class="n">α</gydF4y2Baspan><span class="o">＊</gydF4y2Baspan><span class="n">total_output_gradient</gydF4y2Baspan><span class="c1">＃打印神经网络的最终输出上的输入X</gydF4y2Baspan><span class="nb">打印</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="s2">“培训后的产出：</gydF4y2Baspan><span class="se">\ n</gydF4y2Baspan><span class="si">{}</gydF4y2Baspan><span class="s2">＂</gydF4y2Baspan><span class="o">．</gydF4y2Baspan><span class="n">格式</gydF4y2Baspan><span class="p">（</gydF4y2Baspan><span class="n">output_layer_outputs.</gydF4y2Baspan><span class="p">））</gydF4y2Baspan></code></pre> </div><p></p></td> </tr> </tbody> </table> </div> <p></p> <p>矩阵<gydF4y2Bacode>X</gydF4y2Bacode>是一组输入<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mover accent="true"> <mi> x</米我><米o>⃗</gydF4y2Ba米o></米over> </mrow> <annotation encoding="application/x-tex"> \ vec {x}</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.714em;vertical-align:0em;"></span><span class="mord accent"><span class="vlist-t"><span class="vlist-r"><span class="vlist" style="height:0.714em;"><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="mord"><span class="mord mathdefault">x</gydF4y2Baspan></span></span><span style="top:-3em;"><span class="pstrut" style="height:3em;"></span><span class="accent-body" style="left:-0.20772em;"><span class="overlay" style="height:0.714em;width:0.471em;"> <svg width="0.471em" height="0.714em" style="width:0.471em" viewbox="0 0 471 714" preserveaspectratio="xMinYMin"> <path d="M377 20c0-5.333 1.833-10 5.5-14S391 0 397 0c4.667 0 8.667 1.667 12 5 3.333 2.667 6.667 9 10 19 6.667 24.667 20.333 43.667 41 57 7.333 4.667 11 10.667 11 18 0 6-1 10-3 12s-6.667 5-14 9c-28.667 14.667-53.667 35.667-75 63 -1.333 1.333-3.167 3.5-5.5 6.5s-4 4.833-5 5.5c-1 .667-2.5 1.333-4.5 2s-4.333 1 -7 1c-4.667 0-9.167-1.833-13.5-5.5S337 184 337 178c0-12.667 15.667-32.333 47-59 H213l-171-1c-8.667-6-13-12.333-13-19 0-4.667 4.333-11.333 13-20h359 c-16-25.333-24-45-24-59z"></path> </svg></span></span></span></span></span></span></span></span></span></span>和矩阵<gydF4y2Bacode>y</gydF4y2Bacode>是组输出<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> y</米我></米row><一个nnotation encoding="application/x-tex"> y</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.625em;vertical-align:-0.19444em;"></span><span class="mord mathdefault" style="margin-right:0.03588em;">y</gydF4y2Baspan></span></span></span>．通过设置变量的值，可以自定义隐藏层节点的数量<gydF4y2Bacode>num_hidden.</gydF4y2Bacode>．学习率<gydF4y2Baspan class="katex"><span class="katex-mathml"> <math> <semantics> <mrow> <mi> α.</米我></米row><一个nnotation encoding="application/x-tex"> \α</一个nnotation> </semantics> </math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.43056em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.0037em;">α.</gydF4y2Baspan></span></span></span>由可变控制<gydF4y2Bacode>α</gydF4y2Bacode>．的梯度下降的迭代次数是由所述可变控制<gydF4y2Bacode>num_念堂</gydF4y2Bacode>．</gydF4y2Bap> <p>通过改变这些变量，并将程序的输出与目标值进行比较<gydF4y2Bacode>y</gydF4y2Bacode>，人们可以看到这些变量如何控制反向化程度如何学习数据集<gydF4y2Bacode>X</gydF4y2Bacode>和<gydF4y2Bacode>y</gydF4y2Bacode>．例如，隐藏层中的更多节点以及梯度下降的更多迭代通常将改善拟合训练数据集。但是，使用太大或太小的学习率可能导致模型分别发散或收敛太慢。</gydF4y2Bap> </div> </div> </div> <div id="mentions-data" data-url="/mentions/candidates/" data-id="3155" data-type="wiki"></div> </div> </div> <div class="wiki-self-citation" data-controller="app/wiki:getCitationTime"> <strong>引用如下：</gydF4y2Bastrong>backpropagation。<gydF4y2Baem>bright.org.</gydF4y2Baem>．检索到<gydF4y2Baspan class="retrieval-time"></span>从<一个href="//www.parkandroid.com/wiki/backpropagation/">//www.parkandroid.com/wiki/backpropagation/</一个></d我v> <div class="wiki-rating-feedback-wrapper row" data-controller="app/wiki:feedback"></div> </div> <div class="wiki-overlay"></div> <div class="wiki-footer recommended-course" id="loggedout-wiki-footer" data-controller="app/wiki:showSignUpModal,app/wiki:wikiFooter"> <a href="//www.parkandroid.com/courses/computer-science-fundamentals/" class="course-banner ax-click" data-ax-id="wiki_clicked_course_footer_logged_out"> <div class="img col"> <img class="no-zoom" src="https://ds055uzetaobb.cloudfront.net/brioche/chapter/data_structures-wvUKwz.png?width=100" srcset="https://ds055uzetaobb.cloudfront.net/brioche/chapter/data_structures-wvUKwz.png?width=100 1x, https://ds055uzetaobb.cloudfront.net/brioche/chapter/data_structures-wvUKwz.png?width=200 2x, https://ds055uzetaobb.cloudfront.net/brioche/chapter/data_structures-wvUKwz.png?width=300 3x"> </div> <div class="text col col-5"> <h4>掌握这些概念</gydF4y2Bah4> <button class="btn btn-accent">开始</bgydF4y2Bautton> <p>在我们的数据结构课程中了解更多，由专家为您构建。</gydF4y2Bap> </div></a> </div> <div class="public-signup-modal-experiment modal hide" id="signup-modal-wiki" data-controller="app/signup:signUpModal" data-show-form="true"> <div class="public-signup-left col col-last public-signup-left-experiment " id="public-signup-tour"></div> <div class="public-signup-experiment show-signup" id="public-signup"> <span class="css-sprite-signup-modal signup-modal-image"></span> <div class="text row"> 注册以阅读数学，科学和工程主题中的所有Wiki和测验。</d我v> <div class="public-buttons row" data-controller="app/solvables:preventSocialButtonDoubleClick"> <div class="login-buttons"> <a href="//www.parkandroid.com/account/facebook/login/?next=/wiki/backpropagation/" id="login-fb" class="btn btn-f-b signup-social ax-click" data-ax-id="clicked_login_from_problem_modal_facebook" data-ax-type="button" data-is_modal="true"><span class="fb css-sprite-index"></span>登陆Facebook</一个><一个href="//www.parkandroid.com/account/google/login/?next=/wiki/backpropagation/" id="login-google" class="btn btn-google signup-social ax-click" data-ax-id="clicked_login_from_problem_modal_google" data-ax-type="button" data-is_modal="true"><span class="google css-sprite-index"></span>使用Google登录</一个><一个href="//www.parkandroid.com/account/login/?next=/wiki/backpropagation/" id="problem-login-link" class="btn btn-email ax-click" data-ax-id="clicked_login_from_problem_modal_email" data-ax-type="button" data-is_modal="true" data-next="/wiki/backpropagation/">使用电子邮件登录</一个></d我v> <div class="signup-buttons"> <a href="//www.parkandroid.com/account/facebook/login/?next=/wiki/backpropagation/" id="signup-fb" class="btn btn-f-b signup-social ax-click" data-ax-id="clicked_signup_from_problem_modal_facebook" data-ax-type="button"><span class="fb css-sprite-index"></span>加入使用Facebook.</一个><一个href="//www.parkandroid.com/account/google/login/?next=/wiki/backpropagation/" id="signup-google" class="btn btn-google signup-social ax-click" data-ax-id="clicked_signup_from_problem_modal_google" data-ax-type="button"><span class="google css-sprite-index"></span>加入使用Google.</一个><一个href="//www.parkandroid.com/account/signup/?signup=true&next=/wiki/backpropagation/" id="signup-email" class="btn btn-email ax-click" data-ax-id="clicked_signup_from_problem_modal_email" data-ax-type="button" data-next="/wiki/backpropagation/">加入使用电子邮件</一个></d我v> </div> <div class="signup-form-container" id="signup-form-container" data-url="/signup_form" data-page-key="wiki_canonical_page"></div> <div class="login-form-container row" id="login-form-container" data-url="/login_form" data-page-key="wiki_canonical_page"></div> <div class="alternative row"> <div class="login-alternative"> <p><a href="//www.parkandroid.com/account/password/reset/" class="btn-link forget">忘记密码？</一个>新用户？<一个href="//www.parkandroid.com/account/signup/?signup=true&next=/wiki/backpropagation/" id="problem-signup-link-alternative" class="btn-link ax-click" data-ax-id="clicked_signup_from_problem_modal" data-ax-type="button" data-next="/wiki/backpropagation/">报名</一个></p> </div> <div class="signup-alternative"> <p>现有用户？<一个href="//www.parkandroid.com/account/login/?next=/wiki/backpropagation/" id="problem-login-link-alternative" class="btn-link ax-click" data-ax-id="clicked_login_from_problem_modal" data-ax-type="button" data-is_modal="true" data-next="/wiki/backpropagation/">登录</一个></p> </div> </div> </div> </div> <div data-controller="util/mathjax_loader:controller"></div> <div data-controller="util/analytics:init" data-analytics-live="true" data-segment-key="ttlCaHQqOWtslnGGJ9W4bBeRpfYGksuD" data-segment-url="https://in.www.parkandroid.com" data-amplitude-key="2d768258f0a7507203c7998a3e2678f0" data-cio-key="9b180e7983a5a792f198" data-cio-identify-data="{"id": "e2MwYxiNF8fBYZwGFIOKh8dvtRqZ5CE4"}" data-analytics-identity="e2MwYxiNF8fBYZwGFIOKh8dvtRqZ5CE4" data-analytics-super-properties="{"locale": "en", "account_type": "anonymous", "debug": false, "client": "desktop-browser", "sessionid": null, "user_agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36", "identity": "e2MwYxiNF8fBYZwGFIOKh8dvtRqZ5CE4", "anon_ident_latest": "e2MwYxiNF8fBYZwGFIOKh8dvtRqZ5CE4", "ab_test__send_startalk_welcome_email_04_2018": false, "ab_test__reduce_nux_email_volumes_2018_08": false}" data-analytics-user-properties="{"exp__prealg_declick_2021": "control", "exp__chargebee_gift_09_2020": "chargebee", "exp__nux_onboarding_03_2021": "specific_paths", "exp__intermediate_math_lp_w_pre_algebra_july_2021": "experiment", "exp__signup_modal_one_tap_06_2021": "control", "exp__discounts_05_2021": "control", "exp__chargebee_paywall_08_2020_round_3": "chargebee", "exp__sem_landing_page_08_2021": "control", "exp__v2_sem_landing_banner_experiment_05_2021": "control", "exp__paywall_redesign_02_2021": "control", "exp__logged_in_premium_banners_04_2021": "control", "exp__highlight_1st_lesson_03_2021": "experiment", "exp__sem_landing_banner_experiment_05_2021": "control", "exp__paywall_redesign_02_2021_v2": "control", "exp__prealg_vs_mf_popular_aug_2021": "control", "exp__chargebee_paywall_mature_06_2021": "chargebee", "exp__v2_nux_onboarding_05_2021": "experiment_v2", "exp__logic_foundations_lp_w_pre_algebra_aug_2021": "control", "exp__show_google_one_tap_modal": "experiment", "exp__signup_modal_one_tap_06_2021_v2": "experiment", "exp__trial_paywall_monthly_price_aug_2021": "experiment", "exp__chargebee_group_09_2020": "chargebee", "exp__prealg_vs_intro_to_alg_aug_2021": "control", "exp__mf_lesson2nfc_2021": "control"}" data-facebook-ad-pixel-id="712046235504105" data-google-ad-pixel-id="1007657493" data-ltv-event-id="0" data-ltv-event-ltv="" data-ltv-event-currency="" data-ltv-event-interval="" data-ltv-event-confirm-url="" data-send-ga-trial-subscription-event="" data-displayed-recommended-course-banner="true" data-recommended-course-id="44" data-is-tracked-user="true"> <div class="ax-event" data-ax-name="sign_of_life" data-ax-properties="{"path": "/wiki/backpropagation/", "full_path": "/wiki/backpropagation/", "method": "GET", "ajax": false, "from_request": true, "is_android": false}"></div> </div> <div id="footer-notifs"></div> </div> <div id="default-ajax-error" class="hide" data-error-title="Error" data-error-content="We encountered an error while talking to our servers. Refresh the page and try again in a few seconds. If the problem persists, please <a href='mailto:support@www.parkandroid.com'>email us</a>." data-timeout-content="That action is taking longer than expected. This is likely due to network issues. Please try again in a few seconds, and if the problem persists, <a href='mailto:support@www.parkandroid.com'>send us an email</a>."></div> <div id="fb-root"></div> <div class="nf-feeditem-modal hide" id="nf-feeditem-modal"> <div class="nf-modal-close close" id="nf-modal-close"> ×</d我v> <div class="nf-modal-loading"> <div class="logo"></div> <div class="stripe"></div> <p class="solvable-text">问题加载......</gydF4y2Bap> <p class="note-text">注意加载…</gydF4y2Bap> <p class="set-text">设置加载......</gydF4y2Bap> </div> <div class="nf-feeditem-modal-wrapper"> <div class="nf-solvable-modal-content nf-modal-content solv-modal clearfix" id="cmp_assessment_modal_public_solvable_component_id"></div> <div class="nf-post-modal-content nf-modal-content newdisc-single logged-out" id="cmp_discussions_modal_single_component