国产欧美在线免费观看,亚洲永久在线观看

信容指標揭開參數(shù)量之外的模型真本領

2025-12-11 20:28:01: 來源：科技日報　作者：馬愛平
分享到：

隨著大模型技術的爆發(fā)和快速發(fā)展，各種參數(shù)、系列的模型層出不窮。它們之間有差異嗎？不同的大模型是否有各自的“天賦”？

近日，中國電信人工智能研究院（TeleAI）科研團隊在5個開源異構數(shù)據集上對近50個主流開源大模型測試了文本無損編碼壓縮增益，并統(tǒng)計實驗中模型推理的計算開銷。結果顯示，不同系列模型要實現(xiàn)同等文本無損編碼壓縮增益，所需計算開銷有明顯差異。而同一系列模型，盡管尺寸各異，但文本無損編碼壓縮增益與計算開銷的比值（即大模型的信容）往往保持高度一致。

信容是信息與模型參數(shù)量的比值，用于表示模型內存儲的知識密度。如果把模型比作海綿，信息比作水，那么信容就如同海綿的吸水效率，水吸得越多、越快，說明模型越“聰明”。信容為比較不同架構和參數(shù)大模型的推理效率提供了量化依據，可用于高效評估不同預訓練數(shù)據、模型架構和超參數(shù)的優(yōu)劣?；谛湃菰u估指標，通過對同源小尺寸模型的測試，就能預測大尺寸模型的性能表現(xiàn)，從而加速模型的開發(fā)和迭代。

科研團隊以智傳網理論框架為基礎，通過“信容評估指標”對大模型的效率進行標準化度量。該指標基于“壓縮即智能”的深刻洞察，結合壓縮性能與推理復雜度來定量評估模型效率，不僅能揭示模型在單位計算代價下產出的智能密度，還能在復雜的通算融合網絡中為“算”與“傳”的資源最優(yōu)配置提供理論依據。

隨著大模型推理負載消耗越來越多的計算資源和能源，如何準確評估大模型的推理效率吸引了學界越來越多的關注。專家表示，科研團隊通過信容指標讓跨架構和尺寸的大模型效率評估成為可能，并能有效指導模型的預訓練和高效部署。這項研究不僅為大模型的綠色低碳發(fā)展提供了定量標尺，也為未來通算融合網絡的設計指明了方向。隨著邊緣智能的快速發(fā)展，智傳網的“端-邊-云”分層網絡將在不遠的未來取代傳統(tǒng)的以云上服務器為中心的計算范式，實現(xiàn)更精準的模型選型與算力分配。

目前，該研究的相關代碼與數(shù)據已在相關平臺開源。

（受訪者供圖）

編輯：韓夢晨

相關閱讀：

版權與免責聲明:
①凡本站注明稿件來源為：中國高新技術產業(yè)導報、中國高新網、中高新傳媒的所有文字、圖片和音視頻稿件，版權均屬本網所有，任何媒體、網站或個人未經本網協(xié)議授權不得轉載、鏈接、轉貼或以其他方式復制發(fā)表。已經本網授權使用作品的，被授權人應在授權范圍內使用，并注明“來源：中國高新網、中高新傳媒或者中國高新技術產業(yè)導報”。違反上述聲明者，本網將追究其相關法律責任。
② 任何單位或個人認為本網站或本網站鏈接內容可能涉嫌侵犯其合法權益，應該及時向本網站書面反饋，并提供身份證明，權屬證明及詳細侵權情況證明，本網站在收到上述文件后，將會盡快移除被控侵權的內容或鏈接。
③如因作品內容、版權和其他問題需要與本網聯(lián)系的，請在該事由發(fā)生之日起30日內進行。電話：010-68667266 電子郵件：dbrmt#chih.org　(請將“#”換為“@”)

亚洲一线av|久久久精品毛片|最近最新中文字幕在线第一页|亚洲综合色就色在线观看,国产成人精品三区,久久亚洲男人天堂,黄片大全.cvvv