2026-03-16 23:35:31
每經(jīng)北京3月16日電(記者 李宇彤)3月16日,月之暗面Kimi發(fā)布技術(shù)報(bào)告,對(duì)大模型的核心結(jié)構(gòu)殘差連接行重新設(shè)計(jì),使每一層能夠選擇性地關(guān)注此前各層輸出,而非統(tǒng)一求和,48B模型訓(xùn)練效率提升1.25倍。該報(bào)告的發(fā)布被行業(yè)解讀為提前預(yù)告了下一代模型的關(guān)鍵模塊。
《每日經(jīng)濟(jì)新聞》記者注意到,報(bào)告結(jié)尾處顯示,月之暗面三位聯(lián)合創(chuàng)始人楊植麟、吳育昕、周昕宇帶領(lǐng)數(shù)十名研究員完成了這項(xiàng)研究。報(bào)告發(fā)布后,馬斯克評(píng)價(jià)Kimi的研究令人印象深刻(Impressive work from Kimi),OpenAI的“推理模型之父”、前OpenAI研究副總裁Jerry Tworek則表示“深度學(xué)習(xí)2.0要來(lái)了”。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
計(jì)量賦能產(chǎn)業(yè)生產(chǎn),四川省核醫(yī)療產(chǎn)業(yè)計(jì)量測(cè)試中心揭牌
瞄準(zhǔn)未來(lái)產(chǎn)業(yè),成都落下量子科技產(chǎn)業(yè)版圖關(guān)鍵一子
當(dāng)AI深度重塑經(jīng)濟(jì)增長(zhǎng)模式,我們?nèi)绾胃谩榜{馭”它?
蓉光閃耀,聚愛(ài)同行!150余場(chǎng)全國(guó)助殘日活動(dòng)開(kāi)啟成都美好初夏
對(duì)話柏林駐華商務(wù)聯(lián)絡(luò)處首席代表李怡燃:中德經(jīng)貿(mào)合作向好,雙方企業(yè)攜手開(kāi)發(fā)第三市場(chǎng)將是新趨勢(shì)
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP