每日經(jīng)濟新聞 2025-08-12 11:37:41
每經(jīng)AI快訊,8月12日,360智腦團隊宣布提出新的Light?IF框架,以預(yù)覽?自檢式推理和信息熵控制為核心,提升模型在復(fù)雜指令上的遵循度。Light?IF框架包括五個關(guān)鍵環(huán)節(jié):難度感知指令生成、Zero-RL強化學(xué)習(xí)、推理模式提取與過濾、熵保持監(jiān)督冷啟動、熵自適應(yīng)正則強化學(xué)習(xí)。Light-IF-32B/14B/8B/4B/1.7B全系模型將陸續(xù)在Hugging Face開放。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP