2025-12-17 21:37:11
12月16日,阿里千問(wèn)App上線視頻生成模型萬(wàn)相2.6,推出“AI小劇場(chǎng)”功能,首創(chuàng)“角色合拍”玩法,對(duì)標(biāo)Open AI的Sora2。目前,AI視頻生成領(lǐng)域競(jìng)爭(zhēng)激烈,千問(wèn)App也有不少競(jìng)爭(zhēng)對(duì)手。AI視頻生成戰(zhàn)場(chǎng)不僅是技術(shù)比拼,阿里若想“硬剛”O(jiān)pen AI,在生態(tài)能力與用戶洞察方面需多下功夫。
每經(jīng)記者|陳婷 每經(jīng)編輯|董興生
AI(人工智能)視頻生成,正在追求變得好玩?
12月16日,阿里千問(wèn)App(應(yīng)用程序)同步上線最新視頻生成模型萬(wàn)相2.6,并向所有用戶免費(fèi)開放?!睹咳战?jīng)濟(jì)新聞》記者了解到,基于該模型的核心能力,千問(wèn)App上線了“AI小劇場(chǎng)”功能(即基于該模型的角色扮演新功能),在國(guó)內(nèi)首次實(shí)現(xiàn)了“角色合拍”玩法。
記者體驗(yàn)千問(wèn)App后發(fā)現(xiàn),點(diǎn)進(jìn)“AI小劇場(chǎng)”,的確可以和知名角色、歷史人物合拍視頻。
根據(jù)示例,輸入簡(jiǎn)單描述,“蘇軾”就能穿越時(shí)空被高考難到崩潰;只要上傳自己的照片錄入角色,就能和美國(guó)隊(duì)長(zhǎng)出現(xiàn)在同一視頻中,接受他送的玫瑰花。此外,視頻生成后,還可以一鍵分享鏈接到微信好友、朋友圈和QQ好友。
值得注意的是,這一功能對(duì)標(biāo)的正是Open AI(美國(guó)開放人工智能研究中心)旗下的Sora2(OpenAI發(fā)布的新一代視頻生成模型)?!癆I小劇場(chǎng)”玩法目前僅Sora2大模型有類似功能,而Sora2的優(yōu)勢(shì)便在于,其同步上線了內(nèi)容社區(qū),開啟了AI內(nèi)容社區(qū)化時(shí)代。
當(dāng)前,在AI視頻生成領(lǐng)域,中國(guó)企業(yè)和美國(guó)企業(yè)正展開激烈競(jìng)爭(zhēng)。根據(jù)招商證券統(tǒng)計(jì),目前,該領(lǐng)域已有15個(gè)以上被廣泛認(rèn)可的模型。在此大背景下,阿里持續(xù)加碼視頻生成賽道意欲何為?

事實(shí)上,今年以來(lái),阿里持續(xù)布局視頻生成賽道。
2月,據(jù)阿里云披露消息,阿里云視頻生成大模型萬(wàn)相2.1(Wan)重磅開源,此次開源采用Apache2.0協(xié)議(帕奇授權(quán)協(xié)議,是Apache軟件基金會(huì)發(fā)布的開源軟件許可協(xié)議),14B(140億參數(shù),B 指10億參數(shù))和1.3B(13億參數(shù))兩個(gè)參數(shù)規(guī)格的全部推理代碼和權(quán)重全部開源,同時(shí)支持文生視頻和圖生視頻任務(wù)。
而在今年9月的云棲大會(huì)上,阿里發(fā)布通義萬(wàn)相Wan2.5 preview系列模型,首次實(shí)現(xiàn)音畫同步的視頻生成能力,視頻時(shí)長(zhǎng)從5秒提升至10秒,支持24幀每秒的1080P(視頻顯示格式)高清輸出,通義App第一時(shí)間接入了視頻生成模型。
11月17日,阿里正式宣布“千問(wèn)”項(xiàng)目,全力進(jìn)軍AI to C(人工智能直接面向消費(fèi)者 )市場(chǎng),“通義”App正式改名為“千問(wèn)”App。12月初,千問(wèn)App便已接入萬(wàn)相系列當(dāng)時(shí)的最新模型Wan2.5。
這一次,千問(wèn)App第一時(shí)間接入的萬(wàn)相2.6視覺(jué)大模型,支持音畫同步、多鏡頭生成及聲音驅(qū)動(dòng)等功能,號(hào)稱是全球功能最全的視頻生成模型,也是國(guó)內(nèi)首個(gè)支持角色扮演功能的視頻生成模型。阿里方面表示,這次更新的萬(wàn)相2.6,有的功能比如音頻驅(qū)動(dòng)生成視頻,Sora2尚未實(shí)現(xiàn)。
為何這次千問(wèn)卯足了勁對(duì)標(biāo)Sora2,雙方之間究竟差距何在?
根據(jù)華泰證券相關(guān)研報(bào),9月30日,Open AI發(fā)布最新音視頻生成模型Sora2,并同步試運(yùn)行由該模型驅(qū)動(dòng)的iOS(蘋果操作系統(tǒng))社交應(yīng)用Sora。
該研報(bào)認(rèn)為,Sora此次較大的突破在于推出AI社交平臺(tái),有望通過(guò)雙邊效應(yīng)實(shí)現(xiàn)自我強(qiáng)化,進(jìn)一步降低內(nèi)容創(chuàng)作的門檻,吸引全球開發(fā)者與普通用戶共創(chuàng)內(nèi)容生產(chǎn),并通過(guò)垂直分發(fā)機(jī)制提升內(nèi)容消費(fèi)效率,有望創(chuàng)造新型社交場(chǎng)景。
有觀點(diǎn)認(rèn)為,Sora2及其配套社交應(yīng)用的發(fā)布,標(biāo)志著AI視頻生成與社交互動(dòng)進(jìn)入融合階段,或迎來(lái)AI視頻生成的“ChatGPT(OpenAI 發(fā)布的大語(yǔ)言模型 )時(shí)刻”。
工信部信息通信經(jīng)濟(jì)專家委員會(huì)委員盤和林對(duì)《每日經(jīng)濟(jì)新聞》記者表示,如今,在AI大模型算法能力上,中國(guó)相對(duì)較強(qiáng),具備追上Sora2的能力,且阿里本身具備比較豐富的數(shù)據(jù)資源和算力資源,即便短期有些性能差距,阿里千問(wèn)也能通過(guò)持續(xù)的算力和數(shù)據(jù)投入來(lái)解決問(wèn)題。
“性能上應(yīng)該是能夠無(wú)限接近Sora2。當(dāng)然,現(xiàn)階段還是有些差距的,多是一些生成細(xì)節(jié)上的差距?!北P和林說(shuō)。
記者在千問(wèn)App實(shí)測(cè)“AI小劇場(chǎng)”功能發(fā)現(xiàn),在選擇現(xiàn)存示例進(jìn)行“AI翻拍”的情況下,其視頻生成時(shí)間一般在2到5分鐘,可生成一段10秒視頻。
不過(guò),當(dāng)記者輸入描述,要求“孫悟空和財(cái)神擁抱”時(shí),千問(wèn)App的理解并不到位,給出了前后不相關(guān)的數(shù)個(gè)視頻畫面,包括孫悟空舉起玫瑰花、兩個(gè)財(cái)神擁抱。
就視頻生成賽道而言,千問(wèn)App在國(guó)內(nèi)也有不少競(jìng)爭(zhēng)對(duì)手。
同樣在12月16日,字節(jié)跳動(dòng)旗下“即夢(mèng)AI”網(wǎng)頁(yè)版官宣全面升級(jí),打造一站式“AI片場(chǎng)”。此次升級(jí)核心是即夢(mèng)AI最新視頻生成能力“視頻3.5 Pro”,支持視頻與音頻同時(shí)生成,人物口型、樂(lè)器演奏、環(huán)境音效等元素?zé)o需再后期配音,提升視頻的真實(shí)感與沉浸感。
今年12月,快手旗下“可靈AI”推出視頻生成2.6模型。據(jù)介紹,該模型提供了“音畫同出”能力,能夠在單次生成中,輸出包含自然語(yǔ)言、動(dòng)作音效以及環(huán)境氛圍音的完整視頻。目前,其語(yǔ)音支持生成中文與英文,生成的視頻長(zhǎng)度最長(zhǎng)可達(dá)10秒。12月5日,可靈AI宣布,可靈O1主體庫(kù)和對(duì)比模板兩大功能全新上線。
盤和林認(rèn)為,各大視頻生成AI之間,差距都比較小?!扒?wèn)視頻生成能力應(yīng)該和即夢(mèng)、可靈在同一起跑線?!彼硎?,因?yàn)楦骷以谒惴ā⑺懔?、?shù)據(jù)等基礎(chǔ)上處于近似的水平,AI視頻生成應(yīng)用是這些基礎(chǔ)的結(jié)果而已。
值得一提的是,這些大廠共同爭(zhēng)奪的,是一個(gè)廣闊的市場(chǎng)前景。
招商證券相關(guān)研報(bào)提及,根據(jù)Grand View Horizon(市場(chǎng)研究機(jī)構(gòu)),2025年全球AI視頻生成市場(chǎng)規(guī)模預(yù)計(jì)達(dá)8億美元。在其基本情形假設(shè)中,預(yù)計(jì)AI視頻生成可觸達(dá)市場(chǎng)規(guī)模接近400億美元,包含B端規(guī)模360億美元(90%占比)和C端規(guī)模40億美元(10%占比)。
不過(guò),12月13日,據(jù)《中國(guó)經(jīng)營(yíng)報(bào)》報(bào)道,近日,硅谷風(fēng)投機(jī)構(gòu)a16z合伙人Olivia Moore在社交媒體爆料稱,Sora的下載量仍在增長(zhǎng),但早期用戶留存率數(shù)據(jù)看起來(lái)相當(dāng)疲軟。他曬出了一張App數(shù)據(jù)監(jiān)測(cè)服務(wù)SensorTower的數(shù)據(jù)截圖:Sora的1天、7天、30天和60天用戶留存率分別為10%、2%、1%和0%。
不過(guò),就阿里在AI上的整體布局來(lái)看,千問(wèn)App上線“AI小劇場(chǎng)”的訴求未必是劍指AI視頻生成市場(chǎng)這么簡(jiǎn)單。千問(wèn)App剛上線時(shí),阿里便宣稱,其要與ChatGPT展開全面競(jìng)爭(zhēng),此次推出視頻生成新玩法,或是試圖縮小與Open AI的綜合差距,為正面抗衡鋪路。
截至12月17日,千問(wèn)App公測(cè)已滿一個(gè)月。一個(gè)月來(lái),這款A(yù)pp共計(jì)更新18個(gè)版本,正加強(qiáng)創(chuàng)作、學(xué)習(xí)、辦公三大場(chǎng)景能力。12月10日,阿里官方信息顯示,自11月17日公測(cè)僅23天,千問(wèn)月活躍用戶數(shù)(含App、Web、PC端)已突破3000萬(wàn),成為當(dāng)前全球增長(zhǎng)最快的AI應(yīng)用。
組織架構(gòu)的調(diào)整也在進(jìn)行中。12月9日消息,阿里已成立千問(wèn)C端事業(yè)群,由阿里巴巴集團(tuán)副總裁吳嘉負(fù)責(zé)。據(jù)媒體報(bào)道,阿里在內(nèi)部溝通中提及,千問(wèn)C端事業(yè)群的首要目標(biāo)是將千問(wèn)打造成為一款超級(jí)App,成為AI時(shí)代用戶的第一入口。
AI視頻生成的戰(zhàn)場(chǎng)硝煙彌漫,時(shí)至如今,這場(chǎng)較量不僅是技術(shù)參數(shù)的比拼,更是各家生態(tài)能力與用戶洞察的對(duì)決。在此大背景下,在AI賽道上,阿里若想“硬剛”O(jiān)pen AI,需要做的還有很多。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP