本報訊 (記者梁傲男)12月16日,阿里發(fā)布新一代萬相2.6系列模型,該系列模型面向?qū)I(yè)影視制作和圖像創(chuàng)作場景進行了全面升級,全新的萬相2.6是國內(nèi)首個支持角色扮演功能的視頻模型。該模型同時支持音畫同步、多鏡頭生成及聲音驅(qū)動等功能,是全球功能最全的視頻生成模型。據(jù)記者了解,萬相2.6已同步上線阿里云百煉、萬相官網(wǎng)。
今年9月,阿里率先在國內(nèi)發(fā)布音畫同步的視頻生成模型萬相2.5,極大提升視頻創(chuàng)作的效率,在權(quán)威大模型評測集LMArena上,萬相圖生視頻位居國內(nèi)第一。此次發(fā)布的萬相2.6進一步提升了畫質(zhì)、音效、指令遵循等能力,單次視頻時長實現(xiàn)國內(nèi)最高的15s,萬相2.6還新增了角色扮演和分鏡控制功能,不僅能一鍵完成單人、多人、人與物合拍的視頻,還能自動實現(xiàn)多鏡頭切換等專業(yè)任務(wù),滿足專業(yè)影視級場景需求。
據(jù)介紹,通義萬相在模型結(jié)構(gòu)上集成了多項創(chuàng)新技術(shù),可對輸入?yún)⒖家曨l進行多模態(tài)聯(lián)合建模與學(xué)習(xí),參考具有時序信息的主體情緒、姿態(tài)和多角度全面視覺特征,同時提取音色、語速等聲學(xué)特征,在生成階段作為參考條件控制,實現(xiàn)從畫面到聲音的全感官全維度一致性保持與遷移,目前萬相可支持單人和多人的表演。
在分鏡控制上,通義萬相能通過高層語義理解,將原始輸入構(gòu)建為具備完整故事線與敘事張力的專業(yè)級多鏡頭段落,在多鏡頭絲滑切換的過程中保持核心主體、場景布局和環(huán)境氛圍統(tǒng)一建模,確保全片在內(nèi)容、節(jié)奏和氛圍上的高一致性。
萬相2.6的角色扮演功能讓普通用戶也能在影視級畫面里表現(xiàn)精湛的演技。例如,用戶上傳一段個人視頻,并輸入一段科幻懸疑風(fēng)格的提示詞,萬相2.6能快速完成分鏡設(shè)計、角色演繹、畫面配音等環(huán)節(jié)工作,生成一段鏡頭敘事完整、電影級運鏡的短片,僅需幾分鐘就能幫用戶圓電影主角夢。
即日起,所有人可直接在萬相官網(wǎng)體驗萬相2.6,企業(yè)用戶還能通過阿里云百煉調(diào)用模型API,據(jù)悉,千問APP也將于近期上線該模型,并提供更豐富的玩法。
目前,萬相模型家族已支持文生圖、圖像編輯、文生視頻、圖生視頻、人聲生視頻、動作生成、角色扮演及通用視頻編輯等10多種視覺創(chuàng)作能力,已廣泛應(yīng)用于AI漫劇、廣告設(shè)計和短視頻創(chuàng)作等領(lǐng)域。
(編輯 郭之宸)
衛(wèi)星通信管理制度及政策法規(guī)進一步完善……[詳情]
| 18:03 | 聚焦新能源汽車“四化”發(fā)展新路徑... |
| 17:59 | 得利斯集團董事長鄭思敏榮獲第十屆... |
| 17:58 | 11月份非游戲廠商出海收入榜三甲揭... |
| 17:56 | “山東省董秘領(lǐng)航計劃”在齊魯股權(quán)... |
| 17:50 | 金融壹賬通亮相2025亞洲保險科技洞... |
| 17:45 | 袁記云餃會員總數(shù)突破4000萬 |
| 17:38 | “科八條”以來科創(chuàng)板并購重組方興... |
| 17:26 | 京東健康舉辦兒童健康公益研討會 ... |
| 17:24 | 即時零售成醫(yī)藥健康增長主引擎 京... |
| 17:23 | 一汽解放2026全球合作伙伴大會營銷... |
| 17:22 | 香港交易所集團行政總裁陳翊庭:目... |
| 17:18 | 2.4萬人共赴“健身+防非”之約!華... |
版權(quán)所有《證券日報》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細閱讀法律申明,風(fēng)險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注