本報訊 (記者李冰)7月5日,在2024世界人工智能大會“可信大模型助力產(chǎn)業(yè)創(chuàng)新發(fā)展”論壇上,螞蟻集團公布了其自研的百靈大模型最新研發(fā)進展:百靈大模型已具備能“看”會“聽”、能“說”會“畫”的原生多模態(tài)能力,可以直接理解并訓(xùn)練音頻、視頻、圖、文等多模態(tài)數(shù)據(jù)。原生多模態(tài)被認(rèn)為是通往AGI的必經(jīng)之路,在國內(nèi),目前只有為數(shù)不多的大模型廠商實現(xiàn)了這一能力。
記者從大會現(xiàn)場的演示看到,多模態(tài)技術(shù)可以讓大模型更像人一樣感知和互動。據(jù)悉,目前百靈的多模態(tài)能力已應(yīng)用于“支付寶智能助理”上,未來還將支持支付寶上更多智能體升級。
發(fā)布現(xiàn)場,螞蟻集團副總裁徐鵬展示了新升級的多模態(tài)技術(shù)可實現(xiàn)的更多應(yīng)用場景:通過視頻對話的自然形式,AI助理能為用戶識別穿著打扮,給出約會的搭配建議;根據(jù)用戶不同的意圖,從一堆食材中搭配出不同的菜譜組合;根據(jù)用戶描述的身體癥狀,從一批藥物中,挑選出可能合適的藥,并讀出服用指導(dǎo),供用戶參考等。
同時,基于百靈大模型多模態(tài)能力,由螞蟻集團與武漢大學(xué)聯(lián)合研發(fā)的遙感模型SkySense,也在論壇上公布了開源計劃。SkySense是目前參數(shù)規(guī)模最大、覆蓋任務(wù)最全、識別精度最高的多模態(tài)遙感基礎(chǔ)模型。
“從單一的文本語義理解,到多模態(tài)能力,是人工智能技術(shù)的關(guān)鍵迭代,而多模態(tài)技術(shù)催生的‘看聽說寫畫’的應(yīng)用場景,將讓AI的表現(xiàn)更真實,更接近人類,從而也能更好地服務(wù)人類。螞蟻會持續(xù)投入原生多模態(tài)技術(shù)的研發(fā)。”徐鵬說。
(編輯 張偉)
多地召開“新春第一會” 高質(zhì)量發(fā)展、改革創(chuàng)新等被“置頂”
隨著春節(jié)假期結(jié)束,全國多地在蛇年首個工作……[詳情]
10:45 | 雀巢大中華區(qū)董事長兼首席執(zhí)行官張... |
10:42 | 全國人大代表、寧德時代高級技術(shù)工... |
10:39 | 全國人大代表、河南證監(jiān)局局長牛雪... |
10:25 | 擬披露重大事項!301613,停牌! |
23:41 | 全國政協(xié)委員、證監(jiān)會處罰委辦公室... |
23:41 | 基金券商十位首席經(jīng)濟學(xué)家熱議“穩(wěn)... |
23:41 | 回應(yīng)時代命題 民營企業(yè)大有可為 |
23:41 | 全國政協(xié)十四屆三次會議舉行第三次... |
23:41 | 全國政協(xié)委員、上交所總經(jīng)理蔡建春... |
23:41 | 滬市民營企業(yè)代表委員熱議高質(zhì)量發(fā)... |
23:41 | 穩(wěn)樓市、保就業(yè)、促養(yǎng)老四部門負責(zé)... |
23:40 | 大力提振消費 釋放消費增長潛能 |
版權(quán)所有證券日報網(wǎng)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120180014增值電信業(yè)務(wù)經(jīng)營許可證B2-20181903
京公網(wǎng)安備 11010202007567號京ICP備17054264號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細閱讀法律申明,風(fēng)險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注