螞蟻百靈大模型：多模態(tài)能力讓大模型像人一樣理解感知

UCloud小助手發(fā)布于2024-07-09 17:30 / 292人閱讀

7月5日，在2024世界人工智能大會“可信大模型助力產(chǎn)業(yè)創(chuàng)新發(fā)展”論壇上，螞蟻集團(tuán)公布其自研百靈大模型最新研發(fā)進(jìn)展：百靈大模型已具備能“看”會“聽”、能“說”會“畫”的原生多模態(tài)能力，可以直接理解并訓(xùn)練音頻、視頻、圖、文等多模態(tài)數(shù)據(jù)。原生多模態(tài)被認(rèn)為是通往AGI的必經(jīng)之路，在國內(nèi)，目前只有為數(shù)不多的大模型廠商實(shí)現(xiàn)了這一能力。

從大會現(xiàn)場的演示看到，多模態(tài)技術(shù)可以讓大模型更像人一樣感知和互動，支撐智能體體驗(yàn)升級，百靈的多模態(tài)能力已應(yīng)用于“支付寶智能助理”上，未來還將支持支付寶上更多智能體升級。

據(jù)了解，百靈大模型多模態(tài)能力，在中文圖文理解MMBench-CN評測集上達(dá)到GPT-4o水平，在信通院多模態(tài)安全能力評測達(dá)到優(yōu)秀級（最高），具備支持規(guī)?；瘧?yīng)用的能力，能支持AIGC、圖文對話、視頻理解、數(shù)字人等一系列下游任務(wù)。

多模態(tài)大模型技術(shù)能夠使AI更好地理解人類世界的復(fù)雜信息，也讓AI落地應(yīng)用時更符合人類的交互習(xí)慣，在智能客服、自動駕駛、醫(yī)療診斷等多個領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力。

螞蟻集團(tuán)有著豐富的應(yīng)用場景，百靈大模型的多模態(tài)能力，也已被應(yīng)用在生活服務(wù)、搜索推薦、互動娛樂等場景。在生活服務(wù)上，螞蟻集團(tuán)使用多模態(tài)模型實(shí)現(xiàn)了ACT技術(shù)，讓智能體具備一定規(guī)劃執(zhí)行能力，比如根據(jù)用戶語音指定直接在星巴克小程序下單一杯咖啡，目前這一功能已在支付寶智能助理上線。在醫(yī)療領(lǐng)域，多模態(tài)能力為用戶實(shí)現(xiàn)復(fù)雜任務(wù)的操作，可以對超過100多種復(fù)雜的醫(yī)學(xué)檢驗(yàn)檢測報告進(jìn)行識別和解讀，還可以檢測毛發(fā)健康和脫發(fā)情況，為治療提供輔助。

發(fā)布現(xiàn)場，螞蟻集團(tuán)副總裁徐鵬展示了新升級的多模態(tài)技術(shù)可實(shí)現(xiàn)的更多應(yīng)用場景：通過視頻對話的自然形式，AI助理能為用戶識別穿著打扮，給出約會的搭配建議；根據(jù)用戶不同的意圖，從一堆食材中搭配出不同的菜譜組合；根據(jù)用戶描述的身體癥狀，從一批藥物中，挑選出可能合適的藥，并讀出服用指導(dǎo)，供用戶參考等。

基于百靈大模型多模態(tài)能力，螞蟻集團(tuán)已在探索規(guī)模應(yīng)用落地產(chǎn)業(yè)的實(shí)踐。

論壇上同時發(fā)布的“支付寶多模態(tài)醫(yī)療大模型”，便是這一探索的實(shí)踐。據(jù)了解，支付寶多模態(tài)醫(yī)療大模型添加了包含報告、影像、藥品等多模態(tài)信息在內(nèi)的百億級中英文圖文、千億級醫(yī)療文本語料以及千萬級高質(zhì)量醫(yī)療知識圖譜，具備專業(yè)醫(yī)學(xué)知識，在中文醫(yī)療 LLM 評測榜單promptCBLUE上，取得A榜第一、B榜第二的成績。

基于百靈大模型多模態(tài)能力，由螞蟻集團(tuán)與武漢大學(xué)聯(lián)合研發(fā)的遙感模型SkySense，也在論壇上公布了開源計劃。SkySense是目前參數(shù)規(guī)模最大、覆蓋任務(wù)最全、識別精度最高的多模態(tài)遙感基礎(chǔ)模型。

“從單一的文本語義理解，到多模態(tài)能力，是人工智能技術(shù)的關(guān)鍵迭代，而多模態(tài)技術(shù)催生的‘看聽說寫畫’的應(yīng)用場景，將讓AI的表現(xiàn)更真實(shí)，更接近人類，從而也能更好地服務(wù)人類。螞蟻會持續(xù)投入原生多模態(tài)技術(shù)的研發(fā)。”徐鵬說。

隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展，百靈大模型有望在更多領(lǐng)域發(fā)揮重要作用。螞蟻集團(tuán)等研發(fā)機(jī)構(gòu)將繼續(xù)投入原生多模態(tài)技術(shù)的研發(fā)，推動人工智能技術(shù)的關(guān)鍵迭代。同時，百靈大模型的多模態(tài)能力也將為智能客服、自動駕駛、醫(yī)療診斷等領(lǐng)域帶來更多創(chuàng)新應(yīng)用，推動這些領(lǐng)域的智能化升級和發(fā)展。

綜上所述，百靈大模型作為一款具有強(qiáng)大技術(shù)實(shí)力和廣泛應(yīng)用前景的生成式人工智能大模型，正在不斷推動人工智能技術(shù)的發(fā)展和應(yīng)用落地。

GPU算力平臺 GPU云服務(wù)器大數(shù)據(jù)模型大數(shù)據(jù)數(shù)據(jù)模型大數(shù)據(jù)模型分析大數(shù)據(jù)處理模型

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://specialneedsforspecialkids.com/yun/131127.html

發(fā)表評論

登陸后可評論

0條評論

UCloud小助手

男|高級講師

我要關(guān)注我要私信

TA的文章

U大使獎勵規(guī)則全新發(fā)布

閱讀 157·2024-12-10 11:51
服務(wù)器常用端口大全

閱讀 303·2024-11-07 17:59
又來!OpenAI 宮斗大戲曝光,首席技術(shù)官M(fèi)ira 離職

閱讀 330·2024-09-27 16:59
2.4K star的GOT-OCR2.0：端到端OCR 模型

閱讀 466·2024-09-23 10:37
Openai 放出大招！O1: 邁向下一代人工智能的2.0時代

閱讀 540·2024-09-14 16:58
Openai 放出大招！O1: 邁向下一代人工智能的2.0時代

閱讀 336·2024-09-14 16:58
網(wǎng)頁開發(fā)助手——自動編寫運(yùn)行代碼

閱讀 532·2024-08-29 18:47
一直爆料OpenAI「草莓」的賬號，竟然是個智能體？Agent Q橫空出世，AI界新秀or營銷大師

閱讀 813·2024-08-16 14:40

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

螞蟻百靈大模型：多模態(tài)能力讓大模型像人一樣理解感知

相關(guān)文章

螞蟻金服智能推薦引擎解決方案與實(shí)踐

智譜AI最新GLM-4-Plus上線開放平臺！可視頻通話

人工智能在財富領(lǐng)域的應(yīng)用與探索

發(fā)表評論

0條評論

UCloud小助手

男|高級講師

TA的文章

U大使獎勵規(guī)則全新發(fā)布

服務(wù)器常用端口大全

又來!OpenAI 宮斗大戲曝光,首席技術(shù)官M(fèi)ira 離職

2.4K star的GOT-OCR2.0：端到端OCR 模型

Openai 放出大招！O1: 邁向下一代人工智能的2.0時代

Openai 放出大招！O1: 邁向下一代人工智能的2.0時代

網(wǎng)頁開發(fā)助手——自動編寫運(yùn)行代碼

一直爆料OpenAI「草莓」的賬號，竟然是個智能體？Agent Q橫空出世，AI界新秀or營銷大師

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

螞蟻百靈大模型：多模態(tài)能力讓大模型像人一樣理解感知

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！