7月5日,在2024世界人工智能大會“可信大模型助力產(chǎn)業(yè)創(chuàng)新發(fā)展”論壇上,螞蟻集團(tuán)公布其自研百靈大模型最新研發(fā)進(jìn)展:百靈大模型已具備能“看”會“聽”、能“說”會“畫”的原生多模態(tài)能力,可以直接理解并訓(xùn)練音頻、視頻、圖、文等多模態(tài)數(shù)據(jù)。原生多模態(tài)被認(rèn)為是通往AGI的必經(jīng)之路,在國內(nèi),目前只有為數(shù)不多的大模型廠商實(shí)現(xiàn)了這一能力。
從大會現(xiàn)場的演示看到,多模態(tài)技術(shù)可以讓大模型更像人一樣感知和互動,支撐智能體體驗(yàn)升級,百靈的多模態(tài)能力已應(yīng)用于“支付寶智能助理”上,未來還將支持支付寶上更多智能體升級。
據(jù)了解,百靈大模型多模態(tài)能力,在中文圖文理解MMBench-CN評測集上達(dá)到GPT-4o水平,在信通院多模態(tài)安全能力評測達(dá)到優(yōu)秀級(最高),具備支持規(guī)?;瘧?yīng)用的能力,能支持AIGC、圖文對話、視頻理解、數(shù)字人等一系列下游任務(wù)。
多模態(tài)大模型技術(shù)能夠使AI更好地理解人類世界的復(fù)雜信息,也讓AI落地應(yīng)用時更符合人類的交互習(xí)慣,在智能客服、自動駕駛、醫(yī)療診斷等多個領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力。
螞蟻集團(tuán)有著豐富的應(yīng)用場景,百靈大模型的多模態(tài)能力,也已被應(yīng)用在生活服務(wù)、搜索推薦、互動娛樂等場景。在生活服務(wù)上,螞蟻集團(tuán)使用多模態(tài)模型實(shí)現(xiàn)了ACT技術(shù),讓智能體具備一定規(guī)劃執(zhí)行能力,比如根據(jù)用戶語音指定直接在星巴克小程序下單一杯咖啡,目前這一功能已在支付寶智能助理上線。在醫(yī)療領(lǐng)域,多模態(tài)能力為用戶實(shí)現(xiàn)復(fù)雜任務(wù)的操作,可以對超過100多種復(fù)雜的醫(yī)學(xué)檢驗(yàn)檢測報告進(jìn)行識別和解讀,還可以檢測毛發(fā)健康和脫發(fā)情況,為治療提供輔助。
發(fā)布現(xiàn)場,螞蟻集團(tuán)副總裁徐鵬展示了新升級的多模態(tài)技術(shù)可實(shí)現(xiàn)的更多應(yīng)用場景:通過視頻對話的自然形式,AI助理能為用戶識別穿著打扮,給出約會的搭配建議;根據(jù)用戶不同的意圖,從一堆食材中搭配出不同的菜譜組合;根據(jù)用戶描述的身體癥狀,從一批藥物中,挑選出可能合適的藥,并讀出服用指導(dǎo),供用戶參考等。
基于百靈大模型多模態(tài)能力,螞蟻集團(tuán)已在探索規(guī)模應(yīng)用落地產(chǎn)業(yè)的實(shí)踐。
論壇上同時發(fā)布的“支付寶多模態(tài)醫(yī)療大模型”,便是這一探索的實(shí)踐。據(jù)了解,支付寶多模態(tài)醫(yī)療大模型添加了包含報告、影像、藥品等多模態(tài)信息在內(nèi)的百億級中英文圖文、千億級醫(yī)療文本語料以及千萬級高質(zhì)量醫(yī)療知識圖譜,具備專業(yè)醫(yī)學(xué)知識,在中文醫(yī)療 LLM 評測榜單promptCBLUE上,取得A榜第一、B榜第二的成績。
基于百靈大模型多模態(tài)能力,由螞蟻集團(tuán)與武漢大學(xué)聯(lián)合研發(fā)的遙感模型SkySense,也在論壇上公布了開源計劃。SkySense是目前參數(shù)規(guī)模最大、覆蓋任務(wù)最全、識別精度最高的多模態(tài)遙感基礎(chǔ)模型。
“從單一的文本語義理解,到多模態(tài)能力,是人工智能技術(shù)的關(guān)鍵迭代,而多模態(tài)技術(shù)催生的‘看聽說寫畫’的應(yīng)用場景,將讓AI的表現(xiàn)更真實(shí),更接近人類,從而也能更好地服務(wù)人類。螞蟻會持續(xù)投入原生多模態(tài)技術(shù)的研發(fā)。”徐鵬說。
隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,百靈大模型有望在更多領(lǐng)域發(fā)揮重要作用。螞蟻集團(tuán)等研發(fā)機(jī)構(gòu)將繼續(xù)投入原生多模態(tài)技術(shù)的研發(fā),推動人工智能技術(shù)的關(guān)鍵迭代。同時,百靈大模型的多模態(tài)能力也將為智能客服、自動駕駛、醫(yī)療診斷等領(lǐng)域帶來更多創(chuàng)新應(yīng)用,推動這些領(lǐng)域的智能化升級和發(fā)展。
綜上所述,百靈大模型作為一款具有強(qiáng)大技術(shù)實(shí)力和廣泛應(yīng)用前景的生成式人工智能大模型,正在不斷推動人工智能技術(shù)的發(fā)展和應(yīng)用落地。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/131127.html
摘要:演講中,王志勇代表螞蟻金服首次向公眾介紹了螞蟻金服智能推薦引擎,分享了螞蟻金服利用人工智能和大數(shù)據(jù)能力在推薦引擎上沉淀的大量經(jīng)驗(yàn),并介紹了結(jié)合螞蟻?zhàn)陨韮?yōu)勢打造的能夠靈活適配各種業(yè)務(wù)場景的智能推薦引擎解決方案及其能力和優(yōu)勢。 摘要:以數(shù)字金融新原力(The New Force of Digital Finance)為主題,螞蟻金服ATEC城市峰會于2019年1月4日上海如期舉辦。金融智能...
GLM-4-Plus是智譜AI最新推出的旗艦級預(yù)訓(xùn)練語言模型,標(biāo)志著公司在人工智能技術(shù)上取得了重大突破。相比前一代GLM-3模型,GLM-4-Plus在多個關(guān)鍵指標(biāo)上實(shí)現(xiàn)了大幅提升,尤其是在語言理解能力、指令遵循能力和長文本處理能力方面。這些進(jìn)步使得GLM-4-Plus在各類自然語言處理任務(wù)中的表現(xiàn)更加出色。主要更新語言基座模型 GLM-4-Plus:在語言理解、指令遵循、長文本處理等方面性能得到...
摘要:財富管理專場上,螞蟻金服財富事業(yè)群資深技術(shù)專家康宇麟做了主題為人工智能在財富領(lǐng)域的應(yīng)用與探索的精彩分享。使用人工智能技術(shù)可以幫助螞蟻金服決定給客戶理賠的金額,這大大提升了運(yùn)營的效率。 摘要: 以數(shù)字金融新原力(The New Force of Digital Finance)為主題,螞蟻金服ATEC城市峰會于2019年1月4日上海如期舉辦。財富管理專場上,螞蟻金服財富事業(yè)群資深技術(shù)專家...
閱讀 157·2024-12-10 11:51
閱讀 303·2024-11-07 17:59
閱讀 330·2024-09-27 16:59
閱讀 466·2024-09-23 10:37
閱讀 540·2024-09-14 16:58
閱讀 336·2024-09-14 16:58
閱讀 532·2024-08-29 18:47
閱讀 813·2024-08-16 14:40