
燃油車變速箱配不上新能源車,打通AI服務(wù)“最后一公里”
作者/ ?IT時(shí)報(bào)記者 ?孫妍
編輯/??孫妍
多年前,《IT時(shí)報(bào)》就曾評論:“錯(cuò)過了BAT的上海,這次沒錯(cuò)過‘新BAT’——嗶哩嗶哩(bilibili)、螞蟻集團(tuán)(Ant Group)和商湯(Sense Time)?!?/span>
上海向來都是務(wù)實(shí)派,戰(zhàn)略說到做到的強(qiáng)力執(zhí)行派。這些年,上海逐漸走出了自己的科技之路,歸納為一大基礎(chǔ)、兩大中心和兩大核心。智云上海、5G等新基建是一大基礎(chǔ),科創(chuàng)中心和國際金融中心是其兩大中心,與兩大中心對應(yīng)的核心賽道是AI和金融科技。
而AI和金融科技,正是螞蟻集團(tuán)既定的賽道。
AI理財(cái)助理“螞小財(cái)”連通200多家金融機(jī)構(gòu),不僅能幫用戶“盯盤”,還能深度“診基”;在上億人的手機(jī)里,都有一位健康管家AQ,“最近為什么提不起精神?”“每天喝奶茶患糖尿病的概率會(huì)增加多少?”有什么健康疑慮都可以問它,去醫(yī)院不了解掛什么科也可以問它;看一下就能支付,Rokid、小米、雷鳥等終端都推出了可支付的AI智能眼鏡,以后支付都不用掏手機(jī)了;在滬上阿姨上萬家門店里,數(shù)字碼力“AI督導(dǎo)員”正在巡店,助力規(guī)范設(shè)備衛(wèi)生、原料有效期、物料擺放、茶飲制作等流程,比以往的人海戰(zhàn)術(shù)提效15倍……
螞蟻創(chuàng)業(yè)已經(jīng)21年,第一個(gè)十年,參與了移動(dòng)支付的進(jìn)程,讓二維碼支付深入老百姓的日常生活。第二個(gè)十年,參與了中國數(shù)字普惠金融的實(shí)踐,讓普通用戶和千萬小微商家平等享受到金融服務(wù)。面向下一個(gè)十年,螞蟻確立了支付寶雙飛輪、AI first、加速全球化的戰(zhàn)略,既要探索AI的智能上限,也要守住科技的下限。
打通AI服務(wù)“最后一公里”
AI時(shí)代的支付應(yīng)該是什么樣?移動(dòng)支付在移動(dòng)互聯(lián)網(wǎng)時(shí)代迅猛發(fā)展,全世界都驚訝于中國的移動(dòng)支付便捷程度。
“今天在AI時(shí)代,數(shù)字支付仍然是支付的基礎(chǔ),但是它并不完全適用于AI時(shí)代,就像傳統(tǒng)油車的變速箱不能適配新能源車一樣。”螞蟻集團(tuán)CEO韓歆毅在WAIC 2025上說道,螞蟻希望打通AI時(shí)代支付的“最后一公里”。
今年5月份發(fā)布了國內(nèi)首個(gè)支付,探索智能體間的自然語言調(diào)用支付這一變革趨勢。
從數(shù)字化到通證化的趨勢,正在推動(dòng)跨境支付結(jié)算進(jìn)入秒級時(shí)代,7×24小時(shí)不間斷運(yùn)轉(zhuǎn),成本大幅降低。螞蟻集團(tuán)旗下全球跨境支付解決方案Alipay+讓全球游客一個(gè)錢包走遍天下;萬里匯(WorldFirst)首批參與浦東絲路電商先行試驗(yàn)區(qū),助力中小微企業(yè)貿(mào)易出海。
螞蟻不再局限于支付,分享了對AI應(yīng)用的幾點(diǎn)思考。AI驅(qū)動(dòng)的智能化服務(wù)是專業(yè)的、個(gè)性的和自動(dòng)化的,AI時(shí)代的應(yīng)用不僅局限在數(shù)字世界,也應(yīng)與物理世界實(shí)現(xiàn)數(shù)實(shí)協(xié)同。“我們正在聚焦AI應(yīng)用,努力讓智能上限的突破,惠及老百姓的生活日常。圍繞生活服務(wù)、金融服務(wù)和醫(yī)療健康服務(wù)三個(gè)垂直領(lǐng)域,螞蟻正在打造人人可用的生活管家、金融管家和醫(yī)療健康管家。”韓歆毅說。同時(shí),螞蟻正在探索AI從數(shù)字世界到物理世界的躍遷,比如在浦東張江落戶的螞蟻靈波科技,探索領(lǐng)域和服務(wù)機(jī)器人的研發(fā)與應(yīng)用。
“人工智能的發(fā)展還面臨著多重挑戰(zhàn),而多技術(shù)融合創(chuàng)新,將提升人工智能的下限。”韓歆毅說。螞蟻在AI研發(fā)之外,也在全面推進(jìn)包括核身、安全、數(shù)據(jù)要素等底層技術(shù),支撐未來人工智能大規(guī)模應(yīng)用時(shí)代的到來。過去三年來,螞蟻集團(tuán)每年的研發(fā)投入超過營收的10%,2024年投入的234.5億元更是創(chuàng)下歷史新高。
大模型成為
金融競爭力的關(guān)鍵要素
金融科技是上海的核心賽道,也是螞蟻的核心業(yè)務(wù)。金融行業(yè)的技術(shù)能力,可以說是各行各業(yè)中的珠穆朗瑪峰。要與金融行業(yè)攜手進(jìn)入AI時(shí)代,自身的技術(shù)能力必然要過硬,否則連金融客戶的要求都聽不懂。大模型深入金融行業(yè)實(shí)際業(yè)務(wù)場景,往往需要高度專業(yè)的金融知識、復(fù)雜的業(yè)務(wù)邏輯推理能力以及嚴(yán)格的金融安全合規(guī)要求。
“通用大模型距離產(chǎn)業(yè)實(shí)際應(yīng)用存在知識鴻溝。構(gòu)建專業(yè)的金融大模型是推進(jìn)金融與AI深度融合的必然路徑,未來,金融大模型的應(yīng)用深度將成為金融機(jī)構(gòu)競爭力的關(guān)鍵要素。”螞蟻數(shù)科CEO趙聞飆在WAIC 2025演講中表示。
7月28日,螞蟻集團(tuán)旗下獨(dú)立科技子公司螞蟻數(shù)科發(fā)布金融推理大模型Agentar-Fin-R1,為金融AI應(yīng)用打造“可靠、可控、可優(yōu)化”的智能中樞。Agentar-Fin-R1基于Qwen3研發(fā),在FinEval1.0、FinanceIQ等權(quán)威金融大模型評測基準(zhǔn)上超越Deepseek-R1等同尺寸開源通用大模型以及金融大模型,其三大優(yōu)勢正是金融專業(yè)性、推理能力與安全合規(guī)能力。
要讓模型“天生懂金融,出廠即專家”,必須“投喂”大量的高質(zhì)量數(shù)據(jù)。基于螞蟻集團(tuán)多年在金融科技領(lǐng)域的積累,螞蟻數(shù)科構(gòu)建了千億級金融專業(yè)數(shù)據(jù)語料庫,包括6大類、66小類場景,覆蓋銀行、證券、保險(xiǎn)、基金、信托等金融全場景。此外,模型還能吸收最新的金融政策、市場動(dòng)態(tài)等關(guān)鍵信息。
在可信數(shù)據(jù)合成技術(shù)與專家標(biāo)注的金融思維鏈構(gòu)造機(jī)制的主導(dǎo)下,使用加權(quán)訓(xùn)練算法,大模型得以顯著減少二次微調(diào)的數(shù)據(jù)需求與算力消耗,降低大模型在企業(yè)落地的門檻與成本。
為了考查大模型在實(shí)際金融場景中部署的能力,螞蟻數(shù)科還聯(lián)合中國工商銀行、寧波銀行、北京前沿金融監(jiān)管科技研究院、上海人工智能行業(yè)協(xié)會(huì)等機(jī)構(gòu)推出Finova大模型金融應(yīng)用評測基準(zhǔn),深度考查智能體能力、復(fù)雜推理能力以及安全合規(guī)能力。在Finova評測中,Agentar-Fin-R1取得最高評分,甚至超越更大參數(shù)規(guī)模的通用模型。目前Finova已經(jīng)全面開源,推動(dòng)行業(yè)共同提升大模型在金融領(lǐng)域的應(yīng)用水平。
近年來,螞蟻數(shù)科一直在前沿技術(shù)上探索,從Web3到AI,從金融到新能源行業(yè),此前曾推出金融智能體平臺Agentar,成為首批通過信通院評測的智能體平臺產(chǎn)品,并獲最高評級5級。螞蟻數(shù)科還聯(lián)合行業(yè)合作伙伴,推出超百個(gè)金融智能體解決方案,加速大模型在金融業(yè)規(guī)?;瘧?yīng)用。
螞蟻數(shù)科助力上海某銀行打造了AI手機(jī)銀行,創(chuàng)新“對話即服務(wù)”模式,用戶通過自然對話即可獲取各類金融服務(wù),推動(dòng)銀行老年客戶滿意度顯著提升,月活用戶同比增長25%。目前,螞蟻數(shù)科累計(jì)已服務(wù)100%的國有銀行和股份制銀行、超60%的地方性商業(yè)銀行、數(shù)百家金融機(jī)構(gòu)。
沒有十全十美的大模型
沒有十全十美的大模型,就像沒有不犯錯(cuò)的人一樣,幻覺是智力的必然代價(jià)。
大模型的專業(yè)化應(yīng)用,首要問題是可靠性。盡管當(dāng)前SOTA(最先進(jìn)、性能最優(yōu)的模型)已經(jīng)達(dá)到80%到90%的水平,但其可靠性距離醫(yī)療、工業(yè)、金融等專業(yè)場景的要求仍有顯著差距。浙江大學(xué)教授、區(qū)塊鏈與數(shù)據(jù)安全全國重點(diǎn)實(shí)驗(yàn)室主任陳純在WAIC 2025上表示,有人將這一問題簡單歸結(jié)為“幻覺”,但我想強(qiáng)調(diào):幻覺是智力的必然代價(jià)。若消除所有幻覺,大模型將退化為機(jī)械的檢索工具。因此,可靠性的突破不在于消滅“智力特征”,而在于構(gòu)建工程化保障框架。
如何突破大模型在專業(yè)化應(yīng)用中的可靠性困境?螞蟻集團(tuán)副總裁、螞蟻密算董事長韋韜認(rèn)為,技術(shù)上不應(yīng)當(dāng)只依賴于大模型“十全十美”不犯錯(cuò),而是通過智能體系和工程體系的結(jié)合,實(shí)現(xiàn)專業(yè)應(yīng)用可靠性的保障。正如每個(gè)人作為個(gè)體,是容易犯錯(cuò)、容易有幻覺的,但人類幾千年以來不斷在工程體系上的進(jìn)步,能夠在易錯(cuò)的個(gè)體之上構(gòu)建龐大而可靠的工程體系,完成諸如登月、探訪火星等巨型任務(wù)。他提出,通過全新的程序表達(dá)、場景知識嵌入和閉環(huán)核驗(yàn)反饋機(jī)制,可以將大模型中不確定的智力輸出轉(zhuǎn)化為可信的專業(yè)生產(chǎn)力。
對此,螞蟻密算正在探索高階程序(High-Order Program)大模型可信應(yīng)用技術(shù)框架,核心組件包括業(yè)務(wù)邏輯的程序化表達(dá)、場景知識圖譜和受控工具鏈,在全流程中貫穿核驗(yàn)機(jī)制,對關(guān)鍵執(zhí)行結(jié)果進(jìn)行及時(shí)、有效的核驗(yàn)和處理。該框架借鑒了人類在工程管理體系中的成功經(jīng)驗(yàn),如通過標(biāo)準(zhǔn)作業(yè)程序(SOP)和檢查清單等機(jī)制,構(gòu)建一個(gè)能夠有效復(fù)用、驗(yàn)證、擴(kuò)展和派生的機(jī)制,使大模型在應(yīng)用過程中即使出現(xiàn)幻覺問題,也能保證大模型達(dá)到專業(yè)領(lǐng)域所需的精確性和可靠性。
目前,高階程序技術(shù)框架已經(jīng)在金融風(fēng)控全鏈路、網(wǎng)絡(luò)入侵檢測、醫(yī)療重復(fù)計(jì)費(fèi)等多行業(yè)場景中初步應(yīng)用。在傳統(tǒng)金融風(fēng)控體系下,從數(shù)據(jù)探查、處理到模型構(gòu)建與調(diào)優(yōu)的全鏈路操作,高度依賴人工干預(yù),導(dǎo)致流程冗長、響應(yīng)緩慢,并且容易受人員主觀因素影響,制約了金融風(fēng)控聯(lián)合建模的效率與一致性。在應(yīng)用HOP技術(shù)框架后,將復(fù)雜的SOP轉(zhuǎn)化為可執(zhí)行的流程和代碼,實(shí)現(xiàn)風(fēng)控全鏈路的智能化編排與自動(dòng)化執(zhí)行。相較于傳統(tǒng)建模人員手動(dòng)進(jìn)行數(shù)據(jù)分析和代碼開發(fā),大模型結(jié)合HOP不但能降低處理成本,還能緩解專業(yè)人才緊缺的局面。
韋韜表示,“大模型可靠性的關(guān)鍵,不在于大模型本身,而在于工程化和智能化的融合。解決了可靠性問題,大模型即將涌現(xiàn)新的Killer App(殺手級應(yīng)用)。我們開源高階程序HOP,希望與行業(yè)一起把大模型從人類助手正在變成規(guī)?;瘜I(yè)生產(chǎn)力?!?/span>
排版/ 季嘉穎
圖片/ 螞蟻集團(tuán)
來源/《IT時(shí)報(bào)》公眾號vittimes
E?N?D
公 ? 示
根據(jù)中國記協(xié)《關(guān)于2025年向資深新聞工作者頒發(fā)榮譽(yù)證書和證章的通知》要求,《IT時(shí)報(bào)》擬申報(bào)資深新聞工作者榮譽(yù)證書證章的人員名單:賴真。
賴真同志工作經(jīng)歷:1994年8月-2024年12月,《IT時(shí)報(bào)》社(原《上海郵電報(bào)》社)從事新聞采編等相關(guān)工作,歷任《上海郵電報(bào)》記者、編輯、編輯部副主任;《IT時(shí)報(bào)》編輯部副主任、編輯部主任;IT時(shí)報(bào)/上海電信報(bào)副總編、總編。
《IT時(shí)報(bào)》申報(bào)總?cè)藬?shù):1人。
公示時(shí)間:2025年8月1日-2025年8月7日(5個(gè)工作日)。