

技術(shù)創(chuàng)新必須以尊重用戶權(quán)益和遵守監(jiān)管要求為前提同花財富。
作者|高 進
編輯|楊知潮
時至今日,用戶仍然不能使用自家的AI助手,調(diào)用谷歌郵箱發(fā)一封郵件。

和不久前發(fā)布的豆包手機助手相比,谷歌的AI功能實在太過“落后”。畢竟在之前的用戶實測里,它已經(jīng)可以繞開APP界面,直接幫用戶下單,還能自動回復消息。
但這不意味著谷歌的技術(shù)不如豆包,畢竟AI背后不止有技術(shù),還有用戶的安全和企業(yè)的責任。過于激進的方案,往往難以推進。
12月5日,在經(jīng)歷微信、支付寶、淘寶、農(nóng)業(yè)銀行等多家APP的“拒絕登陸”之后,豆包手機助手發(fā)布關(guān)于調(diào)整AI操作手機能力的說明。
說明指出:
為了讓技術(shù)發(fā)展、行業(yè)接受度和用戶體驗多方都能形成良性適配,我們計劃在接下來的一段時間,在部分場景,對AI操作手機的能力做一些規(guī)范化調(diào)整。具體包括,但不限于進一步限制金融類應(yīng)用的使用:銀行、互聯(lián)網(wǎng)支付等金融場景,直接關(guān)聯(lián)用戶的資金安全,雖然手機助手在敏感操作時都需要用戶授權(quán),但審慎起見,豆包手機助手也將暫時下線操作這類APP的能力。我們也會積極與相關(guān)廠商溝通,希望共同制定清晰、安全的AI操作行為準則。
和前兩天更為強硬的辯駁聲明相比,這份聲明在姿態(tài)上已經(jīng)柔軟很多,聲明主要說兩點:一、我們對于有些限制類應(yīng)用還是保持敬畏;二、我們愿意和大伙兒溝通,找到一個各方都能接受的行為標準。
總之,豆包降低了方案的激進程度。畢竟,此前的方案或許在一定程度上突破了技術(shù)邊界,但也同時突破了傳統(tǒng)的用戶安全體系、監(jiān)管體系、廠商合作模式的邊界。
01 豆包的遭遇不是創(chuàng)新者困局?
全球AI Agent的發(fā)展如火如荼。自2023年AutoGPT開啟智能體序幕以來,從個人助手到企業(yè)級解決方案,AI Agent展現(xiàn)出前所未有的活力。微軟、谷歌、亞馬遜等科技巨頭紛紛布局AI/Agent平臺,在基礎(chǔ)設(shè)施、多模態(tài)能力等方面各有優(yōu)勢。
豆包的方案術(shù)屬于GUI Agent的技術(shù)路線,本身并不新奇。GUI Agent是一種基于多模態(tài)視覺模型驅(qū)動的人工智能系統(tǒng)同花財富,能夠自動推理并執(zhí)行圖形用戶界面(GUI)交互,模擬人類用戶的操作如點擊、輸入、拖拽等,以完成工作任務(wù)。
無獨有偶,豆包手機助手發(fā)布兩天前,大模型獨角獸階躍星辰開源了跟豆包手機助手同類型的GUI Agent技術(shù)——名為GELab-Zero的套組。
在全球范圍內(nèi),GUI Agent技術(shù)的應(yīng)用一直較為謹慎。以蘋果的Siri和谷歌的Google Assistant為例,這些主流的智能助手雖然能夠通過語音指令完成部分操作,但它們嚴格遵循API(應(yīng)用程序編程接口)調(diào)用的方式,避免直接觸碰應(yīng)用程序的核心功能。這種做法既保證了用戶隱私和數(shù)據(jù)安全,也避免了與應(yīng)用程序開發(fā)者或監(jiān)管機構(gòu)的潛在沖突。
在國內(nèi),GUI Agent技術(shù)的落地同樣面臨著嚴格的考驗。百度、華為等廠商在推出各自的智能助手時,也選擇了與應(yīng)用程序開發(fā)者合作,通過API接口實現(xiàn)功能對接。這種方式雖然需要更多的溝通和協(xié)調(diào),但能夠確保技術(shù)的應(yīng)用符合行業(yè)規(guī)范和監(jiān)管要求。
然而,豆包手機助手卻選擇更為激進的路徑,繞過微信、支付寶等主流App的安全體系,豆包試圖通過用戶授權(quán)直接操作這些應(yīng)用程序的界面。這種激進的方案不僅引發(fā)了應(yīng)用開發(fā)者和用戶的不滿,也暴露了GUI Agent技術(shù)在實際應(yīng)用中可能存在的合規(guī)性和安全性問題。
02 為什么說豆包的方案是激進的
豆包的方案,不止是對互聯(lián)網(wǎng)合作關(guān)系的挑戰(zhàn),它還忽視了現(xiàn)有的成熟互聯(lián)網(wǎng)賬號安全體系。
經(jīng)過幾十年的發(fā)展,互聯(lián)網(wǎng)公司的賬戶安全體系設(shè)計可謂環(huán)環(huán)相扣、層層設(shè)防。以登錄驗證為例,有傳統(tǒng)的密碼驗證,也有更為安全的雙重驗證,如短信驗證碼、指紋、面部識別等。還有權(quán)限控制機制,嚴格限制不同用戶對數(shù)據(jù)的訪問權(quán)限,防止未經(jīng)授權(quán)的訪問。反欺詐檢測系統(tǒng)則能實時監(jiān)測異常登錄行為,如異地登錄、頻繁登錄失敗等,及時采取凍結(jié)賬戶等措施。
這些安全機制如果被繞開,存在風險。比如:如果繞過登錄驗證,攻擊者就能獲取用戶賬號,進而竊取用戶隱私信息,如社交賬號中的聊天記錄、聯(lián)系人信息,支付賬戶中的資金、交易記錄等。繞開權(quán)限控制,可能導致數(shù)據(jù)被隨意篡改或泄露,破壞數(shù)據(jù)的完整性與保密性。而跳過反欺詐檢測,異常行為將難以被及時發(fā)現(xiàn)和處理。一旦發(fā)生安全問題,豆包將面臨用戶信任危機,甚至可能承擔法律責任,畢竟用戶是基于對豆包的信任才授權(quán)其操作。
豆包的方案之所以引發(fā)爭議,核心還在于其忽略了互聯(lián)網(wǎng)行業(yè)在賬號安全和監(jiān)管方面的“防護欄”。微信、支付寶等App早已建立了嚴格的安全防護機制,防止第三方程序繞過其官方授權(quán),直接操作用戶的賬號和數(shù)據(jù)。在金融支付領(lǐng)域,監(jiān)管機構(gòu)對數(shù)據(jù)安全和用戶隱私的要求尤為嚴格。金融支付App通常需要通過多重身份驗證和安全協(xié)議,確保用戶操作的安全性。豆包試圖通過用戶授權(quán)直接跳過這些安全機制,這種做法不僅可能威脅到用戶的賬號安全,還可能違反相關(guān)法律法規(guī)。
此外,豆包的方案還涉及到一個關(guān)鍵問題:它是否能夠接過所有App的平臺責任,并滿足監(jiān)管需求?金融支付類App涉及用戶的財產(chǎn)安全,一旦出現(xiàn)數(shù)據(jù)泄露或操作失誤,責任歸屬將變得極其復雜。豆包作為第三方平臺,是否具備足夠的技術(shù)和能力來承擔這些責任?就像自動駕駛機構(gòu),能否承擔車輛行駛的全部安全責任?
如果答案存疑,豆包的方案就如同在現(xiàn)階段推出L5全自動駕駛一樣——還沒有成熟的條件。
從全球范圍來看,任何試圖繞過應(yīng)用開發(fā)者和監(jiān)管機構(gòu)的方案都難以獲得廣泛支持。過于激進的GUI Agent方案不僅可能威脅到用戶的隱私和安全,還可能引發(fā)監(jiān)管部門的審查和處罰。
03 走得穩(wěn)一點
技術(shù)創(chuàng)新必須以尊重用戶權(quán)益和遵守監(jiān)管要求為前提。這不是保守,而是對用戶的責任體現(xiàn)。
如何在維持目前的互聯(lián)網(wǎng)安全體系基礎(chǔ)上,手機智能助手等智能體之間可實現(xiàn)不同賬戶體系之間的互通,為用戶帶來更大價值?
谷歌早就做了示范:作為安卓系統(tǒng)中樞的谷歌助手(或Gemini),在用戶首次調(diào)用第三方應(yīng)用時,會清晰列出它需要訪問的用戶數(shù)據(jù)和權(quán)限。用戶必須主動登錄 Google 賬號并點擊授權(quán)才能繼續(xù)。
在涉及到用戶隱私的應(yīng)用,如郵箱時,谷歌表現(xiàn)得非??酥?,Gemini只有在用戶請求時才會調(diào)用相關(guān)數(shù)據(jù),且不會進行發(fā)布郵件等敏感行為。

圖注:作為谷歌自家的AI助手,Gemini發(fā)郵件沒有任何技術(shù)門檻,但有些行為,是出于對用戶的責任感。
國內(nèi)廠商里,OPPO和支付寶的合作也提供了參考。2025年10月17日,在以“AI,更近一步”為主題的2024 OPPO開發(fā)者大會上,支付寶發(fā)布了AHA(Agent Hub Access)智能體互聯(lián)協(xié)同解決方案。這一方案旨在通過安全可控的方式,實現(xiàn)智能助手與應(yīng)用程序之間的高效協(xié)作。
AHA解決方案的核心在于構(gòu)建了一個智能體互聯(lián)的樞紐。它能夠?qū)⑹謾C操作系統(tǒng)、手機廠商自研的AI大模型以及各類第三方應(yīng)用服務(wù)緊密連接起來。在這一樞紐的作用下,AI助手不再是孤立的個體,而是能夠與各種應(yīng)用進行智能交互的協(xié)同伙伴。比如用戶想要訂餐,不需要再單獨打開外賣App,只需向AI助手發(fā)出指令,助手就能通過AHA解決方案與外賣App進行交互,快速完成訂餐流程。
AHA解決方案在保障安全方面也下足了功夫。它遵循嚴格的安全標準和協(xié)議,確保用戶數(shù)據(jù)在傳輸和存儲過程中的安全性。在用戶授權(quán)方面,采用了透明且明確的授權(quán)機制,讓用戶清楚地知道自己的數(shù)據(jù)將被用于哪些服務(wù),充分尊重用戶的知情權(quán)和選擇權(quán)。
這一方案還具備很強的開放性和兼容性。它能夠接入不同廠商的AI助手和各類應(yīng)用,為整個AI助手行業(yè)提供了一個標準化的互聯(lián)互通平臺。這不僅有助于推動行業(yè)技術(shù)的創(chuàng)新發(fā)展,還能讓更多的開發(fā)者參與到生態(tài)建設(shè)中。
今年工信部、信通院等機構(gòu)也在積極推進國家多智能體互聯(lián)的標準,工信部牽頭的《人工智能 智能體互聯(lián)》系列標準也已發(fā)布,螞蟻集團做為核心參編方牽頭編寫,AHA作為重要業(yè)界實踐參考。
不可否認的是,未來,GUI Agent技術(shù)將持續(xù)發(fā)展,豆包的方案不是第一個也不是最后一個方案,無論如何,AI必須建立在對用戶隱私、數(shù)據(jù)安全和行業(yè)監(jiān)管的尊重之上。只有通過合規(guī)與合作的方式,才能真正實現(xiàn)技術(shù)的價值,為用戶提供更優(yōu)質(zhì)的智能服務(wù)。
頭圖來源|AI制圖
科元網(wǎng)提示:文章來自網(wǎng)絡(luò),不代表本站觀點。