百度開完這場發(fā)布會,OpenAI、微軟、蘋果都在隔空應戰(zhàn)
百度打的好算盤:讓應用依附百度大模型
有點數(shù)·數(shù)字經(jīng)濟工作室原創(chuàng)
作 者 | 有 叔
微信ID | yds_sh
中國互聯(lián)網(wǎng)曾經(jīng)歷過C2C(Copy to China)的階段,即借鑒海外創(chuàng)新,把美國的某種模式搬到中國來。但進入移動互聯(lián)網(wǎng)時代之后,中國勢力彎道超車,海外反而會借鑒中國的成功經(jīng)驗,成了2CC(to China Copy)。
生成式人工智能應用橫空出世之后,AI大模型的發(fā)展之路中外也有所差異:國外大模型過分注重“聰明程度”,卻忽略了用戶的使用成本以及應用體驗,導致新增用戶的趨勢在收縮;相比于美國注重算力基礎設施的供給,中國市場更加貼近用戶和市場,推出了多款與行業(yè)結合的AI應用。面對人工智能的下一個戰(zhàn)場,中外巨頭都在摩拳擦掌。
“不要卷模型,要卷應用”
“過去24個月,AI行業(yè)最大的變化是大模型基本消除了幻覺,回答問題的準確性大幅提升。讓AI變得真正可用、可信賴。” 在近期舉辦的百度世界2024大會上,百度創(chuàng)始人李彥宏以“應用來了”為主題進行了演講,在他看來,AI應用的大規(guī)模落地正在成為現(xiàn)實。
10年,在AI上砸了千億,作為國內最早深耕AI的企業(yè),百度的一舉一動,都是國內AI大模型的風向標。2023年,ChatGPT火爆,AI狂飆。當國內還在聚焦百模大戰(zhàn)時,李彥宏就提出了“不要卷模型,要卷應用”。他認為,大模型不應該只向內卷算力、卷參數(shù),更應該向外卷場景、卷問題,才能充分釋放大模型潛力和價值。
李彥宏認為,中國AI的發(fā)展道路,是由應用來驅動的,而智能體,則是他最看好的AI原生應用發(fā)展方向。
所謂“智能體”,是能夠自主感知環(huán)境、做出規(guī)劃、執(zhí)行任務的智能實體。如果用一個比較直觀的公式來表示,智能體=大模型+規(guī)劃+反饋+工具使用。和傳統(tǒng)的單體大語言模型這個“黑箱模型”相比,智能體的優(yōu)勢在于能更容易理解和分析不同組件如何對系統(tǒng)的整體行為做出貢獻。
英雄所見略同,2023年11月,比爾·蓋茨在其個人網(wǎng)站上撰文表示:“智能體不僅會改變我們與計算機的互動方式,還將顛覆軟件行業(yè),帶來自圖形用戶界面誕生以來最大的計算革命。”他稱智能體將會像過去的Android、iOS和Windows一樣,成為下一個平臺。
扎克伯格也預測,未來智能體的數(shù)量可能會達到數(shù)十億,甚至超過全球人口總數(shù)。今年 3 月,斯坦福大學教授吳恩達指出,他們在研究中基于 GPT-3.5 構建的智能體工作流在應用中表現(xiàn)可以比 GPT-4 要好,基于GPT-4 構建的智能體工作流效果當然還可以更好。他認為,AI 智能體將在2024 年推動 AI 的大規(guī)模進步,甚至可能超過下一代基礎模型所帶來的影響。
11歲的小學生,也能參與創(chuàng)造智能體
黃仁勛在2024年世界政府峰會上被問及人們應該學習什么時,他回答,“因為我們的工作是創(chuàng)造計算技術,使得沒有人需要傳統(tǒng)意義上的‘編程’,讓世界上的每個人都成為程序員。”
智能體最明顯的特點便是使用門檻足夠低,誰都能上手。比如在百度的文心智能體平臺上,有11歲的小學生創(chuàng)造的智能體,通過搜索和其他渠道分發(fā)出去。在大模型幻覺消失之后,越來越多的人靠自然語言提示詞就可以做出很有用的智能體。
盡管智能體降低了用戶的操作門檻,但它的天花板又足夠高,可以做出功能非常強大的應用。多個智能體的協(xié)作,還可以解決更加復雜的問題。
比如,公司類智能體對企業(yè)傳統(tǒng)官網(wǎng)能實現(xiàn)迭代升級。以比亞迪的智能體為例,不僅涵蓋了公司介紹、產(chǎn)品圖片和參數(shù)展示、線下門店位置等官網(wǎng)基本功能,還注入了主動推薦、及時響應、一對一服務等AI能力。比亞迪的官方智能體上線后,銷售轉化率提升119%。
舉個例子,智能體可以準確理解并推薦“性能均衡”的車型,并展示產(chǎn)品圖片:
在個人的工作生活中,或多或少都會遇到各類法律相關的問題,但不是每個人都能第一時間找到專業(yè)的律師來幫自己支招。這時,法律行業(yè)智能體“法行寶”就能派上用場。
假設在發(fā)生了交通事故糾紛,法行寶給出了四個步驟的指導,先是保留相關證據(jù),請求交管部門去調解,如果調解失敗,可以再提起民事訴訟、申請法院的強制執(zhí)行。如果需要計算事故損失和賠償金額,可以輸入詳細信息,法行寶的“賠償計算器”就能幫你計算。不僅如此,法行寶可以幫你寫一封起訴狀:
工具類智能體“自由畫布”則能讓用戶可以在一塊類似“畫布”的界面上自由拖拽文檔、音視頻等富媒體素材,迅速生成多模態(tài)內容。李彥宏稱其為是“立即可用的現(xiàn)貨”。它打通了公域與私域資料的限制,比如行業(yè)分析師可以使用它來撰寫研究報告,文檔、視頻、音頻等不限格式的文件都可以一鍵摘錄到自由畫布。
AI助理或將成為移動互聯(lián)新入口
法律助手、創(chuàng)作助手,以智能體作為切口,國內互聯(lián)網(wǎng)廠商找到的這個AI應用方向,在大洋彼岸也得到了呼應,美國的頭部廠商最近也正爭先推出AI助理產(chǎn)品。
AI助理(AI Agent)是一種能夠感知環(huán)境、進行決策和執(zhí)行動作的智能實體,具備通過獨立思考、調用工具去逐步完成給定目標的能力,既能為C端提供個性化應用,也能為B端提供降本增效方案。對于普通用戶而言,AI助理最核心的功能是AI自主操作手機,輔助完成復雜推理任務。
OpenAI正準備推出一款代號為“Operator”的全新AI助理產(chǎn)品,可以自動執(zhí)行各種復雜操作,包括編寫代碼、預訂旅行、自動電商購物等。根據(jù)內部員工爆料,OpenAI領導層預計將在2025年1月發(fā)布該產(chǎn)品,首先作為研究預覽版和開發(fā)工具推出,屆時將為開發(fā)人員開放API接口。
OpenAI首席執(zhí)行官阿爾特曼表示,“我們將擁有越來越好的模型,但我認為下一個重大突破將是AI助手。”站在OpenAI的角度,其在商業(yè)化進程中面臨著越來越大的壓力, ChatGPT漸進式的改進可能無法吸引用戶支付更高的價格。高管急切需要一款突破性產(chǎn)品,以證明對AI開發(fā)的巨額投資是值得的。
與此同時,微軟近期低調開源了AI工具OmniParser,其可幫助用戶創(chuàng)建個性化智能體,以操作個人計算機;10月22日,微軟宣布在Dynamics 365中集成10個自主AI Agent,支持OpenAI最新模型o1,具備自主學習能力,可自動執(zhí)行跨平臺復雜業(yè)務。
谷歌計劃在12月預覽其大型動作模型“Project Jarvis”,該項目將幫助用戶執(zhí)行諸如“收集研究、購買產(chǎn)品或預訂航班”等任務。
蘋果選擇將Siri與ChatGPT集成,實現(xiàn)更智能的人機交互,另有網(wǎng)友發(fā)現(xiàn)蘋果已經(jīng)默默發(fā)布了Ferret-UI的兩個實現(xiàn)版本(分別基于Gemma 2B和Llama 8B),這是蘋果今年5月發(fā)布的一個可讓AI理解手機屏幕的技術。
在硬件廠商言必稱AI的時代,AI助理或成為終端智能化的突破口。更具有想象空間的是,中外巨頭都在押注的AI助理或將掌握移動互聯(lián)新入口。因具備較強交互性以及便利性,AI助理有望打通原先同個終端不同App之間的天然壁壘,那樣的話,流量分發(fā)格局也必將重塑。
無論是百度、KIMI還是通義、豆包更或是ChatGPT、蘋果、谷歌、微軟,最終誰將掌握新的移動互聯(lián)網(wǎng)入口,拿到未來船票,就看誰的應用更智慧、更好用。
未來搶奪AI移動平臺超級入口的戰(zhàn)爭剛剛開始,先發(fā)優(yōu)勢與后發(fā)優(yōu)勢誰才有真的優(yōu)勢,就看誰率先打造出AI超級應用平臺,這個平臺不是單一應用功能,而是無所不能的超級綜合體。
未來,拭目以待。
原文標題 : 百度開完這場發(fā)布會,OpenAI、微軟、蘋果都在隔空應戰(zhàn)

最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?