說不盡的“百!贝髴(zhàn)
今年以來,我國大模型產(chǎn)業(yè)駛?cè)?ldquo;百模”大戰(zhàn)時代,賽道熱度空前,大戰(zhàn)愈演愈烈。在本月初舉行的2023全球數(shù)字經(jīng)濟(jì)大會人工智能高峰論壇上,北京市經(jīng)濟(jì)和信息化局黨組書記、局長姜廣智表示,現(xiàn)在全國已有80余個大模型公開發(fā)布。
“百模”
“百模”實(shí)則大模型產(chǎn)業(yè)領(lǐng)域中各家企業(yè)發(fā)布的大模型,目前,大模型及其產(chǎn)品主要分為三類。第一類是通用大模型,如OpenAI的ChatGPT、百度的‘文心一言’、科大訊飛的‘星火’等都屬于通用大模型;第二類是行業(yè)大模型;第三類是基于通用大模型或行業(yè)大模型的應(yīng)用型服務(wù)。目前已經(jīng)發(fā)布的產(chǎn)品大多集中在第一類和第二類。
從全球已經(jīng)發(fā)布的大模型分布來看,中美兩國數(shù)量合計(jì)占全球總數(shù)的超 80%。有專家披露,據(jù)不完全統(tǒng)計(jì),目前中國 10 億參數(shù)規(guī)模以上的大模型已發(fā)布 79 個。那么,國內(nèi)又有哪些大模型?
華為:盤古大模型
7月7日-9日,盤古大模型3.0在華為開發(fā)者大會2023上正式發(fā)布,由 5+N+X 三層架構(gòu)組成。
L0 基礎(chǔ)大模型:包含五個基礎(chǔ)大模型:中文語言(NLP)大模型、視覺(CV)大模型、多模態(tài)大模型、科學(xué)計(jì)算大模型和圖網(wǎng)絡(luò)(Graph)大模型。
L1 行業(yè)大模型:涵蓋N 個行業(yè)大模型,已推出了盤古金融大模型、盤古礦山大模型、盤古氣象大模型、盤古電力大模型、盤古制造質(zhì)檢大模型、盤古藥物分子大模型等行業(yè)大模型。
L2 場景模型:為客戶提供更多細(xì)化場景,它更加專注于某個具體的應(yīng)用場景或特定業(yè)務(wù),為客戶提供開箱即用的模型服務(wù)。例如基于氣象大模型的短臨氣象預(yù)報、臺風(fēng)預(yù)測等場景模型;基于電力大模型的無人機(jī)電力巡檢、電力缺陷識別等場景模型;基于時尚大模型的時尚輔助設(shè)計(jì)、時尚版權(quán)保護(hù)等場景模型。
截至目前,盤古大模型已深入金融、制造、政務(wù)、電力、煤礦、醫(yī)療、鐵路等 10 多個行業(yè),支撐起 400 多個 AI 業(yè)務(wù)場景的應(yīng)用落地。
百度:文心一言
2月7日,百度正式宣布推出文心一言(ERNIE Bot),文心一言是基于文心大模型技術(shù)推出的生成式對話產(chǎn)品,底層技術(shù)基礎(chǔ)是文心大模型,底層邏輯是通過百度智能云提供服務(wù),吸引企業(yè)和機(jī)構(gòu)客戶使用API和基礎(chǔ)設(shè)施,共同搭建AI模型、開發(fā)應(yīng)用,實(shí)現(xiàn)產(chǎn)業(yè)AI普惠。
文心大模型包括NLP大模型、CV大模型、跨模態(tài)大模型、生物計(jì)算大模型、行業(yè)大模型。目前,文心大模型已經(jīng)迭代至3.5版本,與3.0版本相比,訓(xùn)練速度提升了2倍,推理速度提升了17倍,模型效果累計(jì)提升超過50%。
據(jù)百度官方表示,文心一言大模型的訓(xùn)練數(shù)據(jù)包括了萬億級網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級的語音日均調(diào)用數(shù)據(jù),以及5500億事實(shí)的知識圖譜等。
騰訊:混元大模型
基于騰訊強(qiáng)大的底層算力和低成本的高速網(wǎng)絡(luò)基礎(chǔ)設(shè)施,2022 年底騰訊發(fā)布了低成本、可落地的NLP萬億大模型——混元(HunYuan)AI 大模型。
混元AI大模型采用騰訊太極機(jī)器學(xué)習(xí)平臺自研的訓(xùn)練框架AngelPTM,相比業(yè)界主流的解決方案,太極AngelPTM單機(jī)可容納的模型可達(dá)55B,20個節(jié)點(diǎn)(A100-40Gx8)可容納萬億規(guī)模模型,節(jié)省45%訓(xùn)練資源,并在此基礎(chǔ)上訓(xùn)練速度提升1倍。
在模型層,混元大模型完整覆蓋 NLP 大模型、 CV 大模型、多模態(tài)大模型、文生圖大模型及眾多行業(yè)、領(lǐng)域、任務(wù)模型。其中,HunYuan-NLP 1T 的模型能力在自然語言理解任務(wù)榜單 CLUE 中登頂。
在產(chǎn)業(yè)化方面,混元先后支持了包括微信、QQ、游戲、騰訊廣告、騰訊云等眾多產(chǎn)品和業(yè)務(wù),通過 NLP、CV、跨模態(tài)等 AI 大模型,不僅為業(yè)務(wù)創(chuàng)造了增量價值而且降低了使用成本。特別是其在廣告內(nèi)容理解、行業(yè)特征挖掘、文案創(chuàng)意生成等方面的應(yīng)用,在為騰訊廣告帶來大幅 GMV 提升的同時,也初步驗(yàn)證了大模型的商業(yè)化潛力。
阿里:通義千問
2022年9月,在阿里巴巴達(dá)摩院主辦的世界人工智能大會“大規(guī)模預(yù)訓(xùn)練模型”主題論壇上,達(dá)摩院副院長周靖人發(fā)布阿里巴巴“通義”大模型系列,并宣布相關(guān)核心模型向全球開發(fā)者開源開放。
通義大模型打造了業(yè)界首個AI(人工智能)統(tǒng)一底座,在業(yè)界首次實(shí)現(xiàn)模態(tài)表示、任務(wù)表示、模型結(jié)構(gòu)的統(tǒng)一。以統(tǒng)一底座為基礎(chǔ),達(dá)摩院構(gòu)建了層次化的模型體系,其中通用模型層覆蓋自然語言處理、多模態(tài)、計(jì)算機(jī)視覺,專業(yè)模型層深入電商、醫(yī)療、法律、金融、娛樂等行業(yè)。
目前,通義大模型系列已在超過200個場景中提供服務(wù),實(shí)現(xiàn)了2%~10%的應(yīng)用效果提升。典型使用場景包括電商跨模態(tài)搜索、AI輔助設(shè)計(jì)、開放域人機(jī)對話、法律文書學(xué)習(xí)、醫(yī)療文本理解等。
京東:言犀大模型
7月13日,京東言犀大模型在2023京東全球科技探索者大會暨京東云峰會上推出。與通用大模型相比,靈犀大模型融合70%通用數(shù)據(jù)與30%數(shù)智供應(yīng)鏈原生數(shù)據(jù),具有“更高產(chǎn)業(yè)屬性、更強(qiáng)泛化能力、更多安全保障”的優(yōu)勢。
同時,京東還推出了一套大模型的完整工具,包括支撐大模型研發(fā)的基礎(chǔ)設(shè)施——言犀AI開發(fā)計(jì)算平臺、向量數(shù)據(jù)庫、混合多云操作系統(tǒng)云艦、高性能存儲平臺云海、軟硬一體虛擬化引擎京剛等核心產(chǎn)品。
該模型的落地應(yīng)用路線圖“125”計(jì)劃也已公布,包括一個平臺、兩個領(lǐng)域和五個應(yīng)用。其中,一個平臺為ChatJD智能人機(jī)對話平臺,兩個領(lǐng)域?yàn)榱闶酆徒鹑,五個應(yīng)用則包括內(nèi)容生成、人機(jī)對話、用戶意圖理解、信息抽取和情感分類。
360:360智腦大模型
6月13日,360集團(tuán)正式召開“360智腦大模型”應(yīng)用發(fā)布會,發(fā)布認(rèn)知型通用大模型“360智腦4.0”,并宣布360智腦已經(jīng)接入360旗下產(chǎn)品“全家桶”中。
據(jù)介紹,本次發(fā)布的“智腦大模型”已經(jīng)具備四大核心能力,包括文字處理能力、圖像處理能力、語音處理能力以及視頻處理能力,可實(shí)現(xiàn)文生文、文生圖、文生表、圖生圖、圖生文、視頻理解等功能。
360選擇了大而全路線,對標(biāo)微軟的全家桶。當(dāng)前,360智腦已具備生成與創(chuàng)作、多輪對話、代碼能力、文本分類、文本改寫、閱讀理解、邏輯與推理、知識問答、多模態(tài)、翻譯等十大核心能力,維度涵蓋數(shù)百項(xiàng)細(xì)分功能。
科大訊飛:星火認(rèn)知大模型
5月6日,科大訊飛星火認(rèn)知大模型正式發(fā)布,涵蓋了文本生成、語言理解、知識問答、邏輯推理等七項(xiàng)核心能力,并持續(xù)迭代于6月9日再次升級發(fā)布星火認(rèn)知大模型V1.5。
目前,科大訊飛圍繞星火認(rèn)知大模型,以一平臺 + 多賽道的“1+N”模式,將業(yè)務(wù)范圍延展到包括開放平臺、智慧教育、智慧醫(yī)療、智慧城市、運(yùn)營商在內(nèi)的多個領(lǐng)域。其中,“1”是指以通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練底座平臺,“N”則是針對于多個行業(yè)領(lǐng)域的專用大模型版本,其中,包含教育、醫(yī)療、汽車、人機(jī)交互、辦公、翻譯、工業(yè)等。
所有產(chǎn)品都值得用大模型重做一遍
“所有產(chǎn)品都值得用大模型重做一遍。”在2023年阿里云峰會上,阿里巴巴集團(tuán)董事會主席兼CEO張勇說道。
放到應(yīng)用層面來理解,玩家都期待借著這個風(fēng)口,把自家產(chǎn)品包裝一下再重新推廣出去。所以,目前各家的大模型都與本身業(yè)務(wù)類型相關(guān)。這也就說明,目前國內(nèi)的“百模”大戰(zhàn),大模型的內(nèi)卷仍是互聯(lián)網(wǎng)企業(yè)主流業(yè)務(wù)的競爭。
小結(jié):
大模型產(chǎn)業(yè)是未來科技競爭的關(guān)鍵較量之一。有些專家認(rèn)為,聚焦細(xì)分領(lǐng)域有可能讓成本降低,讓大模型在領(lǐng)域落地和成本優(yōu)化方面進(jìn)展更快才能真正普惠更多用戶。
有些專家對此持相反觀點(diǎn),認(rèn)為:細(xì)分行業(yè)只存在于“中模型”,不存在于”大模型“,只有覆蓋多個行業(yè)、通用才叫大模型,畢竟“百模大戰(zhàn)”最終拼的是場景落地能力。
如何率先突圍,仍然需要時間的檢驗(yàn)。
原文標(biāo)題 : 資本 | 說不盡的“百!贝髴(zhàn)

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?