訂閱
糾錯
加入自媒體

寫研報水平超過ChatGPT,國產(chǎn)大模型究竟在“寫”啥?

按照科技行業(yè)普遍觀點,某個技術(shù)超越科技奇點后就會產(chǎn)生科技大爆炸,圍繞該技術(shù)的各類應(yīng)用層出不窮,繼而激活一輪新科技革命。顯而易見的是,通過GPT,AI實際上已在2023年跨越了技術(shù)奇點。2024年開始,AI正在進(jìn)入“大航海時代”作者/李長懷編輯/沐凌

國產(chǎn)大模型廠商,正在一些局部能力上成功趕超ChatGPT。近日,弗若斯特沙利文(Frost & Sullivan)聯(lián)合頭豹研究院發(fā)布《2023年中國大模型行研能力評測報告》,商湯商量、文心一言3.5、訊飛星火等多款國產(chǎn)大模型均取得了接近甚至超過GPT3.5的得分。

數(shù)字行研作為一個小規(guī)模、不成熟的行業(yè),對擠進(jìn)榜單前列的幾家廠商整體發(fā)展的影響似乎不大。不過,作為中國廠商全面布局的AIGC眾多細(xì)分市場之一,這些廠商接近甚至超過ChatGPT3.5的能力表現(xiàn),卻是對其大模型卓越競爭能力的有力驗證;也是他們通過各個細(xì)分領(lǐng)域“聚沙成塔”效應(yīng),實現(xiàn)業(yè)務(wù)穩(wěn)健發(fā)展的一個支點。尤其是在AI大航海時代,AI不僅成為各行各業(yè)轉(zhuǎn)型升級的核心動力,也必然帶來全球科技行業(yè)格局和秩序的重構(gòu)。近日微軟市值反超蘋果,即是前兆。透過榜單縱觀整個AIGC市場,商湯、百度、科大訊飛等中國大模型廠商,實際上已具備參與國際競爭,并競逐未來AI時代全球科技領(lǐng)域少數(shù)幾個領(lǐng)導(dǎo)者的能力。

01

新賽道,“中國隊”集體反超

自ChatGPT爆火以來,生成式 AI的顛覆性已毋庸置疑。沒有人再追問何為生成式 AI,而是希望了解它究竟能給自己帶來什么價值。而金融行業(yè)應(yīng)用AI技術(shù)撰寫研報早已有之。早在2018年,一家名為Kensho的人工智能公司,就開發(fā)出一款Warren分析軟件(取自沃倫·巴菲特),只需幾分鐘即可完成各類信息搜索和投研分析,為用戶提供投資建議。相比之下,完全依靠人工操作的資產(chǎn)分析師團(tuán)隊,要完成這一過程,往往需要長達(dá)一周時間。這種顛覆性的投研分析工具,不僅讓Kensho贏得了華爾街“人神共憤”的名聲,更讓這家初創(chuàng)公司獲得標(biāo)普5.5億美元的收購大單,成為當(dāng)時人工智能領(lǐng)域最大的一筆收購交易。

而再往前看,Kensho的早期投資人中,更是不乏高盛、大摩、小摩、花旗、布雷耶、谷歌風(fēng)投、恩頤投資等國際頂尖投資機(jī)構(gòu)?梢,對于數(shù)字投研的產(chǎn)業(yè)價值,國際投資界早已“用腳投票”。之所以一直不溫不火,大概還要歸因于技術(shù)。據(jù)沙利文指出,行業(yè)研究的行業(yè)特殊性、復(fù)雜性、嚴(yán)謹(jǐn)性,對內(nèi)容生成和創(chuàng)作能力提出了多維度的高要求。而顯然,以ChatGPT為代表的語言大模型的突破,成功解決了這一問題。業(yè)界至今仍記得,2023年2月,財通證券發(fā)布的一篇由ChatGPT撰寫的醫(yī)美研報,剛一發(fā)布就迅速在金融圈刷屏,有券商分析師直呼:“肯定會替代人工。”

眾所周知,內(nèi)容生成和創(chuàng)作能力是目前大模型最火熱的應(yīng)用場景。Gartner 預(yù)測,到2025年,企業(yè)30%的營銷信息將會由大模型協(xié)助生成。數(shù)字投研恰好趕上了這一輪數(shù)字變革,從默默無聞一轉(zhuǎn)身成為爆火的黃金賽道。這次由沙利文例舉的12款大模型背后的研發(fā)廠商,堪稱大模型“中國隊”的排頭兵,代表了中國大模型廠商的整體技術(shù)能力。譬如商湯科技,早在大模型熱興起之前,其已成為全球領(lǐng)先的AI軟件公司。

根據(jù)沙利文報告,在這次榜單中,商湯語言大模型“日日新·商量”(簡稱:商湯商量)以總分7.73斬獲總榜第一,并在報告撰寫能力(八大模塊)、模型基礎(chǔ)能力(行研基礎(chǔ)能力)兩個子榜位居第一,成績明顯高于GPT3.5(7.29分)。除商湯之外,百度旗下的文心一言3.5,也獲得了7.48的總分,實現(xiàn)對GPT3.5的反超?拼笥嶏w旗下的訊飛星火總分7.25,緊隨其后,并在報告撰寫能力子榜上獲得8.10的得分,遠(yuǎn)高于GPT3.5的7.58。無論是商湯、百度的整體能力超越,還是科大訊飛的單項能力超越,都向我們傳遞出這樣一個事實:中國大模型廠商,已經(jīng)具備在數(shù)字行研這一新興賽道參與國際競爭并占得優(yōu)勢的能力。 而作為內(nèi)容生成領(lǐng)域的一個高門檻行業(yè),這也意味著“中國隊”在AIGC的其他賽道,同樣可以占得一席之地。

02

構(gòu)筑AI之塔的又一粒金沙

“每個行業(yè)都可以重做一遍”,是這波AIGC熱潮中被重復(fù)最多的一句話。這句話其實包含兩個方面,一是用大模型賦能改造各行各業(yè),實現(xiàn)性能升級、服務(wù)升級,大幅提升產(chǎn)業(yè)效率,在此過程中實現(xiàn)大模型的商業(yè)變現(xiàn);另一方面,則是依托大模型超強(qiáng)的智能化能力,創(chuàng)造新的智能化產(chǎn)品、服務(wù),開拓新的賽道。數(shù)字行研恰恰就是后者的一個典型例證。

可以說,如果沒有大模型這樣強(qiáng)大的數(shù)字能力支撐,Kensho式的小打小鬧,也許很難形成如今刷屏金融圈的金融科技新賽道。類似的案例俯拾即是。去年年中,小冰公司開始推出網(wǎng)紅明星克隆人,數(shù)字人聊天平臺Character.AI的移動端首周下載量甚至超過ChatGPT,其背后正是大模型以其突破性的內(nèi)容生成能力,實現(xiàn)了數(shù)字人的個性化。用《第一財經(jīng)》的話說:“AI已開始為數(shù)字人注入靈魂。”

至于前者,微軟、阿里、百度等國內(nèi)外科技巨頭,使用大模型工具對其自身及客戶產(chǎn)品、平臺功能的陸續(xù)改造,早已不是什么新鮮事。從行業(yè)發(fā)展來說,兩者的“雙路并進(jìn)”,帶來了大模型相關(guān)行業(yè)快速增長的強(qiáng)勁動力。而從企業(yè)來看,這也要求他們不能拘于一隅,限制了自身的發(fā)展,而是要不斷地拓展大模型應(yīng)用領(lǐng)域,在現(xiàn)有的各行各業(yè)率先實現(xiàn)業(yè)務(wù)落地,站穩(wěn)腳跟的同時,不斷探索新的市場,才能真正實現(xiàn)自身業(yè)務(wù)的穩(wěn)健、長期增長。

好在,從政策層到企業(yè)層,都已意識到行業(yè)落地的重要性,并正在積極推進(jìn)。2023年7月發(fā)布的首部大模型監(jiān)管法規(guī)《生成式人工智能服務(wù)管理暫行辦法》,首先即明確了鼓勵生成式人工智能技術(shù)在各行業(yè)、各領(lǐng)域的創(chuàng)新應(yīng)用,探索優(yōu)化應(yīng)用場景,構(gòu)建應(yīng)用生態(tài)體系。今年兩會期間,大模型的落地應(yīng)用也成為代表討論的高頻詞。企業(yè)方面,就本次報告中幾家領(lǐng)先廠商來看,在數(shù)字行研之外的眾多領(lǐng)域,他們都已實現(xiàn)成功落地。據(jù)商湯介紹,截至去年11月底,商湯的語言大模型商量在金融、手機(jī)、醫(yī)療、汽車、地產(chǎn)、能源、傳媒、工業(yè)制造等眾多垂直行業(yè),已經(jīng)與超過500家客戶建立了深度合作。如果拓展到商湯公司在2023年4月發(fā)布的全系列生成式AI產(chǎn)品——商量、秒畫、如影、瓊宇、格物,商湯大模型產(chǎn)品的落地應(yīng)用,正展現(xiàn)出強(qiáng)勁的發(fā)展?jié)撃堋?/p>

根據(jù)商湯2023年半年報,公司生成式AI相關(guān)收入錄得了670.4%的同比增長,對集團(tuán)業(yè)務(wù)的貢獻(xiàn)從2022年的10.4%迅速提升至20.3%,AIGC轉(zhuǎn)型正呈現(xiàn)加速態(tài)勢。國聯(lián)證券研報認(rèn)為,AI大模型已開啟商湯第二增長曲線。從商湯的AIGC轉(zhuǎn)型來看,大模型廠商的業(yè)務(wù)增長模式,恰如《法華經(jīng)》中“聚沙為佛塔”的“童子戲”。對于商湯、百度、科大訊飛等一眾中國大模型廠商來說,在產(chǎn)業(yè)發(fā)展初期,“壘石為屋”式的發(fā)展往往會面臨找不到石塊的窘境,因而每一粒細(xì)沙都顯得彌足珍貴。 可喜的是,面對潛力十足的數(shù)字行研賽道,他們沒有錯過這粒金沙。

03

“大航海時代”的“小日記”

按照科技行業(yè)普遍觀點,某個技術(shù)超越科技奇點后就會產(chǎn)生科技大爆炸,圍繞該技術(shù)的各類應(yīng)用層出不窮,繼而激活一輪新科技革命。顯而易見的是,通過GPT,AI實際上已在2023年跨越了技術(shù)奇點。2024年開始,AI正在進(jìn)入“大航海時代”。

500年前的那次大航海,不僅帶來了“日不落”帝國在全世界范圍的崛起,也醞釀了當(dāng)今世界唯一超級大國的雛形,世界格局發(fā)生了翻天覆地的變化。對于AI行業(yè)這場新的“大航海”來說,其在全球科技領(lǐng)域深遠(yuǎn)影響也同樣顯而易見。因此,“每個行業(yè)都可以重做一遍”,對如今的大模型廠商來說,既是機(jī)遇,也是挑戰(zhàn)。產(chǎn)業(yè)滲透的進(jìn)展,在各個細(xì)分領(lǐng)域的份額,直接影響到大模型廠商在未來科技競爭中的沉浮。1月11日,微軟股價上漲,市值再次超過蘋果,成為新年以來最受關(guān)注的事件之一,仿佛就是科技行業(yè)的一個隱喻。

市場似乎認(rèn)定了在大模型研發(fā)應(yīng)用上走在了前面的微軟,比遲遲不見動靜的蘋果公司,更有可能抓住未來科技領(lǐng)域最有價值的機(jī)遇,成為新的“日不落”和“美利堅”。幸而,中國的大模型廠商們,也已經(jīng)造好了他們的海船。以本次報告中得分高居榜首的商湯為例,其在整個AIGC領(lǐng)域已構(gòu)建起從算力基礎(chǔ)設(shè)施到模型到應(yīng)用的全棧布局,公司在“大模型+大算力”的戰(zhàn)略下,通過AI大裝置SenseCore打造出了具備自然語言處理、內(nèi)容生成、自動化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等多種大模型及能力的“日日新SenseNova”大模型體系,催生了AIGC“新的研究范式”,即基于一個強(qiáng)大的多模態(tài)基模型,通過強(qiáng)化學(xué)習(xí)和人類反饋,不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務(wù)。在“日日新”大模型體系下,商湯創(chuàng)造出了一系列生成式AI模型及應(yīng)用。

尤其值得注意的是,在AI算力需求指數(shù)式增長帶來的算力短缺背景下,商湯對智能計算基礎(chǔ)設(shè)施SenseCore大裝置進(jìn)行持續(xù)升級,算力規(guī)模達(dá)到6ExaFLOPS,為這艘中國大模型“海船”,提供了充足、可靠的動力。環(huán)顧全球大模型廠商,“迪亞士”們率先啟航,但也尚未走遠(yuǎn);“達(dá)伽馬”們未來或許不一定能發(fā)現(xiàn)新大陸,但開辟出通往東方的新航線,也將在“日不落”帝國的崛起中發(fā)揮重要作用;“麥哲倫、哥倫布”出發(fā)稍晚,但等在他們前方的,是最受矚目的美麗新世界。一切都還只是剛剛開始,桂冠也不止一個,唯一的問題是:路在何方?

在如今大模型應(yīng)用爆發(fā)的初期,應(yīng)用領(lǐng)域挖掘不徹底、商業(yè)模式不完善是擺在大模型廠商面前的共同難題。要尋得這些難題的破解之法,只能在更多的應(yīng)用領(lǐng)域進(jìn)行長期深入的廣泛探索,從中總結(jié)經(jīng)驗,發(fā)現(xiàn)規(guī)律。數(shù)字行研本身只是大模型無數(shù)應(yīng)用領(lǐng)域中微不足道的一個,但它對各家廠商們的價值,或許正在于此。 讓我們再次回想500年前,當(dāng)哥倫布來到美洲時,他仍在自己的航海日記中,書寫著在他看來稀松平常的見聞。但直到今天,我們都知道,這位空前偉大的航海家,不經(jīng)意間已經(jīng)記下了歐洲人登陸新大陸的偉大時刻。在數(shù)字行研領(lǐng)域“集體”反超GPT3.5的成果,或許也可以看作中國大模型廠商們,記下的一篇稀松平常的“航海日記”。我們期望,終有一天,在大模型發(fā)展的漫漫航程中,中國廠商們,也將迎來自己的“登陸時刻”。

       原文標(biāo)題 : 寫研報水平超過ChatGPT,國產(chǎn)大模型究竟在“寫”啥?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號