訂閱
糾錯
加入自媒體

垂類AI率先引爆行業(yè)!AI終于開始解決實際問題了

2025-03-14 08:59
雷科技
關注

AI的價值,在于能解決多少實際問題。

最近,一款名為Manus的產品頗受爭議。

Manus是什么,它怎么突然就火了?從官網展示的demo來看,Manus主打的是針對某場景的實際應用,比如可以深度體驗產品并制作調研報告,再比如可以批量處理面試簡歷并打分排名。

圖源:Manus官網

先不管Manus的爭議如何,它的出現能導致刷屏,正好說明了AI領域的一個新趨勢:AI的發(fā)展不再盲目追求規(guī)模,而是開始深入挖掘實際價值。

 

無獨有偶,Manus智能體橫空出世后,OpenAI緊跟放大招,推出開發(fā)者工具鏈簡化智能體開發(fā),幫助開發(fā)人員和企業(yè)構建有用且可靠的AI智能體。OpenAI首席產品官凱文威爾直言:“2025年將是智能體真正發(fā)揮作用的一年。到2025年,ChatGPT將開始在現實世界中為你做事。” 

這也讓我們看到了AI領域的一個根本性變化:過去AI追求通用的廣泛能力,現在則更聚焦于在特定垂直領域解決具體問題。

AI領域重心出現轉移,市場開始聚焦垂類應用

這個發(fā)展路徑并不意外,從歷史上看,科技行業(yè)的變革往往遵循一定的階段性規(guī)律。以互聯(lián)網時代為例,最初是那些“賦能者”受益,比如半導體公司,然后進入基礎設施的層面,包括云計算、設備和電力供應相關的企業(yè),最后才是應用和服務層面,比如抖音、微信、美團等,大部分的價值都會在應用推廣后釋放出來。

這個思路放在AI時代同樣適用,通用大模型建立了基礎設施,最后真正實現AI價值的,是基于通用大模型所衍生出來的垂類模型。

有兩個場景可以充分證明,一是醫(yī)療行業(yè),二是翻譯行業(yè)。

雖然人工智能已經落地醫(yī)療多場景,但當前醫(yī)學領域的專用垂類模型和以DeepSeek為代表的通用大模型還有很大區(qū)別。以藥物研發(fā)為例,據新華財經報道,多家生物醫(yī)藥企業(yè)表示,當前通用大模型對藥物研發(fā)的直接賦能仍然有限。

藥物研發(fā)目前還是依靠垂類模型。通用模型和垂類模型的差別主要取決于兩個方面,一個是訓練數據源的差異,另一個是反饋機制的差異。通用模型可用數據是龐大的、易獲得的;專有模型訓練用的數據是有較高質量要求的、精準的。

再以AI翻譯市場為例,不可否認的是,對于文字轉譯這種簡單翻譯需求,其實大模型都能滿足,但具有專業(yè)難度、容錯率低的翻譯需求,卻往往會讓我們對大模型持更大的懷疑態(tài)度,在準確性、專業(yè)性、安全合規(guī)性上,試錯成本太高,因此最后還是要求助專業(yè)工具。

即便強如DeepSeek,有時候也會在回答結果上進行“思維涌現”,可能會出現在文字上生造概念,堆疊名詞,濫用修辭的現象。簡單來說就是會畫蛇添足。這種自作主張對某個詞語的“優(yōu)化”,在專業(yè)場景中具有致命性,特別是在重要場合,或者醫(yī)藥翻譯上,錯誤代價太高。

而且,DeepSeek有時候存在胡編亂造的可能,比如最典型的是在舉例的時候,很容易自己異想天開。比如以下例子,著實讓人貽笑大方。

圖源:DeepSeek

在需要精準度的專業(yè)領域,通用大模型其引以為傲的"涌現能力"反而成為風險源頭。當技術進入實際產業(yè)應用階段時,建立精準的數據和場景適配,比單純增加模型參數更有意義。 

因此現在我們能夠看到的一大趨勢就是,2025年市場的焦點轉向垂類AI應用。

專業(yè)工具想要擁抱AI,垂類模型是最好的選擇

如果說2024年的主角是通用大模型,那2025年的主角絕對是小參數的垂類模型。

當業(yè)界還在熱議 DeepSeek-R1 開源戰(zhàn)略對 AI 生態(tài)的重構、持續(xù)探討 Manus 智能 Agent 的技術突破時,國產大模型已在垂直賽道實現關鍵性跨越。

3 月 11 日,網易有道宣布完成翻譯底層技術迭代,基于自主研發(fā)的子曰翻譯大模型 2.0,在測試中實現翻譯質量超越國內外主流通用大模型,達行業(yè)第一。

我們也實測了一下,發(fā)現在很多專業(yè)領域的翻譯中,有道大模型翻譯確實領先于市面上主流的通用大模型。

比如兩者分別輸入:“After the 52-week trial period, patients entered a 12-week follow-up safety period during which they were no longer receiving dupilumab or placebo。”對比其翻譯結果。

可以看到,DeepSeek無法將“dupilumab”進行本土化翻譯,仍是以英文的方式呈現,而有道詞典則是準確將“dupilumab”翻譯為度普利尤單抗。

另外,DeepSeek把“trial period”翻譯成了“治療期”,而正確的翻譯應該是有道詞典的“試驗期”。

我不確定在醫(yī)療場景下,“治療期”與“試驗期”的差別是什么,但僅從語義來看,兩者顯然會讓非醫(yī)學專業(yè)的同學產生誤會。

類似的例子還有很多,比如曾有通用大模型將臨床試驗報告中的"placebo effect"(安慰劑效應)誤譯為"愉悅效應",仲裁案中,法律文件里的"force majeure"(不可抗力)被譯成"主要力量";再比如某并購協(xié)議中的“joint and several liability”(連帶責任)被翻譯為“聯(lián)合與單獨責任”,引發(fā)合同雙方對責任范圍的重大誤解,最終需人工律師介入修正。

圖源:小紅書

之所以有道大模型翻譯的質量能做到比主流通用大模型高,背后就是垂類大模型的驅動。

2023年7月,網易有道推出國內首個教育大模型“子曰”,“子曰”大模型從一開始就定位為是一個“場景為先”的教育垂類大模型,相比于通用大模型,教育垂類大模型子曰擁有更專業(yè)的預訓練語料,可以滿足用戶在不同場景下的學習需求。

目前子曰翻譯大模型已經來到了2.0階段,這背后,有道從數據、算法和效果評估三個核心環(huán)節(jié)入手,進行了全面的優(yōu)化和升級。

在數據層面,有道精心收集了并嚴格清洗了數千萬高質量的翻譯數據,并由英語專八認證人員及職業(yè)譯員組成的專家團隊進行多維度人工標注,保證訓練數據的高質量。極大豐富了數據資源庫,讓模型在多樣化翻譯場景中游刃有余。

在算法層面,有道子曰翻譯大模型實現了兩大技術突破,分別是大模型融合與Online DPO。 

簡單來說,大模型融合就是像“專家會診”一樣翻譯,相當于有道子曰翻譯大模型如同組建了“全科專家團”。使用大模型融合技術,通過結合不同大模型的優(yōu)勢來避免災難性遺忘現象,確保模型在保持翻譯能力的同時,也不失綜合能力。

Online DPO則可以理解成翻譯界的"養(yǎng)成計劃",每次訓練生成一優(yōu)一劣兩個譯文,讓模型學習更高質量的譯文,通過3輪對比淘汰機制強化模型的判斷力,自動標注翻譯偏好數據。經過海選→晉級→決賽三輪嚴格篩選,最終留下的都是"全能翻譯"。

在評估層面,有道團隊人工標注了覆蓋各個領域的開發(fā)集和盲測集,嚴格確保了測試數據的全面性和代表性。對算法團隊所使用的開發(fā)集和盲測數據集實行嚴格分離、相互獨立,以確保評估的客觀性與準確性,模型最終效果以盲測集效果為準。

在自動評估方面,有道不僅使用行業(yè)通用的Comet指標,還自主研發(fā)了更精準的大模型評估工具,進一步提升了翻譯質量檢測的可靠性。同時設計并執(zhí)行了更完善的人工評估方案,從多維度對模型的翻譯結果進行細致地分析和評價。

正是通過這三個層面的全方位優(yōu)化與升級,有道用一個小參數模型就能實現超越通用大模型的翻譯質量。而這樣的故事,在2025年還會涌現更多。

AI的價值,在于解決了多少實際問題

科技發(fā)展的核心就是解決問題,F在大家越來越清楚:到2025年,各種專業(yè)領域的AI工具會迎來大爆發(fā)。

根據市場研究機構MarketsandMarkets的最新報告,垂類AI應用的市場規(guī)模預計將從去年51億美元大幅擴張至2030年的大約471億美元,到2032年還可能超過1000億美元。

在這樣的大背景下,以有道為代表的專業(yè)翻譯工具具有標桿意義。這場垂類AI革命給予行業(yè)的最大啟示,或許在于對技術本質的重新認知:AI的價值不在于參數多少,而在于解決了多少實際問題。 

當科技巨頭還在為"萬億俱樂部"的門票廝殺時,那些在垂直領域默默耕耘的“有道”們,正在用更精巧的模型、更專注的投入,撬動百倍于通用模型的實際價值。這種"少即是多"的策略,或許才是穿越AI時代的真正指南針。

站在2025年的技術分水嶺回望,我們會發(fā)現一個有趣的現象:當通用大模型試圖用規(guī)模征服世界時,專業(yè)工具正在用深度重新定義邊界。其中,有道大模型翻譯就是一個將AI與實際應用結合的極佳典范。

這不僅是技術的勝利,更是對產業(yè)規(guī)律最深刻的敬畏:在任何領域,專業(yè)主義永遠是不可替代的稀缺品。

來源:雷科技

本文圖片來自:123RF 正版圖庫       來源:雷科技

       原文標題 : 垂類AI率先引爆行業(yè)!AI終于開始解決實際問題了

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號