訂閱
糾錯
加入自媒體

知乎版ChatGPT「知海圖AI」加入國產大模型亂斗,稱效果與GPT-4持平

“2023知乎發(fā)現大會”上,知乎創(chuàng)始人、董事長兼CEO周源和知乎合作人、CTO李大海共同宣布了知乎與面壁智能聯合發(fā)布“知海圖AI”中文大模型。

周源據介紹,知乎與面壁智能達成深度合作,共同開發(fā)中文大模型產品并推進應用落地。目前,知乎和面壁智能合作自研的“知海圖AI”中文大模型已經運用進了知乎熱榜,知乎首個大模型功能“熱榜摘要”上線并開啟內測。

“知海圖AI”借力知乎語言數據庫優(yōu)勢,稱與GPT-4效果持平

在知乎創(chuàng)始人、董事長兼 CEO 周源看來,AI 時代的生產力要素可以分為三層,從上到下依次是應用場景、專有數據、基礎模型!爸DAI”具備必須的生產力要素基因。

基礎模型方面,在知乎與面壁智能合作自研的“知海圖AI”中文大模型面世之前,面壁智能已在 2020 年底發(fā)布了首個中文大語言模型 CPM-1,之后又陸續(xù)發(fā)布了 CPM-2、CPM-3 和 CPM-Ant 等模型。在應用場景在上,以問答形式為主,知乎搭建了專業(yè)、多元、有價值的“討論場”。專有數據方面,知乎的運營模式決定了其積累了大量高質量的內容、關系和知識圖譜,在當前國內互聯網高質量內容匱乏的情況下,知乎的優(yōu)勢得天獨厚,的確具備構建一個大模型的數據量。

目前,知乎和面壁智能合作自研的“知海圖AI”中文大模型,已經運用進了知乎熱榜,知乎首個大模型功能“熱榜摘要”上線并開啟內測。

在知乎這個場景里面,答主的回答千奇百怪、非常開放,甚至會出現觀點跟提問沒有關系的情況。這對整個大模型很有挑戰(zhàn)。知乎稱,“知海圖AI”利用超強的語言理解能力對知乎熱榜上的問題回答進行抓取、整理和聚合,并把回答梗概展現給用戶,給大家直觀清晰的回答。

面壁智能聯合創(chuàng)始人、CTO 曾國洋表示,“在這個場景(知乎凌亂的問答區(qū))下抽了40個提問去做評測。評測以后,發(fā)現跟GPT-4在這方面基本持平,我們稍微差一些,但還是蠻不錯的。

國產大模型開啟亂斗,資源稟賦各不相同

人工智能激戰(zhàn)正酣,當前各個大廠、創(chuàng)業(yè)企業(yè)開啟亂斗,根據統(tǒng)計,目前國內至少有 15 個大大小小的 AI 大模型正在研發(fā),當然各家資源稟賦各不相同。

國內已經宣布AI大模型項目的企業(yè)/機構

阿里系AI大模型“通義”系列,特點在于“借力阿里超強的中間件優(yōu)勢,構建完整生態(tài)”,“通義”系列大模型將深入到電商、設計、醫(yī)療、法律、金融等行業(yè),服務超過200個場景。阿里通義大模型打造了國內首個AI統(tǒng)一底座,根據研報梳理,阿里大模型相關受益標的主要包括:恒生電子、千方科技、石基信息、眾信旅游、衛(wèi)寧健康、金橋信息、亞康股份、神州數碼、易點天下、絲路視覺等。

騰訊系的混元AI大模型于2022年12月推出,是目前國內首個低成本、可落地的NLP萬億大模型,且登頂自然語言理解任務榜單CLUE。騰訊的數據、人才和硬件儲備是布局AIGC領域的三大優(yōu)勢:數據方面,騰訊現有產品或帶來多樣化、真實度高的數據和應用場景;此外硬件方面騰訊擁有高性能網絡平臺、成熟的太極機器學習平臺,為模型訓練提供堅實基礎。在生態(tài)鏈方面,騰訊系持股或與騰訊有重要合作標的,其中互聯網傳媒領域的有:世紀華通、完美世界、三七互娛、巨人網絡、掌趣科技、電魂網絡等;版權領域的有:華策影視、新媒股份、博納影業(yè)、中文在線、平治信息;計算機領域的有:金山辦公、泛微網絡、四維圖新、博思軟件、長亮科技、超圖軟件等。

華為系的盤古大模型,首次兼顧了圖像判別與生成能力,能同時滿足底層圖像處理與高層語義的理解需求。盤古NLP大模型的可以賦能智能營銷領域,比如,盤古NLP大模型可以通過文本匹配、意圖識別等關鍵技術更好地服務銷售環(huán)節(jié),取代目前逐漸上升的人力成本和低成功率的智能客服與營銷系統(tǒng),幫助服務人員快速提升業(yè)務水平。對于華為盤古大模型生態(tài)鏈,在算力環(huán)節(jié)主要關注的是給華為做AI芯片服務的整機廠商,主要有神州數碼、拓維信息、四川長虹、同方股份、廣電運通、紫光股份等。

百度系的“文心千帆”大模型平臺,不僅包括文心一言,還包括百度全套文心大模型、相應的開發(fā)工具鏈。未來,文心千帆還會支持第三方的開源大模型。從平臺定位上看,文心千帆為一站式企業(yè)級大模型平臺,平臺作為文心大模型服務的唯一入口,為B端企業(yè)用戶,提供數據管理、自動化模型定制微調以及推理服務云端部署一站式大模型定制服務,并提供文心一言企業(yè)級推理云服務。從應用場景上看,文心千帆可應用于智能對話、智能輸入法等通用場景以及電銷領域商品介紹、推廣文章等特定場景。根據研報梳理,目前百度AI生態(tài)鏈主要受益標的包括三六零、科大訊飛、拓爾思、萬興科技、格靈深瞳、云從科技、淳中科技、?低、大華股份等。

目前,BAT 其中兩家 AI 大模型已經進入試用階段,壓力給到其他廠商研發(fā)團隊。在這場軍備競賽中,不乏有趕這場“AI 淘金熱”的隊伍,也有想“給淘金者賣水”的組織,訓練 AI 大模型需要大量的計算資源和數據進行訓練,這時候各家大廠/初創(chuàng)團隊便要憑本事吃飯,這些平臺將在競爭中重新審視系統(tǒng)性、結構工整的知識類內容,這有利于我國科技和生產力的發(fā)展,所以大模型競爭越多越好,最終由用戶來做選擇。

大廠拿所掌握數據投喂AI模型,引發(fā)數據安全擔憂

形勢一片火熱,不乏理中客。

互聯網分析師張京科指出,如今由ChatGPT所引領的大模型浪潮,是科技領域的一次跨時代進步,但也存在巨大的用戶隱私安全風險。

ChatGPT于2022年11月發(fā)布后,其母公司OpenAI估值已漲至290億美元,上線兩個月后,用戶數量達到1億。伴隨“嘗鮮”熱潮而來的是潛在安全風險的討論。ChatGPT是一個生成式預訓練變換模型,該模型前期的訓練過程是基于人類反饋的監(jiān)督學習和強化學習,在與用戶大量的交互過程中聊天模型本身會將用戶“喂”給它的數據作為訓練數據,從而不斷“進化”。

“如今,互聯網公司正在嘗試用自己掌握的大數據投喂AI模型,很多時候廠商會以格式條款的協議獲得用戶各種隱私信息的授權,面對這些APP簽訂的協議,用戶幾乎沒有選擇的余地。各大互聯網巨頭源源不斷地以用戶信息投喂獻祭,很多用戶也不介意類似的隱私安全風險。”

張京科指出,這意味著用戶所有的隱私、喜好、聊天、關系鏈,甚至密碼等等,未來有可能因為一個小小的安全漏洞或者運營事故,而大白于天下。為此,應制定更嚴格的用戶大數據使用標準等措施提前進行預防。


聲明: 本網站所刊載信息,不代表OFweek觀點?帽菊靖寮瑒战洉媸跈。未經授權禁止轉載、摘編、復制、翻譯及建立鏡像,違者將依法追究法律責任。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號