亚洲AV色香蕉一区二区蜜桃小说,日本成熟少妇a∨网站

知乎版ChatGPT「知海圖AI」加入國產(chǎn)大模型亂斗，稱效果與GPT-4持平

2023-04-18 10:37

“2023知乎發(fā)現(xiàn)大會(huì)”上，知乎創(chuàng)始人、董事長兼CEO周源和知乎合作人、CTO李大海共同宣布了知乎與面壁智能聯(lián)合發(fā)布“知海圖AI”中文大模型。

周源據(jù)介紹，知乎與面壁智能達(dá)成深度合作，共同開發(fā)中文大模型產(chǎn)品并推進(jìn)應(yīng)用落地。目前，知乎和面壁智能合作自研的“知海圖AI”中文大模型已經(jīng)運(yùn)用進(jìn)了知乎熱榜，知乎首個(gè)大模型功能“熱榜摘要”上線并開啟內(nèi)測(cè)。

“知海圖AI”借力知乎語言數(shù)據(jù)庫優(yōu)勢(shì)，稱與GPT－4效果持平

在知乎創(chuàng)始人、董事長兼 CEO 周源看來，AI 時(shí)代的生產(chǎn)力要素可以分為三層，從上到下依次是應(yīng)用場(chǎng)景、專有數(shù)據(jù)、基礎(chǔ)模型�！爸DAI”具備必須的生產(chǎn)力要素基因。

基礎(chǔ)模型方面，在知乎與面壁智能合作自研的“知海圖AI”中文大模型面世之前，面壁智能已在 2020 年底發(fā)布了首個(gè)中文大語言模型 CPM－1，之后又陸續(xù)發(fā)布了 CPM－2、CPM－3 和 CPM－Ant 等模型。在應(yīng)用場(chǎng)景在上，以問答形式為主，知乎搭建了專業(yè)、多元、有價(jià)值的“討論場(chǎng)”。專有數(shù)據(jù)方面，知乎的運(yùn)營模式?jīng)Q定了其積累了大量高質(zhì)量的內(nèi)容、關(guān)系和知識(shí)圖譜，在當(dāng)前國內(nèi)互聯(lián)網(wǎng)高質(zhì)量內(nèi)容匱乏的情況下，知乎的優(yōu)勢(shì)得天獨(dú)厚，的確具備構(gòu)建一個(gè)大模型的數(shù)據(jù)量。

目前，知乎和面壁智能合作自研的“知海圖AI”中文大模型，已經(jīng)運(yùn)用進(jìn)了知乎熱榜，知乎首個(gè)大模型功能“熱榜摘要”上線并開啟內(nèi)測(cè)。

在知乎這個(gè)場(chǎng)景里面，答主的回答千奇百怪、非常開放，甚至?xí)霈F(xiàn)觀點(diǎn)跟提問沒有關(guān)系的情況。這對(duì)整個(gè)大模型很有挑戰(zhàn)。知乎稱，“知海圖AI”利用超強(qiáng)的語言理解能力對(duì)知乎熱榜上的問題回答進(jìn)行抓取、整理和聚合，并把回答梗概展現(xiàn)給用戶，給大家直觀清晰的回答。

面壁智能聯(lián)合創(chuàng)始人、CTO 曾國洋表示，“在這個(gè)場(chǎng)景（知乎凌亂的問答區(qū)）下抽了40個(gè)提問去做評(píng)測(cè)。評(píng)測(cè)以后，發(fā)現(xiàn)跟GPT－4在這方面基本持平，我們稍微差一些，但還是蠻不錯(cuò)的。

國產(chǎn)大模型開啟亂斗，資源稟賦各不相同

人工智能激戰(zhàn)正酣，當(dāng)前各個(gè)大廠、創(chuàng)業(yè)企業(yè)開啟亂斗，根據(jù)統(tǒng)計(jì)，目前國內(nèi)至少有 15 個(gè)大大小小的 AI 大模型正在研發(fā)，當(dāng)然各家資源稟賦各不相同。

國內(nèi)已經(jīng)宣布AI大模型項(xiàng)目的企業(yè)／機(jī)構(gòu)

阿里系AI大模型“通義”系列，特點(diǎn)在于“借力阿里超強(qiáng)的中間件優(yōu)勢(shì)，構(gòu)建完整生態(tài)”，“通義”系列大模型將深入到電商、設(shè)計(jì)、醫(yī)療、法律、金融等行業(yè)，服務(wù)超過200個(gè)場(chǎng)景。阿里通義大模型打造了國內(nèi)首個(gè)AI統(tǒng)一底座，根據(jù)研報(bào)梳理，阿里大模型相關(guān)受益標(biāo)的主要包括：恒生電子、千方科技、石基信息、眾信旅游、衛(wèi)寧健康、金橋信息、亞康股份、神州數(shù)碼、易點(diǎn)天下、絲路視覺等。

騰訊系的混元AI大模型于2022年12月推出，是目前國內(nèi)首個(gè)低成本、可落地的NLP萬億大模型，且登頂自然語言理解任務(wù)榜單CLUE。騰訊的數(shù)據(jù)、人才和硬件儲(chǔ)備是布局AIGC領(lǐng)域的三大優(yōu)勢(shì)：數(shù)據(jù)方面，騰訊現(xiàn)有產(chǎn)品或帶來多樣化、真實(shí)度高的數(shù)據(jù)和應(yīng)用場(chǎng)景；此外硬件方面騰訊擁有高性能網(wǎng)絡(luò)平臺(tái)、成熟的太極機(jī)器學(xué)習(xí)平臺(tái)，為模型訓(xùn)練提供堅(jiān)實(shí)基礎(chǔ)。在生態(tài)鏈方面，騰訊系持股或與騰訊有重要合作標(biāo)的，其中互聯(lián)網(wǎng)傳媒領(lǐng)域的有：世紀(jì)華通、完美世界、三七互娛、巨人網(wǎng)絡(luò)、掌趣科技、電魂網(wǎng)絡(luò)等；版權(quán)領(lǐng)域的有：華策影視、新媒股份、博納影業(yè)、中文在線、平治信息；計(jì)算機(jī)領(lǐng)域的有：金山辦公、泛微網(wǎng)絡(luò)、四維圖新、博思軟件、長亮科技、超圖軟件等。

華為系的盤古大模型，首次兼顧了圖像判別與生成能力，能同時(shí)滿足底層圖像處理與高層語義的理解需求。盤古NLP大模型的可以賦能智能營銷領(lǐng)域，比如，盤古NLP大模型可以通過文本匹配、意圖識(shí)別等關(guān)鍵技術(shù)更好地服務(wù)銷售環(huán)節(jié)，取代目前逐漸上升的人力成本和低成功率的智能客服與營銷系統(tǒng)，幫助服務(wù)人員快速提升業(yè)務(wù)水平。對(duì)于華為盤古大模型生態(tài)鏈，在算力環(huán)節(jié)主要關(guān)注的是給華為做AI芯片服務(wù)的整機(jī)廠商，主要有神州數(shù)碼、拓維信息、四川長虹、同方股份、廣電運(yùn)通、紫光股份等。

百度系的“文心千帆”大模型平臺(tái)，不僅包括文心一言，還包括百度全套文心大模型、相應(yīng)的開發(fā)工具鏈。未來，文心千帆還會(huì)支持第三方的開源大模型。從平臺(tái)定位上看，文心千帆為一站式企業(yè)級(jí)大模型平臺(tái)，平臺(tái)作為文心大模型服務(wù)的唯一入口，為B端企業(yè)用戶，提供數(shù)據(jù)管理、自動(dòng)化模型定制微調(diào)以及推理服務(wù)云端部署一站式大模型定制服務(wù)，并提供文心一言企業(yè)級(jí)推理云服務(wù)。從應(yīng)用場(chǎng)景上看，文心千帆可應(yīng)用于智能對(duì)話、智能輸入法等通用場(chǎng)景以及電銷領(lǐng)域商品介紹、推廣文章等特定場(chǎng)景。根據(jù)研報(bào)梳理，目前百度AI生態(tài)鏈主要受益標(biāo)的包括三六零、科大訊飛、拓爾思、萬興科技、格靈深瞳、云從科技、淳中科技、�？低�、大華股份等。

目前，BAT 其中兩家 AI 大模型已經(jīng)進(jìn)入試用階段，壓力給到其他廠商研發(fā)團(tuán)隊(duì)。在這場(chǎng)軍備競(jìng)賽中，不乏有趕這場(chǎng)“AI 淘金熱”的隊(duì)伍，也有想“給淘金者賣水”的組織，訓(xùn)練 AI 大模型需要大量的計(jì)算資源和數(shù)據(jù)進(jìn)行訓(xùn)練，這時(shí)候各家大廠／初創(chuàng)團(tuán)隊(duì)便要憑本事吃飯，這些平臺(tái)將在競(jìng)爭(zhēng)中重新審視系統(tǒng)性、結(jié)構(gòu)工整的知識(shí)類內(nèi)容，這有利于我國科技和生產(chǎn)力的發(fā)展，所以大模型競(jìng)爭(zhēng)越多越好，最終由用戶來做選擇。

大廠拿所掌握數(shù)據(jù)投喂AI模型，引發(fā)數(shù)據(jù)安全擔(dān)憂

形勢(shì)一片火熱，不乏理中客。

互聯(lián)網(wǎng)分析師張京科指出，如今由ChatGPT所引領(lǐng)的大模型浪潮，是科技領(lǐng)域的一次跨時(shí)代進(jìn)步，但也存在巨大的用戶隱私安全風(fēng)險(xiǎn)。

ChatGPT于2022年11月發(fā)布后，其母公司OpenAI估值已漲至290億美元，上線兩個(gè)月后，用戶數(shù)量達(dá)到1億。伴隨“嘗鮮”熱潮而來的是潛在安全風(fēng)險(xiǎn)的討論。ChatGPT是一個(gè)生成式預(yù)訓(xùn)練變換模型，該模型前期的訓(xùn)練過程是基于人類反饋的監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)，在與用戶大量的交互過程中聊天模型本身會(huì)將用戶“喂”給它的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)，從而不斷“進(jìn)化”。

“如今，互聯(lián)網(wǎng)公司正在嘗試用自己掌握的大數(shù)據(jù)投喂AI模型，很多時(shí)候廠商會(huì)以格式條款的協(xié)議獲得用戶各種隱私信息的授權(quán)，面對(duì)這些APP簽訂的協(xié)議，用戶幾乎沒有選擇的余地。各大互聯(lián)網(wǎng)巨頭源源不斷地以用戶信息投喂獻(xiàn)祭，很多用戶也不介意類似的隱私安全風(fēng)險(xiǎn)�！�

張京科指出，這意味著用戶所有的隱私、喜好、聊天、關(guān)系鏈，甚至密碼等等，未來有可能因?yàn)橐粋€(gè)小小的安全漏洞或者運(yùn)營事故，而大白于天下。為此，應(yīng)制定更嚴(yán)格的用戶大數(shù)據(jù)使用標(biāo)準(zhǔn)等措施提前進(jìn)行預(yù)防。