斯坦福團(tuán)隊(duì)抄襲國產(chǎn)AI開源模型
01
近日,斯坦福大學(xué)AI團(tuán)隊(duì)主導(dǎo)的Llama3-V開源模型被證實(shí)套殼抄襲國內(nèi)清華與面壁智能的開源模型“小鋼炮”MiniCPM-Llama3-V 2.5一事,在網(wǎng)絡(luò)上引發(fā)熱議。
巧合的是,最先發(fā)現(xiàn)抄襲的,是星空君一起玩AI的朋友,大家先是在群里義憤填膺的批判,然后朋友把相關(guān)資料發(fā)到推特發(fā)酵,最終引起了斯坦福團(tuán)隊(duì)在hugging face刪庫跑路。
在最新進(jìn)展中,斯坦福Llama3-V團(tuán)隊(duì)的兩位作者Siddharth Sharma和 Aksh Garg在社交平臺(tái)上就這一學(xué)術(shù)不端行為向面壁MiniCPM團(tuán)隊(duì)正式道歉,并表示會(huì)將Llama3-V模型悉數(shù)撤下。
6月3日,面壁智能CEO李大海與聯(lián)合創(chuàng)始人劉知遠(yuǎn)先后發(fā)文,回應(yīng)開源模型被斯坦福大學(xué)AI團(tuán)隊(duì)抄襲一事,稱“深表遺憾”:一方面感慨這是一種受到國際團(tuán)隊(duì)認(rèn)可的方式,另一方面呼吁大家共建開放、合作、有信任的社區(qū)環(huán)境。“我們希望團(tuán)隊(duì)的好工作被更多人關(guān)注與認(rèn)可,但不是以這種方式。”
其實(shí)這從側(cè)面反映出中國AI團(tuán)隊(duì)的影響力。
很長一段時(shí)間,因?yàn)槿ν馊穗y以理解的原因,中國的AI團(tuán)隊(duì)背負(fù)著“抄襲”、“套殼”的惡名,甚至很多人說“國外一開源,國內(nèi)就自研”。
ChatGPT剛剛發(fā)布的時(shí)候,國產(chǎn)的AI因?yàn)椴捎昧溯^多的國外訓(xùn)練集,使用的時(shí)候存在著把用戶的中文翻譯成英文再和大模型交互的情況,被惡毒的攻擊為套殼。
后來,當(dāng)谷歌的大模型發(fā)布的時(shí)候,人們發(fā)現(xiàn)幾乎存在著一模一樣的問題,才有一部分人明白問題的根源。
在生成式AI方面,美國的團(tuán)隊(duì)走的確實(shí)比較快,但并不代表中國一無是處。
如果你研究近年來AI相關(guān)的論文,會(huì)發(fā)現(xiàn)大量的中國團(tuán)隊(duì)和華人散落其中。
如果把世界AI形容成十斗,美國占八斗,中國占一斗,世界其他國家分一斗。
實(shí)事求是的講,這樣的實(shí)力并不算差。中國在這次AI革命中,沒有落伍,不僅跟上了,還斷崖式領(lǐng)先第三名。
在ChatGPT推出不到一年的時(shí)候,中國的生成式AI迅速普及,除了百度的文心一言外,像Kimi、通義千問、ChatGLM都取得了不錯(cuò)的效果,用戶反饋比較積極。
通義千問和ChatGLM都將最新進(jìn)行了開源,深受廣大AI愛好者的喜歡。
MiniCPM-Llama3-V 2.5 不是一個(gè)很知名的模型,被斯坦福的大學(xué)生拿去套殼。這件事有點(diǎn)無厘頭,但也證明了用開源模型套殼這種行為實(shí)際上是行不通的,有無數(shù)種方式可以驗(yàn)證大模型是否自研。
當(dāng)然了,也沒必要把這件事扣到斯坦福大學(xué)頭上,這只是一個(gè)團(tuán)隊(duì)部分成員的學(xué)術(shù)不端行為,不用上綱上線。
結(jié)論是給中國的AI大模型開發(fā)者們一個(gè)遲到的正名:他們沒有靠套殼開源來實(shí)現(xiàn)自研。
02
斯坦福的團(tuán)隊(duì)抄襲中國團(tuán)隊(duì)的AI開源大模型事件后不久,快手放出了文生視頻大模型:可靈。
從前期內(nèi)測用戶的體驗(yàn)來看,可靈幾乎和Sora是同一級(jí)別,某些細(xì)節(jié)還優(yōu)于Sora。
難能可貴的是,可靈已經(jīng)開始大規(guī)模內(nèi)測,而發(fā)布了小半年的Sora依然還只是PPT狀態(tài)。
我一直說,中國的AI的確比美國落后,但并沒有代差,且穩(wěn)居第二名,遙遙領(lǐng)先第三名。
當(dāng)可以落地的商業(yè)模式跑通的時(shí)候,中國的AI場景不會(huì)比美國少,甚至可能還更多一些。
因?yàn)橹袊淖悦襟w行業(yè)高度發(fā)達(dá),使用AI工具創(chuàng)作圖文、視頻素材,已經(jīng)開始普及。
有拿到內(nèi)測賬號(hào)的朋友,用之前Sora發(fā)布的提示詞交給可靈生成視頻,發(fā)現(xiàn)效果非常驚人。
從技術(shù)路線講,現(xiàn)在AI技術(shù)沒有太高深的技術(shù)壁壘。
OpenAI固然niubility,但他們的先發(fā)優(yōu)勢非常小。ChatGPT的3.5版本領(lǐng)先了接近一年,4.0頂多領(lǐng)先了半年,現(xiàn)在已經(jīng)被各開源大模型追趕了上來。
像中國的Kimi、通義千問、ChatGLM等大模型,近期的實(shí)測效果已經(jīng)不比ChatGPT4.0差。
一方面,大模型(哪怕閉源)的主體技術(shù)路線是公開的,一些獨(dú)特的訓(xùn)練技巧,通過高強(qiáng)度大范圍的使用,也是可以推測出來的,在此基礎(chǔ)上進(jìn)行優(yōu)化,大模型就可以“奮起直追”;另一方面,大模型行業(yè)的人才流動(dòng)非常頻繁,也促進(jìn)了技術(shù)的傳播。
OpenAI共有770名員工,ChatGPT團(tuán)隊(duì)不足百人,博士、碩士、本科各占三分之一。
隨著追趕的加速,也許一個(gè)不留神,就有大模型實(shí)現(xiàn)對(duì)ChatGPT的“彎道超車”。
像傳統(tǒng)工業(yè)時(shí)代動(dòng)輒領(lǐng)先十?dāng)?shù)年、數(shù)十年的技術(shù),在AI時(shí)代是不存在的。
由于字節(jié)、小紅書之前過于招搖,大家?guī)缀跬浟丝焓值拇嬖凇?/p>
這類短視頻企業(yè)最大的優(yōu)勢就是有海量的音視頻素材,可以方便的進(jìn)行訓(xùn)練,而我堅(jiān)持認(rèn)為AI大模型本身沒有什么高深的科技,無非就是大力出奇跡。
事實(shí)證明也是如此。ChatGPT3.5一炮走紅的時(shí)候,人們發(fā)現(xiàn)原來居然可以搞一萬張顯卡來訓(xùn)練,放在其他公司這只能是想想。但模式一旦跑通,各大佬紛紛下場搶購顯卡。
比較搞笑的是,可靈迅速在推特火了起來,但快手相關(guān)的APP并沒有純英文版,很多老外在推特上咨詢?nèi)绾巫?cè)、申請(qǐng)內(nèi)測資格。
這也讓中國的AI技術(shù)反向輸出了一把。
星空君的申請(qǐng)只等待了一天就順利通過,請(qǐng)欣賞星空君用可靈制作的視頻:
提示詞:一艘巨大的火箭從山谷里緩緩起飛,漫山遍野的桃花。
提示詞:一個(gè)披肩發(fā)女孩站在閃耀的銀河下。
提示詞:宇航員走出太空船,面臨一個(gè)冰天雪地的星球。
提示詞:一直正在大海邊彈吉他的大熊貓。
03
6月7日凌晨0點(diǎn),阿里云通義千問深夜發(fā)布技術(shù)博文,推出全球性能最強(qiáng)的開源模型Qwen2-72B,性能超過美國最強(qiáng)的開源模型Llama3-70B。
兩小時(shí)后,全球最大開源社區(qū)Hugging Face的聯(lián)合創(chuàng)始人兼首席執(zhí)行官克萊門特·德朗格宣布,Qwen2-72B沖上HuggingFace 開源大模型榜單Open LLM Leaderboard第一名,全球排名最高。
相比2月推出的通義千問Qwen1.5,Qwen2實(shí)現(xiàn)了整體性能的代際飛躍。通義千問Qwen2系列模型大幅提升了代碼、數(shù)學(xué)、推理、指令遵循、多語言理解等能力。
通義千問團(tuán)隊(duì)在技術(shù)博客中披露,Qwen2系列包含5個(gè)尺寸的預(yù)訓(xùn)練和指令微調(diào)模型,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,其中Qwen2-57B-A14B為混合專家模型(MoE)。
Qwen2所有尺寸模型都使用了GQA(分組查詢注意力)機(jī)制,以便讓用戶體驗(yàn)到GQA帶來的推理加速和顯存占用降低的優(yōu)勢。
阿里在AI方面布局非常廣闊,星空君甚至認(rèn)為在AI創(chuàng)新領(lǐng)域,阿里要比OpenAI更有錢景:阿里的AI研發(fā)是直接對(duì)接商業(yè)模式的,OpenAI的核心技術(shù),在阿里這里幾乎都是開源的!
就像導(dǎo)航軟件,未來極有可能出現(xiàn)OpenAI的核心技術(shù)想要拿來賣錢,卻發(fā)現(xiàn)阿里出的都是免費(fèi)的。
比如星空正在用EasyPhoto開源組件(EasyPhoto團(tuán)隊(duì)也是阿里注資的)幫朋友訓(xùn)練的AI繪畫模型,代碼里用到的modelscope是阿里的魔搭社區(qū),阿里的很多AI領(lǐng)域的工作,已經(jīng)成為開源界的標(biāo)準(zhǔn)之一。魔搭社區(qū)也是國內(nèi)最活躍的AI開源社區(qū),大部分開源模型都能在這里交流。
正在用ChatGLM開源模型做財(cái)經(jīng)數(shù)據(jù)訓(xùn)練的星空君表示,之前的工作白費(fèi)了,后面切到Qwen2。
冷/熱知識(shí),國內(nèi)不能直接訪問HuggingFace.co,可以通過鏡像hf-mirror.com 訪問。
說起開源,感謝馬斯克,哦,不,馬云開源!
原文標(biāo)題 : 斯坦福團(tuán)隊(duì)抄襲國產(chǎn)AI開源模型

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?