訂閱
糾錯
加入自媒體

從李一舟看“套殼”、“借殼”和“盜用”的區(qū)別

2024-02-23 16:54
適道
關注

      01 看來做AI是真不賺錢

有句話說:看一個行業(yè)能不能賺錢,就看賣課的多不多。

行業(yè)遍地黃金時,大家都在埋頭淘金,誰會想不開讓別人搶飯碗。只有“卷無可卷”時,才會靠賣信息差,割一波韭菜。

現在國內AI行業(yè)便是如此:做技術開發(fā)門檻高,成本大,戰(zhàn)線長,靠講故事拉不來投資人。

如果不想這樣,你可以另辟蹊徑——賣課。

199元AI課程,一年賣出25萬份,營收5000萬元,這不比吭哧吭哧搞開發(fā)賺錢?

但這個世界是一個巨大的套娃,“盜用”的“盜用”也在賺錢。在某寶上,李一舟的全套課程花0.26元就能買到,同時還贈送另一“巨頭”鶴老師的全套AI課,月銷量相當可觀。

為何AI培訓這么賺錢?換個問法,為何熱門技術培訓這么賺錢?

知識付費是向人性的弱點付費,當賺大錢的欲望和被淘汰的恐懼雙管齊下,再加上“清華博士”“小白可學”“全程服務”等誘人噱頭,輔以“199”的低價。誰聽了都心動。

賣課就是“講故事”。哪個技術熱門,哪里就有故事。投資人聽膩了的故事,說給“韭菜”聽卻很新鮮。

2021年,《元宇宙第一講》10天狂賺160萬;

2023年,《每個人的人工智能課》一年營收5000萬。

所有的slogan都總結為一句話:xxx是普通人改變命運的最后一波機會。“xxx”可以是元宇宙,可以是區(qū)塊鏈,人工智能,也可能是未來任何一項熱門技術。

盲猜下一個是教企業(yè)怎么出海(狗頭保命)。

 02 AI創(chuàng)業(yè)都繞不開的“套殼”

除了賣課,我們回到AI賺錢的第二條捷徑“套殼”,當然,在李一舟的案例里,說“借殼”更準確。

其實“套殼”沒有一個明確的定義。

大模型“內核”指核心架構和算法。如果深究下去,你甚至可以說幾乎所有模型都在“套殼”Google DeepMind 的 Transformer 及其三個變體架構。

實際上,“套殼”也并非沒有技術含量。我們先從大模型的研發(fā)原理來看。

首先,自研大模型需要經過預訓練(Pre-training)和調優(yōu)(Fine-tuning)。

預訓練(Pre-training),開發(fā)者給大模型“喂知識”,不介入它,讓它“啃書”自學,而后得到一個基礎的能力,即基座模型(Base Model)。

調優(yōu)(Fine-tuning),也稱“微調”,開發(fā)者給大模型“出題”,介入式地讓它能夠適應特定任務的需求。

此時,如果在基座模型(Base Model)上加入特定行業(yè)的數據集做進一步的微調,就會得到一個微調模型(Fine-tuning Model),或稱為行業(yè)模型、垂直模型。

基于多種情景的“套殼”就發(fā)生在以上研發(fā)過程。

例如在預訓練階段,會出現“數據套殼”,此前爆出因為中文數據質量差,有國內團隊用ChatGPT輸出的數據進行訓練。

在調優(yōu)階段,也會出現“微調套殼”,但其中不乏優(yōu)秀產品,例如Perplexity。該AI問答引擎微調了GPT-3.5,性能顯著提升,但比GPT-4的費用低,速度快。前一周,Perplexity完成B輪融資,估值5.2億美元。

不過,以上幾種“套殼”都具備相當一部分的技術含量。而我們平時最常說的“套殼”是指簡單粗暴地套開源或者ChatGPT,技術門檻相當低,也可以稱之為“借殼”。

目前,國內很多“借殼”ChatGPT向用戶收費。雖然這一行為已經涉嫌侵權,只不過因為OpenAI在國內沒有代理商,無法起訴。

但這不代表“借殼”者可以肆意妄為。

根據2023年7月出臺的《生成式人工智能服務管理暫行辦法》,對于來源于中國境外向境內提供生成式人工智能服務不符合法律、行政法規(guī)和本辦法規(guī)定的,國家網信部門應當通知有關機構采取技術措施和其他必要措施予以處置。其中,構成犯罪的,依法追究刑事責任。

但《辦法》也在多處放寬了監(jiān)管要求,并增加了鼓勵人工智能技術發(fā)展的措施。

例如,明確生成式AI實施算法的“備案制”,此前預期則是審核許可制。

例如,《辦法》規(guī)定,利用生成式人工智能技術向中華人民共和國境內公眾提供生成文本、圖片、音頻、視頻等內容的服務,適用本辦法。而在4月的《征求意見稿》第二條中,只要是向境內用戶提供服務,不論是“研發(fā)”生成式AI還是“利用”生成式AI,都屬于監(jiān)管范圍。

我們可以推測,“研發(fā)”和“利用”畫出了模型“借殼”和“微調”法律適用范圍的不同。在當前國內AI創(chuàng)業(yè)場景中,完全不“套殼”可能行不通。但開發(fā)者技術門檻越高,“研發(fā)”含量越高,就越不容易觸及監(jiān)管底線。

 03 “三重敘詭”或涉嫌欺詐

最后,回到李一舟事件,你會發(fā)現這廝玩的居然是“三重敘詭”。

一開始,他說他是“自研”模型,但其平臺卻是“借殼”組合,當你以為他只是“借殼”,面具下面卻是“盜用”。

從目前來看,國內很多模型都是開發(fā)者“微調”開源模型Stable Diffusion而來。

據「市界」報道:一位名為“兔猻”的AI繪圖模型開發(fā)者發(fā)現,自己微調的3個模型被一舟智能“盜用”,其中兩個模型是他與Liblib平臺簽署了獨家協(xié)議合同。煉丹科技創(chuàng)始人忠忠,獨立開發(fā)者娜烏斯嘉等人發(fā)現,自己在其他平臺發(fā)布的模型出現在了一舟智能的官網首頁。

對開發(fā)者而言,最直接的影響是他們無法從自己制作的模型產品中獲得任何收益。“兔猻”訓練模型時間多達半年,租賃算力花費2萬元,購買英偉達顯卡花費8萬元。

目前,合計97個模型,除1個模型為Stable Diffusion XL官方模型外,其余均為國內或國外開發(fā)者所制作第三方模型。

這就讓人不禁想問一句,如此光明正大地搬運國內開發(fā)者模型,還對學員稱“自研”模型,不怕被告兩頭詐騙嗎?

不過,有律師表示不明確是否構成“詐騙”,因為AI相關的內容和課程的含義本身比較寬泛,只要在用戶付費后,提供了約定的相關資料,就不能說詐騙。至于這些資料是否符合用戶的預期,屬于合同履行的問題。

但可以肯定的是,李一舟的AI課不僅涉嫌違反《廣告法》和《反不正當競爭法》,構成虛假宣傳的不正當競爭行為,而且涉嫌違反《消費者權益保護法》,侵犯消費者的知情權、公平交易權等。

目前,LiblibAI已經發(fā)布聲明,表示密切關注此事件,并可能采取法律措施來追究侵權責任,為被侵權的創(chuàng)作者維權聲討。

據報道,目前愿意共同發(fā)聲的開發(fā)者人數,已經達到了17人,對應25個模型。雖然單個賠付金額不大,但如果有律師來搞集體訴訟,結果就很難預料了。

參考資料:

  • 《Sora封的第一個“神”,塌了》,市界 董溫淑 董雨晴
  • 《大模型套殼祛魅:質疑套殼,理解套殼》,甲子光年 趙健
  • 《李一舟再陷兩大硬核爭議:一舟智能未獲備案涉嫌非法運營,盜用AI繪圖模型》,鞭牛士 鞭牛士
  • 《清華博士網紅“AI課賣了5000萬”?AI課程亂象調查》,澎湃新聞 范佳來 史若彤 郭思航

       原文標題 : 從李一舟看“套殼”、“借殼”和“盜用”的區(qū)別

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號