訂閱
糾錯(cuò)
加入自媒體

DeepSeek——中國大模型產(chǎn)業(yè)的“春雷”,A股市場的“驚蟄”

本文為西京研究院發(fā)表的第808篇文章,根據(jù)研傳會(huì)旬度直播內(nèi)容整理,有刪節(jié)。

春節(jié)期間,杭州的80后小伙突然打破了世界科技舞臺(tái)上沉默許久的平靜,也同步給全球資本市場帶來了巨大擾動(dòng),特別是對以英偉達(dá)為代表的美股巨頭造成了直接沖擊。這對靠AI產(chǎn)業(yè)支撐的美股來說,無疑是一只黑天鵝。雖然這幾天英偉達(dá)股價(jià)有所修復(fù),但巨大的跳空缺口及被打擊的信心何時(shí)能夠完全修復(fù)仍需更多時(shí)間觀察。對于投資而言,我們需要了解的是,這到底是一次短暫的技術(shù)沖擊,還是一次具有深遠(yuǎn)意義的技術(shù)相變。

我們之前強(qiáng)調(diào)過924是一次政策相變——貨幣大放水,顯示了頂層經(jīng)濟(jì)思路的改變也彰顯了維護(hù)資本市場的信心,推動(dòng)了一次估值水平的整體修復(fù)。新的政策看跌期權(quán)保證了指數(shù)在3200點(diǎn)左右的新中樞開始運(yùn)行,即使再有波動(dòng)也不會(huì)輕易打破那一次的低點(diǎn)。從924相變后,科技板塊已經(jīng)取得非常明顯的上漲,科技股估值中樞已大幅上移。目前,我們需要考慮的是科技端是否也存在趨勢性提升的可能,Deepseek是否正在促發(fā)一場革命性、顛覆性的科技領(lǐng)域相變。

一、一次重大的工程創(chuàng)新

當(dāng)前我們首先需要思考的是Deepseek的影響該如何定義?要拋開自媒體“國運(yùn)論”與“鬧劇論”簡單的極端論述,客觀的從技術(shù)研究本身對其進(jìn)行思考。首先,先談我的結(jié)論,通過這些天較為深入的調(diào)研、研究,我想說的是目前我對Deepseek的最新認(rèn)知與我前些天那篇《DeepSeek是國運(yùn)崛起還是一個(gè)奇跡》的觀點(diǎn)仍保持一致。雖然不能說Deepseek是一次偉大的技術(shù)革命,但它確實(shí)是一次里程碑式的工程創(chuàng)新,是中國工程師文化內(nèi)核優(yōu)勢的再一次完美體現(xiàn)。

我們可以把技術(shù)革命分為科學(xué)革命和工業(yè)革命兩個(gè)過程去看。人工智能的發(fā)展也一樣,人工智能其實(shí)早已有著很長的研究與發(fā)展歷史,差不多從上世紀(jì)60年代就已經(jīng)正式開始。如果從圖靈提出的相關(guān)概念開始算起,那時(shí)間會(huì)更早。而真正讓Ai被大家所認(rèn)知的則是微軟的阿爾法Go,與GPT相似他們都采用了強(qiáng)化學(xué)習(xí)(RL)方式,通過大量實(shí)際交互在與高手過招的過程中進(jìn)行學(xué)習(xí)。阿爾法Go的厲害之處在于它并非完全基于過去的預(yù)訓(xùn)練,而是依靠記憶能力不斷地學(xué)習(xí)和強(qiáng)化,是人工智能革命中一次重要的技術(shù)里程碑。

汽車不是中國發(fā)明的,但今天的中國是汽車第一生產(chǎn)大國,新能源汽車的核心技術(shù)也不是中國發(fā)明的,但中國現(xiàn)在的新能源車可以橫掃全球。要知道,歐洲中世紀(jì)的圣經(jīng)抄寫工作非常昂貴,而中國的活字印刷術(shù)傳到歐洲后,使得圣經(jīng)變得非常便宜且迅速流行,讓每個(gè)人都可以閱讀圣經(jīng)。知識不再被壟斷,人的價(jià)值就被凸顯出來,這直接導(dǎo)致了歐洲的宗教革命、科學(xué)革命和文藝啟蒙等一系列變革,也就是所謂的啟蒙運(yùn)動(dòng)。真正讓美國人能開得起汽車的是福特流水線的功勞,它是流程優(yōu)化,是成本降低。究竟是發(fā)明汽車的科學(xué)家偉大,還是讓每個(gè)人都開上汽車的工程師偉大?

人工智能也是如此,如果沒有Deepseek的出現(xiàn),那我們這個(gè)世界距離大模型應(yīng)用的平民化就還有很長一段距離。許多海外公司,包括硅谷的工程師甚至一些海外傳統(tǒng)的不友好媒體,對Deepseek的評價(jià)其實(shí)是很高的,有的甚至贊不絕口?梢哉f這是一次重大的工程改造,甚至可以認(rèn)為是人工智能領(lǐng)域的一次工業(yè)革命。

二、從deepseek的崛起看Ai的發(fā)展路徑與趨勢

2017年,Google推出了一個(gè)專門從事機(jī)器翻譯的架構(gòu)模型,它引入了自注意力機(jī)制,能夠更高效地捕捉序列數(shù)據(jù)中的長距離依賴關(guān)系,而且支持并行計(jì)算,大大提高了訓(xùn)練和推理的速度,這就是Transformer架構(gòu)。依靠這一優(yōu)勢特點(diǎn),Transformer迅速擴(kuò)展到自然語言處理的其他領(lǐng)域,并逐漸成為大語言模型處理的主流架構(gòu),從實(shí)質(zhì)上推動(dòng)了生成式人工智能的發(fā)展。

人工智能的本質(zhì)是數(shù)學(xué)與物理的運(yùn)用問題,是在電力革命和芯片革命等物理學(xué)革命的基礎(chǔ)上逐漸實(shí)現(xiàn)的,而模型的工作原理其實(shí)并不難,是非常典型的數(shù)學(xué)應(yīng)用問題,主要運(yùn)用三個(gè)數(shù)學(xué)理論,即線性代數(shù),統(tǒng)計(jì)學(xué)與微積分。首先運(yùn)用線性代數(shù)將文字轉(zhuǎn)化為數(shù)字向量,之后使用語言統(tǒng)計(jì)學(xué)將文字形成一串?dāng)?shù)字編碼,并進(jìn)行回歸運(yùn)算。人工智能通過海量的數(shù)據(jù)運(yùn)算,利用空間的廣度實(shí)現(xiàn)無限可能,如果時(shí)間足夠長,空間足夠大,就可能演化出各種運(yùn)算結(jié)果。

硅谷的數(shù)學(xué)家和物理學(xué)家是一批有理想的知識精英,他們引領(lǐng)了這場技術(shù)革命。然而,他們往往忽視工程學(xué)問題,比如如何節(jié)約成本和提高效率。Deepseek的厲害之處就在于它用Fp8,也就是8位二進(jìn)制數(shù)值的浮點(diǎn)計(jì)算能力,解決了國外Fp32運(yùn)算能力所能實(shí)現(xiàn)的工作,讓硅谷高傲的精英模型突然變成了拼多多,讓更多普通大眾能夠用的起Ai。但在旨在追求星辰大海的硅谷科學(xué)家來看,對比先進(jìn)的 Fp32 浮點(diǎn)格式,使用Fp8 是一種倒退,即使 Fp8 可以大幅降低成本,可以說方法都是逼出來的。DeepSeek在訓(xùn)練端和推理端都進(jìn)行了重大的工程優(yōu)化,特別是蒸餾技術(shù)的應(yīng)用。

硅谷的科學(xué)家們往往專注于前沿技術(shù)的開發(fā),在要錢有錢,要芯片有芯片的優(yōu)渥環(huán)境中,他們?nèi)菀缀鲆暢杀镜膯栴}。但高端芯片價(jià)格高昂,大模型訓(xùn)練成本巨大,普通人難以參與。這種分化導(dǎo)致了技術(shù)的門檻越來越高,而且未來可能會(huì)更加嚴(yán)重,只有少數(shù)人能夠引領(lǐng)技術(shù)的發(fā)展。而且隨著歷史可用數(shù)據(jù)的不斷消耗,以及訓(xùn)練成本越來越高,模型預(yù)訓(xùn)練效果難以持續(xù)提升,預(yù)訓(xùn)練時(shí)代也可能即將結(jié)束。所以有的公司開始探索新的訓(xùn)練方法,比如強(qiáng)化學(xué)習(xí)和監(jiān)督微調(diào),以減少對預(yù)訓(xùn)練的依賴,從而在降低成本的同時(shí)提高模型的效率。此外,還有一些公司還采用了混合專家模式和多頭注意力機(jī)制,進(jìn)一步優(yōu)化了推理過程。通過這種方式,模型可以在推理時(shí)只調(diào)用必要的參數(shù),從而節(jié)省大量算力。新技術(shù)的應(yīng)用可能會(huì)帶來一場新的工業(yè)革命,推動(dòng)全球技術(shù)生態(tài)的發(fā)展。

我認(rèn)為這場技術(shù)革命不僅會(huì)改變科技行業(yè),還會(huì)對整個(gè)社會(huì)產(chǎn)生深遠(yuǎn)影響。成本的降低可能會(huì)使更多人能夠使用這些技術(shù),推動(dòng)工業(yè)化制造能力的提升和人類認(rèn)知平權(quán)事業(yè)的發(fā)展。同時(shí),這也可能會(huì)引發(fā)一系列社會(huì)和經(jīng)濟(jì)問題,需要我們密切關(guān)注。

最后,我再次做個(gè)提示供大家思考,就是這次deepseek引發(fā)的大模型工程創(chuàng)新,會(huì)不會(huì)蓄力2024年924以來的A股牛市,從“貨幣牛”轉(zhuǎn)換到“科技牛”,類似2022年11月chatgpt橫空出世以后的美股。當(dāng)然,美股的“科技牛”七成靠七巨頭,中國的“科技牛”有沒有這樣的七巨頭支撐呢?我保持著一定程度的樂觀。

       原文標(biāo)題 : 趙建:DeepSeek——中國大模型產(chǎn)業(yè)的“春雷”,A股市場的“驚蟄”

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號