ā片免费一区二区在线观看,国产精品老汉av

谷歌AI奠基論文被指“翻車”！開山鼻祖給AI帶來了什么？

2023-05-10 18:29

“武功再高，也怕菜刀”。就算是開山鼻祖，也有翻車的一天。

現(xiàn)階段類GPT（Generative Pre－trained Transformer）的語言大模型像雨后春筍一樣，不斷涌現(xiàn)。雖說這股浪潮是由ChatGPT引爆，但在這所有AI大模型的背后其實還有一個更關鍵的技術概念——Transformer架構。

然而就在今天，有人扒出來提出Transformer架構的論文《Attention Is All Your Need》翻車了！論文里面的圖片和代碼是不一致的。

2017年，谷歌大腦團隊發(fā)表了名為《Attention Is All Your Need》的論文，在論文里他們開創(chuàng)性的提出了Transformer架構。此后它成了NLP（自然語言處理）領域最受歡迎的模型之一，也正是有了這個架構，我們才能見到ChatGPT這樣的AI大模型。

所以業(yè)內(nèi)都把Transformer架構奉為AI領域的奠基石，這篇論文也成為了AI探索和研究的“金科玉律”。2019年，谷歌特地為該架構申請了專利。

谷歌AI奠基論文被指“翻車”！開山鼻祖給AI帶來了什么？

據(jù)資料顯示，自2017年發(fā)表以來，《Attention Is All Your Need》這篇論文已經(jīng)被引用了7萬多次�，F(xiàn)在被曝出論文可能出錯了，這不得不讓整個AI圈震驚。

“開山鼻祖”竟然翻車了？

發(fā)現(xiàn)錯誤的是一位知名機器學習與 AI 研究者、初創(chuàng)公司 Lightning AI 的首席 AI 教育家 Sebastian Raschka。他指出，原始 Transformer 論文中的架構圖有誤，這跟代碼不一致。

谷歌AI奠基論文被指“翻車”！開山鼻祖給AI帶來了什么？

他結合了另外兩篇同樣涉及Transformer架構的論文，來佐證《Attention Is All Your Need》里的出現(xiàn)的結構圖是不對的，可能會導致表示崩潰。這對于一篇指導了幾乎所有AI開發(fā)的論文來說，是不能接受的。

針對他提出的錯誤，有網(wǎng)友認為經(jīng)常會遇到與代碼或結果不一致的論文，大多數(shù)是無心之過；但有時令人感到奇怪�？紤]到 Transformer 論文的流行程度，這個不一致問題早就應該被提及 1000 次。

谷歌AI奠基論文被指“翻車”！開山鼻祖給AI帶來了什么？

對此 Sebastian表示，公平地講，“最最原始”的代碼確實與架構圖一致，但 2017 年對提交的代碼版本進行了修改，同時沒有更新架構圖。所以，這實在令人困惑。

“奠基石”也并非一勞永逸

Transformer架構“教出”了一批優(yōu)秀的學生，讓AI領域獲得前所未有的關注，也昭示了AI技術的發(fā)展方向。

但業(yè)界對技術的追求，一直都不滿足現(xiàn)狀。

經(jīng)過大量實踐，開發(fā)者發(fā)現(xiàn)凡是采用Transformer架構的類GPT大模型，都有共同的缺陷，就是太容易健忘，一旦輸入序列的token超過上下文窗口閾值，后續(xù)輸出的內(nèi)容和前文邏輯就對不上了。

ChatGPT只能支持4000個token（約3000個詞）的輸入，目前地表最強的GPT－4也只支持最大32000token窗口，如果繼續(xù)加大輸入序列長度，計算復雜度也會成二次方增長。

前段時間，倫敦數(shù)學科學研究所的研究人員發(fā)布了一篇技術報告，使用循環(huán)記憶Transformer（RMT）將BERT的有效上下文長度提升到前所未有的200萬tokens。該方法可以存儲和處理局部和全局信息，并通過使用循環(huán)讓信息在輸入序列的各segment之間流動。

百度在推出文心一言大模型之后，不停地對其進行訓練，并加快了迭代速度。

在5月9日舉行的百度文心一言技術交流會上，百度集團副總裁侯震宇表示，下一階段人工智能大模型的創(chuàng)新還要從前沿理論研究方面尋找突破口，就比如說探尋突破Transformer框架的方式。

開山論文的締造者，已各奔東西

最近，OpenAI 聯(lián)合創(chuàng)始人 Ilya Stutskever 在談到 Transformer 時表示，當 Transformer 剛發(fā)布之初，實際上是論文放出來的第二天，他們就迫不及待的將以前的研究切換到 Transformer ，后續(xù)才有了 GPT。

而作為Transformer的締造者——《Attention Is All Your Need》論文作者們，大多都選擇了自己的道路。

谷歌AI奠基論文被指“翻車”！開山鼻祖給AI帶來了什么？

Ashish Vaswani、Niki Parmar等人共同創(chuàng)立了Adept，根據(jù)披露的消息這是一家跟OpenAI競爭的大模型公司。目前已經(jīng)獲得了4．15億美元的融資，且估值超過10億美元。

Noam Shazee在 2000 年底加入谷歌，直到 2021 年最終離職。2021年，他和他的朋友Daniel De Freitas一起創(chuàng)立了CharacterAI。這是一家虛擬人聊天AI公司，能生成各種不同人格的虛擬人支持陪聊。目前已經(jīng)獲得了近2億美元的融資。

2021 年，Jakob Uszkoreit 和 Rhiju Das 共同創(chuàng)立了 Inceptive，致力于通過高度可擴展的實驗和深度學習的奇異結合來實現(xiàn)下一代 RNA 分子的設計，已經(jīng)獲得了2000萬美元的融資。

Llion Jones是8人中目前唯一還在谷歌工作的。他聲稱對論文作出了最有意義的貢獻：寫下了Attention is all you need這個響亮的標題。

Aidan Gomez于2019年9月離開Google。2021 年 5 月，他官宣成立新公司——自然語言處理平臺 Cohere，基于自己訓練的大型 NLP 模型為外界提供 API 服務。目前已經(jīng)獲得了近4億美元的融資，員工人數(shù)超過180名。

Lukasz Kaiser也是知名的機器學習系統(tǒng)Tensor Flow的共同創(chuàng)造者之一，2021 年 6 月，Lukasz Kaiser 從谷歌跳槽到了 OpenAI。

Illia Polosukhin現(xiàn)在是 NEAR．AI 的聯(lián)合創(chuàng)始人及 CTO。這是一家區(qū)塊鏈底層技術公司，目前估值約為20億美元。

本地收藏打印推薦給朋友

聲明： 本網(wǎng)站所刊載信息，不代表OFweek觀點。刊用本站稿件，務經(jīng)書面授權。未經(jīng)授權禁止轉載、摘編、復制、翻譯及建立鏡像，違者將依法追究法律責任。

發(fā)表評論

共0條評論，0人參與

登錄登錄即可訪問所有OFweek服務

用戶名/郵箱/手機：
密碼：
忘記密碼？
用其他賬號登錄： QQ | 微信 | 新浪微博

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞