數(shù)億網(wǎng)民數(shù)據(jù)將被用來訓(xùn)練AI?谷歌新隱私政策引發(fā)爭(zhēng)議!
彼之砒霜,我之蜜糖。
從ChatGPT出現(xiàn)到目前為止,大大小小的大模型一只手已經(jīng)數(shù)不過來了。不管這些模型參數(shù)規(guī)模大小,上察天文,下曉地理,總能找出來一個(gè)符合應(yīng)用場(chǎng)景的。這樣的“外掛”說成是解放生產(chǎn)力,也不算為過。
但一家歡喜一家愁。在大模型一路狂奔的背后,那些支持他們訓(xùn)練的數(shù)據(jù)來源,也成了業(yè)內(nèi)心頭一直放不下的障礙。鑒于OpenAI、谷歌等一眾巨頭一直以來“白嫖”的優(yōu)良傳統(tǒng),各個(gè)數(shù)據(jù)源頭如Twitter、Reddit等知名社交平臺(tái)和社區(qū),都表示:想用我的數(shù)據(jù)可以,把錢拿來!
這下AI巨頭們反倒被數(shù)據(jù)源牽著鼻子走了,但是有人偏偏不信這個(gè)邪。
近日,搜索引擎巨頭谷歌宣布:以后只要是發(fā)布在網(wǎng)上的信息,谷歌都可以拿來訓(xùn)練AI!不管是語言模型,只要是和AI相關(guān)的服務(wù),都在允許范圍內(nèi)。
谷歌新政策一出,業(yè)內(nèi)徹底炸開了鍋!
堂而皇之“侵犯隱私”,還能合規(guī)合法?
AI訓(xùn)練“侵犯隱私”的輿論正鬧得沸沸揚(yáng)揚(yáng),谷歌卻頭鐵得出臺(tái)了新的隱私政策,想借此給自己套上免死金牌。
近日,谷歌更新隱私政策,表示將利用網(wǎng)絡(luò)公開數(shù)據(jù)訓(xùn)練旗下的AI模型。
其中,谷歌在新隱私協(xié)議的“可公開獲取的資源”中聲明:“我們可能會(huì)收集公開的在線信息或來自其他公共來源的信息,幫助訓(xùn)練Google的AI模型。”該大模型將會(huì)為谷歌翻譯、谷歌旗下聊天機(jī)器人產(chǎn)品“Bard”及Cloud AI等產(chǎn)品和功能提供支持。
去年年底谷歌就更新了一版隱私政策。對(duì)比上一版,谷歌將“收集信息以幫助訓(xùn)練語言模型”的相關(guān)措辭更改為“訓(xùn)練人工智能模型”,并新增明確了自家AI產(chǎn)品對(duì)于數(shù)據(jù)的使用權(quán)利。
這似乎意味著,谷歌在訓(xùn)練旗下聊天機(jī)器人及其他AI模型,或未來開發(fā)AI產(chǎn)品的過程中,有權(quán)使用人們?cè)诰W(wǎng)上公開發(fā)布的任意內(nèi)容,什么“版權(quán)”、隱私在該政策面前統(tǒng)統(tǒng)不存在了。
經(jīng)確認(rèn),7月5日,谷歌中文版隱私政策也已經(jīng)進(jìn)行同步更新。
谷歌的這項(xiàng)政策沒有針對(duì)誰,指的是在座的所有網(wǎng)民。只要你在網(wǎng)上發(fā)表了什么內(nèi)容,谷歌都可以拿來訓(xùn)練AI。消息一出,網(wǎng)上瞬間炸開了鍋。
“版權(quán)已死” “隱私不在”等等悲觀情緒不一而足,更有的直言“AI正在吞食一切”。
但也有人認(rèn)為,谷歌的此項(xiàng)舉措并沒有嚴(yán)格意義上的“違規(guī)違法”。有相關(guān)律師表示,“無論在我國(guó)還是域外,對(duì)公開數(shù)據(jù)的正常收集和使用,在一般情況下不算違法。”但是他還說,一旦個(gè)人通過郵件等方式明確拒絕了此項(xiàng)政策,那就另當(dāng)別論了。
其他法律人士表示,就目前可獲得的信息而言,谷歌對(duì)收集與處理用戶個(gè)人信息的范圍和目的作出了詳細(xì)說明,即使以歐盟GDPR項(xiàng)下更為嚴(yán)格的“告知-同意”規(guī)則為標(biāo)準(zhǔn),谷歌的這一收集與處理行為至少在形式上具有合法性。
只是在實(shí)際施行中涉及的行為是否合法,還需進(jìn)一步確認(rèn)。
AI巨頭們的“數(shù)據(jù)之戰(zhàn)”
單純看谷歌的一系列操作,可能覺得有些無厘頭。但有意思的是,就在谷歌更新隱私政策前不久,另外一個(gè)AI巨頭就被起訴“侵犯隱私”。
兩名美國(guó)作家在舊金山聯(lián)邦法院對(duì)OpenAI提起訴訟,聲稱 OpenAI 沒有獲得版權(quán)授權(quán),就濫用他們的作品來訓(xùn)練人工智能。
起訴書中顯示,OpenAI 的訓(xùn)練數(shù)據(jù)超過 30 萬本書,其中就包括本就飽受爭(zhēng)議,版權(quán)歸屬不清晰的“影子圖書館”(大多是以侵犯版權(quán)的方式向公眾免費(fèi)提供書籍文獻(xiàn)內(nèi)容的線上網(wǎng)站)。
此前OpenAI和微軟還被16 位匿名人士要起訴,因?yàn)檫@兩家公司沒有經(jīng)過他們的同意就泄露了他們的個(gè)人隱私,要求兩家賠償30億美元。
這么看來,谷歌此舉反倒有一種“自保”的意圖。
而另一方面,則更加突出了AI大潮之下,數(shù)據(jù)的重要性。各家都在保衛(wèi)和爭(zhēng)奪“數(shù)據(jù)”中絞盡腦汁。
Reddit采取的方式簡(jiǎn)單粗暴,就是提高API價(jià)格。Twitter則是限制數(shù)據(jù)的曝光,CEO馬斯克近日宣布 Twitter 將“臨時(shí)限制”用戶每日閱讀推文數(shù)量:未驗(yàn)證的賬戶每天只能看到 600 條推文,對(duì)于新的未驗(yàn)證賬戶,一天只能看到 300 條。經(jīng)過驗(yàn)證的賬戶每天只能閱讀 6000 條帖子。
當(dāng)各家AI的發(fā)展進(jìn)度逐漸持平以后,算力和參數(shù)都漸漸被弱化。接下來的競(jìng)爭(zhēng),就看誰能更快更多地獲取到“高質(zhì)量”數(shù)據(jù)了。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?