AI戴上有色眼鏡:你在機器眼中是好人還是壞蛋?
大眾的認知中,人工智能的決策都是絕對理性與客觀的,因為我們知道背后驅(qū)使它的是冷冰冰卻比千言萬語更接近事實的數(shù)據(jù),然而,近期專家發(fā)現(xiàn),人工智能其實也會帶著有色眼鏡去看人。
據(jù)國外媒體報道,斯坦福大學(xué)的一項研究顯示,亞馬遜、蘋果、谷歌、IBM和微軟的語音識別系統(tǒng)存在種族差異,在白人用戶中出現(xiàn)的錯誤,要比在黑人用戶中少得多。
研究顯示,這五大科技公司的語音識別系統(tǒng)在白人中錯誤識別單詞的概率為19%。而在黑人用戶中,則提升至35%。此外,大約2%的白人音頻片段被這些系統(tǒng)認為是不可讀的。而在黑人用戶中,這一比例卻高達20%。
美國國家標準與技術(shù)研究所(NIST)也曾測試了兩種最常見的人臉識別算法,得出了四點結(jié)論:
1. 在一對一匹配中,大多數(shù)系統(tǒng)對亞裔和非裔美國人比對白人面孔的假陽性匹配率更高,有時是10倍甚至100倍。
2. 這種情況在亞洲國家發(fā)展的人臉識別算法中有所改變,在亞洲和白人之間,假陽性的差異非常小。
3.美國開發(fā)的算法始終不擅長匹配亞洲、非洲裔美國人和美洲原住民的面孔。美國原住民得到的是錯誤率最高。
4. 在一對多的配對中,非裔美國女性的假陽性率最低,這使她們被錯誤指控犯罪的風(fēng)險最高。
事實上,早在2015年就已經(jīng)存在計算機視覺技術(shù)犯錯的例子,表明人工智能技術(shù)存在對女性和有色人種的偏見,實例包括Google 等科技業(yè)巨頭所提供的高人氣網(wǎng)絡(luò)服務(wù),Google 照片應(yīng)用程序(Google Photos app)被發(fā)現(xiàn)將非裔美國人標記為「大猩猩」,谷歌曾也為此進行公開道歉。
在探討如何消除人工智能的不客觀之前,我們先來看看AI的有色眼鏡到底從何而來。
數(shù)據(jù)是“罪魁禍首”
現(xiàn)階段讓AI提升認知世界能力的最有效途徑仍然是監(jiān)督學(xué)習(xí),而目前AI算法能學(xué)習(xí)的數(shù)據(jù),幾乎全部都是通過人力逐一進行標注而得來的,數(shù)據(jù)集質(zhì)量的高低直接決定最終模型的效果。
數(shù)據(jù)標注者通常是人類,而人類是“復(fù)雜”的生物。這也是導(dǎo)致AI產(chǎn)生偏見的一個主要因素,大多數(shù)機器學(xué)習(xí)任務(wù)都是使用大型、帶標注的數(shù)據(jù)集來訓(xùn)練,AI會基于開發(fā)者提供的訓(xùn)練數(shù)據(jù)推斷出規(guī)律,再將規(guī)律套用在某些資料中。
打個比方,在人臉識別應(yīng)用中,如果用于訓(xùn)練的數(shù)據(jù)里白人男性比黑人女性更多,那白人男性的識別率將會更高。
導(dǎo)致AI產(chǎn)生偏見另一個原因可以歸于算法本身,一個常見的機器學(xué)習(xí)程序會試圖最大化訓(xùn)練數(shù)據(jù)集的整體預(yù)測準確率。
有缺陷的算法還會造成惡性循環(huán),使偏見越發(fā)嚴重。例如谷歌翻譯,會默認使用男性代詞,這是因為英語語料庫中男性代詞對女性代詞的比例為2:1。
算法的原則是由AI自行進行學(xué)習(xí),乍看之下很有效率。不過,一但提供的資料不夠全面,或開發(fā)者沒有想方設(shè)法避免歧視,AI推導(dǎo)出的結(jié)果便很容易帶有偏見。
AI并不理解“偏見”
偏見這個詞是人類創(chuàng)造的,也是人類定義的,AI并不能理解偏見的含義。
機器學(xué)習(xí)的方法會讓AI帶上了有色眼鏡,但是改變 AI 學(xué)習(xí)的方式也不是好的解決方式。
或許我們應(yīng)該從自己身上找找原因,畢竟導(dǎo)致AI產(chǎn)生偏見的原因,有部分要歸咎于他們所使用的語言。人們需要弄清楚什么是偏見,以及偏見在語言中的傳遞過程,避免這些偏見在日益強大的 AI 應(yīng)用中更大范圍的傳播。
前微軟副總裁沈向洋博士曾在公開課《打造負責任的AI》中指出:“人工智能已經(jīng)開始做出人類無法理解的決定了,我們需要開啟人工智能的黑箱,了解AI做出決定背后的原因!
算法之所以會對人類進行區(qū)別對待,原因在于訓(xùn)練算法用的基準數(shù)據(jù)集通常是來自新聞和網(wǎng)頁的數(shù)據(jù),就存在著由語言習(xí)慣造成的“性別偏見”,算法也自然“繼承”了人類對這些詞匯理解的性別差異。
AI技術(shù)距離完全消除技術(shù)偏見還有很長的一段路,但各大巨頭也已經(jīng)在技術(shù)層面做出努力。
谷歌開源了一項名為“What-If Tool”的探測工具,IBM將研發(fā)的偏見檢測工具—AI Fairness 360 工具包開源,包括超過 30 個公平性指標(fairness metrics),和 9 個偏差緩解算法,研究人員和開發(fā)者可將工具整合至自己的機器學(xué)習(xí)模型里,檢測并減少可能產(chǎn)生的偏見和歧視。
寫在最后
人類的行為是收到外界影響的,而這種語言傳統(tǒng)中出現(xiàn)的偏見,是在人文歷史中不斷加深嵌入的,在“偏見”通過代碼傳播之際,我們必須弄清楚,是否簡單的語言學(xué)習(xí)就足以解釋我們觀察到傳播中出現(xiàn)的偏見。
最重要的是大眾需要了解“偏見”從何而來,從而在社會中消除這種不文明的“偏見”。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 10 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單