訂閱
糾錯(cuò)
加入自媒體

美國(guó)五大科技巨頭語(yǔ)音識(shí)別系統(tǒng)歧視黑人?網(wǎng)友給出新視角

近年來(lái),隨著人工智能概念的走紅和落地,全球掀起了一股智能化風(fēng)潮,為生物識(shí)別、機(jī)器視覺(jué)等產(chǎn)業(yè)的發(fā)展帶來(lái)了巨大利好。目前,以語(yǔ)音識(shí)別、人臉識(shí)別為代表的生物識(shí)別技術(shù)在世界各國(guó)得到了廣泛應(yīng)用,并加速實(shí)現(xiàn)規(guī)模化商用。

其中,語(yǔ)音識(shí)別技術(shù)的發(fā)展與應(yīng)用正越發(fā)成熟,智能音箱、聊天機(jī)器人、客服機(jī)器人等產(chǎn)品獲得了消費(fèi)者的普遍認(rèn)可。然而,近日斯坦福大學(xué)一項(xiàng)研究成果表明,亞馬遜、蘋(píng)果、谷歌、IBM和微軟這五大科技巨頭的語(yǔ)音識(shí)別系統(tǒng)可能存在種族差異。

該研究顯示,美國(guó)五大科技公司的語(yǔ)音識(shí)別系統(tǒng)在對(duì)白人用戶(hù)和黑人用戶(hù)的識(shí)別中,白人群體的錯(cuò)誤率要比黑人群體少得多。此外,有高達(dá)20%的黑人用戶(hù)音頻片段被系統(tǒng)判定為不可讀。據(jù)此,斯坦福大學(xué)相關(guān)研究人員認(rèn)為,這些公司的語(yǔ)音識(shí)別系統(tǒng)顯然存在歧視性。那么,真相是什么呢?

開(kāi)發(fā)者因素影響

一般來(lái)說(shuō),借助人工智能技術(shù),語(yǔ)音識(shí)別系統(tǒng)等智能化產(chǎn)品都具備自我學(xué)習(xí)能力,可以根據(jù)開(kāi)發(fā)者提供的數(shù)據(jù)資源進(jìn)行自我訓(xùn)練,從而不斷成長(zhǎng)、提高系統(tǒng)性能與服務(wù)水平,增強(qiáng)與人類(lèi)用戶(hù)的溝通、理解能力。

但是在這一過(guò)程中,開(kāi)發(fā)者提供的數(shù)據(jù)資源成為了關(guān)鍵。如果開(kāi)發(fā)者本身存在種族偏見(jiàn),選擇的數(shù)據(jù)資源也非常具有指向性,那么必然造成語(yǔ)音識(shí)別系統(tǒng)在初期學(xué)習(xí)中,就會(huì)養(yǎng)成類(lèi)似種族偏見(jiàn)的“習(xí)慣”。

斯坦福大學(xué)的研究也表明,上述公司的語(yǔ)音識(shí)別系統(tǒng)在訓(xùn)練時(shí),所使用的數(shù)據(jù)就顯得有些片面化,不夠多樣性。因此,語(yǔ)音識(shí)別系統(tǒng)在訓(xùn)練時(shí)如果得不到豐富、多元的數(shù)據(jù),形成“歧視觀念”就難以避免。

使用者因素影響

相對(duì)于在初期訓(xùn)練中具備的“本能”,語(yǔ)音識(shí)別系統(tǒng)在后期用戶(hù)使用過(guò)程中所受到的影響也是關(guān)鍵性的。如果語(yǔ)音識(shí)別系統(tǒng)的主要用戶(hù)是特定的某一群體,那么其持續(xù)自我學(xué)習(xí)數(shù)據(jù)的來(lái)源將變得非!皢握{(diào)”。

從目前美國(guó)市場(chǎng)的反饋來(lái)看,五大科技巨頭開(kāi)發(fā)的語(yǔ)音識(shí)別系統(tǒng)更多的使用群體是白人,黑人用戶(hù)相對(duì)而言較少。所以,在白人用戶(hù)偏多而黑人用戶(hù)偏少的情況下,語(yǔ)音識(shí)別系統(tǒng)所收集、利用的數(shù)據(jù)多樣性不足,就會(huì)造成對(duì)特定用戶(hù)群體的識(shí)別準(zhǔn)確率偏差。

所以,針對(duì)這種情況,相關(guān)企業(yè)應(yīng)當(dāng)重視起來(lái),通過(guò)人為干預(yù)等方式,補(bǔ)充黑人群體、亞裔群體、拉丁裔群體等其他種族人群的語(yǔ)音信息,以保證語(yǔ)音識(shí)別系統(tǒng)在學(xué)習(xí)過(guò)程中接收信息的平衡性,從而盡量避免出現(xiàn)歧視后果。

口音因素影響

除了開(kāi)發(fā)者、使用者所提供的數(shù)據(jù)存在多樣性問(wèn)題外,很多網(wǎng)友認(rèn)為,這和不同群體之間的口音差異也應(yīng)當(dāng)有一定關(guān)聯(lián)。相對(duì)于白人群體,其他種族的人群在發(fā)音上或多或少都會(huì)與之有差異,這可能是語(yǔ)音系統(tǒng)在識(shí)別方面有偏見(jiàn)的原因之一。

其實(shí)在我國(guó),也存在地方方言導(dǎo)致語(yǔ)音識(shí)別有差異的情況。從大的方面來(lái)說(shuō),北方人和南方人的發(fā)音就不盡相同,就普通話(huà)識(shí)別來(lái)說(shuō),肯定是北方人的識(shí)別準(zhǔn)確率更高。因此,方言、發(fā)音等因素也應(yīng)當(dāng)被考慮在內(nèi),而不是簡(jiǎn)單地判定為種族偏見(jiàn)。

可以看出,語(yǔ)音識(shí)別系統(tǒng)要想繼續(xù)拓展市場(chǎng)還存在不少挑戰(zhàn),如果無(wú)法克服用戶(hù)群體傾向性、方言和發(fā)音等硬傷,那么顯然不利于語(yǔ)音識(shí)別產(chǎn)品實(shí)現(xiàn)進(jìn)一步普及,也不利于其獲得更廣泛用戶(hù)的認(rèn)可。對(duì)于語(yǔ)音識(shí)別行業(yè)來(lái)說(shuō),市場(chǎng)前景固然廣闊,但也必須努力克服眼下的困境,才能迎來(lái)真正的騰飛。

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)