訂閱
糾錯
加入自媒體

對網(wǎng)絡(luò)暴力Say NO!AI算法如何辨“好壞”?

社交平臺、短視頻平臺等公共網(wǎng)絡(luò)場所,已經(jīng)成為網(wǎng)絡(luò)暴力行為的高發(fā)地。

在剛結(jié)束的冬奧會上,就有不少人通過網(wǎng)絡(luò)平臺的評論和私信功能,對冬奧選手進(jìn)行詆毀、侮辱攻擊、散布不實(shí)謠言,對冬奧觀賽和社區(qū)氛圍造成了極大的傷害。

事實(shí)上,網(wǎng)絡(luò)暴力由來已久。

由于網(wǎng)絡(luò)暴力往往處于灰色地帶,大部分暴力行為都尚未構(gòu)成誹謗和侮辱,因此很難對網(wǎng)絡(luò)暴力實(shí)施者處以刑罰或者行政處罰。

網(wǎng)民的言論只要不超越法律底線,有權(quán)自由發(fā)表言論。

為了應(yīng)對網(wǎng)絡(luò)暴力行為,全球大多數(shù)的社交平臺都采用了言論投訴、評論過濾、評論/私信關(guān)閉、好友關(guān)注過濾等功能,在一定程度上緩解網(wǎng)絡(luò)霸凌的問題。

但限制性的功能類似于黑名單,并不能完全將網(wǎng)絡(luò)暴力扼殺在搖籃,只能在惡意語言/圖片/視頻出現(xiàn)后進(jìn)行封堵,不幸的是負(fù)面影響已經(jīng)擴(kuò)散開來。

那么,能否采用技術(shù)的手段從源頭就識別網(wǎng)絡(luò)暴力行為呢?

01

以AI技術(shù)制止網(wǎng)絡(luò)暴力

成為全球研究者共同的選擇

2016年,以“賈斯汀·比伯退出Instagram”為導(dǎo)火索,Instagram首次推出了負(fù)面評論過濾功能。之后,Instagram還通過機(jī)器學(xué)習(xí)來處理含有攻擊性信息的照片。

2019年,Instagram又推出兩大反網(wǎng)絡(luò)暴力功能,即言論提醒和自主選定黑粉功能,用來幫用戶抵制網(wǎng)絡(luò)暴力。

其中,言論提醒功能利用AI技術(shù),在冒犯性言論發(fā)表之前,向發(fā)言者發(fā)出提醒。比如:當(dāng)某用戶輸入了“你又丑又蠢!辈Ⅻc(diǎn)擊發(fā)布時,AI會發(fā)出“請為Instagram保持一個友好環(huán)境”的提醒。

“通過獲得這種干預(yù),人們有機(jī)會反思和撤銷他們的評論,使收件人避免收到有害評論通知!盜nstagram主管Adam Mosseri表示,“經(jīng)測試,我們發(fā)現(xiàn)這項功能確實(shí)有引導(dǎo)作用,能使一些用戶撤銷評論或修改評論內(nèi)容!

近日,抖音也推出了類似的防網(wǎng)暴功能,并升級為AI技術(shù)和人工審核相結(jié)合的方式,對違規(guī)用戶進(jìn)行引導(dǎo)和幫助。

當(dāng)用戶發(fā)布違規(guī)或低質(zhì)評論之后,抖音會對該評論進(jìn)行模型匹配和校驗(yàn),用戶會立即收到評論彈窗警示,提示“該評論可能對他人造成負(fù)面影響”,給用戶一個回心轉(zhuǎn)意的機(jī)會。

當(dāng)然,彈窗可以跳過并繼續(xù)發(fā)布評論,但將不會被其它人看見,此時評論會進(jìn)入正常審核邏輯,真正的違規(guī)評論依然會被處理。

此外,抖音在防網(wǎng)暴系統(tǒng)中還新增了名為“心情暖寶寶”的平臺助手。

如果用戶多次違規(guī)發(fā)布私信、評論,AI算法可以自動匹配觸發(fā)“心情暖寶寶”,用消息對話嘗試緩解用戶的抑郁情緒,甚至引導(dǎo)用戶去人工求助、線下就診。

此外,用戶也可以自主在推薦、搜索、評論等場景減少負(fù)面內(nèi)容推薦。

除了識別謾罵/騷擾信息等明顯的負(fù)向內(nèi)容,如:反諷攻擊、答非所問、垃圾廣告導(dǎo)流這類“陰陽怪氣”的內(nèi)容,在不同討論語境下也會引發(fā)不同情緒,這更為AI算法識別帶來了極大挑戰(zhàn)。

對此,2018年知乎就通過AI技術(shù)嘗試處理陰陽怪氣的言論!巴吡Α弊鳛橹跎鐓^(qū)治理的算法機(jī)器人之一,能在0.3秒內(nèi)識別判斷內(nèi)容是否為不友善、答非所問、陰陽怪氣等多種需被折疊的答案。

“我們基于對于用戶切實(shí)體驗(yàn)的累積觀察,與算法團(tuán)隊一起,從情感傾向性、親密關(guān)系、文本特征三方面入手,訓(xùn)練出能夠識別陰陽怪氣的算法模型。

目前‘瓦力’對陰陽怪氣評論文本的識別準(zhǔn)確率,已非常接近社區(qū)最大公約數(shù),比很多人工判斷都更準(zhǔn)!敝踹\(yùn)營總監(jiān)孫達(dá)云表示。

所謂“社區(qū)最大公約數(shù)”指的是社區(qū)共識,即長久積淀下來知乎和用戶共同認(rèn)可的一種公約,知乎稱之為知友們對價值判斷的最大公約數(shù),比如“知乎不讓罵人”,比如“對優(yōu)質(zhì)內(nèi)容的界定”等。

知乎在過去多年中所累積的“舉報”等帶有用戶篩查性質(zhì)的行為語料和豐富的社區(qū)管理經(jīng)驗(yàn),使得知乎得以邁出關(guān)鍵一步:用社區(qū)最大公約數(shù)作為判定尺度。

在算法方面,通過400多個前沿的深度學(xué)習(xí)模型識別過億內(nèi)容,現(xiàn)在的知乎平臺,可以智能地進(jìn)行傾向性識別、爆照識別、風(fēng)險圖片識別等等。

1  2  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號