對網(wǎng)絡(luò)暴力Say NO!AI算法如何辨“好壞”?
社交平臺、短視頻平臺等公共網(wǎng)絡(luò)場所,已經(jīng)成為網(wǎng)絡(luò)暴力行為的高發(fā)地。
在剛結(jié)束的冬奧會上,就有不少人通過網(wǎng)絡(luò)平臺的評論和私信功能,對冬奧選手進(jìn)行詆毀、侮辱攻擊、散布不實(shí)謠言,對冬奧觀賽和社區(qū)氛圍造成了極大的傷害。
事實(shí)上,網(wǎng)絡(luò)暴力由來已久。
由于網(wǎng)絡(luò)暴力往往處于灰色地帶,大部分暴力行為都尚未構(gòu)成誹謗和侮辱,因此很難對網(wǎng)絡(luò)暴力實(shí)施者處以刑罰或者行政處罰。
網(wǎng)民的言論只要不超越法律底線,有權(quán)自由發(fā)表言論。
為了應(yīng)對網(wǎng)絡(luò)暴力行為,全球大多數(shù)的社交平臺都采用了言論投訴、評論過濾、評論/私信關(guān)閉、好友關(guān)注過濾等功能,在一定程度上緩解網(wǎng)絡(luò)霸凌的問題。
但限制性的功能類似于黑名單,并不能完全將網(wǎng)絡(luò)暴力扼殺在搖籃,只能在惡意語言/圖片/視頻出現(xiàn)后進(jìn)行封堵,不幸的是負(fù)面影響已經(jīng)擴(kuò)散開來。
那么,能否采用技術(shù)的手段從源頭就識別網(wǎng)絡(luò)暴力行為呢?
01
以AI技術(shù)制止網(wǎng)絡(luò)暴力
成為全球研究者共同的選擇
2016年,以“賈斯汀·比伯退出Instagram”為導(dǎo)火索,Instagram首次推出了負(fù)面評論過濾功能。之后,Instagram還通過機(jī)器學(xué)習(xí)來處理含有攻擊性信息的照片。
2019年,Instagram又推出兩大反網(wǎng)絡(luò)暴力功能,即言論提醒和自主選定黑粉功能,用來幫用戶抵制網(wǎng)絡(luò)暴力。
其中,言論提醒功能利用AI技術(shù),在冒犯性言論發(fā)表之前,向發(fā)言者發(fā)出提醒。比如:當(dāng)某用戶輸入了“你又丑又蠢!辈Ⅻc(diǎn)擊發(fā)布時,AI會發(fā)出“請為Instagram保持一個友好環(huán)境”的提醒。
“通過獲得這種干預(yù),人們有機(jī)會反思和撤銷他們的評論,使收件人避免收到有害評論通知!盜nstagram主管Adam Mosseri表示,“經(jīng)測試,我們發(fā)現(xiàn)這項功能確實(shí)有引導(dǎo)作用,能使一些用戶撤銷評論或修改評論內(nèi)容!
近日,抖音也推出了類似的防網(wǎng)暴功能,并升級為AI技術(shù)和人工審核相結(jié)合的方式,對違規(guī)用戶進(jìn)行引導(dǎo)和幫助。
當(dāng)用戶發(fā)布違規(guī)或低質(zhì)評論之后,抖音會對該評論進(jìn)行模型匹配和校驗(yàn),用戶會立即收到評論彈窗警示,提示“該評論可能對他人造成負(fù)面影響”,給用戶一個回心轉(zhuǎn)意的機(jī)會。
當(dāng)然,彈窗可以跳過并繼續(xù)發(fā)布評論,但將不會被其它人看見,此時評論會進(jìn)入正常審核邏輯,真正的違規(guī)評論依然會被處理。
此外,抖音在防網(wǎng)暴系統(tǒng)中還新增了名為“心情暖寶寶”的平臺助手。
如果用戶多次違規(guī)發(fā)布私信、評論,AI算法可以自動匹配觸發(fā)“心情暖寶寶”,用消息對話嘗試緩解用戶的抑郁情緒,甚至引導(dǎo)用戶去人工求助、線下就診。
此外,用戶也可以自主在推薦、搜索、評論等場景減少負(fù)面內(nèi)容推薦。
除了識別謾罵/騷擾信息等明顯的負(fù)向內(nèi)容,如:反諷攻擊、答非所問、垃圾廣告導(dǎo)流這類“陰陽怪氣”的內(nèi)容,在不同討論語境下也會引發(fā)不同情緒,這更為AI算法識別帶來了極大挑戰(zhàn)。
對此,2018年知乎就通過AI技術(shù)嘗試處理陰陽怪氣的言論!巴吡Α弊鳛橹跎鐓^(qū)治理的算法機(jī)器人之一,能在0.3秒內(nèi)識別判斷內(nèi)容是否為不友善、答非所問、陰陽怪氣等多種需被折疊的答案。
“我們基于對于用戶切實(shí)體驗(yàn)的累積觀察,與算法團(tuán)隊一起,從情感傾向性、親密關(guān)系、文本特征三方面入手,訓(xùn)練出能夠識別陰陽怪氣的算法模型。
目前‘瓦力’對陰陽怪氣評論文本的識別準(zhǔn)確率,已非常接近社區(qū)最大公約數(shù),比很多人工判斷都更準(zhǔn)!敝踹\(yùn)營總監(jiān)孫達(dá)云表示。
所謂“社區(qū)最大公約數(shù)”指的是社區(qū)共識,即長久積淀下來知乎和用戶共同認(rèn)可的一種公約,知乎稱之為知友們對價值判斷的最大公約數(shù),比如“知乎不讓罵人”,比如“對優(yōu)質(zhì)內(nèi)容的界定”等。
知乎在過去多年中所累積的“舉報”等帶有用戶篩查性質(zhì)的行為語料和豐富的社區(qū)管理經(jīng)驗(yàn),使得知乎得以邁出關(guān)鍵一步:用社區(qū)最大公約數(shù)作為判定尺度。
在算法方面,通過400多個前沿的深度學(xué)習(xí)模型識別過億內(nèi)容,現(xiàn)在的知乎平臺,可以智能地進(jìn)行傾向性識別、爆照識別、風(fēng)險圖片識別等等。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?