訂閱
糾錯(cuò)
加入自媒體

今日頭條整改首先擴(kuò)招審核團(tuán)隊(duì),靠機(jī)器學(xué)習(xí)推薦內(nèi)容已是偽命題?

“今日頭條將強(qiáng)化總編輯責(zé)任制,全面糾正算法和機(jī)器審核的缺陷,不斷強(qiáng)化人工運(yùn)營(yíng)和審核,將現(xiàn)有6000人的運(yùn)營(yíng)審核隊(duì)伍,擴(kuò)大到10000人!4月11日早4時(shí)33分,今日頭條創(chuàng)始人&CEO張一鳴在其《致歉和反思》信中說。

作為國(guó)內(nèi)最大的智能內(nèi)容平臺(tái),今日頭條一直以機(jī)器學(xué)習(xí)推薦技術(shù)引以為傲。此次大幅度擴(kuò)充運(yùn)營(yíng)審核團(tuán)隊(duì),或許是認(rèn)為,以機(jī)器學(xué)習(xí)為主導(dǎo)的機(jī)制,已無法負(fù)荷龐大的內(nèi)容審核工作,需要加大人工輔助力度了。

指控、處罰、責(zé)令關(guān)閉內(nèi)涵段子,今日頭條整改行動(dòng)從本月正式開始

早從今年3月開始,用戶可能或多或少的有所感覺,甚至提出疑問:包含低俗、違法、虛假等內(nèi)容的今日頭條,是不是快要不行了?

3月8日,央視財(cái)經(jīng)發(fā)布《“今日頭條”終于上了“頭條”!無視監(jiān)管,竟做起這種“黑勾當(dāng)”!害苦2.4億用戶...》文章,直指“今日頭條”利用“二跳”手段發(fā)布虛假?gòu)V告,嚴(yán)重侵害消費(fèi)者合法權(quán)益,并危害到相關(guān)藥品企業(yè)正常經(jīng)營(yíng);

3月29日央視《經(jīng)濟(jì)半小時(shí)》欄目直接指出,今日頭條枉顧監(jiān)管約談,明著合法,暗中“二跳”廣告的“黑勾當(dāng)”;

3月30日,就廣告違規(guī)問題,北京工商行政管理局海淀分局對(duì)今日頭條行政作出處罰,沒收廣告費(fèi)并處以廣告費(fèi)用3倍罰款,總計(jì)達(dá)94.4萬元人民幣;

4月4日,國(guó)家廣播電視總局對(duì)今日頭條、快手兩家網(wǎng)站的主要負(fù)責(zé)人進(jìn)行了約談,要求全面整改;

4月9日,多家應(yīng)用商店下架今日頭條APP,暫停其下載服務(wù)3周,時(shí)間從4月9日15時(shí)起至4月30日15時(shí)止;

4月10日,國(guó)家廣播電視總局責(zé)令今日頭條永久關(guān)停“內(nèi)涵段子”。當(dāng)晚,今日頭條關(guān)!皟(nèi)涵段子”。

近一個(gè)月的時(shí)間,央視及國(guó)家相關(guān)監(jiān)管部門接連不斷的的指責(zé),幾乎在大眾面前將今日頭條批的體無完膚。為此,今日頭條方面承諾,將把4月作為整改月,全面清查產(chǎn)品中存在的問題,并定期向監(jiān)管部門匯報(bào)整改進(jìn)度,向公眾同步整改結(jié)果。

依靠機(jī)器學(xué)習(xí)推薦機(jī)制,今日頭條僅用6年便成為國(guó)內(nèi)最大的智能內(nèi)容平臺(tái)

從2012年發(fā)布第一個(gè)版本至今,今日頭條僅用不到6年的時(shí)間,便發(fā)展成為了國(guó)內(nèi)最大的智能內(nèi)容平臺(tái)。相關(guān)數(shù)據(jù)統(tǒng)計(jì),截至2017年7月31日,今日頭條的日活躍用戶數(shù)已經(jīng)達(dá)到了1.2億,較2016年同期翻了一倍多。

眾所周知,機(jī)器學(xué)習(xí)推薦機(jī)制是今日頭條最大功臣?v觀今日頭條推薦的結(jié)果看,其智能算法大致走了以下幾大流程:

一、數(shù)據(jù)抓取,從用戶在該平臺(tái)的瀏覽動(dòng)態(tài)或其他賬號(hào)日常動(dòng)態(tài)中抓取相關(guān)數(shù)據(jù)。

二、用戶分析,每個(gè)用戶都是一個(gè)數(shù)據(jù)庫(kù),信息瀏覽行為越多,其數(shù)據(jù)庫(kù)中的數(shù)據(jù)也越多。智能算法會(huì)對(duì)這些數(shù)據(jù)進(jìn)行整合與分析,從而提煉出該數(shù)據(jù)庫(kù)的關(guān)鍵詞。

三、內(nèi)容審核,智能算法主要做了兩件事,消重和審核。

消重,就是辨別內(nèi)容相似度,以避免推薦給用戶的內(nèi)容過于重復(fù)。顯然,這一點(diǎn),今日頭條做的并不好,用戶經(jīng)常會(huì)看到相似內(nèi)容,甚至標(biāo)題、圖片等都很相似;

審核方面,這是今日頭條被嚴(yán)厲指責(zé)的關(guān)鍵問題所在。因算法尚未成熟,人工干預(yù)度低,導(dǎo)致很多未經(jīng)人工審核的將色情、低俗、虛假、違法等內(nèi)容通過了審核。

四、新聞推薦,這是與用戶直接關(guān)聯(lián)的一步。從今日頭條的推薦機(jī)制看,內(nèi)容會(huì)被推薦與否,與熱點(diǎn)、點(diǎn)擊量直接掛鉤。這是智能算法對(duì)內(nèi)容受歡迎程度的一次判斷。

但顯然,今日頭條這一內(nèi)容平臺(tái),并沒有很好的做到其所期望的。

雖加大人工審核力度,機(jī)器學(xué)習(xí)推薦內(nèi)容依舊是大勢(shì)所趨

“3月29日央視報(bào)道我們的廣告問題后,我不斷反思自己以前的想法,反思公司現(xiàn)在的做法,開始大力推進(jìn)公司員工提高意識(shí)、改進(jìn)管理、完善流程!边@是張一鳴的反思之一。

而隨后的行動(dòng),就是“強(qiáng)化人工運(yùn)營(yíng)和審核,將現(xiàn)有6000人的運(yùn)營(yíng)審核隊(duì)伍,擴(kuò)大到10000人!

顯然,今日頭條這個(gè)人工智能內(nèi)容平臺(tái),已經(jīng)認(rèn)識(shí)到機(jī)器學(xué)習(xí)的不足,開始更為重視人工了。對(duì)此,有網(wǎng)友提出質(zhì)疑,從人工到人工智能是進(jìn)步,從機(jī)器回到人工,這是歷史和科技的倒退?

去年11月,張一鳴在2017今日頭條創(chuàng)作者大會(huì)上透露,其頭條號(hào)賬號(hào)總數(shù)超120萬,平均每天發(fā)布50萬條內(nèi)容,創(chuàng)造內(nèi)容消費(fèi)達(dá)48億次。

以每個(gè)賬號(hào)每天投稿5條內(nèi)容算,頭條好每天的投稿內(nèi)容達(dá)600萬條。除此之外,今日頭條旗下還有悟空問答、微頭條、西瓜/火山/抖音以及已經(jīng)關(guān)停的內(nèi)涵段子。該平臺(tái)每天的投稿、上傳內(nèi)容超4000萬。

僅靠1萬的人工,顯然是無法完全負(fù)荷審核任務(wù)的。僅從目前來說,今日頭條的審核推薦機(jī)制,依舊以機(jī)器學(xué)習(xí)算法為主導(dǎo),并加以大量人工輔助。

其實(shí),除了今日頭條,新浪微博、微信公眾號(hào)、快手短視頻、界面等平臺(tái)也有相關(guān)的機(jī)器學(xué)習(xí)審核算法的加持。如新浪微博,其會(huì)實(shí)時(shí)更新關(guān)鍵詞,如果用戶發(fā)布的內(nèi)容涉及到相關(guān)關(guān)鍵詞,就會(huì)被屏蔽或刪除。

而微信公眾號(hào)作為現(xiàn)今流量排前的內(nèi)容平臺(tái),其在內(nèi)容審核方面則較為嚴(yán)謹(jǐn)。有過運(yùn)營(yíng)經(jīng)歷的人應(yīng)該經(jīng)常碰到,一旦提交審核的內(nèi)容中提及了一些敏感內(nèi)容或詞匯,其審核時(shí)間就會(huì)非常得長(zhǎng)。

很顯然,在平臺(tái)多元、領(lǐng)域多樣、數(shù)量越來越龐大的情況下,通過機(jī)器學(xué)習(xí)審核推薦內(nèi)容是大勢(shì)所趨。僅靠人工,非得累死。

不過,當(dāng)前的機(jī)器學(xué)習(xí)算法能工作質(zhì)量,還遠(yuǎn)不及人類,否則,今日頭條也就不會(huì)陷入如此窘境了。就像扎克伯格曾經(jīng)說的一樣,F(xiàn)acebook對(duì)人工智能非常依賴,希望能夠通過AI改善審核機(jī)制。但想要完全依靠AI審核內(nèi)容,可能還需要5-10年的時(shí)間。

機(jī)器學(xué)習(xí)算法作為每一次內(nèi)容低劣指控的“背鍋俠”,需要的,可能只是時(shí)間和耐心。在沒有完全成熟之前,可以是主導(dǎo),但絕不可以是唯一。技術(shù)提升加以人工輔助,是對(duì)用戶最大的負(fù)責(zé)。

“我是工程師出身,創(chuàng)業(yè)的初心是希望做一款產(chǎn)品,方便全世界用戶互動(dòng)和交流。因此,在過去幾年間,今日頭條將更多的精力和資源,放在了企業(yè)的增長(zhǎng)上,F(xiàn)在,我們必須重新梳理我們的愿景,保證所‘創(chuàng)作’與‘交流’的內(nèi)容是積極向上的、健康有益的,能夠給時(shí)代、給人民帶來正能量。”張一鳴說的似乎很誠(chéng)懇。

最后

快手的創(chuàng)始人&CEO宿華曾表示,技術(shù)讓每個(gè)人前所未有的得到了表達(dá)自我的機(jī)會(huì),但也帶了新的社會(huì)問題。因?yàn)閹浊陙,人們所適應(yīng)的,是由人呈現(xiàn)出來的世界。我們需要去適應(yīng)新的世界。

當(dāng)然,這里不得不提一句,機(jī)器學(xué)習(xí)算法是在抓取用戶“行為數(shù)據(jù)庫(kù)關(guān)鍵詞”之后才進(jìn)行的推薦。如果,你能抵制住低俗內(nèi)容的誘惑,又怎會(huì)被這些內(nèi)容推薦“干擾”?

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)