訂閱
糾錯
加入自媒體

低學(xué)歷的印度數(shù)據(jù)標(biāo)簽工,正成為全球AI功臣

印度人工智能后臺

亞馬遜的MTurk在開始限制非美國員工之前,曾是印度人尋找數(shù)據(jù)標(biāo)簽和注釋工作的熱門平臺。盡管后來取消了限制,但隨著企業(yè)客戶開始更加重視數(shù)據(jù)安全,MTurk在數(shù)據(jù)標(biāo)簽商中的受歡迎程度有所下降。此外,包括Spare5、Cloudfactory和Figure Eight在內(nèi)的新眾包平臺也已經(jīng)進(jìn)入市場,它們則更加關(guān)注注釋和標(biāo)簽市場。

Kolasseri說:“在創(chuàng)辦公司之前,我曾于2015年至2016年期間在MTurk平臺上工作過,如今,仍然不斷有新的平臺出現(xiàn)。但是,由于企業(yè)客戶非常關(guān)注數(shù)據(jù)安全,尤其是考慮到許多數(shù)據(jù)集都是專有的,因此信任這些平臺上的工作人員成為他們面臨的更大挑戰(zhàn)!

由前Flipkart員工Mall、Ajinkya Malasane和Akshay Kumar Lal所創(chuàng)立的Playment,則以一種略有不同的方式對待注釋和標(biāo)簽行業(yè)。

該公司為各種用例開發(fā)了一系列注釋工具,并開發(fā)了一個由受過這些工具培訓(xùn)的標(biāo)簽工和注釋工組成的眾包平臺。該公司直接與客戶或相關(guān)的信息技術(shù)服務(wù)公司進(jìn)行合作。

“要將原始數(shù)據(jù)轉(zhuǎn)換為帶注釋的結(jié)構(gòu)化數(shù)據(jù),你需要前端注釋工具、熟練且經(jīng)濟(jì)高效的人力資源。此外,由于處理數(shù)據(jù)的規(guī);,你還需要有合適的中間件來支持不同的工作流并管理遠(yuǎn)程人力資源,”Mall說。

Playment的眾包平臺擁有30多萬標(biāo)簽工和注釋工。其中,該公司認(rèn)為約有2.5萬人是“高技能頂級玩家”。據(jù)Mall稱,這些人幾乎整天都在平臺上,平均月收入為2萬至3萬盧比。

Playment的大部分工作也來自國際客戶,其中包括三星、滴滴出行、阿里巴巴、Drive.a(chǎn)i和Continental AG,其中大部分都屬于自動駕駛車輛領(lǐng)域。

iMerit的戰(zhàn)略則以員工為中心。其2000多名勞動力中,約80%來自月收入低于100美元的家庭;其中大約一半是女性!拔覀兊纳鐣姑窃谪毨鐓^(qū)和公司或工業(yè)較少的地區(qū)創(chuàng)造技術(shù)就業(yè)機(jī)會。我們在科技產(chǎn)業(yè)稍低、科技就業(yè)機(jī)會較少的城市開展業(yè)務(wù),” Natarajan說道。

所謂的利他主義也有很好的商業(yè)意義。Natarajan表示:“我們的合作伙伴和辦公地點(diǎn),允許我們以非常經(jīng)濟(jì)高效的方式擴(kuò)大數(shù)據(jù)注釋和標(biāo)簽團(tuán)隊(duì),并為客戶提供高質(zhì)量的工作!

盡管iMerit的大部分業(yè)務(wù)都來自美國——客戶包括微軟、易趣和Tripadvisor——但其90%的數(shù)據(jù)注釋和標(biāo)簽工作是在印度完成的。

注釋自動化

雖然各大公司正在開發(fā)用于注釋的自動化工具,但由于許多工作需要更為細(xì)致的定制注釋或標(biāo)簽工作,要想讓自動化工具達(dá)到高精度還需要一段時間。

Natarajan說,與五年前人工智能還在區(qū)分貓和狗的不同相比,現(xiàn)在的人工智能需要處理更高級的工作!皺C(jī)器學(xué)習(xí)已經(jīng)向前發(fā)展,所以不再有人要求我們?yōu)楣泛拓堖M(jìn)行標(biāo)記。如今,每家公司都有定制的需求和非常細(xì)微的需求,所以不可能自動實(shí)現(xiàn)這一點(diǎn),也不可能自動給出數(shù)據(jù)并由一群匿名人士貼上標(biāo)簽!

他說,基于人工智能的自動化注釋工具是不可避免會出現(xiàn)的,但它并不是一個威脅。“自動化注釋工具本身就是經(jīng)過良好注釋訓(xùn)練出來的結(jié)果。當(dāng)你試圖解決一個問題時,這些工具只能把你帶到一定的水平,但是要超越這個水平,你還需要自定義注釋,”Natarajan說。

當(dāng)然,加以一段時間,自動化工具會變的足夠有效,從而能夠創(chuàng)建更好地?cái)?shù)據(jù)集!皬母L遠(yuǎn)的角度來看,我們確實(shí)認(rèn)識到這個行業(yè)并不能永久存在。當(dāng)客戶成功時,我們的任務(wù)就結(jié)束了,”Natarajan說!暗覀円舶l(fā)現(xiàn),這也并不是一個100%肯定的事情,因?yàn)樗偸且粋持續(xù)不斷的學(xué)習(xí)和改進(jìn)的過程。此外,當(dāng)客戶轉(zhuǎn)向下一個問題時,一切又都從零開始了!

換句話說,印度的數(shù)據(jù)標(biāo)簽和注釋公司尚未見頂,這一行業(yè)可能需要很長時間才會走上業(yè)務(wù)流程外包的老路。

<上一頁  1  2  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號