訂閱
糾錯
加入自媒體

曠視科技CTO唐文斌:我們是一家人工智能產(chǎn)品公司

日前,曠視科技Face++創(chuàng)始人兼CTO唐文斌接受了新智元專訪,談了曠視科技Face++的商業(yè)模式、公司定位以及人才和發(fā)展觀。

曠視科技CTO唐文斌:我們是一家人工智能產(chǎn)品公司

唐文斌在曠視科技Face++北京辦公室

“沒有什么技術(shù)是不能被取代的!碧莆谋笳f:“算法也好,技術(shù)也好,都是手段,最后能夠提供出去的是產(chǎn)品價值。”這位三十剛出頭的曠視科技Face++聯(lián)合創(chuàng)始人,對這家中國人臉識別獨(dú)角獸有著很清晰的定位:“曠視不是一家技術(shù)公司,曠視是一家產(chǎn)品公司,是一家以人工智能技術(shù)為核心的產(chǎn)品公司!彼J(rèn)為客戶最終一定是為產(chǎn)品價值買單。曠視的團(tuán)隊人數(shù)從去年到現(xiàn)在翻了一番,增長到600多人,其中擴(kuò)張速度最快、人數(shù)也最多的就是產(chǎn)品部門。

相比曠視更常出現(xiàn)在人們視野中的另一位聯(lián)合創(chuàng)始人印奇,唐文斌說他們的搭配是“印奇仰望星空,我腳踏實(shí)地”,更加側(cè)重工程的他關(guān)注如何選擇場景結(jié)合技術(shù),給用戶帶來最大增值,“不是nice  to have,而是must  have”。他認(rèn)為曠視工程團(tuán)隊要做的事情是把算法邊界內(nèi)能夠自動化的任務(wù)全部交給機(jī)器去完成。他在尋找的也是復(fù)合型AI產(chǎn)品經(jīng)理,以及能夠隨時轉(zhuǎn)變?yōu)閞esearcher,時刻想著如何把research沒有價值的工作砍掉的懂算法、懂編程、更懂體系結(jié)構(gòu)的全棧AI工程師。

曠視不是技術(shù)公司,是產(chǎn)品公司

新智元:目前在人工智能領(lǐng)域尤其是深度學(xué)習(xí)技術(shù)落地,你認(rèn)為真正的壁壘在哪里?

唐文斌:我認(rèn)為深度學(xué)習(xí)技術(shù)的落地,核心的一個關(guān)鍵詞是“結(jié)合”。我們有一些很好的算法,比以前的性能提高了很多,但一定要找到合適的場景,把算法用進(jìn)去解決問題,給用戶帶來明確的價值,這些價值不是“nice to have”,而是“must have”。

我們內(nèi)部有個說法,叫“用戶價值增量”——當(dāng)你把技術(shù)用在場景中后,給用戶帶來的價值和用他原來的方式相比增量有多大,如果很大,那么這就是一個非常好的場景,如果增量只有一點(diǎn),說明這要么不重要,要么你沒有看清本質(zhì)。以人臉識別為例,就是要不斷去思考,人臉識別到底是在哪些場景下,給誰、通過什么樣的方式,帶來了多大的價值。

賣技術(shù)的話,今天你能賣,明天他也能賣,所以一定要做深,深入行業(yè),把產(chǎn)品做好,形成完整的一套業(yè)務(wù)服務(wù),這并不是從用戶價值的角度去思考,而是公司生存的角度。極端一點(diǎn)說,我認(rèn)為沒有哪家公司是無法取代的,客戶為什么選擇你而是不選擇另一家,一定因為你給他帶來的價值更大,他買單的是你產(chǎn)品的價值。

新智元:曠視如何找到這種技術(shù)跟場景價值增量高的結(jié)合點(diǎn)?

唐文斌:我們經(jīng)歷了好幾個階段。最早的時候,作為一家純技術(shù)公司,我們做了一個面向開發(fā)者的開放平臺,叫Face++,通過API的方式提供互聯(lián)網(wǎng)服務(wù),美圖秀秀、快手等APP都用了我們的技術(shù)。第二個階段,我們開始關(guān)注技術(shù)到底在哪些場景下能給客戶帶來重要的價值——去尋找那些用戶需求感知非常強(qiáng)烈的場景。我們找了很多,最終決定在兩個場景進(jìn)行業(yè)務(wù)的深入。

第一個是互聯(lián)網(wǎng)金融,通過人臉識別進(jìn)行遠(yuǎn)程身份認(rèn)證,把線下業(yè)務(wù)線上轉(zhuǎn)化,讓用戶有更便捷的體驗,銀行這邊也實(shí)現(xiàn)了安全,這個增量是非常大的。第二個場景是安防,現(xiàn)在有大量的安防數(shù)據(jù),人根本看不過來,而用機(jī)器去看,可以識別里面每一個人是誰,還可以識別逃犯,根據(jù)觀察到的人物行為模式進(jìn)行預(yù)警,這是原本做不到的事情,這個業(yè)務(wù)價值增量也是巨大的。

同樣一個技術(shù),比如人臉?biāo)阉鳎ɑ蛘呓袌D像搜索),你既可以用在搜索視頻看哪個影星出現(xiàn)在哪些電影片段中,也可以檢索監(jiān)控攝像頭視頻,在后面一個場景你可以解決老人、小孩走失的問題。所以,我們在這兩種場景下,一定選擇后者,因為后者價值更大。

曠視科技Face++的人臉識別做到什么程度了?

新智元:曠視現(xiàn)在的人臉識別做到什么程度了?

唐文斌:這個要取決于具體的場景和數(shù)據(jù)庫。在不同的場景下需求是不一樣的,比如說用人臉識別來做開門,員工走過來門就開了,這種個場景下要求召回率非常高,每個人都得識別出來,并且速度要非?。我們給阿里集團(tuán)做刷臉門禁,阿里現(xiàn)在幾萬人,基本上一天可以識別幾十萬次,大概誤報1~2次。

在安防場景下,數(shù)據(jù)庫會大很多,公安識別嫌疑人的訴求,最重要的一點(diǎn)就是不能老喊“狼來了”,這就要求識別出的盡量都是對的,我們一般會控制一個誤報率。現(xiàn)在我們在安防場景下識別嫌疑人,基本上路過的嫌疑人都能夠識別出來,并且誤報不會超過30%。目前業(yè)界還沒有一個基準(zhǔn),但我們參加了很多樓宇、安防競賽,都是業(yè)界的最高水平。

現(xiàn)在經(jīng)常聽到99.9%,這只是在某個數(shù)據(jù)集上的表現(xiàn),真正現(xiàn)實(shí)的問題和場景要比測試數(shù)據(jù)集難太多太多。其實(shí)最早是我們引領(lǐng)了刷benchmark這個風(fēng)潮,后來我們又不怎么刷了。我們最早刷LFW,已經(jīng)基本刷到頂了,最后即使出錯,感覺好像也不是本質(zhì)問題,所以我們就沒有去管這個事情了。但現(xiàn)在大家還很瘋狂地在刷99.9%后面的位數(shù),這沒有任何意義,LFW只有6000對數(shù)據(jù),那個數(shù)據(jù)集早就已經(jīng)過擬合了。我認(rèn)為大家要更關(guān)注的點(diǎn),應(yīng)該是更結(jié)合實(shí)際場景去解決問題。

新智元:曠視現(xiàn)在很多行業(yè)落地都跟政府有著很強(qiáng)的相關(guān)性,ToG是否是人工智能發(fā)展的一個重要方向?這是否是曠視發(fā)展的一個重要方向?

唐文斌:面向政府絕對會是人工智能發(fā)展落地的一個新方向。就像我剛才說的,我們要做什么,不做什么,選擇的邏輯是用戶價值,圖像識別或者人臉識別對于城市治理和公共安全能夠帶來非常大的價值增量,我們是非常愿意去做的。政府現(xiàn)在是我們最大客戶之一。當(dāng)然,政府也非常支持現(xiàn)在的人工智能產(chǎn)業(yè)發(fā)展,在這種需求里面也給我們提供了很多的機(jī)會。

Research負(fù)責(zé)尋找算法之外的東西

邊界里面的全部通過工程實(shí)現(xiàn)自動化

新智元:曠視的核心優(yōu)勢是什么?

唐文斌:深度學(xué)習(xí)有三個核心要素,算法、數(shù)據(jù)和系統(tǒng),這三者是相乘關(guān)系——你有一個好的算法,用有很多數(shù)據(jù)去催它,當(dāng)數(shù)據(jù)變多、算法變復(fù)雜后,還需要有一套很好的底層架構(gòu)和引擎來支撐。

從算法的角度講,我們請來了孫劍老師,希望孫劍老師帶著同學(xué)們在現(xiàn)有算法基礎(chǔ)上找到新的東西。算法就像人的智商,數(shù)據(jù)就像人的見識,見識決定了你能走到多高,而智商決定了你能走多遠(yuǎn),兩件事情都非常重要。我們的研究團(tuán)隊其實(shí)就在智商這個方向上探索。而數(shù)據(jù)是一個更產(chǎn)品或者更工程的事情,我們需要在產(chǎn)品中設(shè)計一個好的方式,形成數(shù)據(jù)的循環(huán),讓產(chǎn)品中的數(shù)據(jù)回來,不斷加深算法的訓(xùn)練,讓它變成更強(qiáng)的算法。

1  2  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號