訂閱
糾錯(cuò)
加入自媒體

什么是NLP?NLP的兩個(gè)核心任務(wù)是什么?

01

什么是NLP

NLP(自然語(yǔ)言處理-Natural language processing)就是在機(jī)器語(yǔ)言與人類語(yǔ)言之間溝通的橋梁,以實(shí)現(xiàn)人機(jī)交流的目的。

02

NLP的兩個(gè)核心任務(wù)

NLU:自然語(yǔ)言理解。希望機(jī)器像人一樣,具備正常人的語(yǔ)言理解能力。NLG:自然語(yǔ)言生成。為了跨越人類和機(jī)器之間的溝通鴻溝,將非語(yǔ)言格式的數(shù)據(jù)轉(zhuǎn)換成人類可以理解的語(yǔ)言格式,如文章、報(bào)告等。

學(xué)習(xí)鏈接:https://easyai.tech/ai-definition/nlp/

文字也是人類語(yǔ)言之一,文字識(shí)別分為兩個(gè)具體步驟:文字的檢測(cè)和文字的識(shí)別,兩者缺一不可,尤其是文字檢測(cè),是識(shí)別的前提條件,若文字都找不到,那何談文字識(shí)別。

03

自然場(chǎng)景文本檢測(cè)

自然場(chǎng)景下的文本檢測(cè)有如下幾個(gè)難點(diǎn):

文本存在多種分布,文本排布形式多樣;

文本存在多個(gè)方向;

多種語(yǔ)言混合。

1、Faster RCNN

Faster RCNN做文本檢測(cè)感覺問(wèn)題不大,但是從效果來(lái)看,僅套用Faster RCNN來(lái)做文本檢測(cè)效果并不好,原因在于,文本有自己獨(dú)有的特點(diǎn),這種通用的文本檢測(cè)框架并不能很好地解決文本的這些特點(diǎn)。

2、CTPN

CTPN(基于Faster RCNN):目前比較成熟的文本檢測(cè)框架,精確度較好。但是檢測(cè)時(shí)間較長(zhǎng),有很大的優(yōu)化空間。

【文獻(xiàn)】Detecting Text in Natural Image with Connectionist Text Proposal Network

文本行一般以水平長(zhǎng)矩形的形式存在,而且文本行中每個(gè)字都有間隔,所以僅套用Faster RCNN來(lái)做文本檢測(cè)效果并不好。

而CTPN剔除一個(gè)新奇的想法,我們可以把文本檢測(cè)的任務(wù)拆分,第一步我們檢測(cè)文本框中的一部分,判斷它是不是一個(gè)文本的一部分,當(dāng)對(duì)一幅圖里所有小文本框都檢測(cè)之后,我們就將屬于同一個(gè)文本框的小文本框合并,合并之后就可以得到一個(gè)完整的、大的文本框了,也就完成了文本的檢測(cè)任務(wù)。這個(gè)想法有點(diǎn)像“分治法”,先檢測(cè)大物體的一小部分,等所有小部分都檢測(cè)出來(lái),大物體也就可以檢測(cè)出來(lái)了。

1  2  下一頁(yè)>  
聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)