忌憚百度AI技術(shù)?美國(guó)要讓其退市!AI領(lǐng)域,百度科研板凳有厚度!
07詞匯聯(lián)想功能
對(duì)特定詞語(yǔ),進(jìn)行詞語(yǔ)的聯(lián)想。
比如對(duì)于“陰森”,能聯(lián)想到“走廊”,“森林”,“古堡”等名詞。
對(duì)于“太陽(yáng)”,推薦“圓盤(pán),金鑼?zhuān)馉t,火球“等可以用來(lái)比喻的詞匯,用戶(hù)可以借助此功能來(lái)激發(fā)寫(xiě)作靈感,或者據(jù)此寫(xiě)一些比喻句。本功能在寫(xiě)比喻句的時(shí)候尤其有幫助。
技術(shù)實(shí)現(xiàn)上,可以預(yù)先從大規(guī)模數(shù)據(jù)中自動(dòng)挖掘出聯(lián)想詞表,聯(lián)想詞表中記錄詞與聯(lián)想的詞之間的對(duì)應(yīng)關(guān)系,因此,根據(jù)聯(lián)想詞典可以確定出一個(gè)給定詞語(yǔ)對(duì)應(yīng)的聯(lián)想詞匯。
具體挖掘聯(lián)想詞表時(shí),可以根據(jù)預(yù)設(shè)模板(如規(guī)定預(yù)設(shè)句式,如“就像…”)從名家名篇語(yǔ)料庫(kù)中挖掘出形容詞到名詞以及名詞到名詞的聯(lián)想詞表,也可以通過(guò)詞語(yǔ)搭配(可以限定詞性)統(tǒng)計(jì)從大規(guī)模數(shù)據(jù)中自動(dòng)挖掘獲得。
進(jìn)一步的,在抽出聯(lián)想詞表的同時(shí)也可以抽取模板,再通過(guò)新的模板挖掘新的聯(lián)想詞,不斷迭代。
08靈感激發(fā)功能
在用戶(hù)寫(xiě)作原文后,用人工智能相關(guān)技術(shù)在名家名作中精準(zhǔn)地找到可供用戶(hù)參考的句子或段落,從而激發(fā)用戶(hù)靈感,提供修改的參考樣例,同時(shí)讓用戶(hù)通過(guò)學(xué)習(xí)名作來(lái)加強(qiáng)寫(xiě)作水平。
簡(jiǎn)單說(shuō),給寫(xiě)手提供名家名言名句抄襲對(duì)象!
你寫(xiě)的粗俗不堪,上不了臺(tái)面,沒(méi)關(guān)系,給你經(jīng)典造句對(duì)著抄。
技術(shù)實(shí)現(xiàn)上,可以從預(yù)先建立的文章庫(kù)中,選擇與寫(xiě)作原文整體粒度匹配的切分文本單元中,作為候選文本;基于人工智能計(jì)算寫(xiě)作原文與每個(gè)候選文本的相似度,根據(jù)相似度選擇預(yù)設(shè)個(gè)數(shù)的候選文本作為靈感激發(fā)信息。
具體的,首先建立一個(gè)高質(zhì)量的名家名作文章的庫(kù),然后進(jìn)行切分,切分分別按照句子,自然段落和多段落三個(gè)不同粒度進(jìn)行切分,最后形成句子,自然段落,多段落三種切分文本單元。
其次,在用戶(hù)輸入寫(xiě)作原文后,以寫(xiě)作原文整體與文章庫(kù)中的切分文本單元進(jìn)行比較,得到粒度匹配的切分文本單元作為候選文本。粒度匹配是指長(zhǎng)度最相近的切分文本單元。
例如,寫(xiě)作原文是句子時(shí),則將文章庫(kù)中的句子作為候選文本;或者,寫(xiě)作原文是段落時(shí),將文章庫(kù)中的段落作為候選文本;或者,寫(xiě)作原文是多段落時(shí),將文章庫(kù)中的多段落作為候選文本。
再次,計(jì)算寫(xiě)作原文與每個(gè)候選文本的相似度,根據(jù)相似度選擇預(yù)設(shè)個(gè)數(shù)的候選文本作為靈感激發(fā)信息。
計(jì)算寫(xiě)作原本與候選文本的相似度時(shí),可以根據(jù)應(yīng)用效果采用已有或?qū)?lái)出現(xiàn)的計(jì)算相似度的方案中的一種或幾種的融合。
其中一種計(jì)算相似度的方案是:抽取出用戶(hù)輸入的寫(xiě)作原文中的關(guān)鍵實(shí)體詞(實(shí)體詞如命名實(shí)體,具體如地名、人名等)(或關(guān)鍵詞)以及主題詞(抽象出的原文主題,如體育、娛樂(lè)等)。如果用戶(hù)輸入的是長(zhǎng)文本(如字?jǐn)?shù)大于或等于預(yù)設(shè)字?jǐn)?shù)),則使用主題模型和關(guān)鍵實(shí)體詞(或關(guān)鍵詞)兩個(gè)維度來(lái)計(jì)算候選文本與輸入文本的相似度。如果用戶(hù)輸入的是短文本(如字?jǐn)?shù)小于預(yù)設(shè)字?jǐn)?shù)),則可以使用GRNN或者CNN深度學(xué)習(xí)網(wǎng)絡(luò)加上關(guān)鍵實(shí)體詞(或關(guān)鍵詞)兩個(gè)維度來(lái)計(jì)算候選文本與輸入文本的相似度,最后根據(jù)相似度進(jìn)行召回和排序,呈現(xiàn)給用戶(hù)。
09智能素材推薦功能
深度分析和理解用戶(hù)提供的寫(xiě)作原文,為用戶(hù)推薦相關(guān)主題的寫(xiě)作素材(如新聞,歷史故事),用戶(hù)也可以自己選擇想要的素材類(lèi)型,比如新聞,歷史故事等(在圖片中沒(méi)有體現(xiàn))。此功能在議論文寫(xiě)作中非常實(shí)用。
技術(shù)實(shí)現(xiàn)上,基于人工智能抽取寫(xiě)作原文的主題詞,并根據(jù)主題詞從預(yù)先建立的素材庫(kù)中,選擇主題相近的素材作為候選素材;根據(jù)主題模型計(jì)算寫(xiě)作原文與每個(gè)候選素材的相似度,根據(jù)相似度選擇預(yù)設(shè)個(gè)數(shù)的候選素材作為智能推薦信息。
具體的,首先從公開(kāi)的網(wǎng)頁(yè)數(shù)據(jù)中抓取優(yōu)質(zhì)的新聞,人文歷史故事等候選素材,然后用摘要技術(shù)和文檔標(biāo)簽技術(shù)分別對(duì)抓取的語(yǔ)料進(jìn)行處理,生成相應(yīng)摘要和文檔標(biāo)簽。
抽取出用戶(hù)輸入文本中的主題詞,然后與語(yǔ)料的標(biāo)簽進(jìn)行比對(duì),召回一批候選的相近主題的素材,然后再使用主題模型計(jì)算用戶(hù)輸入與摘要的相似度,對(duì)候選的素材進(jìn)行排序,將相似較高的呈現(xiàn)的素材的摘要呈現(xiàn)給用戶(hù),用戶(hù)可以進(jìn)一步通過(guò)點(diǎn)擊來(lái)查看素材原文。
可以通過(guò)搜集用戶(hù)的點(diǎn)擊信息,作為素材質(zhì)量水平的參考,并加入召回和排序的規(guī)則中去,不斷演進(jìn)產(chǎn)品的效果。
10智能基礎(chǔ)改寫(xiě)功能
具體的,在用戶(hù)輸入寫(xiě)作原文后,在保證語(yǔ)義不變的情況下自動(dòng)替換詞語(yǔ),修改句子的樣式,改變語(yǔ)句語(yǔ)序等。如果用戶(hù)在某種情況下希望借鑒某一段文字,但不能原封不動(dòng)地直接使用,就可以通過(guò)本功能進(jìn)行自動(dòng)地改寫(xiě)。
技術(shù)實(shí)現(xiàn)上,可以采用兩種方案,其一是:基于人工智能,對(duì)寫(xiě)作原文執(zhí)行如下項(xiàng)中的至少一項(xiàng),得到寫(xiě)作輔助信息:詞語(yǔ)替換、句子改寫(xiě)、語(yǔ)序調(diào)整。其二是:采用基于人工智能建立的LSTM模型,確定與寫(xiě)作原文對(duì)應(yīng)的智能基礎(chǔ)改寫(xiě)信息。
具體的,本功能可以有兩種方案進(jìn)行實(shí)現(xiàn):第一種是將改寫(xiě)任務(wù)分解成詞語(yǔ)替換,句子改寫(xiě)和語(yǔ)序調(diào)整三個(gè)部分。詞語(yǔ)替換直接使用詞語(yǔ)替換推薦功能的技術(shù)方案(存在多個(gè)推薦詞語(yǔ)時(shí)選擇最優(yōu)的),句子改寫(xiě)和語(yǔ)序調(diào)整可以使用規(guī)則模板,用語(yǔ)言模型進(jìn)行過(guò)濾,去除低概率的改寫(xiě)方案。
另外需要加入一定的隨機(jī)性,讓用戶(hù)每次點(diǎn)擊可以生成不一樣的改寫(xiě)。第二種方案是使用LSTM(Long Short-Term Memory)深度神經(jīng)網(wǎng)絡(luò)通過(guò)學(xué)習(xí)人工標(biāo)注的復(fù)述語(yǔ)料直接對(duì)句子進(jìn)行序列到序列的生成。
11智能潤(rùn)色改寫(xiě)功能
具體的,在原有文章基礎(chǔ)上進(jìn)行修改潤(rùn)色,讓文章更有文采,更具文學(xué)性和可讀性。比如替換一些更“高級(jí)”的詞匯,增加一些形容詞和短句等。
技術(shù)實(shí)現(xiàn)上,基于人工智能對(duì)所述寫(xiě)作原文進(jìn)行詞語(yǔ)替換、句子改寫(xiě)以及增加短語(yǔ)或短句,得到智能潤(rùn)色改寫(xiě)信息。
具體的,本功能主要可以分解為三個(gè)部分:詞語(yǔ)的替換,句子的改寫(xiě),以及增加詞語(yǔ)或短句。詞語(yǔ)的替換沿用詞語(yǔ)替換推薦功能的技術(shù)方案,使用最優(yōu)的替換結(jié)果。句子的改寫(xiě)有兩種方案,方案一是人工配置一些潤(rùn)色的規(guī)則,方案二是人工標(biāo)注一些潤(rùn)色的訓(xùn)練語(yǔ)料,用RNN或者LSTM神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行學(xué)習(xí)。增加詞或短句(比喻,描寫(xiě)等)可以通過(guò)一定的模板挖掘從大數(shù)據(jù)語(yǔ)料中挖掘出實(shí)體或者主題對(duì)應(yīng)的描寫(xiě)詞和描寫(xiě)短句,并同時(shí)記錄下短句周?chē)年P(guān)鍵詞。
每次對(duì)輸入文本的句子作解析,用CRF模型或者句法分析規(guī)則找出句子的核心主體詞,然后根據(jù)周?chē)P(guān)鍵詞的匹配,添加合適的描寫(xiě)詞或描寫(xiě)短句。
本實(shí)施例中,由于加入了人工智能,特別是自然語(yǔ)言理解技術(shù),功能更豐富更強(qiáng)大,更加智能。用戶(hù)可以直接輸入自己的寫(xiě)作原文,利用多項(xiàng)功能對(duì)自己的文章進(jìn)行改進(jìn)。
原文標(biāo)題 : 忌憚百度AI技術(shù)?美國(guó)要讓其退市!AI領(lǐng)域,百度科研板凳有厚度!

發(fā)表評(píng)論
登錄
手機(jī)
驗(yàn)證碼
立即登錄即可訪(fǎng)問(wèn)所有OFweek服務(wù)
還不是會(huì)員?免費(fèi)注冊(cè)
忘記密碼請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車(chē)研發(fā)中心重磅落地,寶馬家門(mén)口“搶人”
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)
-
12月18日立即報(bào)名>> 【線(xiàn)下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
推薦專(zhuān)題
- 1 人形機(jī)器人,正狂奔在批量交付的曠野
- 2 3 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 4 2025年8月人工智能投融資觀(guān)察
- 5 一家被嚴(yán)重低估的國(guó)產(chǎn)AI巨頭
- 6 a16z最新AI百?gòu)?qiáng)榜:硅谷頂級(jí)VC帶你讀懂全球生成式AI賽道最新趨勢(shì)
- 7 Manus跑路,大廠(chǎng)掉線(xiàn),只能靠DeepSeek了
- 8 地平線(xiàn)的野心:1000萬(wàn)套HSD上車(chē)
- 9 一萬(wàn)億美元!馬斯克薪酬細(xì)節(jié)拆解
- 10 蘋(píng)果把身家押在Siri上:一場(chǎng)輸不起的自我革命