詞云是什么?如何使用Python創(chuàng)建詞云?
停用詞是沒有任何含義的單詞,例如‘is’, ‘a(chǎn)re’, ‘a(chǎn)n’, ‘I’ 等。Wordcloud帶有內(nèi)置停用詞庫,該庫將自動(dòng)從文本中刪除停用詞。同時(shí)我們也可以通過stopwords.a(chǎn)dd()函數(shù)在python中添加停用詞的選擇。Wordcloud方法可以設(shè)置詞云的寬度和高度,我將它們都設(shè)置為500,背景色設(shè)置為粉紅色。如果不添加隨機(jī)狀態(tài),則每次運(yùn)行代碼時(shí),詞云都會(huì)看起來不同,我們可以將其設(shè)置為任何int值。從上面的代碼中,我們將獲得這樣的詞云:
通過查看上圖,我們可以看到機(jī)器學(xué)習(xí)是最常用的詞,還有一些其他經(jīng)常使用的詞是模型,任務(wù),訓(xùn)練和數(shù)據(jù),因此,我們可以得出結(jié)論,機(jī)器學(xué)習(xí)是訓(xùn)練數(shù)據(jù)模型的任務(wù)。我們還可以在這里通過背景顏色方法更改背景顏色,并通過colormap方法更改字體顏色,還可以在背景顏色中添加顏色的哈希碼,但是mapcolor帶有內(nèi)置的特定顏色。讓我們通過使用哈希碼將背景色更改為藍(lán)綠色,將字體顏色更改為藍(lán)色:from wordcloud import WordCloud, StopWords
import matplotlib.pyplot as plt
def plot_cloud(wordcloud):
plt.figure(figsize=(10, 10))
plt.imshow(wordcloud)
plt.a(chǎn)xis("off");
wordcloud = WordCloud(width = 500, height = 500, background_color='#40E0D0', colormap="ocean", random_state=10).generate(final_result)
plot_cloud(wordcloud)
在這里,我指定了ocean,如果我添加了一些錯(cuò)誤的顏色圖,jupyter將拋出一個(gè)值錯(cuò)誤,并向我顯示顏色圖的可用選項(xiàng),如下所示:
我們還可以使用PIL庫在任何圖像中實(shí)現(xiàn)詞云。尾注在本文中,我們討論了詞云,詞云的定義,應(yīng)用領(lǐng)域以及使用python實(shí)現(xiàn)詞云。參考鏈接:https://www.a(chǎn)nalyticsvidhya.com/blog/2020/10/word-cloud-or-tag-cloud-in-python/
☆ END ☆

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評 >> 【評選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?