分層聚類算法,為何如此關(guān)鍵?
分層聚類法就是對(duì)給定數(shù)據(jù)對(duì)象的集合進(jìn)行層次分解,根據(jù)分層分解采用的分解策略,分層聚類法又可以分為凝聚的(agglomerative)和分裂的(divisive)分層聚類。
凝聚的分層聚類
它采用自底向上的策略,首先將每一個(gè)對(duì)象作為一個(gè)類,然后根據(jù)某種度量(如2個(gè)當(dāng)前類中心點(diǎn)的距離)將這些類合并為較大的類,直到所有的對(duì)象都在一個(gè)類中,或者是滿足某個(gè)終止條件時(shí)為止,絕大多數(shù)分層聚類算法屬于這一類,它們只是在類間相似度的定義上有所不同。
分裂的分層聚類
它采用與凝聚的分層聚類相反的策略——自頂向下,它首先將所有的對(duì)象置于一個(gè)類中,然后根據(jù)某種度量逐漸細(xì)分為較小的類,直到每一個(gè)對(duì)象自成一個(gè)類,或者達(dá)到某個(gè)終止條件(如達(dá)到希望的類個(gè)數(shù),或者2個(gè)最近的類之間的距離超過(guò)了某個(gè)閾值)。
分層聚類雖然比較簡(jiǎn)單,但經(jīng)常會(huì)遇到選擇合并點(diǎn)或者分裂點(diǎn)的問(wèn)題。這種選擇非常關(guān)鍵,因?yàn)橐坏┮唤M對(duì)象被合并或者分裂,下一步的工作就是在新形成的類上進(jìn)行,已做的處理不能撤銷,類之間也不能交換對(duì)象。如果合并或者分裂的決定不合適,就可能得出低質(zhì)量的聚類結(jié)果。而且,分層聚類算法沒(méi)有很好的可伸縮性,在決定合并或者分裂之前需要檢查和估算大量的對(duì)象和類。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?