不可不知的七大統(tǒng)計模型
一、多元回歸
1、概述:
在研究變量之間的相互影響關系模型時候,用到這類方法,具體地說:其可以定量地描述某一現象和某些因素之間的函數關系,將各變量的已知值帶入回歸方程可以求出因變量的估計值,從而可以進行預測等相關研究。
2、分類
分為兩類:多元線性回歸和非線性線性回歸;
其中非線性回歸可以通過一定的變化轉化為線性回歸,比如:y=lnx 可以轉化為y=u u=lnx來解決;
3、 注意事項
在做回歸的時候,一定要注意兩件事:
(1) 回歸方程的顯著性檢驗
(2) 回歸系數的顯著性檢驗
檢驗是很多學生在建模中不注意的地方,好的檢驗結果可以體現出你模型的優(yōu)劣,這點一定要注意。
二、聚類分析
1、概述:
聚類分析指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程。
2、分類
聚類主要有三種:
(1) K均值聚類
(2) 系統(tǒng)聚類
(3)二階聚類
類的距離計算方法:
(1) 最短距離法
(2) 最長距離法
(3) 中間距離法
(4) 重心法
(5) 類平均法
(6) 可變類平均法
(7) 可變法
(8) 利差平均和法
3、注意事項
在樣本量比較大時,要得到聚類結果就顯得不是很容易,這時需要根據背景知識和相關的其他方法輔助處理。
還需要注意的是:如果總體樣本的顯著性差異不是特別大的時候,使用的時候也要注意!
三、分類
1、概述
分類是一種典型的有監(jiān)督的機器學習方法,其目的是從一組已知類別的數據中發(fā)現分類模型,以預測新數據的未知類別。
這里需要說明的是:預測和分類是有區(qū)別的,預測是對數據的預測,而分類是類別的預測。
2、常用分類模型:
(1)神經網絡
(2)決策樹
3、注意事項
A. 神經網絡適用于下列情況的分類:
(1) 數據量比較小,缺少足夠的樣本建立數學模型
(2) 數據的結構難以用傳統(tǒng)的統(tǒng)計方法來描述
(3) 分類模型難以表示為傳統(tǒng)的統(tǒng)計模型
B. 神經網絡的優(yōu)點:
分類準確度高,并行分布處理能力強, 對噪聲數據有較強的魯棒性和容錯能力,能夠充分逼近復雜的非線性關系,具備聯想記憶的功能等。
C. 神經網絡缺點:
需要大量的參數,不能觀察中間學習過程,輸出結果較難解釋,會影響到結果的可信度,需要較長的學習時間,當數據量較大的時候,學習速度會制約其應用。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?