訂閱
糾錯(cuò)
加入自媒體

Prophet:Facebook 簡單高效的時(shí)間序列模型

導(dǎo)讀:

時(shí)序預(yù)測是一個(gè)很常見的數(shù)據(jù)科學(xué)任務(wù),可以幫助組織或個(gè)人進(jìn)行目標(biāo)規(guī)劃或者異常檢測等。

本文介紹的是 Facebook 2017 年的工作——Prophet,這是一個(gè)適用于大規(guī)模的時(shí)序預(yù)測模型。它不僅解決了時(shí)序預(yù)測的建模問題,還解決了模型的可解釋性問題。

此外,F(xiàn)acebook 提供了 Prophet 的開源代碼,并且將模型封裝的非常簡單且友好,極大地降低了分析人員的入門門檻,同時(shí)也提供了各種接口以便分析人員靈活地調(diào)整模型。

1 為什么有 Prophet

構(gòu)建一個(gè)高質(zhì)量的預(yù)測不是一件容易事,而在商業(yè)預(yù)測的實(shí)踐過程中通常會(huì)出現(xiàn)兩個(gè)問題:

完全自動(dòng)的預(yù)測技術(shù)不夠靈活,過于死板;分析師通常有較高的專業(yè)知識(shí),但是在時(shí)序模型預(yù)測方面一無所知;

預(yù)測是一個(gè)需要大量專業(yè)經(jīng)驗(yàn)的任務(wù),因此,如何能夠提供一個(gè)高質(zhì)量且簡單易用的預(yù)測模型成了一個(gè)亟需解決的問題。

為此,F(xiàn)acebook 的研究員進(jìn)行了大量的研究,并提出了 Prophet 模型,該模型非常簡單靈活,適用于沒有進(jìn)行過時(shí)序預(yù)測的人員,同時(shí)也提供了非常人性化的配置。

下圖展示了大規(guī)模商業(yè)分析中的循環(huán)方法,其由自動(dòng)化建模和人工干預(yù)兩部分組成:

Modeling:首先分析師會(huì)使用制定的參數(shù)對(duì)時(shí)間序列進(jìn)行建模;Foreca and Evaluation:然后由模型產(chǎn)生預(yù)測并對(duì)其進(jìn)行評(píng)估;Surface Problems:當(dāng)性能不佳時(shí)可以進(jìn)行人工干預(yù),并將問題標(biāo)記給分析師;Visually Inspect Forecasts:分析師進(jìn)行檢查并根據(jù)反饋調(diào)整模型。

2 Prophet 預(yù)測模型

在介紹模型之前,我們先看一張圖:

這是 Facebook 的真實(shí)數(shù)據(jù)集,每一天都有一個(gè)點(diǎn),點(diǎn)的顏色按照星期進(jìn)行編碼,以展示一個(gè)星期的周期性。

從這張圖中我們可以看到:這個(gè)時(shí)間序列具有周期性 (weekly、yearly)、趨勢變化性 (Trend)、異常點(diǎn) (outliers) 和節(jié)假日效應(yīng) (holiday)。

我們可以使用時(shí)間序列分解將其分解為趨勢、季節(jié)性、節(jié)假日:

其中,g(t)建模時(shí)間序列值非周期變化的趨勢函數(shù);s(t)建模周期性變換,包括 weekly、yearly;h(t)建模不規(guī)律的假期影響;誤差項(xiàng) 表示模型不適應(yīng)的任何特殊變化;后面我們會(huì)假設(shè)這個(gè)參數(shù)服從正態(tài)分布。

這類規(guī)范類似于廣義可加模型 (Generalized additive model,GAM),這是一種非線性的回歸模型。這里 Prophet 只使用時(shí)間作為回歸因子,并用幾個(gè)線性和非線性的時(shí)間函數(shù)作為分量。

GAM 不具備 ARIMA 重要的推論優(yōu)勢,但其也具備其他方面的優(yōu)勢:

靈活性強(qiáng),易于分解,且在必要時(shí)也可以容納新的成分;擬合速度快,允許用戶進(jìn)行交互式探索;測量值不需要有規(guī)則的間隔,也不需要對(duì)缺失值進(jìn)行處理;參數(shù)的可解釋性強(qiáng),方便用戶更改。

接下來我們關(guān)注模型分解后的不同模塊。

1  2  3  4  下一頁>  
聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)