網(wǎng)站性能檢測(cè)評(píng)分
注:本網(wǎng)站頁(yè)面html檢測(cè)工具掃描網(wǎng)站中存在的基本問(wèn)題,僅供參考。
趨勢(shì)預(yù)測(cè)法
時(shí)間序列預(yù)測(cè)這么操作真的很簡(jiǎn)單 行業(yè)視頻課程
時(shí)間序列預(yù)測(cè)法就是通過(guò)編制和分析時(shí)間序列,根據(jù)時(shí)間序列所反映出來(lái)的發(fā)展過(guò)程、方向和趨勢(shì),進(jìn)行類推或延伸,借以預(yù)測(cè)下一段時(shí)間或以后若干年內(nèi)可能達(dá)到的水平。
本次操作案例的時(shí)間序列預(yù)測(cè)的工作流如下:
1. 商業(yè)目標(biāo)
業(yè)務(wù)理解:該案例所用的數(shù)據(jù)是《銷售數(shù)據(jù).csv》,該數(shù)據(jù)包含銷售日期、銷量和利潤(rùn)(萬(wàn)元)三個(gè)指標(biāo),如下:
業(yè)務(wù)目標(biāo):建立預(yù)測(cè)分析系統(tǒng),分析利潤(rùn)在未來(lái)的預(yù)測(cè)值。
數(shù)據(jù)挖掘目標(biāo):建立時(shí)間序列預(yù)測(cè)模型,該模型以日期為輸入,以利潤(rùn)為目標(biāo),建立預(yù)測(cè)模型。
2.數(shù)據(jù)理解
使用<數(shù)據(jù)審核>節(jié)點(diǎn)計(jì)算字段的特征統(tǒng)計(jì)量,輸出結(jié)果如下:
3.分布趨勢(shì)分析
分析時(shí)間序列趨勢(shì)是時(shí)間序列建模的初步工作。目的是為了分析時(shí)間序列的規(guī)律和序列特征,如序列是否平穩(wěn)?是否有周期性或者趨勢(shì)性?并由此分析哪些分析模型更適合。
操作如下:
第一步,使用類型轉(zhuǎn)換節(jié)點(diǎn)將字符型的日期型轉(zhuǎn)化為日期型。節(jié)點(diǎn)配置如下:
第二步,使用時(shí)間選擇節(jié)點(diǎn)選擇選擇85年 - 95年的數(shù)據(jù)的進(jìn)行分析。數(shù)據(jù)如下:
第三步,設(shè)置時(shí)間區(qū)間,節(jié)點(diǎn)配置如下:
第四步,使用時(shí)序圖節(jié)點(diǎn)分析序列的趨勢(shì),節(jié)點(diǎn)配置如下:
從下圖可以看出,序列整體呈下降趨勢(shì),沒(méi)有明顯的周期性。
4.簡(jiǎn)單序列預(yù)測(cè)
工作流如下:
接下來(lái),我們選擇一個(gè)簡(jiǎn)單的移動(dòng)平均預(yù)測(cè)算法進(jìn)行預(yù)測(cè)。步驟如下:
第一步,使用時(shí)間區(qū)間節(jié)點(diǎn)設(shè)置時(shí)間區(qū)間為“月”, 匯總配置中按照月對(duì)數(shù)據(jù)進(jìn)行匯總,配置如下:
該節(jié)點(diǎn)執(zhí)行前數(shù)據(jù)預(yù)覽如下:
執(zhí)行后數(shù)據(jù)預(yù)覽如下:
第二步,使用移動(dòng)平均節(jié)點(diǎn)進(jìn)行移動(dòng)平均計(jì)算。節(jié)點(diǎn)配置如下:
執(zhí)行后預(yù)覽數(shù)據(jù)如下:
第三步,使用派生字段節(jié)點(diǎn)計(jì)算殘差,節(jié)點(diǎn)配置如下:
第四步,使用時(shí)序圖節(jié)點(diǎn)可視化預(yù)測(cè)結(jié)果。節(jié)點(diǎn)配置如下:
如上圖所示,移動(dòng)平均算法對(duì)該時(shí)間序列的趨勢(shì)有一定預(yù)測(cè)能力,該模型也總結(jié)一些規(guī)律,但是尚有一些規(guī)律并未總結(jié)出。這是一個(gè)趨勢(shì)性非平穩(wěn)序列,您還可以考慮使用指數(shù)平滑模型、ARIMA模型、殘差自回歸模型等重新建模。
5.重新建模
使用<時(shí)間區(qū)間>節(jié)點(diǎn)數(shù)據(jù)直接進(jìn)行重新建模。
第一步:使用類型節(jié)點(diǎn)制定角色。配置如下:
本次建模選用指數(shù)平滑模型,配置如下:
執(zhí)行結(jié)果如下,得到時(shí)間散點(diǎn)圖和預(yù)測(cè)數(shù)據(jù):
小結(jié)
時(shí)間序列分析是數(shù)據(jù)挖掘最難的算法之一。當(dāng)然它也有一個(gè)好處,就是建模之前的數(shù)據(jù)量一般都很小,一般只有幾十條到幾百條記錄(如果您的預(yù)測(cè)粒度是月,那么每年才12條數(shù)據(jù),10年才120條),因此模型計(jì)算很快。
時(shí)間序列預(yù)測(cè)這么操作真的很簡(jiǎn)單 企業(yè)視頻課程
時(shí)間序列預(yù)測(cè)法就是通過(guò)編制和分析時(shí)間序列,根據(jù)時(shí)間序列所反映出來(lái)的發(fā)展過(guò)程、方向和趨勢(shì),進(jìn)行類推或延伸,借以預(yù)測(cè)下一段時(shí)間或以后若干年內(nèi)可能達(dá)到的水平。
本次操作案例的時(shí)間序列預(yù)測(cè)的工作流如下:
1. 商業(yè)目標(biāo)
業(yè)務(wù)理解:該案例所用的數(shù)據(jù)是《銷售數(shù)據(jù).csv》,該數(shù)據(jù)包含銷售日期、銷量和利潤(rùn)(萬(wàn)元)三個(gè)指標(biāo),如下:
業(yè)務(wù)目標(biāo):建立預(yù)測(cè)分析系統(tǒng),分析利潤(rùn)在未來(lái)的預(yù)測(cè)值。
數(shù)據(jù)挖掘目標(biāo):建立時(shí)間序列預(yù)測(cè)模型,該模型以日期為輸入,以利潤(rùn)為目標(biāo),建立預(yù)測(cè)模型。
2.數(shù)據(jù)理解
使用<數(shù)據(jù)審核>節(jié)點(diǎn)計(jì)算字段的特征統(tǒng)計(jì)量,輸出結(jié)果如下:
3.分布趨勢(shì)分析
分析時(shí)間序列趨勢(shì)是時(shí)間序列建模的初步工作。目的是為了分析時(shí)間序列的規(guī)律和序列特征,如序列是否平穩(wěn)?是否有周期性或者趨勢(shì)性?并由此分析哪些分析模型更適合。
操作如下:
第一步,使用類型轉(zhuǎn)換節(jié)點(diǎn)將字符型的日期型轉(zhuǎn)化為日期型。節(jié)點(diǎn)配置如下:
第二步,使用時(shí)間選擇節(jié)點(diǎn)選擇選擇85年 - 95年的數(shù)據(jù)的進(jìn)行分析。數(shù)據(jù)如下:
第三步,設(shè)置時(shí)間區(qū)間,節(jié)點(diǎn)配置如下:
第四步,使用時(shí)序圖節(jié)點(diǎn)分析序列的趨勢(shì),節(jié)點(diǎn)配置如下:
從下圖可以看出,序列整體呈下降趨勢(shì),沒(méi)有明顯的周期性。
4.簡(jiǎn)單序列預(yù)測(cè)
工作流如下:
接下來(lái),我們選擇一個(gè)簡(jiǎn)單的移動(dòng)平均預(yù)測(cè)算法進(jìn)行預(yù)測(cè)。步驟如下:
第一步,使用時(shí)間區(qū)間節(jié)點(diǎn)設(shè)置時(shí)間區(qū)間為“月”, 匯總配置中按照月對(duì)數(shù)據(jù)進(jìn)行匯總,配置如下:
該節(jié)點(diǎn)執(zhí)行前數(shù)據(jù)預(yù)覽如下:
執(zhí)行后數(shù)據(jù)預(yù)覽如下:
第二步,使用移動(dòng)平均節(jié)點(diǎn)進(jìn)行移動(dòng)平均計(jì)算。節(jié)點(diǎn)配置如下:
執(zhí)行后預(yù)覽數(shù)據(jù)如下:
第三步,使用派生字段節(jié)點(diǎn)計(jì)算殘差,節(jié)點(diǎn)配置如下:
第四步,使用時(shí)序圖節(jié)點(diǎn)可視化預(yù)測(cè)結(jié)果。節(jié)點(diǎn)配置如下:
如上圖所示,移動(dòng)平均算法對(duì)該時(shí)間序列的趨勢(shì)有一定預(yù)測(cè)能力,該模型也總結(jié)一些規(guī)律,但是尚有一些規(guī)律并未總結(jié)出。這是一個(gè)趨勢(shì)性非平穩(wěn)序列,您還可以考慮使用指數(shù)平滑模型、ARIMA模型、殘差自回歸模型等重新建模。
5.重新建模
使用<時(shí)間區(qū)間>節(jié)點(diǎn)數(shù)據(jù)直接進(jìn)行重新建模。
第一步:使用類型節(jié)點(diǎn)制定角色。配置如下:
本次建模選用指數(shù)平滑模型,配置如下:
執(zhí)行結(jié)果如下,得到時(shí)間散點(diǎn)圖和預(yù)測(cè)數(shù)據(jù):
小結(jié)
時(shí)間序列分析是數(shù)據(jù)挖掘最難的算法之一。當(dāng)然它也有一個(gè)好處,就是建模之前的數(shù)據(jù)量一般都很小,一般只有幾十條到幾百條記錄(如果您的預(yù)測(cè)粒度是月,那么每年才12條數(shù)據(jù),10年才120條),因此模型計(jì)算很快。