Skip to main content
 Web开发网 » 编程语言 » Python语言

如何用Python做舆情时间序列可视化?

2021年11月27日4380百度已收录

如何用Python做舆情时间序列可视化?  Python数据可视化 第1张

  尽管我们针对时间序列模型专门撰写了一系列大数据分析培训课程python时间序列预测SARIMAX模型教程文章,但我们尚未讨论一个非常重要的主题-季节性。

  到目前为止,我们检查的每个模型-AR,MA,ARMA,ARIMA或ARIMAX都有季节性等效项。

  您可能会猜到,这些对应项的名称分别是SARMA,SARIMA和SARIMAX,其中“ S”代表季节性。

  因此,模型的全名将是季节性自回归综合移动平均外生模型。

  我们都可以同意这是一个嘴,所以我们会坚持使用缩写。

  此外,SARMA和SARIMA可以看作是SARIMAX的简单案例,在这里我们不使用积分或外生变量,因此在大数据分析培训课程python时间序列预测SARIMAX模型教程中,我们将主要关注SARIMAX。

  什么是季节性?

  如果需要提示,当某些模式不一致时会发生季节性变化,但会周期性出现。例如,每周查看YouTube搜索的圣诞节歌曲,例如“ Jingle Bells ”。

如何用Python做舆情时间序列可视化?  Python数据可视化 第2张

  在每年的12月的节日期间,这种情况的发生频率更高。但是,这些歌曲的播放次数通常在6月或7月要低得多。

  因此,简单的自回归组件不能很好地描述数据。

  详细地说,一个简单的AR组件会严重地低估基于11月(滞后1年)的统计数据,圣诞节歌曲在12月播放的次数。同时,它也将大大夸大1月份的数字,以12月份记录的数值为基础,因为这种类型通常在圣诞节后有所下降。

  我们如何处理季节性问题?

  为了说明这种模式,我们需要将上一个节日期间记录的值包括到模型中。在此特定示例中,这意味着要依赖于去年12月播放歌曲的次数。当然,我们还可以包含两个12月甚至更晚的数据。

如何用Python做舆情时间序列可视化?  Python数据可视化 第3张

  有点像有另一个系列比我们最初的系列在时间上进一步扩展。回到音乐示例,原始时间序列包含相隔一个月的值,而季节性序列包含相隔12个月的值。

如何用Python做舆情时间序列可视化?  Python数据可视化 第4张

  SARIMAX模型定义

  现在我们已经熟悉了季节性模型的一般概念,接下来让我们看看我们使用的符号以及每个值的含义。与ARIMAX相比,SARIMAX需要另外4个订单。

如何用Python做舆情时间序列可视化?  Python数据可视化 第5张

  这听起来可能很多,但无需担心!

  这4个订单中的前3个只是ARIMA订单的季节性版本。

如何用Python做舆情时间序列可视化?  Python数据可视化 第6张

  换句话说,我们有一个以大写字母P表示的季节性自回归阶,以大写字母D表示的季节性积分阶和以大写Q表示的季节性移动平均阶。为便于区分,计量经济学家同意使用小写字母表示非季节性的字母。

如何用Python做舆情时间序列可视化?  Python数据可视化 第7张

  第四个也是最后一个顺序是循环的长度。例如,如果我们有每小时的数据,并且周期长度为24,则季节性模式每24小时出现一次。

  季节性模型的周期长度是多少?

  另一种思考的方式是“趋势重新出现之前必须经过的时间段数”。如果要检查季节性趋势,则需要确保设置适当的周期长度。我们用小写的“ s”表示最后一个订单,因为它设置了每个季节的时长。

  我们如何解释季节性订单?

  让我们快速解释这四个新订单如何协同工作。

  本质上,长度“ s”表示季节要素与当前期间的距离。因此,如果我们有一个季节顺序为(2,0,1和5)的模型,那么我们将包括5、10个周期之前的滞后值以及5个周期之前的误差项。大数据分析培训课程python时间序列预测SARIMAX模型教程个周期前的误差项。

如何用Python做舆情时间序列可视化?  Python数据可视化 第8张

  概括地说,我们对每个“ s”值都感兴趣。我们从第“ s”个开始,一直到“ s,乘以p”。季节性积分值和季节性误差也是如此。

如何用Python做舆情时间序列可视化?  Python数据可视化 第9张

  SARIMAX模型的方程是什么?

  让我们看看阶(1,0,1)和季节性阶(2,0,1,5)的SARIMAX模型的方程是什么样的。

如何用Python做舆情时间序列可视化?  Python数据可视化 第10张

  有趣的是,每个季节性要素还包含其他滞后值。如果要了解原因,可在此处找到SARIMAX模型背后数学的详细说明。

  那么,从方程式中我们可以看到什么呢?我们估计的系数总数等于季节性和非季节性AR和MA订单的总和。换句话说,我们正在查看“ P加Q,加p加q”的总数–许多系数。

如何用Python做舆情时间序列可视化?  Python数据可视化 第11张

  非季节性的用小写的ϕ和θ表示; 而其季节性对应物分别用大写Φ和Θ表示。就像订单一样,大写字母表示季节性成分,小写字母表示非季节性成分。

  因此,这是您需要的季节性模型的基本知识。但是,如果您想了解有关时间序列和时间序列数据的更多信息,请务必查看有关该主题的文章。

  如果您不熟悉 Python,并且热衷于了解更多信息,那么这篇有关学习Python编程的综合文章将指导您从安装到Python IDE,库和框架,再到最佳Python职业发展道路,以及工作前景。

/

评论列表暂无评论
发表评论
微信