组件时间序列分析涵盖各种任务,从汇总和检查时间序列中的季节性到构建 自回归综合移动平均 (ARIMA) 模型 并检查模型残差。这些组件使用 Python 集成,扩展了 KNIME Analytics Platform 的时间序列分析能力 统计模型 Python 中的模块。但是,代码仅在后台执行,您可以像任何其他 KNIME 节点一样定义每个任务的设置:在组件的配置对话框中。
时间序列组件可在 Hub 上使用。将它们 阿尔及利亚电话号码数据 拖放到工作流编辑器中,然后开始构建时间序列分析的工作流!
图 1:访问时间序列组件:将组件拖放到工作流编辑器中
在这篇博文中,我们想花点时间介绍其中的几个新组件,并讨论如何将它们组合到时间序列分析管道中。
假设你有一个传感器连接到某个东西上,比如你家里的电表,你想规划你的预算。你需要预测未来会用掉多少电量。
时间聚合
获取这些传感器数据后,我们可能采取的第一步是将其精简为易于管理的形式。汇总这些数据(可能按小时计算)不仅可以大幅减少数据量,还可以消除一些噪音。
对于此操作,我们需要 聚合粒度 根据每小时数据生成每日总能耗的组件。有多种粒度和聚合方法可供选择,我们还可以根据每日数据生成月平均值等。(图 2):
图 2:使用聚合粒度组件按选定的粒度和聚合方法聚合时间序列。在此示例中,我们计算“cluster_26”列的每日总值。