在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
通过对用电负荷用r软件进行聚类,我们可以提取典型负荷曲线,提高随后的用电量预测的准确性。 我将向您展示第一个用例,即通过K-medoids聚类方法提取典型的电力负载曲线。 我们必须以某种方式降低维度。最好的方法之一是使用时间序列表示来降低维度,减少噪音并强调时间序列的主要特征。 我们使用一种基本的基于模型的表示方法 - 平均季节性轮廓。另一个非常重要的通知是,时间序列的归一化是时间序列的每个聚类或分类之前的必要过程。 使用K-medoids(pam函数从cluster包)聚类方法 。 “最佳”数量的簇是7 。 我们用7个聚类数绘制聚类结果。 现在,让我们尝试一些更复杂的方法来提取季节性分布 - GAM回归系数。 可视化结果: 再次聚类的最佳数量是7.让我们绘制结果。 提取的消费情况比平均季节性情况更平滑。蓝色虚线与每日和每周季节性系数相接。 我将向您展示一些非数据自适应表示的聚类结果,让我们选择例如DFT(离散傅立叶变换)方法并提取前48个DFT系数。 因此,基于模型的时间序列表示在这种用例中非常有效(因此典型的剖面提取)。 FeaClip是从限幅表示特征提取方法。建议将FeaClip旁边的开窗方法用于时间序列的每一天。 我们绘制结果 我们可以看到,现在出现了2个“肘部”。最大的变化是在2到3个簇之间,所以我会选择3号。 结论 在本教程中,我向您展示了使用时间序列表示方法来创建更多消费者的特征。
【服务场景】 科研项目; 公司项目外包 ;线上线下一对一培训 ;学术研究。
【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询服务
分享最新的大数据资讯,每天学习一点数据分析,让我们一起做有态度的数据人
微信客服号:lico_9e
QQ交流群:186388004
欢迎关注微信公众号,了解更多数据干货资讯!
通过对用电负荷用r软件进行聚类,我们可以提取典型负荷曲线,提高随后的用电量预测的准确性。 我将向您展示第一个用例,即通过K-medoids聚类方法提取典型的电力负载曲线。 我们必须以某种方式降低维度。最好的方法之一是使用时间序列表示来降低维度,减少噪音并强调时间序列的主要特征。 我们使用一种基本的基于模型的表示方法 - 平均季节性轮廓。另一个非常重要的通知是,时间序列的归一化是时间序列的每个聚类或分类之前的必要过程。 使用K-medoids(pam函数从cluster包)聚类方法 。 “最佳”数量的簇是7 。 我们用7个聚类数绘制聚类结果。 现在,让我们尝试一些更复杂的方法来提取季节性分布 - GAM回归系数。 可视化结果: 再次聚类的最佳数量是7.让我们绘制结果。 提取的消费情况比平均季节性情况更平滑。蓝色虚线与每日和每周季节性系数相接。 我将向您展示一些非数据自适应表示的聚类结果,让我们选择例如DFT(离散傅立叶变换)方法并提取前48个DFT系数。 因此,基于模型的时间序列表示在这种用例中非常有效(因此典型的剖面提取)。 FeaClip是从限幅表示特征提取方法。建议将FeaClip旁边的开窗方法用于时间序列的每一天。 我们绘制结果 我们可以看到,现在出现了2个“肘部”。最大的变化是在2到3个簇之间,所以我会选择3号。 结论 在本教程中,我向您展示了使用时间序列表示方法来创建更多消费者的特征。 |
请发表评论