关于算法:拓端tecdat电力消耗模型构建分析和预测

41次阅读

共计 1378 个字符,预计需要花费 4 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=23392 

作者:Minghong Xu

某制药公司每年要花费大量的资金在电费上,因为电力公司的业务改革,该药企能够在一年或月开始时向电力公司预购肯定数量的电力,如果理论耗费大于该值,则每多耗费一度电要付比以前更多的电费,如果实际上没有耗费这么多,也不会退还多余的电费,因而该公司打算预测将来的电力耗费以节俭资金耗费。

解决方案

工作 / 指标

依据制药公司要求,使用多种数据源剖析实现精准电力耗费预测。

数据源筹备

为了预测电力的耗费,将电的次要应用分为生产车间的耗费,空调的电力耗费和其它耗费,其它耗费视为一个常量,在最初增加下来。

数据处理

在理论收到的数据中,有很多日期的某些电表的耗电量和某些车间的产量并没有被记录下来,因而应用拉格朗日插值法来补足两头的缺口。

特色转换

把不能解决的特色做一些转换,解决成算法容易解决的洁净特色举例如下:

工夫属性。就工夫属性自身来说,对模型来说不具备任何意义,须要把日期转变成到天,年、月、日、周伪变量。

电量属性。因为收集的是繁多电表的数据指标,所以合并雷同类型的数据,作为车间和空调的总耗电来参加模型建设。

产量属性。因为车间生产了数种药品,且不同药品的每箱分量不同。有的工序的耗电量只和分量无关,有的工序的耗电量之和箱数无关,因而咱们两种计量形式都要用上。

结构

划分训练集和测试集

思考到最终模型会预测未来的某时间段的耗电量,为了更实在的测试模型成果,以工夫来切分训练集和测试集。具体做法如下:用软件随机划分 80% 的数据作为训练集,剩下的 20% 作为测试集。

建模

一元线性回归 在思考一些工序的耗电时,容易发现机器的耗电量和产量是呈线性关系的,此时就应用一元线性回归模型来拟合。(y=kx+b)

一元非线性回归,在工厂里为了维持生产车间的恒温,应用气温暖空调来进行调温。气暖耗费的是蒸汽,只有空调才会耗电。当室内温度高于肯定值时,空调才会开启;室内的温度越高,空调的功率越大,因而空调耗电和气温是一元非线性关系。(y=f(x))

多元线性回归,有的生产工序不仅仅和产品的分量无关,还和产品的箱数无关,此时就应用二元线性模型来拟合。(z=k1x+k2y+b)

模型优化

1. 上线之前的优化:特征提取,样本抽样,参数调参。

2. 上线之后的迭代,依据理论的 A / B 测试和业务人员的倡议改良模型

我的项目后果

在此案例中,别离用三种模型来计算耗电量的三个重量。

用一元非线性回归,计算空调耗电量,其可视化图形如下,其中这里的气温是日最高气温(关系式省略):

用一元线性回归,计算出局部机器的耗电量和

产量的关系图形如下(关系式省略):

 

 

这是三种机器的耗电量和产量的关系图,能够看到当产量为 0 时,机器待机时也有肯定的耗电量。

用二元线性回归模型,计算出最初一种机器和产品分量和箱数的关系:

下面是截面图,上面是散点图

能够看出,几种耗电量的模型根本都能够较完满的拟合理论状况,置信度都有 95% 以上。这个模型次要有两个用处,一是预测,就能够利用模型和打算产量等因素来预测将来的耗电量,从而实现准确购电。二是异样检测,如果有一天预测值和理论耗电量有较大偏差的时候,阐明机器很可能呈现了故障,要及时检修。

预测模型仅仅是算法计算下的后果,在理论生存中,这样的预测值仅仅只能作为参考,在理论生存中还有更多的因素影响后果,须要从多方面来考量。

正文完
 0