基于改进随机森林算法的电力企业市场竞争预测模型构建与实现
刘俊宇,陈 辉,张福峰,曲永强,赵铁英
(国网抚顺供电公司,辽宁 抚顺 113008)
作者简介:刘俊宇(1973—),男,高级工程师,硕士,主要研究方向为电力企业管理,ljy122@sina.com.
摘要:电力企业市场竞争力预测关系到电力企业未来的发展,基于改进随机森林算法对电力企业的市场竞争力进行预测。随机森林算法中森林树数量和叶节点数量对预测结果影响比较大,采用果蝇优化算法对这两个参数进行优化,得到改进后的随机森林算法。将传统随机森林算法和改进后的随机森林算法应用于电力企业市场竞争力预测中,结果表明,改进随机森林算法对竞争预测的精度高于传统随机森林算法,这对于电力企业市场竞争预测具有一定的参考价值。
关键词:随机森林;果蝇优化算法;电力企业;竞争力预测
中图分类号:F406.15 文献标识码:A 文章编号:2095-509X(2021)06-0085-04
电力行业是国民经济发展的基础,确保电力企业的健康发展对促进国民经济快速发展具有至关重要的意义[1]。电力企业数量的快速增加使得电力企业之间的竞争越来越激烈,通过建立电力企业市场竞争力预测模型可以更加科学地了解影响电力企业市场竞争力的因素,对电力企业的市场竞争力做出客观的评价。高晓红等[2]采用时序人工神经网络和因果人工神经网络建立了企业竞争力的预测模型,决策者可以根据技术创新、管理创新、营销创新、知识创新等各项指标,借助所搭建的预测模型来预测企业的竞争力。邓蓉晖等[3]基于神经网络对建筑企业竞争力评估方法进行了研究,所搭建的神经网络可以实现二级指标和综合指标的非线性映射,避免了指标权重确定的人为因素和随机因素干扰,采用所搭建的神经网络模型可以预测建筑企业的竞争力。电力企业市场竞争力预测是一件十分复杂的事情,随机森林算法是利用多棵树对样本进行训练并预测的分类器,在解决复杂问题方面具有十分广泛的应用。基于此,本文在对随机森林算法分析的基础上给出了改进的随机森林算法,并将其应用于电力企业市场竞争力预测中。
1 随机森林算法及改进
1.1 随机森林算法
随机森林算法是采用随机方法构建一个森林,所构建的森林由无关联的多颗决策树所组成,其主要被应用于分类和回归问题的分析中[4]。采用重采样技术从原始数据中抽取一定数量的样本,对抽取的样本进行决策树建模,生成多棵决策树,最终得到回归预测值。图1为随机森林回归预测模型图。
设X为原始输入数据,Y为原始输出数据,由原始输入数据X和原始输出数据Y构成原始数据集合S=(X,Y)。由图1可知,随机森林回归预测是从原始数据集合S中随机抽样,取k个数据组成训练样本集合,通过训练样本集合产生k棵决策树。每一棵决策树都会产生一个预测值,对k个预测值求平均值最终得到回归预测结果。在随机森林中,每一棵树均为二叉树。二叉树的生成遵循自上向下的递归分裂原则[4]。在随机森林的根节点中包含有全部的训练数据,其被分裂为左节点与右节点。分裂按照节点不纯度最小原则进行,直到满足停止规则。在随机森林算法中常常采用基尼指数来衡量不纯度,基尼指数GH的计算公式为[5]: |