中国电力 ›› 2024, Vol. 57 ›› Issue (5): 251-260.DOI: 10.11930/j.issn.1004-9649.202303125
• 技术经济 • 上一篇
叶煜明1(), 钱琪琪1(
), 万正东2(
), 张继钢2(
)
收稿日期:
2023-03-29
接受日期:
2023-12-21
出版日期:
2024-05-28
发布日期:
2024-05-16
作者简介:
叶煜明(1973—),男,高级工程师,从事电网工程建设技术经济数据分析与预测研究,E-mail:yeym@csg.cn基金资助:
Yuming YE1(), Qiqi QIAN1(
), Zhengdong WAN2(
), Jigang ZHANG2(
)
Received:
2023-03-29
Accepted:
2023-12-21
Online:
2024-05-28
Published:
2024-05-16
Supported by:
摘要:
架空线路工程造价的准确预测对于工程建设质量及造价管控具有十分重要的意义。针对传统架空线路工程造价预测中遇到的特征维度过高、单一预测模型难以拟合复杂造价数据等问题,提出了基于嵌入法数据降维与集成学习的线路工程造价预测算法。首先通过嵌入法与极端梯度提升(extreme gradient boosting,XGBoost)模型对特征进行排序,筛选出对造价影响显著的特征完成数据降维。然后对XGBoost、随机森林、支持向量机(support vector machine,SVM)等模型进行融合,构成双层集成学习模型并对线路工程造价进行预测。最后基于某电网公司近年线路工程造价数据进行实例分析,分别与XGBoost、随机森林、SVM、极限学习机(extreme learning machine,ELM)与反向传播(back propagation,BP)神经网络等模型进行对比。实验表明预测结果的平均绝对百分比误差低于4%,优于其他单一模型,对线路工程造价控制研究具有较大价值。
叶煜明, 钱琪琪, 万正东, 张继钢. 基于嵌入法与集成学习的线路工程造价预测[J]. 中国电力, 2024, 57(5): 251-260.
Yuming YE, Qiqi QIAN, Zhengdong WAN, Jigang ZHANG. Prediction of Transmission Line Cost Based on Embedding Method and Ensemble Learning[J]. Electric Power, 2024, 57(5): 251-260.
特征 分类 | 特征名称 | 特征 数量 | ||
内部 | 电压等级、地区、风速、覆冰、海拔、回路数、地形、导线截面、分裂数、转角塔比例、地线根数、地线型号、导线型式、单回长、双回长、四回长、折单回全长、杆塔基数、单位塔材量、单位钢材量、单位导线量、是否光纤架空地线(OPGW) | 22 | ||
外部 | 生产者价格指数(PPI)、消费者物价指数(CPI)、塔材总价、塔材单价、导线价格、导线单价、钢材总价、钢材单价 | 8 |
表 1 线路工程造价数据特征构成
Table 1 Characteristics of transmission line project cost data
特征 分类 | 特征名称 | 特征 数量 | ||
内部 | 电压等级、地区、风速、覆冰、海拔、回路数、地形、导线截面、分裂数、转角塔比例、地线根数、地线型号、导线型式、单回长、双回长、四回长、折单回全长、杆塔基数、单位塔材量、单位钢材量、单位导线量、是否光纤架空地线(OPGW) | 22 | ||
外部 | 生产者价格指数(PPI)、消费者物价指数(CPI)、塔材总价、塔材单价、导线价格、导线单价、钢材总价、钢材单价 | 8 |
项目 编号 | 地区编号 | 设计风速/ (m·s–1) | 电压等级/ kV | 回路数 | 导线截面/ mm2 | 分裂数 | 转角塔 比例/% | ··· | 折单回 全长/km | 单位造价/ (万元·km–1) | ||||||||||
1 | 1 | 29.0 | 500 | 双回路 | 720 | 4 | 40.00 | ··· | 8.05 | 418.50 | ||||||||||
2 | 1 | 0 | 220 | 双回路 | 630 | 2 | 0 | ··· | 0.56 | 565.71 | ||||||||||
3 | 1 | 0 | 220 | 双回路 | 630 | 2 | 35.00 | ··· | 21.14 | 365.47 | ||||||||||
4 | 2 | 27.0 | 220 | 单回路 | 630 | 2 | 36.00 | ··· | 30.23 | 147.59 | ||||||||||
5 | 2 | 23.5 | 220 | 单回路 | 630 | 2 | 33.00 | ··· | 31.60 | 164.68 | ||||||||||
··· | ··· | ··· | ··· | ··· | ··· | ··· | ··· | ··· | ··· | ··· | ||||||||||
964 | 2 | 23.5 | 220 | 单回路 | 400 | 2 | 21.09 | ··· | 42.85 | 119.24 | ||||||||||
965 | 2 | 23.5 | 220 | 单回路 | 400 | 2 | 29.47 | ··· | 37.62 | 103.78 |
表 2 线路工程数据示例
Table 2 Example of transmission line project data
项目 编号 | 地区编号 | 设计风速/ (m·s–1) | 电压等级/ kV | 回路数 | 导线截面/ mm2 | 分裂数 | 转角塔 比例/% | ··· | 折单回 全长/km | 单位造价/ (万元·km–1) | ||||||||||
1 | 1 | 29.0 | 500 | 双回路 | 720 | 4 | 40.00 | ··· | 8.05 | 418.50 | ||||||||||
2 | 1 | 0 | 220 | 双回路 | 630 | 2 | 0 | ··· | 0.56 | 565.71 | ||||||||||
3 | 1 | 0 | 220 | 双回路 | 630 | 2 | 35.00 | ··· | 21.14 | 365.47 | ||||||||||
4 | 2 | 27.0 | 220 | 单回路 | 630 | 2 | 36.00 | ··· | 30.23 | 147.59 | ||||||||||
5 | 2 | 23.5 | 220 | 单回路 | 630 | 2 | 33.00 | ··· | 31.60 | 164.68 | ||||||||||
··· | ··· | ··· | ··· | ··· | ··· | ··· | ··· | ··· | ··· | ··· | ||||||||||
964 | 2 | 23.5 | 220 | 单回路 | 400 | 2 | 21.09 | ··· | 42.85 | 119.24 | ||||||||||
965 | 2 | 23.5 | 220 | 单回路 | 400 | 2 | 29.47 | ··· | 37.62 | 103.78 |
序号 | 真实值/(万元·km–1) | 预测值/(万元·km–1) | 误差/% | |||
1 | 90.38 | 89.66 | 0.79 | |||
2 | 151.34 | 149.59 | 1.15 | |||
3 | 155.25 | 153.56 | 1.08 | |||
4 | 93.21 | 91.75 | 1.57 | |||
5 | 162.40 | 158.85 | 2.19 | |||
6 | 134.75 | 140.63 | 4.43 |
表 3 预测结果部分样本
Table 3 Examples of forecast results
序号 | 真实值/(万元·km–1) | 预测值/(万元·km–1) | 误差/% | |||
1 | 90.38 | 89.66 | 0.79 | |||
2 | 151.34 | 149.59 | 1.15 | |||
3 | 155.25 | 153.56 | 1.08 | |||
4 | 93.21 | 91.75 | 1.57 | |||
5 | 162.40 | 158.85 | 2.19 | |||
6 | 134.75 | 140.63 | 4.43 |
方法 | MAPE/% | RMSE | ||
XGBoost | 7.25 | 15.56 | ||
随机森林 | 8.03 | 17.42 | ||
SVM | 8.89 | 18.70 | ||
ELM | 12.35 | 22.83 | ||
BP神经网络 | 15.64 | 28.71 | ||
本文方法 | 3.91 | 8.39 |
表 4 不同方法预测结果对比
Table 4 Comparison of prediction results of different methods
方法 | MAPE/% | RMSE | ||
XGBoost | 7.25 | 15.56 | ||
随机森林 | 8.03 | 17.42 | ||
SVM | 8.89 | 18.70 | ||
ELM | 12.35 | 22.83 | ||
BP神经网络 | 15.64 | 28.71 | ||
本文方法 | 3.91 | 8.39 |
1 | 涂开开. 新疆110 kV架空输电线路工程造价差异动因研究[D]. 北京: 华北电力大学, 2022. |
TU Kaikai. Study on the cost difference of Xinjiang 110 kV overhead transmission line project[D]. Beijing: North China Electric Power University, 2022. | |
2 |
卢艳超, 郑燕, 赵彪. 输变电工程外部环境影响分析[J]. 中国电力, 2012, 45 (10): 100- 103.
DOI |
LU Yanchao, ZHENG Yan, ZHAO Biao. The external environment influence analysis of power transmission project based on PEST model[J]. Electric Power, 2012, 45 (10): 100- 103.
DOI |
|
3 | 丁政中, 彭露苇. 基于MK-TESM法的输变电工程造价数据预测方法[J]. 沈阳工业大学学报, 2021, 43 (2): 126- 131. |
DING Zhengzhong, PENG Luwei. Prediction method for cost data of power transmission and transformation project based on MK-TESM method[J]. Journal of Shenyang University of Technology, 2021, 43 (2): 126- 131. | |
4 | 张书研. 基于全生命周期理论的电网工程造价分析方法与应用[D]. 杭州: 浙江大学, 2022. |
ZHANG Shuyan. Power grid project cost analysis method and application based on life cycle theory[D]. Hangzhou: Zhejiang University, 2022. | |
5 | 乔慧婷, 文上勇, 黄琰. 电网输电工程项目数据插补及造价预测融合模型[J]. 沈阳工业大学学报, 2021, 43 (5): 481- 486. |
QIAO Huiting, WEN Shangyong, HUANG Yan. Data interpolation and cost prediction fusion model for power grid transmission project[J]. Journal of Shenyang University of Technology, 2021, 43 (5): 481- 486. | |
6 | 吴美琼. 电网工程设备材料价格影响因素分析与预测模型研究[D]. 北京: 华北电力大学, 2018. |
WU Meiqiong. Research on influencing factors and forecasting models of equipment price in power grid project[D]. Beijing: North China Electric Power University, 2018. | |
7 | 武小琳, 栾凌, 潘连武, 等. 基于LM-CNN的输变电工程造价自动计算模型[J]. 中国电力, 2023, 56 (2): 157- 163. |
WU Xiaolin, LUAN Ling, PAN Lianwu, et al. LM-CNN-based automatic cost calculation model for power transmission and transformation projects[J]. Electric Power, 2023, 56 (2): 157- 163. | |
8 | 舒隽, 甘磊. 极限学习机方法在电力线路建设成本估算中的应用研究[J]. 现代电力, 2011, 28 (4): 78- 83. |
SHU Jun, GAN Lei. Research on cost estimation of power lines construction projects based on extreme learning machine method[J]. Modern Electric Power, 2011, 28 (4): 78- 83. | |
9 | 王宁宁, 王飞, 尹彦涛, 等. 基于支持向量机的变电工程造价预测研究[J]. 建筑经济, 2016, 37 (5): 48- 52. |
WANG Ningning, WANG Fei, YIN Yantao, et al. Research on cost predicting of power transformation projects based on SVM[J]. Construction Economy, 2016, 37 (5): 48- 52. | |
10 | 宋宗耘, 牛东晓, 肖鑫利, 等. 基于改进萤火虫算法优化SVM的变电工程造价预测[J]. 中国电力, 2017, 50 (3): 168- 173. |
SONG Zongyun, NIU Dongxiao, XIAO Xinli, et al. Substation engineering cost forecasting method based on modified firefly algorithm and support vector machine[J]. Electric Power, 2017, 50 (3): 168- 173. | |
11 | 卢文飞, 袁竞峰, 张嘉澍, 等. 基于机器学习算法的输电线路工程投资预测[J]. 科学技术与工程, 2022, 22 (17): 6992- 7001. |
LU Wenfei, YUAN Jingfeng, ZHANG Jiashu, et al. Transmission line project investment prediction based on machine learning algorithm[J]. Science Technology and Engineering, 2022, 22 (17): 6992- 7001. | |
12 | 俞敏, 王愿翔, 闫园, 等. 架空线路改造工程造价的组合预测方法[J]. 电力科学与技术学报, 2020, 35 (1): 24- 30. |
YU Min, WANG Yuanxiang, YAN Yuan, et al. A combinational forecasting method for predicting the cost of an overhead line reconstruction project[J]. Journal of Electric Power Science and Technology, 2020, 35 (1): 24- 30. | |
13 | 鲍海波, 吴阳晨, 张国应, 等. 基于特征加权Stacking集成学习的净负荷预测方法[J]. 电力建设, 2022, 43 (9): 104- 116. |
BAO Haibo, WU Yangchen, ZHANG Guoying, et al. Net load forecasting method based on feature-weighted stacking ensemble learning[J]. Electric Power Construction, 2022, 43 (9): 104- 116. | |
14 | 吴思婕, 王怀远. 基于集成学习的时间自适应电力系统暂态稳定评估方法[J]. 电力系统保护与控制, 2022, 50 (24): 112- 119. |
WU Sijie, WANG Huaiyuan. Transient stability assessment of power system with time-adaptive method based on ensemble learning[J]. Power System Protection and Control, 2022, 50 (24): 112- 119. | |
15 | 史佳琪, 张建华. 基于多模型融合Stacking集成学习方式的负荷预测方法[J]. 中国电机工程学报, 2019, 39 (14): 4032- 4042. |
SHI Jiaqi, ZHANG Jianhua. Load forecasting based on multi-model by stacking ensemble learning[J]. Proceedings of the CSEE, 2019, 39 (14): 4032- 4042. | |
16 | CHEN T Q, GUESTRIN C. XGBoost: a scalable tree boosting system[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco California USA. ACM, 2016: 785–794. |
17 | BIAU G, SCORNET E. A random forest guided tour[J]. TEST, 2016: 197–227. |
18 | DHAL P, AZAD C. A comprehensive survey on feature selection in the various fields of machine learning[J]. Applied Intelligence, 2022, 52 (4): 4543- 4581. |
19 | ZHANG R, NIE F P, LI X L, et al. Feature selection with multi-view data: a survey[J]. Information Fusion, 2019, 50, 158- 167. |
20 | ZHOU H F, ZHANG J W, ZHOU Y Q, et al. A feature selection algorithm of decision tree based on feature weight[J]. Expert Systems with Applications, 2021, 164 113842. |
21 | LIU Z G, YANG J L, WANG L, et al. A novel relation aware wrapper method for feature selection[J]. Pattern Recognition, 2023, 140 109566. |
22 | 黄奇文, 李丽颖, 沈富可, 等. 基于集成特征选择的网络异常流量检测[J]. 华东师范大学学报(自然科学版), 2021, (6): 100- 111. |
HUANG Qiwen, LI Liying, SHEN Fuke, et al. Network anomaly traffic detection based on ensemble feature selection[J]. Journal of East China Normal University (Natural Science), 2021, (6): 100- 111. | |
23 | 李占山, 刘兆赓. 基于XGBoost的特征选择算法[J]. 通信学报, 2019, 40 (10): 101- 108. |
LI Zhanshan, LIU Zhaogeng. Feature selection algorithm based on XGBoost[J]. Journal on Communications, 2019, 40 (10): 101- 108. | |
24 | RAMRAJ S , UZIR N , SUNIL R , et al. Experimenting Xgboost algorithm for prediction and classification of different datasets[C]//National Conference on Recent Innovations in Software Engineering and Computer Technologies (NCRISECT) 2017. 2017. |
25 | BREIMAN L. Random forests[J]. Machine Learning, 2001: 5–32. |
26 |
CHERKASSKY V, MA Y Q. Practical selection of SVM parameters and noise estimation for SVM regression[J]. Neural Networks, 2004, 17 (1): 113- 126.
DOI |
27 | 徐睿, 梁循, 齐金山, 等. 极限学习机前沿进展与趋势[J]. 计算机学报, 2019, 42 (7): 1640- 1670. |
XU Rui, LIANG Xun, QI Jinshan, et al. Advances and trends in extreme learning machine[J]. Chinese Journal of Computers, 2019, 42 (7): 1640- 1670. | |
28 | 刘颖, 杨鹏飞, 张立军, 等. 前馈神经网络和循环神经网络的鲁棒性验证综述[J]. 软件学报, 2023, 34 (7): 3134- 3166. |
LIU Ying, YANG Pengfei, ZHANG Lijun, et al. Survey on robustness verification of feedforward neural networks and recurrent neural networks[J]. Journal of Software, 2023, 34 (7): 3134- 3166. | |
29 |
DIVINA F, GILSON A, GOMÉZ-VELA F, et al. Stacking ensemble learning for short-term electricity consumption forecasting[J]. Energies, 2018, 11 (4): 949.
DOI |
[1] | 宋智伟, 黄新波, 纪超, 张凡, 张烨. 基于PCSA-YOLOv7 Former的输电线路连接金具及其锈蚀检测方法[J]. 中国电力, 2024, 57(6): 141-152. |
[2] | 王传琦, 伍历文, 邓志斌, 邓伟锋, 杨彬. 时间累积架空输电线路覆冰预测模型与算法综述[J]. 中国电力, 2024, 57(6): 153-164, 234. |
[3] | 李瀚儒, 刘智健, 来立永, 黄凌宇, 丁施尹, 刘任, 唐波. 考虑气象参数预测误差条件分布的架空输电线路载流量概率预测方法[J]. 中国电力, 2024, 57(2): 103-114. |
[4] | 张业茂, 李妮, 周翠娟, 鲁浩男. 750 kV高海拔交流输电线路无线电干扰测试数据分析[J]. 中国电力, 2023, 56(2): 77-85. |
[5] | 刘昳娟, 陈云龙, 刘继彦, 张雪梅, 吴潇雨, 孔维政. 基于集成学习的分布式光伏发电功率日前预测[J]. 中国电力, 2022, 55(9): 38-45. |
[6] | 李永胜, 杨加伦, 郑维刚, 刘彬, 高正旭. 辽宁省特定重现期舞动区域分布图绘制[J]. 中国电力, 2022, 55(8): 129-134. |
[7] | 胡京, 邓颖, 蒋兴良, 曾蕴睿. 输电线路覆冰垭口微地形的特征提取与识别方法[J]. 中国电力, 2022, 55(8): 135-142. |
[8] | 马爱清, 王洁, 毕永翔. 500 kV交流线路对并行±800 kV直流线路带电作业人员安全防护的影响[J]. 中国电力, 2022, 55(6): 128-136. |
[9] | 方春华, 陶玉宁, 张威, 智李, 李景. 实测风速分析模拟及微地形下杆塔风速修正方法[J]. 中国电力, 2022, 55(6): 146-153. |
[10] | 徐鑫, 方春华, 智李, 丁璨, 董晓虎, 程绳, 孙维, 陶玉宁. 线激光清除架空线路树障时温度和效率分析[J]. 中国电力, 2022, 55(5): 94-101. |
[11] | 毕洁廷. 计及山谷深度的输电线路雷电绕击率三维EGM研究[J]. 中国电力, 2021, 54(8): 91-97. |
[12] | 武建卫, 邵剑峰. 计及波速变化的反行波直流输电线路故障测距方法[J]. 中国电力, 2021, 54(5): 121-128. |
[13] | 何继勇, 周海阔, 朱仁勋. 高压输电线路在线监测设备无线供电磁耦合机构优化[J]. 中国电力, 2021, 54(5): 139-147,165. |
[14] | 范海虹. 基于萤火虫算法的短期电力负荷预测方法[J]. 中国电力, 2021, 54(3): 141-148. |
[15] | 李福志, 郑卫宾, 张文海, 张智勇, 林德锋, 张旭波, 张荣建. 基于回路直流电阻测量的输电线路单相接地故障离线故障定位[J]. 中国电力, 2021, 54(2): 140-146. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||