随着全球环境问题不断恶化,人们越来越意识到非污染和可再生能源的重要性。风能作为一种分布广泛的洁净能源,在全世界范围内得到广泛开发和利用。我国是风机制造和生产大国,也是风力发电大国。风电机组常常面临机组工况多变和条件恶劣的工作环境,导致其在服役期间容易因故障而停机,带来安全隐患,影响风电场经济效益。本数据集为山西晋城泽州风电场10台风电机组故障数据集,时间范围为2021年5月19日到2022年5月18日,数据集包含了采样间隔10min的SCADA数据和故障信息。本数据集时间范围长,收录较多风机故障数据,为研究风机运行策略、风机故障诊断与预测等科学问题提供数据支持。
| 采集时间 | 2021/05/19 - 2022/05/18 |
|---|---|
| 采集地点 | 山西晋城泽州风电场 |
| 数据量 | 190.5 MiB |
| 数据格式 | CSV格式 |
| 坐标系 |
本数据集采自位于山西省晋城市泽州风电场,区域面积88KM2,场区实际可利用面积55KM2,海拔在800~1200m之间。风电场所处位置,位于太行山风带北部边缘地带,大陆性季风气候明显,四季分明,一般为:春季干旱多风,夏季炎热多雨,秋季秋高气爽,冬季寒冷干燥。风电场多年无霜期192.6天,最多为226天。降水量主要分布在夏季,占全年降水量的60%。该风电场风机型号为远景EN-115/2.2机型,单机容量为2200kW,轮毂高度90米,叶片直径115米。机位90m高度平均自由流风速为5.52m/s时,平均发电小时为1959小时。
本数据为风电机组SCADA数据,所用机型为远景EN-115/2.2机型,采用自动观测的方法。
统计分析了2021年5月19日到2022年5月18日10台风机SCADA数据的数据质量。10台远景EN-115/2.2机组有效数据比例为97.92%,每月数据有效比分析如图4所示。除2021年8月11日至15日因风电场调试机组无数据,2021年10月、11月,2022年1月、4月、5月缺失部分数据外,其余各月数据均无缺失。
| # | 编号 | 名称 | 类型 |
| 1 | 22YF7GA145 | 基于多元数据驱动的风电机组关键部件智能故障诊断和预防性维护研究 | 其他 |
本作品采用
知识共享署名
4.0 国际许可协议进行许可。
| # | 标题 | 文件大小 |
|---|---|---|
| 1 | 20210519-20220518首发故障表.csv | 7.7 KiB |
| 2 | JCZZ03.csv | 941.3 KiB |
| 3 | JCZZ03_SCADA.csv | 18.0 MiB |
| 4 | JCZZ06.csv | 945.7 KiB |
| 5 | JCZZ06_SCADA.csv | 17.8 MiB |
| 6 | JCZZ13.csv | 894.6 KiB |
| 7 | JCZZ13_SCADA.csv | 18.3 MiB |
| 8 | JCZZ17.csv | 828.7 KiB |
| 9 | JCZZ17_SCADA.csv | 18.4 MiB |
| 10 | JCZZ18.csv | 743.8 KiB |
| # | 时间 | 姓名 | 用途 |
|---|---|---|---|
| 1 | 2025/11/24 00:22 | 吴*一 |
我在从事基于红外图像的变电站设备实时检测技术研究与应用工作,希望获得该数据进行时序分析方面的研究,谢谢。
|
| 2 | 2025/11/09 01:39 | 李*农 |
您好!
我们课题组现申请使用“山西晋城泽州风电场SCADA故障数据集”,旨在开展基于多源多模态数据融合的风电机组数字孪生模型构建与故障诊断前沿研究。
我们深知,该数据集不仅包含了风机SCADA系统的海量运行参数(如风速、功率、转速、温度、压力等),更珍贵的是,它配套提供了详尽的故障事件记录表。这种 “高频时序运行数据”与“精确故障标签”的多模态对应关系,正是我们开展下一代智能化故障诊断研究不可或缺的基础。
我们的具体研究规划与申请理由如下:
1. 面向数字孪生的多源数据融合与模型驱动
传统的故障诊断模型多为“数据黑箱”,缺乏对物理机理的考量。我们计划利用该数据集:
· 构建风电机组关键部件(如齿轮箱、发电机、主轴承)的数字孪生体。SCADA数据将作为孪生体的实时驱动输入,在虚拟空间中镜像物理实体的运行状态。
· 实现多源异构数据的深度融合。我们将SCADA数据(每秒或每分钟级)与故障记录(事件级)在时间线上进行精确对齐与融合。这种融合不仅丰富了数据维度,更重要的是为数字孪生模型提供了 “正常-异常”全生命周期状态的监督信号,用于校准和验证我们的模型。
· 研究故障的传播与演化机理。通过分析故障发生前数小时甚至数天内,多参数耦合的异常变化模式,在数字孪生体中复现故障的萌芽、发展直至爆发的全过程,从而深化对故障物理本质的理解。
2. 基于数字孪生的故障预测与健康管理(PHM)
本研究的最终目标是开发一个具有高精度、可解释性的故障预测平台。
· 在数字孪生体中进行故障推演与预测。我们将在孪生体中模拟不同工况和应力条件下的部件退化,利用数据集中真实的故障案例作为验证,实现从“事后诊断”到“事前预测”的转变。
· 开发基于混合模型的预警算法。我们将结合数据的驱动(如深度学习从SCADA数据中学习异常模式)与模型的驱动(基于物理的退化模型),交叉验证预警结果,显著降低误报率和漏报率。该数据集中的多台风机数据,为我们验证模型的泛化能力提供了绝佳条件。
总结而言,贵中心提供的“山西晋城泽州风电场SCADA故障数据集”以其独特的、经过标注的多模态特性,为我们开展创新性的数字孪生研究提供了最关键的数据基石。这不仅对推进我国风电智能化运维的理论发展具有重要意义,也对提升风电场实际运营的安全性与经济性有直接的参考价值。
我们承诺,所获数据将严格用于本次所述的科学研究,遵守贵中心的所有数据使用规定,并愿意在成果中按要求标注数据来源。
|
| 3 | 2025/11/02 19:05 | liu******hua |
论文题目:风浪耦合下的海上风电机组可靠性评估与运维策略研究
数据在研究中的作用:为论文中研究风电子系统故障相关性提供理论依据
论文类型:硕士论文
导师姓名:胡博
|
| 4 | 2025/10/24 05:44 | 杨* |
论文题目:基于数据分解和深度学习方法的风电功率预测研究
数据在研究中的作用:训练预测模型
论文类型:硕士学位论文
导师姓名:张嘉英
|
| 5 | 2025/10/22 22:37 | 王*德 |
目前组内在研究通过深度学习进行故障诊断,但是组内缺少可验证的数据集,烦请您分享一下数据,非常感谢!
|
| 6 | 2025/10/22 00:24 | 刘*山 |
Paper title:风力机的预测性维护
Paper abstract:
Paper type:博士论文
Tutor 卜思齐
|
| 7 | 2025/10/21 18:58 | ho****hen |
尊敬的国家冰川冻土沙漠科学数据中心老师:
您好!首先,非常感谢您审阅我的数据申请。我再次申请使用 “山西晋城泽州风电场10台风电机组故障数据集(2021-2022年)” ,并希望就申请目的进行更详细的说明。
1. 申请目的与科研属性:我们团队参加 “全国大学生数据要素素养大赛”并且晋级国赛。本次大赛的核心要求是围绕一个真实的科学问题,完成从数据获取、处理、分析到建模的全流程研究。我们选定的课题是 《风机故障诊断数据智能分析与预测系统》 。该课题旨在利用真实工业数据,探索数据驱动的方法来解决风机运维中的实际问题,这本质上是一项典型的科学研究与探索。
2. 数据用途与科研价值:如果获得该数据集,我们将严格遵循科研数据的用途,用于:
科学研究方法验证:我们将利用该数据,研究并验证时序数据分析、机器学习(如分类模型用于故障诊断)、深度学习(如LSTM模型用于故障预测)等算法在工业设备预测性维护领域的有效性与局限性。
形成科研成果:我们的研究成果(包括分析方法、模型构建流程与结论)将在大赛结束后,整理成学术报告或科研论文,我们非常乐意在成果中致谢 国家冰川冻土沙漠科学数据中心提供的数据支持。我们承诺,所有分析工作均在确保数据安全的科研环境下进行。
3. 对数据提供方的承诺:我们郑重承诺:
本数据集仅用于本次大赛相关的科学研究与学习,不会用于任何商业用途。
我们不会对数据进行复制、传播或泄露给任何第三方。
在研究过程中,我们将严格遵守数据安全管理规定。
该数据集对于培养我们解决实际问题的科研能力至关重要。恳请数据中心老师能够综合考虑我们课题的科研性质与学习目的,批准我们的数据申请。
再次感谢您付出的时间与劳动,期待您的佳音!
祝好!
|
| 8 | 2025/10/17 20:35 | 魏*来 |
Paper title:基于数据驱动的风电机组故障诊断方法研究
Paper abstract:风力涡轮机的故障检测对风电场的安全与可靠运行至关重要。然而,监控与数据采集(SCADA)数据通常具有高维度、冗余性和非平稳性,这给精确分类带来了巨大挑战。为此,本文提出了一种兼顾准确性与鲁棒性的数据驱动集成模型:首先,采用 $k$ 近邻进行离群点检测以剔除异常样本;其次,结合置换重要度的 eXtreme Gradient Boosting(XGBoost)对特征进行排序与选择,保留最具贡献的变量作为输入;随后,引入具有物理可解释性的“热差(thermal-difference)”特征以增强表征能力,明确刻画相间热不平衡与跨部件热耦合异常,从而提升故障识别的可分性与鲁棒性;最后,通过堆叠(stacking)集成随机森林、XGBoost 和 $k$ 近邻构建最终分类器,并采用灰狼优化器对超参数进行联合优化。基于 SCADA 数据集的实验表明,所提方法在分类准确性与稳定性方面均显著优于基线模型;同时借助基于热学机理的特征工程保持了良好的可解释性。
Paper type:毕业论文
Tutor 田中大
|
| 9 | 2025/10/15 21:52 | 欧* |
论文题目:基于大模型的风机故障诊断
数据在研究中的作用:作为历史案例分析为大模型构建成一个知识库
论文类型:故障诊断,大模型应用
导师姓名:张葛祥
|
| 10 | 2025/10/10 04:37 | ru****yan |
论文题目:基于深度学习的风电机组故障预警研究
数据在研究中的作用:训练故障预警模型
论文类型:硕士论文
导师姓名:马然
|
©2024 中国科学院西北生态环境资源研究院 备案号:陇ICP备2021001824号-34
兰州市东岗西路320号 730000 电话:0931-4967592, 0931-4967596