Современная эпоха характеризуется значительным ростом научных и технологических достижений, среди которых искусственный интеллект (ИИ) и машинное обучение (МО) занимают центральное место. Технологии ИИ и МО не только кардинально изменили бизнес-процессы, но и стали важнейшими инструментами в научных исследованиях, открывая новые горизонты и расширяя границы возможностей. Искусственный интеллект и машинное обучение оказывают значительное влияние на научные исследования, позволяя учёным обрабатывать большие объёмы данных и анализировать сложные модели.
Целью статьи стало изучение влияния метеорологических условий на точность прогнозирования. Для этого необходимо:
- разработать модель краткосрочного прогнозирования теоретической генерации электроэнергии Пальеозерской ГЭС, способной без учета человеческого фактора и аварийных ситуаций в энергосистеме с высокой точностью прогнозировать необходимые величины;
- оценить влияние метеорологических факторов на точность прогнозирования теоретической выработки электроэнергии.
Существует множество работ, описывающих применение технологий искусственного интеллекта и машинного обучения в разных сферах жизнедеятельности. Например, в работах [Овчаренко], [Соболева] описано применение искусственного интеллекта в обработке естественного языка, при обучении чтению на английском языке и в психологической практике.
На сегодняшний день развитие и укрепление энергетической отрасли является актуальной проблемой как в глобальном, так и в региональном аспекте. В настоящее время необходимо не только наращивание энергетических мощностей, но и одновременное повышение экологической безопасности, экономической эффективности, рентабельности производства электроэнергии и её конкурентоспособности. Одной из важных и развивающихся традиционных отраслей энергии является гидроэнергетика.
В статье приведено использование искусственного интеллекта и машинного обучения в энергетической отрасли, которая получила название гидроэнергетика.
* * * * *
Гидроэлектростанции являются важным элементом энергетической системы. Благодаря своей высокой маневренности и способности эффективно функционировать в периоды пиковых нагрузок гидроэлектростанции могут брать на себя задачи по обеспечению резервов мощности и быстро реагировать на внезапное изменение потребления мощности в энергосистеме, что существенно увеличивает надежность системы электроснабжения. Присутствие гидроэлектростанций в энергосистеме способствует уменьшению расхода газа и твёрдого топлива на тепловых электростанциях. Более того, на данный момент гидроэлектростанции остаются единственным источником возобновляемой энергии, способным производить электроэнергию в значительных объёмах [Митрофанов: 4].
В контексте глобального перехода к устойчивым источникам энергии, значение гидроэнергетики как долгосрочного и чистого возобновляемого ресурса, заменяющего традиционные технологии сжигания ископаемого топлива, продолжает возрастать. Следует подчеркнуть, что все государства с гидропотенциалом активно его используют. Гидроэнергетика, являясь частью электроэнергетического сектора, решает две ключевые задачи: обеспечивает надежную и бесперебойную работу энергетических систем и способствует низкоуглеродному развитию экономики России. Кроме своей энергетической и экологической роли гидроэлектростанции создают комплексные социально-экономические эффекты, способствуя развитию экономики регионов, где они расположены, а также других секторов национальной экономики. Развитие гидроэнергетики не только увеличивает производство электроэнергии и улучшает маневренность и надежность энергосистемы, но и стимулирует стратегические инициативы, в которых вклад гидроэнергетики в развитие территорий и отраслей является значительным и многосторонним [Веселов: 15-16].
Для предсказания генерации без учета человеческого фактора и аварийных ситуаций в энергосистеме (далее, теоретической выработки), используются разнообразные подходы, включая физические модели, статистические методы и алгоритмы машинного обучения. Физические модели, как правило, разрабатываются с использованием методов численного моделирования атмосферных процессов. В свою очередь, статистические методы опираются на данные предшествующих наблюдений, чтобы установить взаимосвязь между входными переменными и величинами, подлежащими прогнозированию. Результативность каждого из этих методов может варьироваться от
конкретной ситуации и существенно зависит от временного горизонта прогнозирования, выбранных метрик качества, а также объема доступных данных и вычислительных мощностей [Сергеев: 357].
Наиболее эффективными методами для решения задач прогнозирования являются методы машинного обучения, способные выявлять более сложные зависимости и с высокой точностью прогнозировать необходимые параметры. Обучение в контексте моделей машинного обучения заключается в итерационном подборе параметров для аппроксимации зависимостей, описывающих какой-либо изменяющийся во времени процесс. Такой подход позволяет адаптивным моделям извлекать сложные нелинейные зависимости на длительных интервалах, за счет чего, они, как правило, по сравнению с моделями на основе статистических подходов показывают более высокий результат при прогнозировании временных рядов на достаточно сильно удаленные от текущего момента промежутки времени [Сергеев: 359].
Ключевыми аспектами создания моделей прогнозирования являются сбор, обработка и использование необходимых исходных данных. При прогнозировании выработки электроэнергии на гидроэлектростанциях в качестве исходной информации применяются как метеорологические показатели (например, скорость ветра, уровень осадков, атмосферное давление и др.), так и ретроспективные данные о фактической генерации электроэнергии конкретными гидроэлектростанциями [Сергеев: 356].
Подробнее ознакомиться с этапами построения моделей прогнозирования можно на рисунке 1.
Рис. 1. Этапы создания модели прогнозирования
Существует множество методов машинного обучения: методы опорных векторов, ансамблевые методы, нейронные сети. В работе приведено применение ансамблевого метода машинного обучения для прогнозирования теоретической выработки электроэнергии Пальеозерской гидроэлектростанцией.
Ансамблевые методы машинного обучения основаны на принципе синергии, который возникает при объединении множества простых моделей в одну комплексную. В результате такой интеграции точность итоговой модели значительно превышает точность её отдельных компонентов [Антоненков: 59].
К основным методам ансамблевого обучения относятся:
1. Бэггинг – этот метод подразумевает обучение нескольких моделей на различных подвыборках исходных данных, после чего их предсказания объединяются для получения итогового результата. Одним из наиболее известных алгоритмов, использующих бэггинг, является случайный лес (Random Forest) [Владимирова: 350].
2. Бустинг – в этом подходе модели обучаются последовательно, при этом каждая новая модель нацелена на исправление ошибок предыдущей. Наиболее известные алгоритмы бустинга включают адаптивный бустинг (AdaBoost) и градиентный бустинг (XGBoost). Эти методы различаются способом учета ошибок: в адаптивном бустинге на каждой итерации увеличивается вес тех объектов, на которых были допущены ошибки, тогда как в градиентном бустинге каждый новый регрессор строится с целью максимального уменьшения общей ошибки ансамбля, а градиент используется для определения направления наибольшего снижения ошибки [Антоненков: 59].
3. Стекинг – этот метод объединяет предсказания нескольких базовых моделей с помощью мета-модели, которая обучается на их выходах для улучшения общей точности предсказаний. Мета-модель объединяет результаты работы других моделей и принимает итоговое решение [Петрова: 212].
Одной из разновидностей бустинга, применяемой в процессе построения модели классификации и регрессии и использующей дерево решений, является так называемый адаптивный бустинг. Адаптивный бустинг (AdaBoost) представляет собой алгоритм, который объединяет несколько слабых регрессоров для формирования более точного сильного регрессора. В отличие от других методов ансамблевого обучения, этот подход использует всю обучающую выборку без её разделения на подмножества. Модели обучаются последовательно, и каждая новая модель направлена на исправление ошибок, допущенных предыдущими [Кротова: 88].
На рисунке 2 представлена модель прогнозирования теоретической выработки электроэнергии Пальеозерской гидроэлектростанцией, построенная с помощью адаптивного бустинга (AdaBoost).
Рис. 2. Модель прогнозирования теоретической выработки электроэнергии Пальеозерской гидроэлектростанцией, построенная с помощью адаптивного бустинга (AdaBoost)
Метрики точности модели:
1) Для модели прогнозирования без учета погодных условий:
Коэффициент детерминации r 2 : 0,889
Средняя абсолютная ошибка MAE: 0,055
Среднеквадратическая ошибка MSE: 0,008
2) Для модели прогнозирования с учетом погодных условий:
Коэффициент детерминации r 2 : 0,25
Средняя абсолютная ошибка MAE: 0,186
Среднеквадратическая ошибка MSE: 0,053
Тот факт, что учет метеорологических условий вызывает существенное снижение точности моделей, является неожиданным результатом, который требует дополнительного анализа. Вероятно, изменение климата год от года приводит и к изменению зависимостей между теоретической генерацией и метеорологическими условиями, так, что модель, обученная на данных первых восьми лет, находит зависимости между выработкой и погодными параметрами, которые на следующий год оказываются измененными. Это подтверждается при анализе матриц корреляции Пирсона для разных лет, представленном на рисунке 3 (а, б).
а)
б)
Рис. 3. Матрицы корреляции Пирсона (а – 2019 год, б – 2020 год)
Анализ матрицы коэффициентов корреляции Пирсона для разных лет показывает, что зависимость теоретической выработки электроэнергии от метеорологических условий существенно отличается из года в год. Сравним два соседних календарных года. В 2019 году коэффициент корреляции Пирсона между генерацией и среднесуточной температурой составил 0,15, в 2020 году – (-0,18), то есть в 2019 году среднесуточная температура оказала большее влияние на генерацию. В 2019 году коэффициент корреляции Пирсона между генерацией и высотой верхнего бьефа составил 0,49, в 2020 году – (-0,16), то есть в 2019 году высота верхнего бьефа оказала большее влияние на генерацию. Поэтому в процессе обучения модели на ретроспективных данных выявляют определенные зависимости между генерацией электроэнергии и метеорологическими условиями, которые впоследствии теряют свою актуальность.
* * * * *
В данной работе акцент сделан на разработке модели краткосрочного прогнозирования теоретической выработки электроэнергии на Пальеозерской ГЭС. При обучении модели были учтены ключевые факторы, влияющие на генерацию электроэнергии, такие, как высота нижнего и верхнего бьефов, а также среднесуточное водопотребление. Также была выделена группа метеорологических факторов, включающая удельную влажность, среднесуточную температуру, уровень ультрафиолетового излучения небесной поверхности. Выдвинута гипотеза о том, что учет метеорологических факторов может повысить точность краткосрочного прогнозирования выработки электроэнергии ГЭС. Однако данная гипотеза не подтвердилась: при учете метеорологических факторов точность модели значительно снизилась. Безусловно, погодные условия оказывают влияние на генерацию: увеличение осадков, особенно в виде дождя или таяния снега, приводит к повышению уровня воды в реках и водохранилищах (оказывают существенное влияние на высоту верхнего и нижнего бьефов), что увеличивает доступный водный поток для генерации электроэнергии, но из-за стабильных климатических условий, хорошо спроектированных систем хранения, влияние метеорологических условий может быть несущественно. При устойчивом климате в регионах, где осадки распределены равномерно в течение года, погодные изменения могут не оказывать значительного влияния на уровень воды и, соответственно, на выработку электроэнергии, а также реки могут иметь постоянный сток благодаря подземным водам или ледникам, что делает выработку энергии менее зависимой от краткосрочных изменений погоды.
В дальнейшем планируется расширить набор используемых алгоритмов машинного обучения и провести эксперименты по созданию модели прогнозирования фактической генерации с учетом ремонтов гидроагрегатов, аварийных ситуаций в энергосистеме. Также в планах разработка модели прогнозирования естественного притока к створу ГЭС.
Таким образом, применение технологий искусственного интеллекта способствует:
1. Значительному увеличению точности прогнозирования выработки электроэнергии Пальеозерской гидроэлектростанцией: точность модели, построенной на основе статистических методов составляет примерно 77–90 %, точность модели прогнозирования, представленной на рисунке 2, построенной на основе метода искусственного интеллекта составляет 89 %, используя другие методы машинного обучения, можно повысить точность прогнозирования теоретической выработки до 93–95%.
2. Повышению уровня информативности управленческих решений в электроэнергетических системах и обеспечения бесперебойной и эффективной работы энергосистем, а также является важной основой для создания новых цифровых и интеллектуальных энергосистем: технологии ИИ позволяют грамотно управлять водными ресурсами: могут оказать помощь в оптимизации уровня воды в водохранилищах, чтобы обеспечить максимальную эффективность генерации в зависимости от прогнозируемого спроса, а также автоматизировать процессы мониторинга и регулирования работы ГЭС, что снижает вероятность человеческой ошибки.
Список литературы
Антоненков Д.В. Исследование ансамблевых и нейросетевых методов машинного обучения в задаче краткосрочного прогнозирования электропотребления горных предприятий / Д.В. Антоненков, П.В. Матренин // Электротехнические системы и комплексы. 2021. № 3(52). С. 57-65.
Веселов Ф.В. Системный взгляд на эффективность развития гидроэнергетики России / Ф.В. Веселов, О.В. Маширова, Т.А. Радченко, Р.Н. Бердников, И.О. Волкова, С.В. Сасим // Энергетическая политика. 2024. № 1(192). С. 14-27.
Владимирова М.Р. Бэггинг нейронных сетей в задаче анализа биологической активности ядерных рецепторов / М.Р. Владимирова, М.С. Попова // Машинное обучение и анализ данных. 2016. № 2(3). С. 349-363.
Кротова О.С. Применение ансамблевых методов машинного обучения для диагностики сахарного диабета // Информация и образование: границы коммуникаций. 2018. № 10(18). С. 87-89.
Митрофанов С.В. Разработка системы поддержки принятия решений на основе многокритериальной оптимизации состава агрегатов ГЭС: дис. канд. энерг. наук: 05.14.02. Новосибирск, 2013. 213 с.
Овчаренко В.Р. Применение искусственного интеллекта при обучении чтению на английской языке / В.Р. Овчаренко, М. Чжан // Дистанционные образовательные технологии. Симферополь: Ариал, 2024. С. 171-174.
Петрова А.К. Применение алгоритма стекинга для идентификации отклонений в данных газотранспортной сети / А.К. Петрова, С.Е. Абрамкин // V Международная конференция по нейронным сетям и нейротехнологиям (NeuroNT'2024) (Санкт-Петербург, 20 июня 2024 г.). Санкт-Петербургский государственный электротехнический университет ЛЭТИ им. В.И. Ульянова (Ленина), 2024. С. 211-214.
Сергеев Н.Н. Обзор международного опыта в прогнозировании генерации возобновляемых источников энергии с помощью методов машинного обучения / Н.Н. Сергеев, П.В. Матренин // iPolytech Journal. 2023. Т. 27. № 2. С. 354-369.
Соболева Е.В. Возможности применения технологий искусственного интеллекта в психологической практике / Е.В. Соболева, М.А. Соболев // Вестник совета молодых ученых и специалистов Челябинской области. 2024. Т. 1. № 1(44). C. 39-42.