На главную страницу Rambler's Top100

О журнале

Архив

Разделы

Полезные ссылки

Rambler's Top100

Yandex.CN Сделано для России , тематический каталог отборных русских сайтов.

 

В. И. Гнатюк

доктор технических наук, профессор, академик РАЕН, инженер-электромеханик
  • Энергобезопасность и энергосбережение №1, 2009

    Прогнозирование электропотребления на основе GZ-анализа

    Международная организация по стандартизации (ISO), объединяющая 157 стран-членов, начала разработку нового международного стандарта ISO 50001 Energy management systems — Requirements with guidance for use (Системы энергоменеджмента — Требования с руководством по использованию). С этой целью создан новый технический комитет ИСО/ТК 242 "Энергоменеджмент" (ISO/TC 242 Energy Management), 1-е пленарное заседание которого состоялось 8-10 сентября прошлого года в США (Вашингтон, округ Колумбия). Комитет намерен подготовить стандарт ISO 50001 к публикации уже к концу 2010 г.

    Введение

    Основу энергосбережения составляет планомерная реализация широкого комплекса технических и технологических мер, которые должны осуществляться в рамках процедур оптимального управления электропотреблением инфраструктуры на системном уровне. Целью управления является упорядочение электропотребления объектами инфраструктуры, экономия направленных на оплату за потребленную электроэнергию средств, полученная за счет организационных мероприятий, а также создание научно обоснованных предпосылок для проведения целенаправленных углубленных энергетических обследований с последующей реализацией технических и технологических мер по энергосбережению. Под инфраструктурой в данном случае понимается техноценоз (регион в целом, город, район, крупное предприятие, фирма, район нефте- и газодобычи, аграрная инфраструктура, группировка войск, сеть магазинов или заправочных станций и т.п.).

    Постановка задачи

    В качестве основного метода решения задач оптимального управления электропотреблением техноценоза выступает ранговый анализ, который позволяет в процессе энергосбережения задействовать системный уровень оперативного и структурного управления, который ранее не использовался. При этом в реальном масштабе времени осуществляются процедуры формирования базы данных по электропотреблению, выявления аномальных объектов, прогнозирования и нормирования. Это дает возможность техноценозу извлекать из процесса энергосбережения дополнительные конкурентные преимущества и ресурсы экономии. Уже первый (организационный) этап реализации предлагаемой методики позволяет экономить до 10 — 15% от объемов ежегодных выплат за потребляемую электроэнергию без капитальных вложений. Последующее внедрение энергосберегающих технологий и технических решений еще больше увеличивает экономию. В свою очередь, менеджмент техноценоза получает инструментарий, позволяющий эффективно управлять электротехническим комплексом в условиях развивающейся инфраструктуры.

    Оптимальное управление электропотреблением объектов техноценоза [1] на системном уровне осуществляется в рамках связанной методики, включающей ряд этапов. На этапе статистического анализа осуществляется обработка данных по электропотреблению, которая включает взаимосвязанные процедуры рангового анализа (формирования базы данных, интервального оценивания, прогнозирования и нормирования) (рис. 1) [2—6].

    С целью повышения точности расчетов стандартные процедуры рангового анализа дополняются соответствующими тонкими процедурами: верификацией базы данных, а также дифлекс-, GZ- и ASR-анализом рангового параметрического распределения (рис. 1) [4—7]. Рассмотрим центральную тонкую процедуру рангового анализа, существенно уточняющую процедуру прогнозирования — GZ-анализ (рис. 2).

    Прогнозирование — процедура оптимального управления ресурсами техноценоза, заключающаяся в определении вероятных значений функциональных параметров в будущем. Прогнозирование может выполняться на основе статической модели, отражающей процесс электропотребления на год вперед. Динамическое стохастическое моделирование позволяет осуществлять прогноз на среднесрочную перспективу (5 — 7 лет) [5—7]. Применительно к техноценозу прогнозирование может осуществляться G-методами (Gauss-методами, основанными на гауссовой математической статистике), Z-методами (Zipf-методами, основанными на ципфовой математической статистике) и синтетическими GZ-методами, органично сочетающими их достоинства. Последние предполагают выполнение предварительной тонкой процедуры GZ-анализа (Gauss-Zipf analysis).

    GZ-анализ может реализовываться в двух вариантах, первый из которых является упрощенным эвристическим, а второй — основным критериальным (рис. 2). Эвристический вариант как основной метод прогнозирования применяется только для оценочных расчетов, причем на сравнительно небольших базах данных. Кроме того, с его помощью на предварительном этапе синтезируется так называемая GZ-матрица методов прогнозирования, необходимая для процедуры юстировки ключевых параметров критериального варианта GZ-анализа.

    На рис. 3 приведена упрощенная структура прогнозной базы данных техноценоза по электропотреблению.

    Из базы данных предварительно осуществляется выделение следующих информационных подсистем. Фактические известные данные по электропотреблению на текущем временном интервале составляют «Вектор верификации». Прогнозируемые данные на будущем временном интервале определяются как «Вектор прогнозирования». Все остальные известные данные образуют «Матрицу данных» [6].

    Процесс прогнозирования электропотребления объектов техноценоза с помощью эвристического варианта GZ-анализа реализуется следующим образом (рис. 2 — 4). На первом этапе в качестве базы прогнозирования используется матрица данных, применительно к которой реализуются последовательно все имеющиеся в распоряжении методы прогнозирования. Статистическое сравнение полученных прогнозных результатов с соответствующими данными вектора верификации позволяет для каждого из объектов определить наиболее эффективный метод. Затем вектор верификации присоединяется к матрице данных и осуществляется окончательный прогноз электропотребления, причем процедура для каждого объекта осуществляется именно тем методом, который на первом этапе был определен для него как наиболее эффективный. В базе данных прогнозирования могут использоваться самые различные методы (как G-, так и Z-). В любом случае в процессе реализации эвристического варианта GZ-анализа выбирается наиболее эффективный из них [4—7].

    Для прогнозирования электропотребления объектов G-методами в основном используются модели авторегрессионного скользящего среднего (см. рис. 5 для примера, показанного на рис. 4), декомпозиции временного ряда, а также различные вариации методов на основе анализа сингулярного спектра траекторной матрицы временного ряда [8]. В процессе прогнозирования электропотребления техноценоза Z-методами должны учитываться техноценологические свойства, сводящиеся в конечном итоге к понятию устойчивости гиперболических ранговых параметрических распределений (см. рис. 6 для примера, показанного на рис. 4). Здесь, как правило, находят применение методы без фиксированной первой точки, с фиксированной первой точкой, а также с делением на кастовые зоны. Полная совокупность методов составляет GZ-модуль прогнозирования [4—7].

    Критериальный вариант GZ-анализа (рис. 2) позволяет еще до начала собственно процедуры прогнозирования осуществить выбор G- или Z-методологии, что существенно ускоряет расчеты и повышает их точность (положительный эффект пропорционален размерам базы данных). Как следует из закона оптимального построения техноценозов, в качестве критерия выбора метода следует рассматривать соотношение объемов системного и гауссового ресурсов кластеров техноценоза (рис. 7) [5,6].

    Как следует из уравнений закона оптимального построения техноценозов, гауссовый ресурс кластера равен [5,6]:

    (1)

    где W(r) — ранговое параметрическое распределение техноценоза по электропотреблению;
    Wg(r) — гауссовое распределение, соответствующее кластерному распределению параметров в ранговой дифференциальной форме;
    W2 — значение электропотребления, соответствующее правой ранговой границе кластера.

    При этом системный ресурс кластера техноценоза определяется следующим образом [5,6]:

    (2)

    Как показывает анализ, процедура кластеризации ранговых параметрических распределений по исследуемому параметру существенно затруднена из-за негауссовости распределений, что неотвратимо ведет к негауссовости кластеров. При этом нарушается главный минимаксный критерий кластер-анализа (то, что статистически внутри кластера функциональные параметры объектов должны распределяться по нормальному закону). Выход из этого положения возможен в результате увеличения количества кластеров (стремлении размера кластера к нулю), при этом системный и гауссовый ресурсы кластеров в пределе сводятся соответственно к системному и гауссовому доверительным интервалам объектов и рангов [6].

    Под системным доверительным интервалом рангового параметрического распределения техноценоза понимается совокупность верхних и нижних доверительных границ, каждая из которых получается в результате статистической обработки выборки значений параметров, соответствующих данному рангу на протяжении определенного количества временных интервалов (независимо от объектов, которые «проходят» через ранг в процессе функционирования) [4,6]. Для определения ширины доверительного интервала используется понятие интерквартильного размаха применительно к выборке значений электропотребления, соответствующих данному рангу на протяжении ряда временных интервалов [6]:

    (3)

    где Wq0,75 — верхний квартиль распределения значений электропотребления (квантиль порядка 0,75);
    Wq0,25 —инжний квартиль (квантиль порядка 0,25).

    Квартили распределения определяются как значение электропотребления, при котором функция распределения становится равной соответствующей величине (0,75 или 0,25). Если исходить из того, что распределение значений электропотребления для одного ранга на протяжении ряда временных интервалов является нормальным [7], то ширина интерквартильного размаха может быть определена на основе решения относительно переменной DWz следующего уравнения [6]:

    (4)

    где DWz /2 — ширина системного доверительного интервала в одну сторону от математического ожидания (в расчетах принимается эмпирическое среднее);
    s — среднеквадратичное отклонение экспериментальных точек от математического ожидания (в расчетах принимается эмпирический стандарт);
    Ф -1(t) — обратная функция Лапласа;
    pd — априорно принимаемая доверительная вероятность (для получения интерквартильного размаха должна быть принята равной 0,95).

    Для моделирования функции распределения нормального распределения в (4) применяется стандартная функция Лапласа:

    (5)

    где x — формальная переменная интегрирования.

    Системный доверительный интервал является мерилом системного ресурса объекта, «занимающего» в рассматриваемый момент времени определенный ранг на ранговом параметрическом распределении, и характеризует разброс параметров техноценоза, при котором его функционирование можно считать нормальным (рис. 8). Фактически этот интервал отражает требования или ограничения, которые система выдвигает объектам, чтобы обеспечить свое устойчивое инерционное функционирование. Если эмпирическое значение параметра объекта (в частности — электропотребления) выходит за пределы системного интервала, то это означает, что объект не подчиняется системным требованиям и в этом смысле проявляет индивидуальность. Сама же величина отклонения может рассматриваться как мера индивидуальности данного объекта.

    Ширина системного доверительного интервала определяется предысторией развития техноценоза, будучи взятого в целом, и если она невелика, то это свидетельствует о том, что техноценоз развивается стабильно и сбалансировано, все изменения в нем происходят плавно. Напротив, широкий интервал свидетельствует о резких структурных изменениях. Методика определения системного интервала позволяет противопоставить его гауссовому доверительному интервалу, который определяется применительно не к рангу распределения, а к объекту техноценоза.

    Под гауссовым доверительным интервалом рангового параметрического распределения техноценоза понимается совокупность верхних и нижних доверительных границ, каждая из которых получается в результате статистической обработки выборки значений параметров, соответствующих данному объекту на протяжении определенного количества временных интервалов (независимо от рангов, которые он принимает в процессе функционирования) [4,6]. Для определения ширины гауссового доверительного интервала также используется понятие интерквартильного размаха применительно к выборке значений электропотребления объекта на протяжении ряда временных интервалов [6]:

    (6)

    Если исходить из того, что распределение значений электропотребления для одного объекта на протяжении ряда временных интервалов также является нормальным [7], то ширина интерквартильного размаха может быть определена на основе решения относительно переменной следующего уравнения, аналогичного (4) [6]:

    (7)

    Гауссовый доверительный интервал является мерилом гауссового ресурса объекта на ранговом параметрическом распределении и характеризует разброс параметров объекта, при которых его функционирование можно считать нормальным (независимо от поведения техноценоза). Ширина данного интервала задается предысторией развития объекта, и чем ширина меньше, тем стабильней его функционирование. В случае выхода эмпирического значения параметра объекта за границы гауссового интервала можно говорить, что на самом объекте произошли резкие изменения (осуществлена модернизация оборудования, внедрены новые технологии) либо система предъявила новые требования, для выполнения которых объект вынужден резко изменить свой режим функционирования (рис. 9).

    Таким образом, для каждого объекта можно получить отношение системного и гауссового доверительных интервалов, которое называется коэффициентом когерентности и показывает степень согласованности поведения объекта по отношению к техноценозу [4,6]:

    (8)

    где KK — количество кластеров техноценоза;
    KO — количество объектов техноценоза.

    Итак, теоретически коэффициент когерентности может быть определен как предел отношения системного ресурса кластера (выражение (2)) к его гауссовому ресурсу (1) при условии сужения ширины кластера до нуля (устремления количества кластеров к общему количеству объектов техноценоза). Это видно на рис. 7. Эмпирически же, как указано выше, коэффициент когерентности может быть определен как отношение системного доверительного интервала (см. выражение (3)) к гауссовому (выражение (6)). Если коэффициент когерентности близок к единице (то есть системный и гауссовый интервалы примерно равны), то можно говорить о согласованном поведении данного объекта и техноценоза.

    Дальнейший более глубокий GZ-анализ техноценоза заключается в определении так называемого кумулятивного когерент-фактора (coherent factor), который равен отношению суммарного системного доверительного интервала всех объектов техноценоза к соответствующему суммарному гауссовому доверительному интервалу:

    (9)

    где n — количество объектов техноценоза.

    Когерент-фактор техноценоза показывает, в какой степени его системное поведение согласовано с индивидуальным поведением объектов по отдельности (под поведением здесь, безусловно, понимаются свойства параметрических временных рядов объектов и техноценоза). Затем могут быть получены динамические когерент-функции (coherent function):

    (10)

    где t — время функционирования техноценоза.

    Когерент-функции позволяют оценивать в любой момент времени и прогнозировать изменение в будущем динамических свойств как техноценоза в целом, так и его объектов в частности.

    Когерент-параметры также могут существенно оптимизировать процесс прогнозирования в техноценозе. В частности, как показывают исследования и реализация на практике, коэффициент когерентности является индикатором выбора наиболее эффективного метода прогнозирования для рассматриваемого объекта. При сравнительно больших значениях коэффициента лучше работают G-методы, в противном случае — Z-методы, а в качестве критерия выбора может применяться альтернатива [6]:

    (11)

    где K1GZ и K2GZ — соответственно левое и правое критериальные значения коэффициента когерентности;
    KmnGZ и KmxGZ — соответственно минимальное и максимальное значения коэффициента когерентности.

    Критериальные значения коэффициента когерентности в выражении (11) определяются на основе юстировки базы методов прогнозирования к базе данных по электропотреблению. Здесь находит применение эвристический вариант GZ-анализа, целью которого является определение так называемой GZ-матрицы, представляющей собой таблицу методов прогнозирования, определенных как наиболее эффективные применительно к объектам на соответствующих временных интервалах (рис. 10) [6].

    Строки GZ-матрицы — объекты, столбцы — последние пять временных интервалов предыстории функционирования. Элемент матрицы — код метода, который дает для объекта наименьшую относительную ошибку. Кодировка методов прогнозирования в GZ-матрице следующая (см. рис. 1): 1 — G-метод на основе АРСС; 2 — G-метод на основе МДВР; 3 —

    G-метод на основе SSA; 4 — Z-метод БПТ; 5 — Z-метод СПТ; 6 — Z-метод ДКЗ.

    Следует отметить, что GZ-матрица получается в результате последовательной многократной реализации различных методов прогнозирования применительно к базе данных по электропотреблению. При этом глубина матрицы данных меняется прибавлением вектора данных по одному временному интервалу (начиная от минус пятого), и применительно к каждому состоянию матрицы данных выполняются процедуры эвристического варианта GZ-анализа (см. комментарии к рис. 2 и 3) [6].

    Параллельно с GZ-матрицей формируется матрица коэффициентов когерентности объектов на последних пяти временных интервалах, имеющая ту же размерность (матрица G, рис. 11). При этом расчет коэффициентов когерентности каждый раз осуществляется на основе статистической обработки выборок значений электропотребления из матрицы данных соответствующей глубины [6]. В итоге каждому объекту на каждом временном интервале можно соотнести два параметра: код наиболее эффективного метода прогнозирования и коэффициент когерентности.

    Статистическое сравнение GZ-матрицы и матрицы коэффициентов когерентности G позволяет получить параметры для выражения (11). При этом граничные значения коэффициента KmnGZ и KmxGZ получаются путем извлечения минимального и максимального элементов из матрицы G:

    (12)

    Значения левого и правого критериальных значений коэффициента когерентности K1GZ и K2GZ получаются на основе предварительного анализа чувствительности, в ходе которого методом случайного поиска осуществляется варьирование с целью определения таких значений, при которых частота встречаемости в GZ-матрице кодов G- и Z-методов различалась бы в наибольшей степени. Частота встречаемости кодов определяется путем статистической обработки предварительно векторизованной GZ-матрицы. Поиск осуществляется в разделенной пополам области определения, в качестве которой выступает векторизованная матрица коэффициентов когерентности G, путем численного решения задачи (рис. 12) [6]:

    (13)

    где CG — количество элементов GZ-матрицы, имеющих коды, соответствующие G-методам (1 — 3);
    CZ — количество элементов GZ-матрицы, имеющих коды, соответствующие Z-методам (4 — 6);
    CS — общее количество элементов GZ-матрицы.

    Следует подчеркнуть, что целевая функция (13) формально прописана неоднозначно, так как в ее левой части предусмотрены операции над GZ-матрицей, а в правой записаны условия, касающиеся матрицы коэффициентов когерентности G. Однако данная неоднозначность снимается однозначным соответствием между элементами двух матриц.

    Оптимизационная задача (13) неизбежно порождает область неопределенности, в которой G- и Z-методы прогнозирования, как наиболее эффективные, встречаются примерно с одинаковой частотой (см. выражение (11) и рис. 12). В области неопределенности предлагается использовать комбинацию применяемых методов прогнозирования электропотребления. Прогноз в заданный момент времени вычисляется по отдельности каждым методом с использованием информации, доступной на интервале предыстории. Окончательное прогнозное значение электропотребления получается как билинейная комбинация всех применяемых методов [9]:

    (14)

    где Wt+1— прогнозное значение электропотребления на момент времени (t+1) (см. рис. 3);
    KФ — количество учитываемых факторов;
    jit+1 — весовой коэффициент i-го фактора;
    KM — количество применяемых методов прогнозирования;
    Yijt+1 — весовой коэффициент i-го метода прогнозирования;
    Wijt+1 — прогнозное значение электропотребления, полученное j-м методом с учетом i-го фактора.

    Весовые коэффициенты факторов, воздействующих на процесс электропотребления, определяются на основе фактор-анализа [8], а весовые коэффициенты каждого из методов прогнозирования вычисляются как частота встречаемости данного метода прогнозирования как лучшего в области неопределенности GZ-матрицы:

    (15)

    где CBN — количество элементов области неопределенности GZ-матрицы, где метод фиксируется как лучший;
    CSN — общее количество элементов области неопределенности;
    GZ — GZ-матрица лучших методов прогнозирования;
    G — G-матрица коэффициентов когерентности.

    К системе (15) необходимо дать следующие важные пояснения. Во-первых, для выполнения нормировочного условия (второе уравнение) должны быть рассмотрены все элементы области неопределенности GZ-матрицы. Во-вторых, границы самой области неопределенности фиксируются по соответствующим критериальным значениям коэффициента когерентности G-матрицы (третье уравнение системы). В-третьих, однозначное соответствие между GZ-матрицей и матрицей коэффициентов когерентности устанавливается по индексам строк и столбцов (четвертое выражение).

    Таким образом, ранговый анализ техноценоза по электропотреблению включает процедуры интервального оценивания, прогнозирования и нормирования. Прогнозирование осуществляется с использованием гауссовых и ципфовых (G- и Z-) методов. Более тонкий анализ рангового параметрического распределения, осуществляемый с помощью процедур GZ-анализа, позволяет существенно повысить эффективность прогнозирования (см. рис. 13 для примера, подробно рассмотренного в работе [6]).

    В качестве оценочного параметра на рис. 13 используется средняя относительная ошибка прогноза за пять лет:

    (16)

    где n — количество объектов исследуемого техноценоза;
    Р и П — индексы реального и прогнозного электропотребления.

    Из рис. 13 видно, что наивысшей (в известном смысле — абсолютной) точностью обладает эвристический GZ-метод. Критериальный вариант GZ-метода прогнозирования существенно лучше любого отдельно взятого G- или Z-метода (как представляется, это характерно для любого техноценоза). Что же касается отдельно взятых G- и Z-методов, то здесь картина несколько иная. Для разных техноценозов на различных этапах лучшим может оказаться, по сути, любой из методов. Из отдельных методов для данного конкретного техноценоза на данном этапе его развития наиболее эффективным оказался Z-метод без фиксированной первой точки [6]. Из G-методов наилучшей точностью обладает метод, основанный на декомпозиции временного ряда. Как показано в работах [4—7], погрешность прогнозирования электропотребления на год вперед с применением процедур критериального GZ-анализа для отдельных объектов может составить 4 — 10%. При этом погрешность прогноза для техноценоза в целом не превышает 1,5 — 2%, что удовлетворяет современным требованиям.

    Выводы

    На этапе статистического анализа и построения эмпирической модели процесса электропотребления осуществляется глубокая обработка данных по электропотреблению объектов, которая включает интервальное оценивание, прогнозирование и нормирование. Прогнозирование электропотребления объектами осуществляется с использованием гауссовых и ципфовых (G- и Z-) методов. Более тонкий анализ рангового параметрического распределения, осуществляемый с помощью процедур GZ-анализа, позволяет существенно повысить эффективность прогнозирования. Как показано в работах [4—7], погрешность прогнозирования электропотребления с применением процедур критериального GZ-анализа для отдельных объектов может составить 4 — 10%. При этом погрешность прогноза для техноценоза в целом, как правило, не превышает 1,5 — 2%.

    Литература

    1. Кудрин Б. И. Введение в технетику. – Томск: ТГУ, 1993. – 552 с.

    2. Гнатюк В. И., Лагуткин О. Е. Ранговый анализ техноценозов. – Калининград: БНЦ РАЕН – КВИ ФПС РФ, 2000. – 86 с.

    3. Гнатюк В. И., Северин А. Е. Ранговый анализ и энергосбережение. – Калининград: КВИ ФПС РФ, 2003. – 120 с.

    4. Гнатюк В. И. Интернет-сайт «Техника, техносфера, энергосбережение». – М., 2000 – 2009. – http://www.gnatukvi.ru.

    5. Гнатюк В. И. Закон оптимального построения техноценозов. – Выпуск 29. Ценологические исследования. – М.: Изд-во ТГУ – Центр системных исследований, 2005. – 384 с.

    6. Гнатюк В. И. Закон оптимального построения техноценозов. – Компьютерная версия, перераб. и доп. – М.: Изд-во ТГУ – Центр системных исследований, 2005 – 2009. – http://gnatukvi.ru/ind.html.

    7. Гнатюк В. И. и др. // Электрика. 2003. – № 2 – 6; 2004. – № 7; 2005. – № 2; 2006. – № 1, 7, 12; 2007. – № 2, 3, 7, 8, 11, 12; 2008. – № 4, 8.

    8. Данилов Д. Л., Жиглявский А. А. Главные компоненты временных рядов: Метод «Гусеница». – СПб.: СПбГУ, 1997. – 308 с.

    9. Воронцов К. В., Егорова Е. В. Динамически адаптируемые композиции алгоритмов прогнозирования. – М.: Искусственный интеллект, 2006. – С. 277 – 280 с.

  • © «Московский институт энергобезопасности и энергосбережения»
    Полное или частичное использование материалов возможно только с разрешения редакции.

    Зарегистрирован в Федеральной службе по надзору в сфере массовых коммуникаций, связи и охраны культурного наследия. Свидетельство ПИ № ФС77-28742

    webmaster: webmaster@endf.ru