Відмінності між версіями «Методи прогнозування водоспоживання»

Рядок 149: Рядок 149:
 
*'''''не є придатним для прогнозування погодинних даних та довготермінового прогнозування.'''''<br>
 
*'''''не є придатним для прогнозування погодинних даних та довготермінового прогнозування.'''''<br>
  
== Методи Бокса-Дженкінса (ARIMA)==
+
= Методи Бокса-Дженкінса (ARIMA)=
  
 
В середині 90-х років минулого століття був розроблений принципово новий і достатньо могутній клас алгоритмів для прогнозування тимчасових рядів. Велику частину роботи по дослідженню методології і перевірці моделей була проведена двома статистиками, Г.Е.П. Боксом ([http://en.wikipedia.org/wiki/George_E._P._Box G.E.P. Box]) і Г.М. Дженкинсом ([http://en.wikipedia.org/wiki/Gwilym_Jenkins G.M. Jenkins]). З тих пір побудова подібних моделей і отримання на їх основі прогнозів іноді називатися методами Бокса-Дженкінса. В це сімейство входить декілька алгоритмів, найвідомішим і використовуваним з них є алгоритм ARIMA. Він вбудований практично в будь-який спеціалізований пакет для прогнозування. У класичному варіанті ARIMA не використовуються незалежні змінні. Моделі спираються тільки на інформацію, що міститься в передісторії прогнозованих рядів, що обмежує можливості алгоритму. В даний час в науковій літературі часто згадуються варіанти моделей ARIMA, що дозволяють враховувати незалежні змінні. У даній доповіді вони розглядатись не будуть, обмежимось тільки загальновідомим класичним варіантом. На відміну від розглянутих раніше методик прогнозування тимчасових рядів, в методології ARIMA не передбачається якої-небудь чіткої моделі для прогнозування даної тимчасової серії. Задається лише загальний клас моделей, що описують часовий ряд і що дозволяють якось виражати поточне значення змінної через її попередні значення. Потім алгоритм, підстроюючи внутрішні параметри, сам вибирає найбільш відповідну модель прогнозування. Як вже наголошувалося вище, існує ціла ієрархія моделей Бокса-Дженкінса. Логічно її можна визначити так
 
В середині 90-х років минулого століття був розроблений принципово новий і достатньо могутній клас алгоритмів для прогнозування тимчасових рядів. Велику частину роботи по дослідженню методології і перевірці моделей була проведена двома статистиками, Г.Е.П. Боксом ([http://en.wikipedia.org/wiki/George_E._P._Box G.E.P. Box]) і Г.М. Дженкинсом ([http://en.wikipedia.org/wiki/Gwilym_Jenkins G.M. Jenkins]). З тих пір побудова подібних моделей і отримання на їх основі прогнозів іноді називатися методами Бокса-Дженкінса. В це сімейство входить декілька алгоритмів, найвідомішим і використовуваним з них є алгоритм ARIMA. Він вбудований практично в будь-який спеціалізований пакет для прогнозування. У класичному варіанті ARIMA не використовуються незалежні змінні. Моделі спираються тільки на інформацію, що міститься в передісторії прогнозованих рядів, що обмежує можливості алгоритму. В даний час в науковій літературі часто згадуються варіанти моделей ARIMA, що дозволяють враховувати незалежні змінні. У даній доповіді вони розглядатись не будуть, обмежимось тільки загальновідомим класичним варіантом. На відміну від розглянутих раніше методик прогнозування тимчасових рядів, в методології ARIMA не передбачається якої-небудь чіткої моделі для прогнозування даної тимчасової серії. Задається лише загальний клас моделей, що описують часовий ряд і що дозволяють якось виражати поточне значення змінної через її попередні значення. Потім алгоритм, підстроюючи внутрішні параметри, сам вибирає найбільш відповідну модель прогнозування. Як вже наголошувалося вище, існує ціла ієрархія моделей Бокса-Дженкінса. Логічно її можна визначити так

Версія за 01:41, 22 лютого 2012

Прізвище Чура
Ім'я Наталя
По-батькові Ярославівна
Факультет ФІС
Група СНм-51
Залікова книжка СНм-11-256
Репозиторія
Презентація доповіді на тему Методи прогнозування водоспоживання
є розміщеною в Репозиторії.


Цілодобове забезпечення мешканців водою на сьогоднішній день для багатьох міст України є досить актуальною проблемою. Незважаючи на те, що останнім часом йде оновлення водопровідних мереж та насосного обладнання, левова їх частка відслужила свій вік. Для збільшення терміну експлуатації такого технологічного устаткування, комунальні підприємства встановлюють різноманітні графіки подачі води населенню, що є негативним. Поряд з цим на насосних станціях активно відбувається впровадження такого засобу енергозбереження як частотно регульований електропривод. Забезпечення постійного тиску води (сигнал завдання) в трубопроводі. Недоліком такого алгоритму керування є те, що в години пікового водоспоживання частина мешканців недоотримують воду. Дана проблема може бути вирішена коли сигнал завдання є функцією від споживання води з трубопроводу. Такий підхід в умовах водопроводів значної довжини та складної конфігурації, передбачає наявність прогнозованого значення рівня споживання води.
Вирішення проблем, пов’язаних із енерго- та ресурсозбереженням у системах водопостачання , зокрема: зонування водопостачальної мережі, зниження тисків та підбір діаметрів будинкових лічильників водопостачальної системи, можна здійснити шляхом прогнозування водоспоживання.

Поняття водоспоживання

Термін “водоспоживання” означає “об'єм води, спожитої користувачами за одиницю часу”.
Водоспоживанням називається процес споживання води користувачами системи питного водопостачання.
Об’єктом дослідження є погодинна інтенсивність водоспоживання - об’єм води у літрах, спожитий певною групою користувачів за одну годину.

Види прогнозу водоспоживання

  • оперативний - прогноз водоспоживання на наступну годину (у межах поточної доби);
  • короткостроковий - прогноз водоспоживання на наступну добу (доба-тиждень-місяць);
  • довгостроковий - прогноз водоспоживання на наступний тиждень чи місяць (місяць-квартал-рік).

Моделі прогнозу водоспоживання

Актуальною є розробка методів прогнозування водоспоживання як засобу визначення аварійних станів системи водопостачання. Зокрема, методи прогнозування повинні дозволяти оцінювання точності прогнозу. Найбільш корисним у практичних застосуваннях є інтервальний прогноз водоспоживання. З його допомогою можна отримати довірчі інтервали, які накривають прогнозовані значення водоспоживання із певною заданою довірчою ймовірністю.
Серед математичних моделей та методів аналізу та оперативного прогнозу водоспоживання найбільш відомими є моделі:

  • експоненційного згладження Тейлора (яка використовується у методі адитивних та мультиплікативних тенденцій Холта-Вінтерса);
  • регресійна;
  • подвійно-сезонна мультиплікативна ARIMA;
  • узагальненої авторегресійної умовної гетероскедастичності GARCH;
  • штучної нейронної мережі;
  • модифікації та комбінації наведених вище моделей.

Усі згадані моделі враховують стохастичний характер водоспоживання, але не пояснюють механізму його утворення окремими споживачами, ймовірнісний опис цих моделей здійснюється лише в рамках моментних функції 1-го та 2-го порядків. Самі моделі використані для передбачення подобового водоспоживання в найближчих 7-денних та щотижневого водоспоживання в 365-денних часових інтервалах.

Модель експоненційного згладження Тейлора

Принцип експоненційного згладжування дає змогу прогнозувати характеристики параметрів контрольованих процесів у разі допущення незмінності їх моделей як на ділянці спостереження за цими процесами, так і на ділянці прогнозування. Обчислення оцінки невідомих параметрів моделей дозволяють отримати залежності, які відповідають однаково добре (з погляду вибраного критерію) всім даним, які є про процес. По мірі надходження нової інформації про процес, отримані оцінки уточнюються. У разі прийнятого допущення вся інформація про процес (як поточна, так і отримана в минулому) мас однакову цінність і використовується в розрахунках однаковою мірою.
Ідея експоненційного згладжування заснована на припущенні, що прогнозоване значення функції X(t) може бути виражене рядом Тейлора:

[math]\lt br\gt X_{t+\Delta t}^{'}=x_{t}+\frac{dx}{dt}\Delta t+\frac{1}{2!}\frac{d^{2} x}{dt^{2}}(\Delta t)^{2}+...+ \frac{1}{n!}\frac{d^{n} x}{dt^{n}}(\Delta t)^{n}[/math]

де [math]X_{t+\Delta t}^{'}[/math] – прогнозоване значення [math]X(t)[/math];
[math]\Delta t[/math] – тривалість часу, на який здійснюється прогноз;
[math]x(t)[/math] – поточне значення спостережувального сигналу.
Члени ряду Тейлора виразимо формулами експоненційного згладжування:

[math]\lt br\gt \bar{q}_{t}=2S_{t}^{(1)}-S_{t}^{(2)}[/math]
[math]\lt br\gt \frac{dq}{dt}\Delta t=\frac{\alpha}{1-\alpha}( S_{t}^{(1)}-S_{t}^{(2)})[/math]

де [math]S_{t}^{(1)}[/math] і [math]S_{t}^{(2)}[/math] – експоненційно згладжені величини першого і другого порядків; α – вага поточного спостереження. Очевидно, що [math]S_{t}[/math] є лінійною комбінацією всіх спостережень, вага яких зменшується в геометричній прогресії. Поточне спостереження [math]\bar{q}_{t}[/math] має вагу [math]\alpha[/math], що лежить в межах від 0 до 1, граничне значення [math]\alpha=1[/math] означає, що ми абсолютно не довіряємо попереднім даним про процес і за згладжене значення приймаємо поточну величину [math]\bar{q}_{t}[/math]. При [math]\alpha=0[/math] значення [math]S_{t}[/math] є настільки стабільним, що ми не використовуємо нову інформацію про процес.
Недоліком методу Хольта-Вінтерса є те, що модель не дозволяє максимально точно прогнозувати погодинне водоспоживання.
Висновки. Регулювання параметрів системи водопостачання за величинами, пропорційними статистичним параметрам, зменшує видатки на регулювання і регулювальні пристрої, зменшує збитки під час роботи споживачів електричної енергії від неякісних параметрів електричної енергії, що приводить до економії витрат на експлуатацію елементів та системи водопостачання і економію коштів як у споживачів, так і в самій системі.

Регресійні методи прогнозування

Існує прогнозована змінна Y (залежна змінна) і відібраний заздалегідь комплект змінних, від яких вона залежить, [math]X_{1},X_{2},...,X_{N}[/math](незалежні змінні). Природа незалежних змінних може бути різною.
Модель множинної регресії в загальному випадку описується виразом:

[math]\lt br\gt Y=F\left( X_{1},\,X_{2},\,...,\,X_{N} \right)+\varepsilon[/math]

У простішому варіанті лінійної регресійної моделі залежність залежної змінної від незалежних має вигляд:

[math]Y=\beta _{0}+\beta _{1}X_{1}+\beta _{2}X_{2}+...+\beta _{N}X_{N}+\varepsilon[/math]

Тут [math]\beta _{0},\beta _{1},...,\beta _{N} -[/math] підібрані коефіцієнти регресії;
[math]\varepsilon -[/math] компонента помилки. Передбачається, що всі помилки незалежні і нормально розподілені. Для побудови регресійних моделей необхідно мати базу даних спостережень приблизно такого вигляду:

  Змінні
 
Незалежні
Залежна
X1 X2 ... XN Y
1 x_11 x_12 ... x_1N Y_1
2 x_21 x_22 ... x_2N Y_2
... ... ... ... ... ...
m x_M1 x_M2 ... x_MN Y_m

За допомогою таблиці значень минулих спостережень можна підібрати (наприклад, методом найменших квадратів) коефіцієнти регресії, побудувавши тим самим модель.
При роботі з регресією треба дотримуватися певної обережності і обов'язково перевірити на адекватність знайдені моделі. Існують різні способи такої перевірки. Обов'язковим є статистичний аналіз залишків, тест Дарбіна-Уотсона. Корисно, як і у випадку з нейронними мережами, мати незалежний набір прикладів, на яких можна перевірити якість роботи моделі.
Недоліки методу прогнозу на основі регресійної моделі:

  • похибки прогнозу водоспоживання у літній період є неприпустимо великими;
  • не є придатним для прогнозування погодинних даних та довготермінового прогнозування.

Методи Бокса-Дженкінса (ARIMA)

В середині 90-х років минулого століття був розроблений принципово новий і достатньо могутній клас алгоритмів для прогнозування тимчасових рядів. Велику частину роботи по дослідженню методології і перевірці моделей була проведена двома статистиками, Г.Е.П. Боксом (G.E.P. Box) і Г.М. Дженкинсом (G.M. Jenkins). З тих пір побудова подібних моделей і отримання на їх основі прогнозів іноді називатися методами Бокса-Дженкінса. В це сімейство входить декілька алгоритмів, найвідомішим і використовуваним з них є алгоритм ARIMA. Він вбудований практично в будь-який спеціалізований пакет для прогнозування. У класичному варіанті ARIMA не використовуються незалежні змінні. Моделі спираються тільки на інформацію, що міститься в передісторії прогнозованих рядів, що обмежує можливості алгоритму. В даний час в науковій літературі часто згадуються варіанти моделей ARIMA, що дозволяють враховувати незалежні змінні. У даній доповіді вони розглядатись не будуть, обмежимось тільки загальновідомим класичним варіантом. На відміну від розглянутих раніше методик прогнозування тимчасових рядів, в методології ARIMA не передбачається якої-небудь чіткої моделі для прогнозування даної тимчасової серії. Задається лише загальний клас моделей, що описують часовий ряд і що дозволяють якось виражати поточне значення змінної через її попередні значення. Потім алгоритм, підстроюючи внутрішні параметри, сам вибирає найбільш відповідну модель прогнозування. Як вже наголошувалося вище, існує ціла ієрархія моделей Бокса-Дженкінса. Логічно її можна визначити так

AR(p)+MA(q)→ARMA(p,q)→ARMA(p,q)(P,Q)→ARIMA(p,q,r)(P,Q,R)→...

AR(p)- авторегресивна модель порядку р

Модель має вигляд:

[math]Y\left( t \right)=f_{0}+f_{1}\cdot Y\left( t-1 \right)+f_{2}\cdot Y\left( t-2 \right)+...+f_{p}\cdot Y\left( t-p \right)+E\left( t \right)[/math]

де Y(t) – залежна змінна у момент часу t. [math]f_{0},f_{1},f_{2}...,f_{p}[/math] - оцінювані параметри. E(t) - помилка від впливу змінних, які не враховуються в даній моделі. Завдання полягає в тому, щоб визначити [math]f_{0},f_{1},f_{2}...,f_{p}[/math]. Їх можна оцінити різними способами. Найправильніше шукати їх через систему рівнянь Юла-Уолкера, для складання цієї системи буде потрібно розрахунок значень автокореляційної функції. Можна поступити простішим способом - порахувати їх методом найменших квадратів.

MA(q) - модель з ковзаючим середнім порядку q

Модель має вигляд:

[math]Y\left( t \right)=m+e\left( t \right)-w_{1}\cdot e\left( t-1 \right)-w_{2}\cdot e\left( t-2 \right)-...-w_{p}\cdot e\left( t-p \right)[/math]

Де Y(t) -залежна змінна у момент часу t. [math]w_{0},w_{1},w_{2}...,w_{p}[/math] - оцінювані параметри.

Авторегресійне ковзне середнє ARMA(p,q)

Під позначенням ARMA(p,q) розуміється модель, p авторегресійних складових, що містить q, ковзаючих середніх.

Точніше модель ARMA(p,q) включає моделі AR(p) і MA(q):

[math]X_{t}=c+e_{t}+\sum\limits_{i=1}^{q}{\theta _{i}e_{t-i}}+\sum\limits_{i=1}^{p}{\phi _{i}X_{t-i}},[/math]

Зазвичай значення помилки [math]e_{t}[/math] вважають незалежними однаково розподіленими випадковими величинами, узятими з нормального розподілу з нульовим середнім: [math]e_{t}\sim N\left( 0,\sigma ^{2} \right),[/math] де [math]\sigma ^{2}[/math] — дисперсія. Припущення можна ослабити, але це може привести до зміни властивостей моделі. Наприклад, якщо не припускати незалежності і однакового розподілу помилок, поведінка моделі суттєво міняється.

ARIMA (p,d,q)

У завданні аналізу тимчасового ряду з складною структурою часто використовуються моделі класу ARIMA(p,d,q)(авторегресійне інтегрування ковзаючого середнього - Autoregressive Integrated Moving Average) порядку (p,d,q), які моделюють різні ситуації, що зустрічаються при аналізі стаціонарних і нестаціонарних рядів. Залежно від аналізованого ряду модель ARIMA (p,d,q) може трансформуватися до авторегресійної моделі AR(p), моделі ковзного середнього MA(q) або змішаній моделі ARMA (p,q). При переході від нестаціонарного ряду до стаціонарного значення параметра d, що визначає порядок різниці, приймається рівним 0 або 1, тобто цей параметр має тільки цілочисельні значення. Зазвичай обмежуються вибором між d = 0 і d = 1. Проте з поля зору дослідників випадає ситуація, коли параметр d може приймати дробові значення.

ARFIMA(p,d,q)

Для ситуації розгляду дробових значень порядку різниці, в роботах зарубіжних учених, в першу чергу, C.W.Granger, J.R.Hosking, P.M.Robinson, R. Beran, був запропонований новий клас моделей ARFIMA(p,d,q)(F: fractional - дріб), що допускає можливість нецілого параметра d і авторегресійний дріб інтегрований процес ковзного середнього. Такі ряди володіють своєю специфікою: самоподібністю, дробовою розмірністю, поволі спадаючою кореляцією. Прогнозування тимчасових рядів за допомогою моделі ARFIMA(p,d,q) відкриває ширші перспективи для підвищення точності прогнозу.

Модель вигляду ARIMA (p,d,q)(P,D,Q)S

ARIMA (p,d,q)(P,D,Q)S,
де: p - авторегресійні доданки;
D - різниці;
q - доданки ковзаючого середнього;
P – сезонні авторегресійні доданки;
D – сезонні різниці на інтервалі S;
Q – доданки сезонного ковзаючого середнього.

Моделі штучної нейронної мережі

Метод прогнозування водоспоживання на основі моделі штучної нейронної мережі не враховує:

  • стохастичний характер водоспоживання;
  • процес «навчання» нейронної мережі моделі може бути невизначено тривалим до досягнення найточніших вагових коефіцієнтів;
  • модель не дозволяє оцінити похибку отриманого прогнозу;
  • впровадження системи керування водопостачанням на основі моделі штучної нейронної мережі вимагає великих економічних затрат порівняно з іншими методами.

Висновок. Синтезовані нейропредиктори на основі одношарової нейронної мережі з прямим поширенням сигналу дають змогу достатньо точно формувати короткостроковий прогноз зміни споживання води населенням, а пропонована схема системи керування на їх основі є перспективною при її впровадженні.