Відмінності між версіями «Методи прогнозування водоспоживання»

 
(Не показані 46 проміжних версій ще одного користувача)
Рядок 1: Рядок 1:
 +
{{Завдання|Чура Н. Я.|Назаревич О. Б.|18 березня 2012}}
 
{|border=2 style="float: right; margin-left: 1em; margin-bottom: 0.5em; width: 242px; border: #99B3FF solid 1px"
 
{|border=2 style="float: right; margin-left: 1em; margin-bottom: 0.5em; width: 242px; border: #99B3FF solid 1px"
  
Рядок 15: Рядок 16:
 
|}
 
|}
  
{{Презентація доповіді |title= Методи прогнозування водоспоживання}}
+
{{Презентація доповіді |title= http://elartu.tntu.edu.ua/handle/123456789/1586 Методи прогнозування водоспоживання}}
  
 
'''Цілодобове забезпечення мешканців водою''' на сьогоднішній день для багатьох міст України є досить актуальною проблемою. Незважаючи на те, що останнім часом йде оновлення водопровідних мереж та насосного обладнання, левова їх частка відслужила свій вік. Для збільшення терміну експлуатації такого технологічного устаткування, комунальні підприємства встановлюють різноманітні графіки подачі води населенню, що є негативним. Поряд з цим на насосних станціях активно відбувається впровадження такого засобу енергозбереження як частотно регульований електропривод. Забезпечення постійного тиску води (сигнал завдання) в трубопроводі. Недоліком такого алгоритму керування є те, що в години пікового водоспоживання частина мешканців недоотримують воду. Дана проблема може бути вирішена коли сигнал завдання є функцією від споживання води з трубопроводу. Такий підхід в умовах водопроводів значної довжини та складної конфігурації, передбачає наявність прогнозованого значення рівня споживання води.<br>
 
'''Цілодобове забезпечення мешканців водою''' на сьогоднішній день для багатьох міст України є досить актуальною проблемою. Незважаючи на те, що останнім часом йде оновлення водопровідних мереж та насосного обладнання, левова їх частка відслужила свій вік. Для збільшення терміну експлуатації такого технологічного устаткування, комунальні підприємства встановлюють різноманітні графіки подачі води населенню, що є негативним. Поряд з цим на насосних станціях активно відбувається впровадження такого засобу енергозбереження як частотно регульований електропривод. Забезпечення постійного тиску води (сигнал завдання) в трубопроводі. Недоліком такого алгоритму керування є те, що в години пікового водоспоживання частина мешканців недоотримують воду. Дана проблема може бути вирішена коли сигнал завдання є функцією від споживання води з трубопроводу. Такий підхід в умовах водопроводів значної довжини та складної конфігурації, передбачає наявність прогнозованого значення рівня споживання води.<br>
 
Вирішення проблем, пов’язаних із енерго- та ресурсозбереженням у системах водопостачання , зокрема: зонування водопостачальної мережі, зниження тисків та підбір діаметрів будинкових лічильників водопостачальної системи, можна здійснити шляхом прогнозування водоспоживання.<br>
 
Вирішення проблем, пов’язаних із енерго- та ресурсозбереженням у системах водопостачання , зокрема: зонування водопостачальної мережі, зниження тисків та підбір діаметрів будинкових лічильників водопостачальної системи, можна здійснити шляхом прогнозування водоспоживання.<br>
  
== Поняття водоспоживання ==
+
= Поняття водоспоживання =
  
  
Рядок 27: Рядок 28:
 
Об’єктом дослідження є '''погодинна інтенсивність водоспоживання''' - об’єм води у літрах, спожитий певною групою користувачів за одну годину.<br>
 
Об’єктом дослідження є '''погодинна інтенсивність водоспоживання''' - об’єм води у літрах, спожитий певною групою користувачів за одну годину.<br>
  
== Види прогнозу водоспоживання ==
+
= Види прогнозу водоспоживання =
  
 
*''оперативний'' - прогноз водоспоживання на наступну годину (у межах поточної доби);<br>
 
*''оперативний'' - прогноз водоспоживання на наступну годину (у межах поточної доби);<br>
Рядок 33: Рядок 34:
 
*''довгостроковий'' - прогноз водоспоживання на наступний тиждень чи місяць (місяць-квартал-рік).<br>
 
*''довгостроковий'' - прогноз водоспоживання на наступний тиждень чи місяць (місяць-квартал-рік).<br>
  
== Моделі прогнозу водоспоживання ==  
+
= Моделі прогнозу водоспоживання =  
  
 
Актуальною є розробка методів прогнозування водоспоживання як засобу визначення аварійних станів системи водопостачання. Зокрема, методи прогнозування повинні дозволяти оцінювання точності прогнозу. Найбільш корисним у практичних застосуваннях є інтервальний прогноз водоспоживання. З його допомогою можна отримати довірчі інтервали, які накривають прогнозовані значення водоспоживання із певною заданою довірчою ймовірністю.<br>
 
Актуальною є розробка методів прогнозування водоспоживання як засобу визначення аварійних станів системи водопостачання. Зокрема, методи прогнозування повинні дозволяти оцінювання точності прогнозу. Найбільш корисним у практичних застосуваннях є інтервальний прогноз водоспоживання. З його допомогою можна отримати довірчі інтервали, які накривають прогнозовані значення водоспоживання із певною заданою довірчою ймовірністю.<br>
Рядок 45: Рядок 46:
 
Усі згадані моделі враховують стохастичний характер водоспоживання, але не пояснюють механізму його утворення окремими споживачами, ймовірнісний опис цих моделей здійснюється лише в рамках моментних функції 1-го та 2-го порядків. Самі моделі використані для передбачення подобового водоспоживання в найближчих 7-денних та щотижневого водоспоживання в 365-денних часових інтервалах.<br>
 
Усі згадані моделі враховують стохастичний характер водоспоживання, але не пояснюють механізму його утворення окремими споживачами, ймовірнісний опис цих моделей здійснюється лише в рамках моментних функції 1-го та 2-го порядків. Самі моделі використані для передбачення подобового водоспоживання в найближчих 7-денних та щотижневого водоспоживання в 365-денних часових інтервалах.<br>
  
== Модель експоненційного згладження Тейлора ==  
+
= Модель експоненційного згладження Тейлора =  
  
  
 
Принцип експоненційного згладжування дає змогу прогнозувати характеристики параметрів контрольованих процесів у разі допущення незмінності їх моделей як на ділянці спостереження за цими процесами, так і на ділянці прогнозування. Обчислення оцінки невідомих параметрів моделей дозволяють отримати залежності, які відповідають однаково добре (з погляду вибраного критерію) всім даним, які є про процес. По мірі надходження нової інформації про процес, отримані оцінки уточнюються. У разі прийнятого допущення вся інформація про процес (як поточна, так і отримана в минулому) мас однакову цінність і використовується в розрахунках однаковою мірою.<br>
 
Принцип експоненційного згладжування дає змогу прогнозувати характеристики параметрів контрольованих процесів у разі допущення незмінності їх моделей як на ділянці спостереження за цими процесами, так і на ділянці прогнозування. Обчислення оцінки невідомих параметрів моделей дозволяють отримати залежності, які відповідають однаково добре (з погляду вибраного критерію) всім даним, які є про процес. По мірі надходження нової інформації про процес, отримані оцінки уточнюються. У разі прийнятого допущення вся інформація про процес (як поточна, так і отримана в минулому) мас однакову цінність і використовується в розрахунках однаковою мірою.<br>
Ідея експоненційного згладжування заснована на припущенні, що прогнозоване значення функції X(t) може бути виражене рядом Тейлора:<br>
+
Ідея експоненційного згладжування заснована на припущенні, що прогнозоване значення функції X(t) може бути виражене рядом Тейлора:
 
<center>
 
<center>
<math>X_{t+\Delta t}^{'}=x_{t}+\frac{dx}{dt}\Delta t+\frac{1}{2!}\frac{d^{2} x}{dt^{2}}(\Delta t)^{2}+...+ \frac{1}{n!}\frac{d^{n} x}{dt^{n}}(\Delta t)^{n}</math>
+
<math><br>X_{t+\Delta t}^{'}=x_{t}+\frac{dx}{dt}\Delta t+\frac{1}{2!}\frac{d^{2} x}{dt^{2}}(\Delta t)^{2}+...+ \frac{1}{n!}\frac{d^{n} x}{dt^{n}}(\Delta t)^{n}</math>
 
</center>
 
</center>
де <math>X_{t+\Delta t}^{'}</math> – прогнозоване значення X(t);<br>
+
де <math>X_{t+\Delta t}^{'}</math> – прогнозоване значення <math>X(t)</math>;<br>
 
<math>\Delta t</math> – тривалість часу, на який здійснюється прогноз;<br>
 
<math>\Delta t</math> – тривалість часу, на який здійснюється прогноз;<br>
 
<math>x(t)</math> – поточне значення спостережувального сигналу.<br>
 
<math>x(t)</math> – поточне значення спостережувального сигналу.<br>
 
Члени ряду Тейлора виразимо формулами експоненційного згладжування:
 
Члени ряду Тейлора виразимо формулами експоненційного згладжування:
 
<center>
 
<center>
<math><br>\hat{q}_{t}=2S_{t}^{(1)}-S_{t}^{(2)}</math>
+
<math><br>\bar{q}_{t}=2S_{t}^{(1)}-S_{t}^{(2)}</math>
 
</center>
 
</center>
 
<center>
 
<center>
 
  <math><br>\frac{dq}{dt}\Delta t=\frac{\alpha}{1-\alpha}( S_{t}^{(1)}-S_{t}^{(2)}) </math>
 
  <math><br>\frac{dq}{dt}\Delta t=\frac{\alpha}{1-\alpha}( S_{t}^{(1)}-S_{t}^{(2)}) </math>
 
</center>
 
</center>
 
 
де <math>S_{t}^{(1)}</math> і <math>S_{t}^{(2)}</math> – експоненційно згладжені величини першого і другого порядків; α – вага поточного спостереження.
 
де <math>S_{t}^{(1)}</math> і <math>S_{t}^{(2)}</math> – експоненційно згладжені величини першого і другого порядків; α – вага поточного спостереження.
Очевидно, що <math>S_{t}</math> є лінійною комбінацією всіх спостережень, вага яких зменшується в геометричній прогресії. Поточне спостереження <math>\hat{q}_{t}</math> має вагу <math>\alpha</math>, що лежить в межах від 0 до 1, граничне значення <math>\alpha=1</math> означає, що ми абсолютно не довіряємо попереднім даним про процес і за згладжене значення приймаємо поточну величину <math>\hat{q}_{t}</math>. При <math>\alpha=0</math> значення <math>S_{t}</math> є настільки стабільним, що ми не використовуємо нову інформацію про процес.<br>
+
Очевидно, що <math>S_{t}</math> є лінійною комбінацією всіх спостережень, вага яких зменшується в геометричній прогресії. Поточне спостереження <math>\bar{q}_{t}</math> має вагу <math>\alpha</math>, що лежить в межах від 0 до 1, граничне значення <math>\alpha=1</math> означає, що ми абсолютно не довіряємо попереднім даним про процес і за згладжене значення приймаємо поточну величину <math>\bar{q}_{t}</math>. При <math>\alpha=0</math> значення <math>S_{t}</math> є настільки стабільним, що ми не використовуємо нову інформацію про процес.<br>
Недоліком методу Хольта-Вінтерса є те, що модель не дозволяє максимально точно прогнозувати погодинне водоспоживання.<br>
+
'''''Недоліком методу Хольта-Вінтерса є те, що модель не дозволяє максимально точно прогнозувати погодинне водоспоживання.'''''<br>
''Висновки.'' Регулювання параметрів системи водопостачання за величинами, пропорційними статистичним параметрам, зменшує видатки на регулювання і регулювальні пристрої, зменшує збитки під час роботи споживачів електричної енергії від неякісних параметрів електричної енергії, що приводить до економії витрат на експлуатацію елементів та системи водопостачання і економію коштів як у споживачів, так і в самій системі.<br>
+
'''''Висновки.''''' Регулювання параметрів системи водопостачання за величинами, пропорційними статистичним параметрам, зменшує видатки на регулювання і регулювальні пристрої, зменшує збитки під час роботи споживачів електричної енергії від неякісних параметрів електричної енергії, що приводить до економії витрат на експлуатацію елементів та системи водопостачання і економію коштів як у споживачів, так і в самій системі.<br>
  
 
= Регресійні методи прогнозування =
 
= Регресійні методи прогнозування =
  
Разом з описаними вище методами, заснованими на експоненціальному згладжуванні, вже достатньо довгий час для прогнозування використовуються регресійні алгоритми. Коротко суть алгоритмів такого класу можна описати так.<br>
+
Існує прогнозована змінна Y (залежна змінна) і відібраний заздалегідь комплект змінних, від яких вона залежить, <math>X_{1},X_{2},...,X_{N}</math>(незалежні змінні). Природа незалежних змінних може бути різною.<br>  
Існує прогнозована змінна Y (залежна змінна) і відібраний заздалегідь комплект змінних, від яких вона залежить, - <math>\X_{1},\X_{2},\,...,\,\X_{N}-</math>(незалежні змінні). Природа незалежних змінних може бути різною.<br>  
+
Модель множинної регресії в загальному випадку описується виразом:<br>
Модель множинної регресії в загальному випадку описується виразом: <br>
 
 
<center>
 
<center>
 
  <math><br>Y=F\left( X_{1},\,X_{2},\,...,\,X_{N} \right)+\varepsilon </math>
 
  <math><br>Y=F\left( X_{1},\,X_{2},\,...,\,X_{N} \right)+\varepsilon </math>
Рядок 79: Рядок 78:
 
У простішому варіанті лінійної регресійної моделі залежність залежної змінної від незалежних має вигляд:
 
У простішому варіанті лінійної регресійної моделі залежність залежної змінної від незалежних має вигляд:
 
<center>
 
<center>
<math>Y=\beta _{0}+\beta _{1}X_{1}+\beta _{2}X_{2}+...+\beta _{N}X_{N}+\varepsilon </math>
+
<math>Y=\beta _{0}+\beta _{1}X_{1}+\beta _{2}X_{2}+...+\beta _{N}X_{N}+\varepsilon </math>
 
</center>
 
</center>
Тут <math>\beta _{1},\beta _{2},\,...,\,\beta _{N}-</math> підбирані коефіцієнти регресії
+
Тут <math>\beta _{0},\beta _{1},...,\beta _{N} -</math> підібрані коефіцієнти регресії;<br>
 
+
<math>\varepsilon -</math> компонента помилки. Передбачається, що всі помилки незалежні і нормально розподілені.
<math>\varepsilon -</math> компонента помилки. Передбачається, що всі помилки незалежні і нормально розподілені.
 
 
Для побудови регресійних моделей необхідно мати базу даних спостережень приблизно такого вигляду:
 
Для побудови регресійних моделей необхідно мати базу даних спостережень приблизно такого вигляду:
 
<center>
 
<center>
Рядок 146: Рядок 144:
 
</center>
 
</center>
  
 +
За допомогою таблиці значень минулих спостережень можна підібрати (наприклад, методом найменших квадратів) коефіцієнти регресії, побудувавши тим самим модель.<br>
 +
При роботі з регресією треба дотримуватися певної обережності і обов'язково перевірити на адекватність знайдені моделі. Існують різні способи такої перевірки. Обов'язковим є статистичний аналіз залишків, тест Дарбіна-Уотсона. Корисно, як і у випадку з нейронними мережами, мати незалежний набір прикладів, на яких можна перевірити якість роботи моделі.<br>
 +
'''''Недоліки методу прогнозу на основі регресійної моделі:'''''<br>
 +
*'''''похибки прогнозу водоспоживання у літній період є неприпустимо великими;'''''<br>
 +
*'''''не є придатним для прогнозування погодинних даних та довготермінового прогнозування.'''''<br>
 +
 +
= Методи Бокса-Дженкінса (ARIMA)=
 +
 +
В середині 90-х років минулого століття був розроблений принципово новий і достатньо могутній клас алгоритмів для прогнозування тимчасових рядів. Велику частину роботи по дослідженню методології і перевірці моделей була проведена двома статистами, Г.Е.П. Боксом ([http://en.wikipedia.org/wiki/George_E._P._Box G.E.P. Box]) і Г.М. Дженкинсом ([http://en.wikipedia.org/wiki/Gwilym_Jenkins G.M. Jenkins]). З тих пір побудова подібних моделей і отримання на їх основі прогнозів іноді називатися методами Бокса-Дженкінса. В це сімейство входить декілька алгоритмів, найвідомішим і використовуваним з них є алгоритм ARIMA. Він вбудований практично в будь-який спеціалізований пакет для прогнозування. У класичному варіанті ARIMA не використовуються незалежні змінні. Моделі спираються тільки на інформацію, що міститься в передісторії прогнозованих рядів, що обмежує можливості алгоритму. В даний час в науковій літературі часто згадуються варіанти моделей ARIMA, що дозволяють враховувати незалежні змінні. У даній доповіді вони розглядатись не будуть, обмежимось тільки загальновідомим класичним варіантом. На відміну від розглянутих раніше методик прогнозування тимчасових рядів, в методології ARIMA не передбачається якої-небудь чіткої моделі для прогнозування даної тимчасової серії. Задається лише загальний клас моделей, що описують часовий ряд і що дозволяють якось виражати поточне значення змінної через її попередні значення. Потім алгоритм, підстроюючи внутрішні параметри, сам вибирає найбільш відповідну модель прогнозування. Як вже наголошувалося вище, існує ціла ієрархія моделей Бокса-Дженкінса. Логічно її можна визначити так
 +
<center>
 +
<b>AR(p)+MA(q)→ARMA(p,q)→ARMA(p,q)(P,Q)→ARIMA(p,q,r)(P,Q,R)→...</b>
 +
</center>
 +
 +
== AR(p) - авторегресивна модель порядку р ==
 +
 +
Модель має вигляд:
 +
<center>
 +
<math>Y\left( t \right)=f_{0}+f_{1}\cdot Y\left( t-1 \right)+f_{2}\cdot Y\left( t-2 \right)+...+f_{p}\cdot Y\left( t-p \right)+E\left( t \right)</math>
 +
</center>
 +
 +
де
 +
Y(t) – залежна змінна у момент часу t. <math>f_{0},f_{1},f_{2}...,f_{p}</math> - оцінювані параметри. E(t) - помилка від впливу змінних, які не враховуються в даній моделі. Завдання полягає в тому, щоб визначити <math>f_{0},f_{1},f_{2}...,f_{p}</math>. Їх можна оцінити різними способами. Найправильніше шукати їх через систему рівнянь Юла-Уолкера, для складання цієї системи буде потрібно розрахунок значень автокореляційної функції. Можна поступити простішим способом - порахувати їх методом найменших квадратів.
 +
 +
== MA(q) - модель з ковзаючим середнім порядку q ==
 +
 +
Модель має вигляд:
 +
<center>
 +
<math>Y\left( t \right)=m+e\left( t \right)-w_{1}\cdot e\left( t-1 \right)-w_{2}\cdot e\left( t-2 \right)-...-w_{p}\cdot e\left( t-p \right)</math>
 +
</center>
 +
 +
Де Y(t) -залежна змінна у момент часу t. <math>w_{0},w_{1},w_{2}...,w_{p}</math> - оцінювані параметри.
 +
 +
== Авторегресійне ковзне середнє ARMA(p,q) ==
 +
 +
Під позначенням ARMA(p,q) розуміється модель, p авторегресійних складових, що містить  q, ковзаючих середніх.
 +
 +
Точніше модель ARMA(p,q) включає моделі AR(p) і MA(q):
 +
<center>
 +
<math>X_{t}=c+e_{t}+\sum\limits_{i=1}^{q}{\theta _{i}e_{t-i}}+\sum\limits_{i=1}^{p}{\phi _{i}X_{t-i}},</math>
 +
</center>
 +
Зазвичай значення помилки <math>e_{t}</math>  вважають незалежними однаково розподіленими випадковими величинами, узятими з нормального розподілу з нульовим середнім: <math>e_{t}\sim N\left( 0,\sigma ^{2} \right),</math>  де <math>\sigma ^{2}</math> — дисперсія. Припущення можна ослабити, але це може привести до зміни властивостей моделі. Наприклад, якщо не припускати незалежності і однакового розподілу помилок, поведінка моделі суттєво міняється.<br>
 +
 +
== ARIMA (p,d,q) ==
 +
 +
У  завданні  аналізу тимчасового  ряду  з  складною структурою  часто  використовуються  моделі  класу  ARIMA(p,d,q)(авторегресійне  інтегрування  ковзаючого  середнього - Autoregressive Integrated Moving Average)  порядку (p,d,q),  які    моделюють  різні  ситуації,  що зустрічаються  при  аналізі стаціонарних і нестаціонарних рядів. Залежно від  аналізованого  ряду  модель  ARIMA (p,d,q)  може  трансформуватися  до  авторегресійної моделі  AR(p), моделі ковзного  середнього  MA(q)  або  змішаній  моделі  ARMA (p,q).  При переході  від  нестаціонарного ряду  до  стаціонарного  значення  параметра  d, що визначає порядок  різниці,  приймається  рівним  0 або 1,  тобто цей  параметр  має  тільки  цілочисельні  значення.  Зазвичай  обмежуються вибором між    d = 0 і  d = 1. Проте  з  поля  зору  дослідників  випадає    ситуація, коли  параметр  d  може  приймати  дробові  значення.<br>
 +
 +
== ARFIMA(p,d,q) ==
 +
 +
Для  ситуації розгляду дробових значень порядку різниці, в  роботах  зарубіжних  учених,  в першу чергу,  C.W.Granger,  J.R.Hosking,  P.M.Robinson, R. Beran,  був  запропонований  новий клас  моделей  ARFIMA(p,d,q)(F: fractional  -  дріб),  що допускає  можливість  нецілого  параметра  d  і авторегресійний  дріб інтегрований  процес  ковзного  середнього.  Такі  ряди  володіють  своєю  специфікою:  самоподібністю,  дробовою  розмірністю,  поволі  спадаючою  кореляцією.  Прогнозування  тимчасових  рядів  за допомогою  моделі  ARFIMA(p,d,q)  відкриває  ширші  перспективи  для  підвищення  точності  прогнозу.<br>
 +
 +
== Модель вигляду ARIMA (p,d,q)(P,D,Q)S ==
 +
 +
ARIMA (p,d,q)(P,D,Q)S,<br>
 +
де: p - авторегресійні доданки;<br>
 +
D - різниці;<br>
 +
q - доданки ковзаючого середнього;<br>
 +
P – сезонні авторегресійні доданки;<br>
 +
D – сезонні різниці на інтервалі S;<br>
 +
Q – доданки сезонного ковзаючого середнього.<br>
 +
 +
= Методи ARCH та GARCH =
 +
 +
Модель авторегресії умовної гетероскедастичності (ARCH) узагальнює моделі AR через додаткове врахування гетероскедастичності часового ряду. Модель ARCH (q) може бути оцінена із використанням методу найменших квадратів.<br>
 +
Узагальненою моделлю ARCH є узагальнена авторегресійна модель умовної гетероскедастичності GARCH, запропонована Боллерслевом у 1986 р.<br>
 +
Нехай <math>x_{t}</math> – гетероскедастичний процес, тоді модель GARCH (р,q) має такий вигляд:<br>
 +
 +
<center>
 +
<math>\left\{\begin{matrix}
 +
  x_{t}=\sigma_{t}\varepsilon_{t},  \\
 +
  \sigma_{t}^{2}=a_{0}+a_{1}x_{t-1}^{2}+...+a_{q}x_{t-q}^{2}+\varepsilon_{t-1}^{2}+...+ \beta_{p} \varepsilon_{1-p}^{2} \\
 +
\end{matrix}\right </math>
 +
</center>
 +
де <math>\varepsilon_{t}\sim N(0,1)</math>, <math>a_{0}>0</math>, <math>a_{i}>=0, i>0;</math><br> 
 +
<math>p</math> - порядок для GARCH елемента <math>\sigma ^{2}</math>;<br>
 +
<math>q</math> - порядок елемента <math>\varepsilon ^{2}</math> моделі ARCH.<br>
 +
'''''Моделі узагальненої авторегресійної умовної гетероскедастичності GARCH мають умовну випадкову дисперсію, а водоспоживання доцільніше розглядати як процес із періодичною дисперсією.'''''
 +
 +
= Моделі штучної нейронної мережі =
 +
 +
'''''Метод прогнозування водоспоживання на основі моделі штучної нейронної мережі не враховує:'''''<br>
 +
*стохастичний характер водоспоживання;<br>
 +
*процес «навчання» нейронної мережі моделі може бути невизначено тривалим до досягнення найточніших вагових коефіцієнтів;<br>
 +
*модель не дозволяє оцінити похибку отриманого прогнозу;<br>
 +
*впровадження системи керування водопостачанням на основі моделі штучної нейронної мережі вимагає великих економічних затрат порівняно з іншими методами.<br>
 +
'''''Висновок.''''' Синтезовані нейропредиктори на основі одношарової нейронної мережі з прямим поширенням сигналу дають змогу достатньо точно формувати короткостроковий прогноз зміни споживання води населенням, а пропонована схема системи керування на їх основі є перспективною при її впровадженні.
 +
 +
= Список використаних джерел =
 +
 +
1. http://www.neuroproject.ru/forecasting_tutorial.php#mlp Методы прогнозирования (лютий 2012)<br>
 +
2. http://www.nbuv.gov.ua/portal/Natural/Vtot/2011_2/57myh.pdf Т.В. Михайлович. Метод прогнозу водоспоживання з використанням моделі періодичної авторегресії (лютий 2012)<br>
 +
3. http://journal.iasa.kpi.ua/zm456st/2011/No1/2011-n1-maslyanko-1 Системний аналіз методів прогнозування (лютий 2012)<br>
 +
4.http://www.nbuv.gov.ua/portal/natural/Vnulp/Teploenerg/2009_659/20.pdf Модель експоненційного згладжування Тейлора (лютий 2012)<br>
 +
5. Кінчур О.Ф. Підвищення ефективності водопостачання
 +
населення за рахунок впровадження інтелектуальної системи оперативного управління електроприводом насосної станції. / О.Ф. Кінчур // Вісник Національного університету водного господарства та природокористування. - 2007. - № 3 (39) - частина 2. - С. 313.<br>
 +
6. Фриз М.Є. Обґрунтування математичної моделі водоспоживання у вигляді умовного лінійного випадкового процесу. / М.Є. Фриз, Т.В. Михайлович // Електроніка та системи управління. - 2010. - № 3 (25). - С. 137 - 142.<br>
 +
7. Уоссермен Ф. Нейрокомпьютерная техника. Теория и практика.– М. Мир, 1992. –186с. <br> 
  
За допомогою таблиці значень минулих спостережень можна підібрати (наприклад, методом найменших квадратів) коефіцієнти регресії, побудувавши тим самим модель.
+
{{Завдання:Виступ|Natalochka|21 лютого 2012|Методи прогнозування водоспоживання}}
  
При роботі з регресією треба дотримуватися певної обережності і обов'язково перевірити на адекватність знайдені моделі. Існують різні способи такої перевірки. Обов'язковим є статистичний аналіз залишків, тест Дарбіна-Уотсона. Корисно, як і у випадку з нейронними мережами, мати незалежний набір прикладів, на яких можна перевірити якість роботи моделі.
+
[[Категорія:Планування експерименту]]

Поточна версія на 19:33, 7 березня 2012

Blue check.png Дана стаття являється неперевіреним навчальним завданням.
Студент: Чура Н. Я.
Викладач: Назаревич О. Б.
Термін до: 18 березня 2012

До вказаного терміну стаття не повинна редагуватися іншими учасниками проекту. Після завершення терміну виконання будь-який учасник може вільно редагувати дану статтю і витерти дане попередження, що вводиться за допомогою шаблону.


Прізвище Чура
Ім'я Наталя
По-батькові Ярославівна
Факультет ФІС
Група СНм-51
Залікова книжка СНм-11-256
Репозиторія
Презентація доповіді на тему http://elartu.tntu.edu.ua/handle/123456789/1586 Методи прогнозування водоспоживання
є розміщеною в Репозиторії.


Цілодобове забезпечення мешканців водою на сьогоднішній день для багатьох міст України є досить актуальною проблемою. Незважаючи на те, що останнім часом йде оновлення водопровідних мереж та насосного обладнання, левова їх частка відслужила свій вік. Для збільшення терміну експлуатації такого технологічного устаткування, комунальні підприємства встановлюють різноманітні графіки подачі води населенню, що є негативним. Поряд з цим на насосних станціях активно відбувається впровадження такого засобу енергозбереження як частотно регульований електропривод. Забезпечення постійного тиску води (сигнал завдання) в трубопроводі. Недоліком такого алгоритму керування є те, що в години пікового водоспоживання частина мешканців недоотримують воду. Дана проблема може бути вирішена коли сигнал завдання є функцією від споживання води з трубопроводу. Такий підхід в умовах водопроводів значної довжини та складної конфігурації, передбачає наявність прогнозованого значення рівня споживання води.
Вирішення проблем, пов’язаних із енерго- та ресурсозбереженням у системах водопостачання , зокрема: зонування водопостачальної мережі, зниження тисків та підбір діаметрів будинкових лічильників водопостачальної системи, можна здійснити шляхом прогнозування водоспоживання.

Поняття водоспоживання

Термін “водоспоживання” означає “об'єм води, спожитої користувачами за одиницю часу”.
Водоспоживанням називається процес споживання води користувачами системи питного водопостачання.
Об’єктом дослідження є погодинна інтенсивність водоспоживання - об’єм води у літрах, спожитий певною групою користувачів за одну годину.

Види прогнозу водоспоживання

  • оперативний - прогноз водоспоживання на наступну годину (у межах поточної доби);
  • короткостроковий - прогноз водоспоживання на наступну добу (доба-тиждень-місяць);
  • довгостроковий - прогноз водоспоживання на наступний тиждень чи місяць (місяць-квартал-рік).

Моделі прогнозу водоспоживання

Актуальною є розробка методів прогнозування водоспоживання як засобу визначення аварійних станів системи водопостачання. Зокрема, методи прогнозування повинні дозволяти оцінювання точності прогнозу. Найбільш корисним у практичних застосуваннях є інтервальний прогноз водоспоживання. З його допомогою можна отримати довірчі інтервали, які накривають прогнозовані значення водоспоживання із певною заданою довірчою ймовірністю.
Серед математичних моделей та методів аналізу та оперативного прогнозу водоспоживання найбільш відомими є моделі:

  • експоненційного згладження Тейлора (яка використовується у методі адитивних та мультиплікативних тенденцій Холта-Вінтерса);
  • регресійна;
  • подвійно-сезонна мультиплікативна ARIMA;
  • узагальненої авторегресійної умовної гетероскедастичності GARCH;
  • штучної нейронної мережі;
  • модифікації та комбінації наведених вище моделей.

Усі згадані моделі враховують стохастичний характер водоспоживання, але не пояснюють механізму його утворення окремими споживачами, ймовірнісний опис цих моделей здійснюється лише в рамках моментних функції 1-го та 2-го порядків. Самі моделі використані для передбачення подобового водоспоживання в найближчих 7-денних та щотижневого водоспоживання в 365-денних часових інтервалах.

Модель експоненційного згладження Тейлора

Принцип експоненційного згладжування дає змогу прогнозувати характеристики параметрів контрольованих процесів у разі допущення незмінності їх моделей як на ділянці спостереження за цими процесами, так і на ділянці прогнозування. Обчислення оцінки невідомих параметрів моделей дозволяють отримати залежності, які відповідають однаково добре (з погляду вибраного критерію) всім даним, які є про процес. По мірі надходження нової інформації про процес, отримані оцінки уточнюються. У разі прийнятого допущення вся інформація про процес (як поточна, так і отримана в минулому) мас однакову цінність і використовується в розрахунках однаковою мірою.
Ідея експоненційного згладжування заснована на припущенні, що прогнозоване значення функції X(t) може бути виражене рядом Тейлора:

[math]\lt br\gt X_{t+\Delta t}^{'}=x_{t}+\frac{dx}{dt}\Delta t+\frac{1}{2!}\frac{d^{2} x}{dt^{2}}(\Delta t)^{2}+...+ \frac{1}{n!}\frac{d^{n} x}{dt^{n}}(\Delta t)^{n}[/math]

де [math]X_{t+\Delta t}^{'}[/math] – прогнозоване значення [math]X(t)[/math];
[math]\Delta t[/math] – тривалість часу, на який здійснюється прогноз;
[math]x(t)[/math] – поточне значення спостережувального сигналу.
Члени ряду Тейлора виразимо формулами експоненційного згладжування:

[math]\lt br\gt \bar{q}_{t}=2S_{t}^{(1)}-S_{t}^{(2)}[/math]
[math]\lt br\gt \frac{dq}{dt}\Delta t=\frac{\alpha}{1-\alpha}( S_{t}^{(1)}-S_{t}^{(2)})[/math]

де [math]S_{t}^{(1)}[/math] і [math]S_{t}^{(2)}[/math] – експоненційно згладжені величини першого і другого порядків; α – вага поточного спостереження. Очевидно, що [math]S_{t}[/math] є лінійною комбінацією всіх спостережень, вага яких зменшується в геометричній прогресії. Поточне спостереження [math]\bar{q}_{t}[/math] має вагу [math]\alpha[/math], що лежить в межах від 0 до 1, граничне значення [math]\alpha=1[/math] означає, що ми абсолютно не довіряємо попереднім даним про процес і за згладжене значення приймаємо поточну величину [math]\bar{q}_{t}[/math]. При [math]\alpha=0[/math] значення [math]S_{t}[/math] є настільки стабільним, що ми не використовуємо нову інформацію про процес.
Недоліком методу Хольта-Вінтерса є те, що модель не дозволяє максимально точно прогнозувати погодинне водоспоживання.
Висновки. Регулювання параметрів системи водопостачання за величинами, пропорційними статистичним параметрам, зменшує видатки на регулювання і регулювальні пристрої, зменшує збитки під час роботи споживачів електричної енергії від неякісних параметрів електричної енергії, що приводить до економії витрат на експлуатацію елементів та системи водопостачання і економію коштів як у споживачів, так і в самій системі.

Регресійні методи прогнозування

Існує прогнозована змінна Y (залежна змінна) і відібраний заздалегідь комплект змінних, від яких вона залежить, [math]X_{1},X_{2},...,X_{N}[/math](незалежні змінні). Природа незалежних змінних може бути різною.
Модель множинної регресії в загальному випадку описується виразом:

[math]\lt br\gt Y=F\left( X_{1},\,X_{2},\,...,\,X_{N} \right)+\varepsilon[/math]

У простішому варіанті лінійної регресійної моделі залежність залежної змінної від незалежних має вигляд:

[math]Y=\beta _{0}+\beta _{1}X_{1}+\beta _{2}X_{2}+...+\beta _{N}X_{N}+\varepsilon[/math]

Тут [math]\beta _{0},\beta _{1},...,\beta _{N} -[/math] підібрані коефіцієнти регресії;
[math]\varepsilon -[/math] компонента помилки. Передбачається, що всі помилки незалежні і нормально розподілені. Для побудови регресійних моделей необхідно мати базу даних спостережень приблизно такого вигляду:

  Змінні
 
Незалежні
Залежна
X1 X2 ... XN Y
1 x_11 x_12 ... x_1N Y_1
2 x_21 x_22 ... x_2N Y_2
... ... ... ... ... ...
m x_M1 x_M2 ... x_MN Y_m

За допомогою таблиці значень минулих спостережень можна підібрати (наприклад, методом найменших квадратів) коефіцієнти регресії, побудувавши тим самим модель.
При роботі з регресією треба дотримуватися певної обережності і обов'язково перевірити на адекватність знайдені моделі. Існують різні способи такої перевірки. Обов'язковим є статистичний аналіз залишків, тест Дарбіна-Уотсона. Корисно, як і у випадку з нейронними мережами, мати незалежний набір прикладів, на яких можна перевірити якість роботи моделі.
Недоліки методу прогнозу на основі регресійної моделі:

  • похибки прогнозу водоспоживання у літній період є неприпустимо великими;
  • не є придатним для прогнозування погодинних даних та довготермінового прогнозування.

Методи Бокса-Дженкінса (ARIMA)

В середині 90-х років минулого століття був розроблений принципово новий і достатньо могутній клас алгоритмів для прогнозування тимчасових рядів. Велику частину роботи по дослідженню методології і перевірці моделей була проведена двома статистами, Г.Е.П. Боксом (G.E.P. Box) і Г.М. Дженкинсом (G.M. Jenkins). З тих пір побудова подібних моделей і отримання на їх основі прогнозів іноді називатися методами Бокса-Дженкінса. В це сімейство входить декілька алгоритмів, найвідомішим і використовуваним з них є алгоритм ARIMA. Він вбудований практично в будь-який спеціалізований пакет для прогнозування. У класичному варіанті ARIMA не використовуються незалежні змінні. Моделі спираються тільки на інформацію, що міститься в передісторії прогнозованих рядів, що обмежує можливості алгоритму. В даний час в науковій літературі часто згадуються варіанти моделей ARIMA, що дозволяють враховувати незалежні змінні. У даній доповіді вони розглядатись не будуть, обмежимось тільки загальновідомим класичним варіантом. На відміну від розглянутих раніше методик прогнозування тимчасових рядів, в методології ARIMA не передбачається якої-небудь чіткої моделі для прогнозування даної тимчасової серії. Задається лише загальний клас моделей, що описують часовий ряд і що дозволяють якось виражати поточне значення змінної через її попередні значення. Потім алгоритм, підстроюючи внутрішні параметри, сам вибирає найбільш відповідну модель прогнозування. Як вже наголошувалося вище, існує ціла ієрархія моделей Бокса-Дженкінса. Логічно її можна визначити так

AR(p)+MA(q)→ARMA(p,q)→ARMA(p,q)(P,Q)→ARIMA(p,q,r)(P,Q,R)→...

AR(p) - авторегресивна модель порядку р

Модель має вигляд:

[math]Y\left( t \right)=f_{0}+f_{1}\cdot Y\left( t-1 \right)+f_{2}\cdot Y\left( t-2 \right)+...+f_{p}\cdot Y\left( t-p \right)+E\left( t \right)[/math]

де Y(t) – залежна змінна у момент часу t. [math]f_{0},f_{1},f_{2}...,f_{p}[/math] - оцінювані параметри. E(t) - помилка від впливу змінних, які не враховуються в даній моделі. Завдання полягає в тому, щоб визначити [math]f_{0},f_{1},f_{2}...,f_{p}[/math]. Їх можна оцінити різними способами. Найправильніше шукати їх через систему рівнянь Юла-Уолкера, для складання цієї системи буде потрібно розрахунок значень автокореляційної функції. Можна поступити простішим способом - порахувати їх методом найменших квадратів.

MA(q) - модель з ковзаючим середнім порядку q

Модель має вигляд:

[math]Y\left( t \right)=m+e\left( t \right)-w_{1}\cdot e\left( t-1 \right)-w_{2}\cdot e\left( t-2 \right)-...-w_{p}\cdot e\left( t-p \right)[/math]

Де Y(t) -залежна змінна у момент часу t. [math]w_{0},w_{1},w_{2}...,w_{p}[/math] - оцінювані параметри.

Авторегресійне ковзне середнє ARMA(p,q)

Під позначенням ARMA(p,q) розуміється модель, p авторегресійних складових, що містить q, ковзаючих середніх.

Точніше модель ARMA(p,q) включає моделі AR(p) і MA(q):

[math]X_{t}=c+e_{t}+\sum\limits_{i=1}^{q}{\theta _{i}e_{t-i}}+\sum\limits_{i=1}^{p}{\phi _{i}X_{t-i}},[/math]

Зазвичай значення помилки [math]e_{t}[/math] вважають незалежними однаково розподіленими випадковими величинами, узятими з нормального розподілу з нульовим середнім: [math]e_{t}\sim N\left( 0,\sigma ^{2} \right),[/math] де [math]\sigma ^{2}[/math] — дисперсія. Припущення можна ослабити, але це може привести до зміни властивостей моделі. Наприклад, якщо не припускати незалежності і однакового розподілу помилок, поведінка моделі суттєво міняється.

ARIMA (p,d,q)

У завданні аналізу тимчасового ряду з складною структурою часто використовуються моделі класу ARIMA(p,d,q)(авторегресійне інтегрування ковзаючого середнього - Autoregressive Integrated Moving Average) порядку (p,d,q), які моделюють різні ситуації, що зустрічаються при аналізі стаціонарних і нестаціонарних рядів. Залежно від аналізованого ряду модель ARIMA (p,d,q) може трансформуватися до авторегресійної моделі AR(p), моделі ковзного середнього MA(q) або змішаній моделі ARMA (p,q). При переході від нестаціонарного ряду до стаціонарного значення параметра d, що визначає порядок різниці, приймається рівним 0 або 1, тобто цей параметр має тільки цілочисельні значення. Зазвичай обмежуються вибором між d = 0 і d = 1. Проте з поля зору дослідників випадає ситуація, коли параметр d може приймати дробові значення.

ARFIMA(p,d,q)

Для ситуації розгляду дробових значень порядку різниці, в роботах зарубіжних учених, в першу чергу, C.W.Granger, J.R.Hosking, P.M.Robinson, R. Beran, був запропонований новий клас моделей ARFIMA(p,d,q)(F: fractional - дріб), що допускає можливість нецілого параметра d і авторегресійний дріб інтегрований процес ковзного середнього. Такі ряди володіють своєю специфікою: самоподібністю, дробовою розмірністю, поволі спадаючою кореляцією. Прогнозування тимчасових рядів за допомогою моделі ARFIMA(p,d,q) відкриває ширші перспективи для підвищення точності прогнозу.

Модель вигляду ARIMA (p,d,q)(P,D,Q)S

ARIMA (p,d,q)(P,D,Q)S,
де: p - авторегресійні доданки;
D - різниці;
q - доданки ковзаючого середнього;
P – сезонні авторегресійні доданки;
D – сезонні різниці на інтервалі S;
Q – доданки сезонного ковзаючого середнього.

Методи ARCH та GARCH

Модель авторегресії умовної гетероскедастичності (ARCH) узагальнює моделі AR через додаткове врахування гетероскедастичності часового ряду. Модель ARCH (q) може бути оцінена із використанням методу найменших квадратів.
Узагальненою моделлю ARCH є узагальнена авторегресійна модель умовної гетероскедастичності GARCH, запропонована Боллерслевом у 1986 р.
Нехай [math]x_{t}[/math] – гетероскедастичний процес, тоді модель GARCH (р,q) має такий вигляд:

[math]\left\{\begin{matrix}
x_{t}=\sigma_{t}\varepsilon_{t},  \\
\sigma_{t}^{2}=a_{0}+a_{1}x_{t-1}^{2}+...+a_{q}x_{t-q}^{2}+\varepsilon_{t-1}^{2}+...+ \beta_{p} \varepsilon_{1-p}^{2} \\
\end{matrix}\right[/math]

де [math]\varepsilon_{t}\sim N(0,1)[/math], [math]a_{0}\gt 0[/math], [math]a_{i}\gt =0, i\gt 0;[/math]
[math]p[/math] - порядок для GARCH елемента [math]\sigma ^{2}[/math];
[math]q[/math] - порядок елемента [math]\varepsilon ^{2}[/math] моделі ARCH.
Моделі узагальненої авторегресійної умовної гетероскедастичності GARCH мають умовну випадкову дисперсію, а водоспоживання доцільніше розглядати як процес із періодичною дисперсією.

Моделі штучної нейронної мережі

Метод прогнозування водоспоживання на основі моделі штучної нейронної мережі не враховує:

  • стохастичний характер водоспоживання;
  • процес «навчання» нейронної мережі моделі може бути невизначено тривалим до досягнення найточніших вагових коефіцієнтів;
  • модель не дозволяє оцінити похибку отриманого прогнозу;
  • впровадження системи керування водопостачанням на основі моделі штучної нейронної мережі вимагає великих економічних затрат порівняно з іншими методами.

Висновок. Синтезовані нейропредиктори на основі одношарової нейронної мережі з прямим поширенням сигналу дають змогу достатньо точно формувати короткостроковий прогноз зміни споживання води населенням, а пропонована схема системи керування на їх основі є перспективною при її впровадженні.

Список використаних джерел

1. http://www.neuroproject.ru/forecasting_tutorial.php#mlp Методы прогнозирования (лютий 2012)
2. http://www.nbuv.gov.ua/portal/Natural/Vtot/2011_2/57myh.pdf Т.В. Михайлович. Метод прогнозу водоспоживання з використанням моделі періодичної авторегресії (лютий 2012)
3. http://journal.iasa.kpi.ua/zm456st/2011/No1/2011-n1-maslyanko-1 Системний аналіз методів прогнозування (лютий 2012)
4.http://www.nbuv.gov.ua/portal/natural/Vnulp/Teploenerg/2009_659/20.pdf Модель експоненційного згладжування Тейлора (лютий 2012)
5. Кінчур О.Ф. Підвищення ефективності водопостачання населення за рахунок впровадження інтелектуальної системи оперативного управління електроприводом насосної станції. / О.Ф. Кінчур // Вісник Національного університету водного господарства та природокористування. - 2007. - № 3 (39) - частина 2. - С. 313.
6. Фриз М.Є. Обґрунтування математичної моделі водоспоживання у вигляді умовного лінійного випадкового процесу. / М.Є. Фриз, Т.В. Михайлович // Електроніка та системи управління. - 2010. - № 3 (25). - С. 137 - 142.
7. Уоссермен Ф. Нейрокомпьютерная техника. Теория и практика.– М. Мир, 1992. –186с.

SeminarSpeech.png
Студент: Користувач:Natalochka
Виступ відбувся: 21 лютого 2012
Тема: Методи прогнозування водоспоживання