<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="uk">
		<id>https://wiki.tntu.edu.ua/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Vova</id>
		<title>Wiki ТНТУ - Внесок користувача [uk]</title>
		<link rel="self" type="application/atom+xml" href="https://wiki.tntu.edu.ua/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Vova"/>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/%D0%A1%D0%BF%D0%B5%D1%86%D1%96%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0:%D0%92%D0%BD%D0%B5%D1%81%D0%BE%D0%BA/Vova"/>
		<updated>2026-05-28T02:29:29Z</updated>
		<subtitle>Внесок користувача</subtitle>
		<generator>MediaWiki 1.30.0</generator>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14049</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14049"/>
				<updated>2012-03-13T17:31:32Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Приклад функції ядра */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерне згладжуваня''' - один із найпростіших видів [[Непараметрична регресія|непараметричної регресії]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачі ==&lt;br /&gt;
&lt;br /&gt;
:Вирішується завдання відновлення регресії. Заданий простір об'єктів &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; і безліч можливих відповідей &amp;lt;math&amp;gt;y=r&amp;lt;/math&amp;gt;. Існує невідома цільова залежність &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, значення якої відомі лише на об'єктах навчальної вибірки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;.  Потрібно побудувати алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, що апроксимує цільову залежність &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, використання ідейно простого підхіду до уявлення послідовності вагів &amp;lt;math&amp;gt;\{ W_{mi}(x)\}_{i=1}^m&amp;lt;/math&amp;gt; полягає в описі форми вагової  функції &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; за допомогою функції щільності із скалярним параметром, який регулює розмір і форму вагів біля х.  Цю функцію форми  прийнято називати ''''ядром'''' &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Отримані таким чином ваги далі використовуються для представлення величини &amp;lt;math&amp;gt;a(x) &amp;lt;/math&amp;gt; у вигляді зваженої суми значень &amp;lt;math&amp;gt;y_i&amp;lt;/math&amp;gt; навчаючої вибірки.&lt;br /&gt;
&lt;br /&gt;
== Опис методу ==&lt;br /&gt;
=== Визначення ядра ===&lt;br /&gt;
'''Ядро''' — це неперермвна обмеженна симетрична речовина функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; з одиничним інтегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Послідовність ваги ===&lt;br /&gt;
Послідовність ваги для ядерних оцінок (для одновимірного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) знаходиться як ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
де&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
уявимо собі ядро з параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Також цей параметр прийнято називати шириной вікна. Підкреслемо залежність &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; від об'єму вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, умова скороченого значення послідовністі ваги &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функція ядра ===&lt;br /&gt;
Функція &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; являєтся ''ядерною оцінкою щільності Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальної) щільності зміної &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Даний вид ядерних вагів &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; був запропонований в работах (Nadaraya, 1964) і (Watson, 1964). Як наслідок, оцінка очікуваної величини відновлюваної залежності &amp;lt;math&amp;gt;e(y\|x) &amp;lt;/math&amp;gt;: ::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-x_i) Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-x_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто називають оцінкою ''Надарая—Ватсона''.&lt;br /&gt;
Ширіна вікна визначає, наскільки швидко убувають ваги &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; у міру видалення об'єктів &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Характер убування визначається виглядом ядра &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормалізація вагів &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантує, що сума вагів дорівнює одиниці.&lt;br /&gt;
 &lt;br /&gt;
'''Примітка'''. При ряду умов має місце збіжність по вірогідності даної оцінки до &amp;lt;math&amp;gt;e(y|x) &amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Приклад функції ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практиці використовується декілька видів ядерних функцій.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Також викоритовуєтьсятся ядро Епанечникова, яке володіє деякими властивостями оптимальності [Хардле В п 4.5]; це функція &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Іншим прикладом є ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
трикутне ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
і прямокутне ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Примітка'''. Точність відновленоії залежності мало залежить від вибору ядра. &lt;br /&gt;
Ядро визначає міру гладкості функції &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Залежність від ширини вікна ===&lt;br /&gt;
Вибір вікна вирішальним чином впливає на точність відновлюваної залежності. При занадто малих значеннях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; крива &amp;lt;math&amp;gt;a(x) &amp;lt;/math&amp;gt; прагне пройти через кожну точку вибірки, гостро реагуючи на шуми і зазнаючи різкі скачки, оскільки в цьому випадку оцінка опирається лише на невелике число спостережень з вузької окружності точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Навпаки, якщо ширина вікна велика, функція надмірно згладжується і в межі при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вироджується в константу -- усереднене значення величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В цьому випадку згладжена функція не дає можливості визначити характерні особливості шуканої залежності &amp;lt;math&amp;gt; y^*(x) &amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14048</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14048"/>
				<updated>2012-03-13T17:30:46Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Приклад функції ядра */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерне згладжуваня''' - один із найпростіших видів [[Непараметрична регресія|непараметричної регресії]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачі ==&lt;br /&gt;
&lt;br /&gt;
:Вирішується завдання відновлення регресії. Заданий простір об'єктів &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; і безліч можливих відповідей &amp;lt;math&amp;gt;y=r&amp;lt;/math&amp;gt;. Існує невідома цільова залежність &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, значення якої відомі лише на об'єктах навчальної вибірки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;.  Потрібно побудувати алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, що апроксимує цільову залежність &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, використання ідейно простого підхіду до уявлення послідовності вагів &amp;lt;math&amp;gt;\{ W_{mi}(x)\}_{i=1}^m&amp;lt;/math&amp;gt; полягає в описі форми вагової  функції &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; за допомогою функції щільності із скалярним параметром, який регулює розмір і форму вагів біля х.  Цю функцію форми  прийнято називати ''''ядром'''' &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Отримані таким чином ваги далі використовуються для представлення величини &amp;lt;math&amp;gt;a(x) &amp;lt;/math&amp;gt; у вигляді зваженої суми значень &amp;lt;math&amp;gt;y_i&amp;lt;/math&amp;gt; навчаючої вибірки.&lt;br /&gt;
&lt;br /&gt;
== Опис методу ==&lt;br /&gt;
=== Визначення ядра ===&lt;br /&gt;
'''Ядро''' — це неперермвна обмеженна симетрична речовина функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; з одиничним інтегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Послідовність ваги ===&lt;br /&gt;
Послідовність ваги для ядерних оцінок (для одновимірного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) знаходиться як ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
де&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
уявимо собі ядро з параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Також цей параметр прийнято називати шириной вікна. Підкреслемо залежність &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; від об'єму вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, умова скороченого значення послідовністі ваги &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функція ядра ===&lt;br /&gt;
Функція &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; являєтся ''ядерною оцінкою щільності Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальної) щільності зміної &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Даний вид ядерних вагів &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; був запропонований в работах (Nadaraya, 1964) і (Watson, 1964). Як наслідок, оцінка очікуваної величини відновлюваної залежності &amp;lt;math&amp;gt;e(y\|x) &amp;lt;/math&amp;gt;: ::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-x_i) Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-x_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто називають оцінкою ''Надарая—Ватсона''.&lt;br /&gt;
Ширіна вікна визначає, наскільки швидко убувають ваги &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; у міру видалення об'єктів &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Характер убування визначається виглядом ядра &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормалізація вагів &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантує, що сума вагів дорівнює одиниці.&lt;br /&gt;
 &lt;br /&gt;
'''Примітка'''. При ряду умов має місце збіжність по вірогідності даної оцінки до &amp;lt;math&amp;gt;e(y|x) &amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Приклад функції ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практиці використовується декілька видів ядерних функцій.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Також викоритовуєтьсятся ядро Епанечникова, яке володіє деякими властивостями оптимальності [Хардле В п4.5]; це функція &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Іншим прикладом є ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
трикутне ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
і прямокутне ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Примітка'''. Точність відновленоії залежності мало залежить від вибору ядра. &lt;br /&gt;
Ядро визначає міру гладкості функції &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Залежність від ширини вікна ===&lt;br /&gt;
Вибір вікна вирішальним чином впливає на точність відновлюваної залежності. При занадто малих значеннях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; крива &amp;lt;math&amp;gt;a(x) &amp;lt;/math&amp;gt; прагне пройти через кожну точку вибірки, гостро реагуючи на шуми і зазнаючи різкі скачки, оскільки в цьому випадку оцінка опирається лише на невелике число спостережень з вузької окружності точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Навпаки, якщо ширина вікна велика, функція надмірно згладжується і в межі при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вироджується в константу -- усереднене значення величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В цьому випадку згладжена функція не дає можливості визначити характерні особливості шуканої залежності &amp;lt;math&amp;gt; y^*(x) &amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14047</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14047"/>
				<updated>2012-03-13T17:30:16Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Залежність від ширини вікна */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерне згладжуваня''' - один із найпростіших видів [[Непараметрична регресія|непараметричної регресії]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачі ==&lt;br /&gt;
&lt;br /&gt;
:Вирішується завдання відновлення регресії. Заданий простір об'єктів &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; і безліч можливих відповідей &amp;lt;math&amp;gt;y=r&amp;lt;/math&amp;gt;. Існує невідома цільова залежність &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, значення якої відомі лише на об'єктах навчальної вибірки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;.  Потрібно побудувати алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, що апроксимує цільову залежність &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, використання ідейно простого підхіду до уявлення послідовності вагів &amp;lt;math&amp;gt;\{ W_{mi}(x)\}_{i=1}^m&amp;lt;/math&amp;gt; полягає в описі форми вагової  функції &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; за допомогою функції щільності із скалярним параметром, який регулює розмір і форму вагів біля х.  Цю функцію форми  прийнято називати ''''ядром'''' &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Отримані таким чином ваги далі використовуються для представлення величини &amp;lt;math&amp;gt;a(x) &amp;lt;/math&amp;gt; у вигляді зваженої суми значень &amp;lt;math&amp;gt;y_i&amp;lt;/math&amp;gt; навчаючої вибірки.&lt;br /&gt;
&lt;br /&gt;
== Опис методу ==&lt;br /&gt;
=== Визначення ядра ===&lt;br /&gt;
'''Ядро''' — це неперермвна обмеженна симетрична речовина функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; з одиничним інтегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Послідовність ваги ===&lt;br /&gt;
Послідовність ваги для ядерних оцінок (для одновимірного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) знаходиться як ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
де&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
уявимо собі ядро з параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Також цей параметр прийнято називати шириной вікна. Підкреслемо залежність &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; від об'єму вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, умова скороченого значення послідовністі ваги &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функція ядра ===&lt;br /&gt;
Функція &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; являєтся ''ядерною оцінкою щільності Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальної) щільності зміної &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Даний вид ядерних вагів &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; був запропонований в работах (Nadaraya, 1964) і (Watson, 1964). Як наслідок, оцінка очікуваної величини відновлюваної залежності &amp;lt;math&amp;gt;e(y\|x) &amp;lt;/math&amp;gt;: ::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-x_i) Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-x_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто називають оцінкою ''Надарая—Ватсона''.&lt;br /&gt;
Ширіна вікна визначає, наскільки швидко убувають ваги &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; у міру видалення об'єктів &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Характер убування визначається виглядом ядра &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормалізація вагів &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантує, що сума вагів дорівнює одиниці.&lt;br /&gt;
 &lt;br /&gt;
'''Примітка'''. При ряду умов має місце збіжність по вірогідності даної оцінки до &amp;lt;math&amp;gt;e(y|x) &amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Приклад функції ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практиці використовується декілька видів ядерних функцій.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Також викоритовуєтьсятся ядро Епанечникова, яке володіє деякими властивостями оптимальності [Хардле В п4.5]; це функція &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Іншими прикладом є ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
трикутне ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
і прямокутне ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Примітка'''. Точність відновленоії залежності мало залежить від вибору ядра. &lt;br /&gt;
Ядро визначає міру гладкості функції &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Залежність від ширини вікна ===&lt;br /&gt;
Вибір вікна вирішальним чином впливає на точність відновлюваної залежності. При занадто малих значеннях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; крива &amp;lt;math&amp;gt;a(x) &amp;lt;/math&amp;gt; прагне пройти через кожну точку вибірки, гостро реагуючи на шуми і зазнаючи різкі скачки, оскільки в цьому випадку оцінка опирається лише на невелике число спостережень з вузької окружності точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Навпаки, якщо ширина вікна велика, функція надмірно згладжується і в межі при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вироджується в константу -- усереднене значення величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В цьому випадку згладжена функція не дає можливості визначити характерні особливості шуканої залежності &amp;lt;math&amp;gt; y^*(x) &amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14046</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14046"/>
				<updated>2012-03-13T17:16:56Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Приклад функції ядра */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерне згладжуваня''' - один із найпростіших видів [[Непараметрична регресія|непараметричної регресії]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачі ==&lt;br /&gt;
&lt;br /&gt;
:Вирішується завдання відновлення регресії. Заданий простір об'єктів &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; і безліч можливих відповідей &amp;lt;math&amp;gt;y=r&amp;lt;/math&amp;gt;. Існує невідома цільова залежність &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, значення якої відомі лише на об'єктах навчальної вибірки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;.  Потрібно побудувати алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, що апроксимує цільову залежність &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, використання ідейно простого підхіду до уявлення послідовності вагів &amp;lt;math&amp;gt;\{ W_{mi}(x)\}_{i=1}^m&amp;lt;/math&amp;gt; полягає в описі форми вагової  функції &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; за допомогою функції щільності із скалярним параметром, який регулює розмір і форму вагів біля х.  Цю функцію форми  прийнято називати ''''ядром'''' &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Отримані таким чином ваги далі використовуються для представлення величини &amp;lt;math&amp;gt;a(x) &amp;lt;/math&amp;gt; у вигляді зваженої суми значень &amp;lt;math&amp;gt;y_i&amp;lt;/math&amp;gt; навчаючої вибірки.&lt;br /&gt;
&lt;br /&gt;
== Опис методу ==&lt;br /&gt;
=== Визначення ядра ===&lt;br /&gt;
'''Ядро''' — це неперермвна обмеженна симетрична речовина функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; з одиничним інтегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Послідовність ваги ===&lt;br /&gt;
Послідовність ваги для ядерних оцінок (для одновимірного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) знаходиться як ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
де&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
уявимо собі ядро з параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Також цей параметр прийнято називати шириной вікна. Підкреслемо залежність &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; від об'єму вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, умова скороченого значення послідовністі ваги &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функція ядра ===&lt;br /&gt;
Функція &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; являєтся ''ядерною оцінкою щільності Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальної) щільності зміної &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Даний вид ядерних вагів &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; був запропонований в работах (Nadaraya, 1964) і (Watson, 1964). Як наслідок, оцінка очікуваної величини відновлюваної залежності &amp;lt;math&amp;gt;e(y\|x) &amp;lt;/math&amp;gt;: ::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-x_i) Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-x_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто називають оцінкою ''Надарая—Ватсона''.&lt;br /&gt;
Ширіна вікна визначає, наскільки швидко убувають ваги &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; у міру видалення об'єктів &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Характер убування визначається виглядом ядра &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормалізація вагів &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантує, що сума вагів дорівнює одиниці.&lt;br /&gt;
 &lt;br /&gt;
'''Примітка'''. При ряду умов має місце збіжність по вірогідності даної оцінки до &amp;lt;math&amp;gt;e(y|x) &amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Приклад функції ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практиці використовується декілька видів ядерних функцій.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Також викоритовуєтьсятся ядро Епанечникова, яке володіє деякими властивостями оптимальності [Хардле В п4.5]; це функція &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Іншими прикладом є ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
трикутне ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
і прямокутне ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Примітка'''. Точність відновленоії залежності мало залежить від вибору ядра. &lt;br /&gt;
Ядро визначає міру гладкості функції &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Залежність від ширини вікна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14045</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14045"/>
				<updated>2012-03-13T17:04:55Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Функція ядра */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерне згладжуваня''' - один із найпростіших видів [[Непараметрична регресія|непараметричної регресії]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачі ==&lt;br /&gt;
&lt;br /&gt;
:Вирішується завдання відновлення регресії. Заданий простір об'єктів &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; і безліч можливих відповідей &amp;lt;math&amp;gt;y=r&amp;lt;/math&amp;gt;. Існує невідома цільова залежність &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, значення якої відомі лише на об'єктах навчальної вибірки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;.  Потрібно побудувати алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, що апроксимує цільову залежність &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, використання ідейно простого підхіду до уявлення послідовності вагів &amp;lt;math&amp;gt;\{ W_{mi}(x)\}_{i=1}^m&amp;lt;/math&amp;gt; полягає в описі форми вагової  функції &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; за допомогою функції щільності із скалярним параметром, який регулює розмір і форму вагів біля х.  Цю функцію форми  прийнято називати ''''ядром'''' &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Отримані таким чином ваги далі використовуються для представлення величини &amp;lt;math&amp;gt;a(x) &amp;lt;/math&amp;gt; у вигляді зваженої суми значень &amp;lt;math&amp;gt;y_i&amp;lt;/math&amp;gt; навчаючої вибірки.&lt;br /&gt;
&lt;br /&gt;
== Опис методу ==&lt;br /&gt;
=== Визначення ядра ===&lt;br /&gt;
'''Ядро''' — це неперермвна обмеженна симетрична речовина функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; з одиничним інтегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Послідовність ваги ===&lt;br /&gt;
Послідовність ваги для ядерних оцінок (для одновимірного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) знаходиться як ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
де&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
уявимо собі ядро з параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Також цей параметр прийнято називати шириной вікна. Підкреслемо залежність &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; від об'єму вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, умова скороченого значення послідовністі ваги &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функція ядра ===&lt;br /&gt;
Функція &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; являєтся ''ядерною оцінкою щільності Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальної) щільності зміної &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Даний вид ядерних вагів &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; був запропонований в работах (Nadaraya, 1964) і (Watson, 1964). Як наслідок, оцінка очікуваної величини відновлюваної залежності &amp;lt;math&amp;gt;e(y\|x) &amp;lt;/math&amp;gt;: ::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-x_i) Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-x_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто називають оцінкою ''Надарая—Ватсона''.&lt;br /&gt;
Ширіна вікна визначає, наскільки швидко убувають ваги &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; у міру видалення об'єктів &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Характер убування визначається виглядом ядра &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормалізація вагів &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантує, що сума вагів дорівнює одиниці.&lt;br /&gt;
 &lt;br /&gt;
'''Примітка'''. При ряду умов має місце збіжність по вірогідності даної оцінки до &amp;lt;math&amp;gt;e(y|x) &amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Приклад функції ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Залежність від ширини вікна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14044</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14044"/>
				<updated>2012-03-13T17:00:48Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Функція ядра */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерне згладжуваня''' - один із найпростіших видів [[Непараметрична регресія|непараметричної регресії]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачі ==&lt;br /&gt;
&lt;br /&gt;
:Вирішується завдання відновлення регресії. Заданий простір об'єктів &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; і безліч можливих відповідей &amp;lt;math&amp;gt;y=r&amp;lt;/math&amp;gt;. Існує невідома цільова залежність &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, значення якої відомі лише на об'єктах навчальної вибірки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;.  Потрібно побудувати алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, що апроксимує цільову залежність &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, використання ідейно простого підхіду до уявлення послідовності вагів &amp;lt;math&amp;gt;\{ W_{mi}(x)\}_{i=1}^m&amp;lt;/math&amp;gt; полягає в описі форми вагової  функції &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; за допомогою функції щільності із скалярним параметром, який регулює розмір і форму вагів біля х.  Цю функцію форми  прийнято називати ''''ядром'''' &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Отримані таким чином ваги далі використовуються для представлення величини &amp;lt;math&amp;gt;a(x) &amp;lt;/math&amp;gt; у вигляді зваженої суми значень &amp;lt;math&amp;gt;y_i&amp;lt;/math&amp;gt; навчаючої вибірки.&lt;br /&gt;
&lt;br /&gt;
== Опис методу ==&lt;br /&gt;
=== Визначення ядра ===&lt;br /&gt;
'''Ядро''' — це неперермвна обмеженна симетрична речовина функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; з одиничним інтегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Послідовність ваги ===&lt;br /&gt;
Послідовність ваги для ядерних оцінок (для одновимірного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) знаходиться як ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
де&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
уявимо собі ядро з параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Також цей параметр прийнято називати шириной вікна. Підкреслемо залежність &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; від об'єму вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, умова скороченого значення послідовністі ваги &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функція ядра ===&lt;br /&gt;
Функція &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; являєтся ''ядерною оцінкою щільності Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальної) щільності зміної &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Даний вид ядерних вагів &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; був запропонований в работах (Nadaraya, 1964) і (Watson, 1964). Як наслідок, оцінка очікуваної величини відновлюваної залежності &amp;lt;math&amp;gt;e(y\|x) &amp;lt;/math&amp;gt;: ::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-x_i) Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-x_i)}&amp;lt;/math&amp;gt; часто називають оцінкою ''''Надарая—Ватсона''''.  Ширіна вікна визначає, наскільки швидко убувають ваги &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; у міру видалення об'єктів &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Характер убування визначається виглядом ядра &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормалізація вагів &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантує, що сума вагів дорівнює одиниці. &lt;br /&gt;
''''''Примітка''''''. При ряду умов має місце збіжність по вірогідності даної оцінки до &amp;lt;math&amp;gt;e(y|x) &amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Приклад функції ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Залежність від ширини вікна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14043</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14043"/>
				<updated>2012-03-13T16:47:20Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Визначення ядра */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерне згладжуваня''' - один із найпростіших видів [[Непараметрична регресія|непараметричної регресії]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачі ==&lt;br /&gt;
&lt;br /&gt;
:Вирішується завдання відновлення регресії. Заданий простір об'єктів &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; і безліч можливих відповідей &amp;lt;math&amp;gt;y=r&amp;lt;/math&amp;gt;. Існує невідома цільова залежність &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, значення якої відомі лише на об'єктах навчальної вибірки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;.  Потрібно побудувати алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, що апроксимує цільову залежність &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, використання ідейно простого підхіду до уявлення послідовності вагів &amp;lt;math&amp;gt;\{ W_{mi}(x)\}_{i=1}^m&amp;lt;/math&amp;gt; полягає в описі форми вагової  функції &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; за допомогою функції щільності із скалярним параметром, який регулює розмір і форму вагів біля х.  Цю функцію форми  прийнято називати ''''ядром'''' &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Отримані таким чином ваги далі використовуються для представлення величини &amp;lt;math&amp;gt;a(x) &amp;lt;/math&amp;gt; у вигляді зваженої суми значень &amp;lt;math&amp;gt;y_i&amp;lt;/math&amp;gt; навчаючої вибірки.&lt;br /&gt;
&lt;br /&gt;
== Опис методу ==&lt;br /&gt;
=== Визначення ядра ===&lt;br /&gt;
'''Ядро''' — це неперермвна обмеженна симетрична речовина функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; з одиничним інтегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Послідовність ваги ===&lt;br /&gt;
Послідовність ваги для ядерних оцінок (для одновимірного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) знаходиться як ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
де&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
уявимо собі ядро з параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Також цей параметр прийнято називати шириной вікна. Підкреслемо залежність &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; від об'єму вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, умова скороченого значення послідовністі ваги &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функція ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Приклад функції ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Залежність від ширини вікна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14042</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14042"/>
				<updated>2012-03-13T16:42:17Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Принцип */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерне згладжуваня''' - один із найпростіших видів [[Непараметрична регресія|непараметричної регресії]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачі ==&lt;br /&gt;
&lt;br /&gt;
:Вирішується завдання відновлення регресії. Заданий простір об'єктів &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; і безліч можливих відповідей &amp;lt;math&amp;gt;y=r&amp;lt;/math&amp;gt;. Існує невідома цільова залежність &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, значення якої відомі лише на об'єктах навчальної вибірки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;.  Потрібно побудувати алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, що апроксимує цільову залежність &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, використання ідейно простого підхіду до уявлення послідовності вагів &amp;lt;math&amp;gt;\{ W_{mi}(x)\}_{i=1}^m&amp;lt;/math&amp;gt; полягає в описі форми вагової  функції &amp;lt;math&amp;gt;w_{mi}(x) &amp;lt;/math&amp;gt; за допомогою функції щільності із скалярним параметром, який регулює розмір і форму вагів біля х.  Цю функцію форми  прийнято називати ''''ядром'''' &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt;. &lt;br /&gt;
Отримані таким чином ваги далі використовуються для представлення величини &amp;lt;math&amp;gt;a(x) &amp;lt;/math&amp;gt; у вигляді зваженої суми значень &amp;lt;math&amp;gt;y_i&amp;lt;/math&amp;gt; навчаючої вибірки.&lt;br /&gt;
&lt;br /&gt;
== Опис методу ==&lt;br /&gt;
=== Визначення ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Послідовність ваги ===&lt;br /&gt;
Послідовність ваги для ядерних оцінок (для одновимірного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) знаходиться як ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
де&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
уявимо собі ядро з параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Також цей параметр прийнято називати шириной вікна. Підкреслемо залежність &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; від об'єму вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, умова скороченого значення послідовністі ваги &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функція ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Приклад функції ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Залежність від ширини вікна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14041</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14041"/>
				<updated>2012-03-13T16:34:26Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Постановка задачі */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерне згладжуваня''' - один із найпростіших видів [[Непараметрична регресія|непараметричної регресії]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачі ==&lt;br /&gt;
&lt;br /&gt;
:Вирішується завдання відновлення регресії. Заданий простір об'єктів &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; і безліч можливих відповідей &amp;lt;math&amp;gt;y=r&amp;lt;/math&amp;gt;. Існує невідома цільова залежність &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, значення якої відомі лише на об'єктах навчальної вибірки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;.  Потрібно побудувати алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, що апроксимує цільову залежність &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Опис методу ==&lt;br /&gt;
=== Визначення ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Послідовність ваги ===&lt;br /&gt;
Послідовність ваги для ядерних оцінок (для одновимірного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) знаходиться як ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
де&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
уявимо собі ядро з параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Також цей параметр прийнято називати шириной вікна. Підкреслемо залежність &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; від об'єму вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, умова скороченого значення послідовністі ваги &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функція ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Приклад функції ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Залежність від ширини вікна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14040</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14040"/>
				<updated>2012-03-13T16:31:58Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Постановка задачи */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерне згладжуваня''' - один із найпростіших видів [[Непараметрична регресія|непараметричної регресії]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачі ==&lt;br /&gt;
&lt;br /&gt;
:Вирішується завдання відновлення регресії. Заданий простір об'єктів &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; і безліч можливих відповідей &amp;lt;math&amp;gt;y=r&amp;lt;/math&amp;gt;. Існує невідома цільова залежність &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, значення якої відомі лише на об'єктах повчальної вибірки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;.  Потрібно побудувати алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, що апроксимує цільову залежність &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Опис методу ==&lt;br /&gt;
=== Визначення ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Послідовність ваги ===&lt;br /&gt;
Послідовність ваги для ядерних оцінок (для одновимірного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) знаходиться як ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
де&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
уявимо собі ядро з параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Також цей параметр прийнято називати шириной вікна. Підкреслемо залежність &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; від об'єму вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, умова скороченого значення послідовністі ваги &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функція ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Приклад функції ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Залежність від ширини вікна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14039</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14039"/>
				<updated>2012-03-13T16:29:52Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Последовательность весов */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерне згладжуваня''' - один із найпростіших видів [[Непараметрична регресія|непараметричної регресії]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Опис методу ==&lt;br /&gt;
=== Визначення ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Послідовність ваги ===&lt;br /&gt;
Послідовність ваги для ядерних оцінок (для одновимірного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) знаходиться як ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
де&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
уявимо собі ядро з параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Також цей параметр прийнято називати шириной вікна. Підкреслемо залежність &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; від об'єму вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, умова скороченого значення послідовністі ваги &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функція ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Приклад функції ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Залежність від ширини вікна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14036</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14036"/>
				<updated>2012-03-13T16:19:13Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Описание метода */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерне згладжуваня''' - один із найпростіших видів [[Непараметрична регресія|непараметричної регресії]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Опис методу ==&lt;br /&gt;
=== Визначення ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функція ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Приклад функції ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Залежність від ширини вікна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14035</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14035"/>
				<updated>2012-03-13T16:16:02Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерне згладжуваня''' - один із найпростіших видів [[Непараметрична регресія|непараметричної регресії]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:CoreFunc.png&amp;diff=14034</id>
		<title>Файл:CoreFunc.png</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:CoreFunc.png&amp;diff=14034"/>
				<updated>2012-03-13T16:10:46Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: Приклади різних функцій ядра(Ядерне зглоджування)&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Приклади різних функцій ядра(Ядерне зглоджування)&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14033</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14033"/>
				<updated>2012-03-13T16:08:47Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Пример функции ядра */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Файл:CoreFunc.png|thumb|right|400px|Приклади різних функцій ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14032</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14032"/>
				<updated>2012-03-13T16:04:26Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* См. также */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Варіація і зміщення]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14031</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14031"/>
				<updated>2012-03-13T16:02:26Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Литература */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Література==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекції по алгоритмам відновлення регресії] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.''Прикладна математична статистика.- 2009&lt;br /&gt;
&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14030</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14030"/>
				<updated>2012-03-13T15:51:12Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Литература */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# ''Хардле В.''[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''[http://www.ccas.ru/voron/download/Regression.pdf/ Лекции по алгоритмам восстановления регрессии] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.'' Наглядная математическая статистика. - 2009&lt;br /&gt;
&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14029</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14029"/>
				<updated>2012-03-13T15:50:39Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Литература */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# ''Хардле В.''&lt;br /&gt;
[http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/ Прикладна непараметрична регресія]-1989р.&lt;br /&gt;
# ''Воронцов К.В.''&lt;br /&gt;
[http://www.ccas.ru/voron/download/Regression.pdf/ Лекции по алгоритмам восстановления регрессии] - 2007.&lt;br /&gt;
# ''Лагутин М.Б.'' Наглядная математическая статистика. - 2009&lt;br /&gt;
&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14028</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14028"/>
				<updated>2012-03-13T15:40:57Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* посилання */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
==посилання==&lt;br /&gt;
[[Непараметрична регресія]]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14027</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14027"/>
				<updated>2012-03-13T15:38:47Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|18 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
==посилання==&lt;br /&gt;
[Непараметрическая регрессия]&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14026</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14026"/>
				<updated>2012-03-13T15:34:19Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Завдання|Шостак В.М.|Назаревич О. Б.|10 березня 2012}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
&lt;br /&gt;
[[Категория:Непараметрическая регрессия]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14025</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14025"/>
				<updated>2012-03-13T15:30:33Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* См. также */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
&lt;br /&gt;
[[Категория:Непараметрическая регрессия]]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14024</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14024"/>
				<updated>2012-03-13T15:29:45Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Зависимость от ширины окна */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
&lt;br /&gt;
[[Категория:Непараметрическая регрессия]]&lt;br /&gt;
&lt;br /&gt;
{{ЗаданиеВыполнено|Tolstikhin|Vokov|31 декабря 2009}}&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14023</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14023"/>
				<updated>2012-03-13T15:29:17Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Зависимость от ширины окна */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; кривая &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;math&amp;gt; h \rightarrow \infty&amp;lt;/math&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;math&amp;gt; y^*(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
&lt;br /&gt;
[[Категория:Непараметрическая регрессия]]&lt;br /&gt;
&lt;br /&gt;
{{ЗаданиеВыполнено|Tolstikhin|Vokov|31 декабря 2009}}&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14022</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14022"/>
				<updated>2012-03-13T15:27:21Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Пример функции ядра */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/math&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/math&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;math&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;tex&amp;gt;h&amp;lt;/tex&amp;gt; кривая &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;tex&amp;gt; h \rightarrow \infty&amp;lt;/tex&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;tex&amp;gt; y_i&amp;lt;/tex&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;tex&amp;gt; y^*(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
&lt;br /&gt;
[[Категория:Непараметрическая регрессия]]&lt;br /&gt;
&lt;br /&gt;
{{ЗаданиеВыполнено|Tolstikhin|Vokov|31 декабря 2009}}&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14021</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14021"/>
				<updated>2012-03-13T15:25:46Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Функция ядра */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. Данный вид ядерных весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;math&amp;gt;E(y\|x)&amp;lt;/math&amp;gt;:&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/math&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; по мере удаления объектов &amp;lt;math&amp;gt;x_i&amp;lt;/math&amp;gt; от &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;math&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/math&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;math&amp;gt;E(y|x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;tex&amp;gt;h&amp;lt;/tex&amp;gt; кривая &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;tex&amp;gt; h \rightarrow \infty&amp;lt;/tex&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;tex&amp;gt; y_i&amp;lt;/tex&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;tex&amp;gt; y^*(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
&lt;br /&gt;
[[Категория:Непараметрическая регрессия]]&lt;br /&gt;
&lt;br /&gt;
{{ЗаданиеВыполнено|Tolstikhin|Vokov|31 декабря 2009}}&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14020</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14020"/>
				<updated>2012-03-13T15:22:35Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Последовательность весов */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;) определяется как ::&amp;lt;math&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/math&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;math&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/math&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;math&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/math&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;math&amp;gt;h_m&amp;lt;/math&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;math&amp;gt;h\ =\ h_m&amp;lt;/math&amp;gt; от объема выборки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/tex&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;. Данный вид ядерных весов &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;tex&amp;gt;E(y\|x)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
::&amp;lt;tex&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/tex&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; по мере удаления объектов &amp;lt;tex&amp;gt;x_i&amp;lt;/tex&amp;gt; от &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/tex&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;tex&amp;gt;E(y|x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;tex&amp;gt;h&amp;lt;/tex&amp;gt; кривая &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;tex&amp;gt; h \rightarrow \infty&amp;lt;/tex&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;tex&amp;gt; y_i&amp;lt;/tex&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;tex&amp;gt; y^*(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
&lt;br /&gt;
[[Категория:Непараметрическая регрессия]]&lt;br /&gt;
&lt;br /&gt;
{{ЗаданиеВыполнено|Tolstikhin|Vokov|31 декабря 2009}}&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14019</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14019"/>
				<updated>2012-03-13T15:20:40Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Определение ядра */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;math&amp;gt;\int K(u)du=1&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;) определяется как ::&amp;lt;tex&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/tex&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;tex&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/tex&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;tex&amp;gt;h_m&amp;lt;/tex&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;tex&amp;gt;h\ =\ h_m&amp;lt;/tex&amp;gt; от объема выборки &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/tex&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;. Данный вид ядерных весов &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;tex&amp;gt;E(y\|x)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
::&amp;lt;tex&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/tex&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; по мере удаления объектов &amp;lt;tex&amp;gt;x_i&amp;lt;/tex&amp;gt; от &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/tex&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;tex&amp;gt;E(y|x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;tex&amp;gt;h&amp;lt;/tex&amp;gt; кривая &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;tex&amp;gt; h \rightarrow \infty&amp;lt;/tex&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;tex&amp;gt; y_i&amp;lt;/tex&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;tex&amp;gt; y^*(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
&lt;br /&gt;
[[Категория:Непараметрическая регрессия]]&lt;br /&gt;
&lt;br /&gt;
{{ЗаданиеВыполнено|Tolstikhin|Vokov|31 декабря 2009}}&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14018</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14018"/>
				<updated>2012-03-13T15:20:02Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Принцип */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;math&amp;gt;a(x)&amp;lt;/math&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;tex&amp;gt;\int K(u)du=1&amp;lt;/tex&amp;gt;&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;) определяется как ::&amp;lt;tex&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/tex&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;tex&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/tex&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;tex&amp;gt;h_m&amp;lt;/tex&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;tex&amp;gt;h\ =\ h_m&amp;lt;/tex&amp;gt; от объема выборки &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/tex&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;. Данный вид ядерных весов &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;tex&amp;gt;E(y\|x)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
::&amp;lt;tex&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/tex&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; по мере удаления объектов &amp;lt;tex&amp;gt;x_i&amp;lt;/tex&amp;gt; от &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/tex&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;tex&amp;gt;E(y|x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;tex&amp;gt;h&amp;lt;/tex&amp;gt; кривая &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;tex&amp;gt; h \rightarrow \infty&amp;lt;/tex&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;tex&amp;gt; y_i&amp;lt;/tex&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;tex&amp;gt; y^*(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
&lt;br /&gt;
[[Категория:Непараметрическая регрессия]]&lt;br /&gt;
&lt;br /&gt;
{{ЗаданиеВыполнено|Tolstikhin|Vokov|31 декабря 2009}}&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14017</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14017"/>
				<updated>2012-03-13T15:19:27Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Принцип */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;math&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/math&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;math&amp;gt;W_{mi}(x)&amp;lt;/math&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt; в виде взвешенной суммы значений &amp;lt;math&amp;gt; y_i&amp;lt;/math&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;tex&amp;gt;\int K(u)du=1&amp;lt;/tex&amp;gt;&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;) определяется как ::&amp;lt;tex&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/tex&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;tex&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/tex&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;tex&amp;gt;h_m&amp;lt;/tex&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;tex&amp;gt;h\ =\ h_m&amp;lt;/tex&amp;gt; от объема выборки &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/tex&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;. Данный вид ядерных весов &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;tex&amp;gt;E(y\|x)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
::&amp;lt;tex&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/tex&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; по мере удаления объектов &amp;lt;tex&amp;gt;x_i&amp;lt;/tex&amp;gt; от &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/tex&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;tex&amp;gt;E(y|x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;tex&amp;gt;h&amp;lt;/tex&amp;gt; кривая &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;tex&amp;gt; h \rightarrow \infty&amp;lt;/tex&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;tex&amp;gt; y_i&amp;lt;/tex&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;tex&amp;gt; y^*(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
&lt;br /&gt;
[[Категория:Непараметрическая регрессия]]&lt;br /&gt;
&lt;br /&gt;
{{ЗаданиеВыполнено|Tolstikhin|Vokov|31 декабря 2009}}&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14016</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14016"/>
				<updated>2012-03-13T15:17:49Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Постановка задачи */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;math&amp;gt;Y=R&amp;lt;/math&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;math&amp;gt; y^*: X \rightarrow Y&amp;lt;/math&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;math&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/math&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;math&amp;gt;a: X \rightarrow Y &amp;lt;/math&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;math&amp;gt;y^*&amp;lt;/math&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;tex&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/tex&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt; в виде взвешенной суммы значений &amp;lt;tex&amp;gt; y_i&amp;lt;/tex&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;tex&amp;gt;\int K(u)du=1&amp;lt;/tex&amp;gt;&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;) определяется как ::&amp;lt;tex&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/tex&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;tex&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/tex&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;tex&amp;gt;h_m&amp;lt;/tex&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;tex&amp;gt;h\ =\ h_m&amp;lt;/tex&amp;gt; от объема выборки &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/tex&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;. Данный вид ядерных весов &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;tex&amp;gt;E(y\|x)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
::&amp;lt;tex&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/tex&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; по мере удаления объектов &amp;lt;tex&amp;gt;x_i&amp;lt;/tex&amp;gt; от &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/tex&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;tex&amp;gt;E(y|x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;tex&amp;gt;h&amp;lt;/tex&amp;gt; кривая &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;tex&amp;gt; h \rightarrow \infty&amp;lt;/tex&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;tex&amp;gt; y_i&amp;lt;/tex&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;tex&amp;gt; y^*(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
&lt;br /&gt;
[[Категория:Непараметрическая регрессия]]&lt;br /&gt;
&lt;br /&gt;
{{ЗаданиеВыполнено|Tolstikhin|Vokov|31 декабря 2009}}&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14015</id>
		<title>Ядерне згладжуваня</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%AF%D0%B4%D0%B5%D1%80%D0%BD%D0%B5_%D0%B7%D0%B3%D0%BB%D0%B0%D0%B4%D0%B6%D1%83%D0%B2%D0%B0%D0%BD%D1%8F&amp;diff=14015"/>
				<updated>2012-03-13T15:14:47Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: Створена сторінка: '''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непарам…&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;'''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].&lt;br /&gt;
&lt;br /&gt;
== Постановка задачи ==&lt;br /&gt;
&lt;br /&gt;
:Решается задача восстановления регрессии. Задано пространство объектов &amp;lt;tex&amp;gt;X&amp;lt;/tex&amp;gt; и множество возможных &lt;br /&gt;
ответов &amp;lt;tex&amp;gt;Y=R&amp;lt;/tex&amp;gt;. Существует неизвестная целевая зависимость &amp;lt;tex&amp;gt; y^*: X \rightarrow Y&amp;lt;/tex&amp;gt;, &lt;br /&gt;
значения которой известны только на объектах обучающей выборки &amp;lt;tex&amp;gt; X^m={(x_i, y_i)}_{i=1}^m&amp;lt;/tex&amp;gt;. &lt;br /&gt;
Требуется построить алгоритм &amp;lt;tex&amp;gt;a: X \rightarrow Y &amp;lt;/tex&amp;gt;, аппроксимирующий целевую зависимость &amp;lt;tex&amp;gt;y^*&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Принцип ==&lt;br /&gt;
Принцип, используйщий идейно простой подход к представлению последовательности весов &amp;lt;tex&amp;gt;\{ W_{mi}(x) \}_{i=1}^m&amp;lt;/tex&amp;gt; состоит в описании формы весовой &lt;br /&gt;
функции &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. &lt;br /&gt;
Эту функцию формы  принято называть ''ядром'' &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Полученные таким образом веса далее используются для представления величины &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt; в виде взвешенной суммы значений &amp;lt;tex&amp;gt; y_i&amp;lt;/tex&amp;gt; обучающей выборки.&lt;br /&gt;
&lt;br /&gt;
== Описание метода ==&lt;br /&gt;
=== Определение ядра ===&lt;br /&gt;
'''Ядро''' — это непрерывная ограниченная симметричная вещественная функция &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt; с единичным интегралом&lt;br /&gt;
::&amp;lt;tex&amp;gt;\int K(u)du=1&amp;lt;/tex&amp;gt;&lt;br /&gt;
=== Последовательность весов ===&lt;br /&gt;
Последовательность весов для ядерных оценок (для одномерного &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;) определяется как ::&amp;lt;tex&amp;gt;W_{mi}(x)=\frac{K_{h_m}(x-X_i)}{\hat{f}_{h_m}(x)}&amp;lt;/tex&amp;gt;,&lt;br /&gt;
где&lt;br /&gt;
::&amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)=\frac1m \sum_{i=1}^m K_{h_m}(x-X_i)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
a&lt;br /&gt;
::&amp;lt;tex&amp;gt;K_{h_m}(u)=\frac{1}{h_m} K\(\frac{u}{h_m}\)&amp;lt;/tex&amp;gt;&lt;br /&gt;
представляет собой ядро с параметром &amp;lt;tex&amp;gt;h_m&amp;lt;/tex&amp;gt;. Этот параметр принято называть шириной окна. Подчеркнув зависимость &amp;lt;tex&amp;gt;h\ =\ h_m&amp;lt;/tex&amp;gt; от объема выборки &amp;lt;tex&amp;gt;m&amp;lt;/tex&amp;gt;, условимся сокращенно обозначать последовательность весов &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Функция ядра ===&lt;br /&gt;
Функция &amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/tex&amp;gt; является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности &lt;br /&gt;
переменной &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;. Данный вид ядерных весов &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; был предложен в работах (Nadaraya, 1964) и (Watson, 1964). Как следствие, оценка &lt;br /&gt;
ожидаемой величины восстанавливаемой зависимости &amp;lt;tex&amp;gt;E(y\|x)&amp;lt;/tex&amp;gt;:&lt;br /&gt;
::&amp;lt;tex&amp;gt;\hat{m}_h(x)=\frac{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)Y_i}{\frac1m\textstyle\sum\limits_{i=1}^m K_{h_m}(x-X_i)}&amp;lt;/tex&amp;gt;&lt;br /&gt;
часто называют оценкой ''Надарая—Ватсона''. &lt;br /&gt;
Ширина окна определяет, насколько быстро убывают веса &amp;lt;tex&amp;gt;W_{mi}(x)&amp;lt;/tex&amp;gt; по мере удаления объектов &amp;lt;tex&amp;gt;x_i&amp;lt;/tex&amp;gt; от &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;. &lt;br /&gt;
Характер убывания определяется видом ядра &amp;lt;tex&amp;gt;K&amp;lt;/tex&amp;gt;. &lt;br /&gt;
Нормализация весов &amp;lt;tex&amp;gt;\hat{f}_{h_m}(x)&amp;lt;/tex&amp;gt; гарантирует, что сумма весов равна единице. &lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. При ряде условий имеет место сходимость по вероятности данной оценки к &amp;lt;tex&amp;gt;E(y|x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Пример функции ядра ===&lt;br /&gt;
[[Изображение:CoreFunc.png|thumb|right|400px|Примеры различных функций ядра.]]&lt;br /&gt;
&lt;br /&gt;
На практике используется несколько видов ядерных функций.&lt;br /&gt;
Чаще всего используется квартическая ядерная функция&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(15/16)(1-u^2)^2I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Также используется ядро Епанечникова, обладающее некоторыми свойствами оптимальности [Хардле В п4.5]; это функция &lt;br /&gt;
параболического типа (Epanechnikov, 1969; Bartlett, 1963):&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=0.75(1-u^2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Другими примерами являются ядро Гаусса,&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(2\pi)^{-1/2} \exp(-u^2/2)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
треугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1-\|u\|)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;,&lt;br /&gt;
и прямоугольное ядро&lt;br /&gt;
::&amp;lt;tex&amp;gt;K(u)=(1/2)I(\| u \| \le 1)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
'''Замечание'''. Точность восстанавливаемой зависимости мало зависит от выбора ядра.&lt;br /&gt;
Ядро определяет степень гладкости функции &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== Зависимость от ширины окна ===&lt;br /&gt;
Выбор окна решающим образом влияет на точность восстанавливаемой зависимости.&lt;br /&gt;
При чересчур малых значениях &amp;lt;tex&amp;gt;h&amp;lt;/tex&amp;gt; кривая &amp;lt;tex&amp;gt;a(x)&amp;lt;/tex&amp;gt; стремится пройти через каждую точку выборки, остро реагируя на шумы и претерпевая резкие&lt;br /&gt;
скачки, поскольку в этом случае оценка опирается только на небольшое число наблюдений из узкой окрестности точки &amp;lt;tex&amp;gt;x&amp;lt;/tex&amp;gt;.&lt;br /&gt;
Наоборот, если ширина окна велика, функция чрезмерно сглаживается и в пределе при &amp;lt;tex&amp;gt; h \rightarrow \infty&amp;lt;/tex&amp;gt; вырождается в константу -- усреднённое&lt;br /&gt;
значение величин &amp;lt;tex&amp;gt; y_i&amp;lt;/tex&amp;gt;. В этом случае сглаженная функция не даёт возможности определить характерные особенности искомой зависимости &amp;lt;tex&amp;gt; y^*(x)&amp;lt;/tex&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
==Литература==&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Хардле В.&lt;br /&gt;
|заглавие  = Прикладная непараметрическая регрессия&lt;br /&gt;
|год          = 1989&lt;br /&gt;
|ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Воронцов К.В.&lt;br /&gt;
|заглавие  = Лекции по алгоритмам восстановления регрессии&lt;br /&gt;
|год          = 2007&lt;br /&gt;
|ссылка       = http://www.ccas.ru/voron/download/Regression.pdf&lt;br /&gt;
}}&lt;br /&gt;
# {{книга&lt;br /&gt;
|автор        = Лагутин М.Б.&lt;br /&gt;
|заглавие  = Наглядная математическая статистика&lt;br /&gt;
|год          = 2009&lt;br /&gt;
|ссылка       = &lt;br /&gt;
}}&lt;br /&gt;
==См. также==&lt;br /&gt;
* [[Алгоритм LOWESS]]&lt;br /&gt;
* [[Вариация и смещение]]&lt;br /&gt;
* [[Регрессионный анализ]]&lt;br /&gt;
&lt;br /&gt;
[[Категория:Непараметрическая регрессия]]&lt;br /&gt;
&lt;br /&gt;
{{ЗаданиеВыполнено|Tolstikhin|Vokov|31 декабря 2009}}&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14006</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14006"/>
				<updated>2012-03-13T12:00:42Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцієваності і гладкості отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстаповскі  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради об'єктивності підкреслимо, що подані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації засновані на основі найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну средньоквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; див. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значеннях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельній мінімізації, а також її обчислювальної складністі.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальні наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні згладжування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів неув'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і їх зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN згладжування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє змінних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' є середнім, зваженим в мінливих ділянках. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; за евклідом ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних згладжувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропускались через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значеннях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризована оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональних розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування з допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Згладжування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Згладжування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точками, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регресограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регресограмма є середнім тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регресограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медіан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний згладжувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійке відносно великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоцикли ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Посилання == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне згладжуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14005</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14005"/>
				<updated>2012-03-13T11:59:50Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Див. також */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцієваності і гладкості отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстаповскі  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради об'єктивності підкреслимо, що подані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації засновані на основі найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну средньоквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; див. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значеннях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельній мінімізації, а також її обчислювальної складністі.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальні наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні згладжування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів неув'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і їх зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN згладжування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє змінних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' є середнім, зваженим в мінливих ділянках. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; за евклідом ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних згладжувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропускались через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значеннях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризована оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональних розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування з допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Згладжування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Згладжування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точками, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регресограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регресограмма є середнім тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регресограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медіан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний згладжувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійке відносно великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоцикли ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Посилання == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне згладжуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14004</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14004"/>
				<updated>2012-03-13T11:59:32Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Ссилки */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцієваності і гладкості отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстаповскі  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради об'єктивності підкреслимо, що подані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації засновані на основі найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну средньоквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; див. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значеннях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельній мінімізації, а також її обчислювальної складністі.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальні наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні згладжування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів неув'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і їх зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN згладжування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє змінних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' є середнім, зваженим в мінливих ділянках. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; за евклідом ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних згладжувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропускались через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значеннях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризована оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональних розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування з допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Згладжування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Згладжування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точками, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регресограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регресограмма є середнім тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регресограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медіан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний згладжувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійке відносно великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоцикли ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Посилання == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14003</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14003"/>
				<updated>2012-03-13T11:58:53Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Медіанне згладжування */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцієваності і гладкості отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстаповскі  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради об'єктивності підкреслимо, що подані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації засновані на основі найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну средньоквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; див. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значеннях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельній мінімізації, а також її обчислювальної складністі.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальні наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні згладжування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів неув'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і їх зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN згладжування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє змінних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' є середнім, зваженим в мінливих ділянках. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; за евклідом ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних згладжувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропускались через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значеннях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризована оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональних розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування з допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Згладжування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Згладжування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точками, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регресограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регресограмма є середнім тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регресограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медіан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний згладжувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійке відносно великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоцикли ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14002</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14002"/>
				<updated>2012-03-13T11:56:14Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Регресограмма */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцієваності і гладкості отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстаповскі  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради об'єктивності підкреслимо, що подані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації засновані на основі найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну средньоквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; див. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значеннях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельній мінімізації, а також її обчислювальної складністі.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальні наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні згладжування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів неув'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і їх зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN згладжування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє змінних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' є середнім, зваженим в мінливих ділянках. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; за евклідом ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних згладжувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропускались через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значеннях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризована оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональних розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування з допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Згладжування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Згладжування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точками, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регресограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регресограмма є середнім тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регресограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медиан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний зглажувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійко по відношенню до великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоциклах ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14001</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14001"/>
				<updated>2012-03-13T11:54:46Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Рекурентні методи */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцієваності і гладкості отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстаповскі  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради об'єктивності підкреслимо, що подані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації засновані на основі найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну средньоквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; див. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значеннях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельній мінімізації, а також її обчислювальної складністі.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальні наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні згладжування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів неув'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і їх зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN згладжування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє змінних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' є середнім, зваженим в мінливих ділянках. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; за евклідом ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних згладжувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропускались через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значеннях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризована оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональних розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування з допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Згладжування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Згладжування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точками, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регресограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регрессограмма являє собою середнє тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регрессограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медиан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний зглажувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійко по відношенню до великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоциклах ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14000</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=14000"/>
				<updated>2012-03-13T11:53:29Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Регрессограмма */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцієваності і гладкості отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстаповскі  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради об'єктивності підкреслимо, що подані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації засновані на основі найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну средньоквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; див. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значеннях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельній мінімізації, а також її обчислювальної складністі.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальні наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні згладжування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів неув'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і їх зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN згладжування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє змінних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' є середнім, зваженим в мінливих ділянках. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; за евклідом ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних згладжувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропускались через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значеннях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризована оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональних розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування з допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Згладжування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Згладжування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точкам, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регресограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регрессограмма являє собою середнє тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регрессограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медиан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний зглажувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійко по відношенню до великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоциклах ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13999</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13999"/>
				<updated>2012-03-13T11:53:03Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Зглажування сплайнами */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцієваності і гладкості отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстаповскі  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради об'єктивності підкреслимо, що подані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації засновані на основі найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну средньоквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; див. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значеннях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельній мінімізації, а також її обчислювальної складністі.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальні наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні згладжування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів неув'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і їх зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN згладжування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє змінних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' є середнім, зваженим в мінливих ділянках. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; за евклідом ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних згладжувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропускались через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значеннях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризована оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональних розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування з допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Згладжування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Згладжування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точкам, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регрессограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регрессограмма являє собою середнє тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регрессограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медиан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний зглажувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійко по відношенню до великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоциклах ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13998</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13998"/>
				<updated>2012-03-13T11:52:20Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Оцінки ортогональніх розкладань */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцієваності і гладкості отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстаповскі  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради об'єктивності підкреслимо, що подані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації засновані на основі найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну средньоквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; див. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значеннях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельній мінімізації, а також її обчислювальної складністі.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальні наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні згладжування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів неув'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і їх зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN згладжування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє змінних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' є середнім, зваженим в мінливих ділянках. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; за евклідом ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних згладжувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропускались через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значеннях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризована оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональних розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування з допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Зглажування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Зглажування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точкам, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регрессограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регрессограмма являє собою середнє тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регрессограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медиан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний зглажувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійко по відношенню до великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоциклах ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13997</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13997"/>
				<updated>2012-03-13T11:51:30Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* k-NN оцінки */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцієваності і гладкості отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстаповскі  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради об'єктивності підкреслимо, що подані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації засновані на основі найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну средньоквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; див. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значеннях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельній мінімізації, а також її обчислювальної складністі.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальні наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні згладжування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів неув'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і їх зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN згладжування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє змінних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' є середнім, зваженим в мінливих ділянках. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; за евклідом ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних згладжувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропускались через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значеннях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризована оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональніх розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування c допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Зглажування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Зглажування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точкам, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регрессограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регрессограмма являє собою середнє тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регрессограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медиан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний зглажувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійко по відношенню до великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоциклах ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13996</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13996"/>
				<updated>2012-03-13T11:43:24Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Бутстраповскі  методи */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцієваності і гладкості отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстаповскі  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради об'єктивності підкреслимо, що подані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації засновані на основі найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну средньоквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; див. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значеннях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельній мінімізації, а також її обчислювальної складністі.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальні наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні згладжування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів неув'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і їх зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN зглажування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє зміних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' являє собою середнє, зважене в мінливих ділянок. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; по евкліду ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних зглажувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочіно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропусколись через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значенях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризовавша оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональніх розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування c допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Зглажування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Зглажування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точкам, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регрессограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регрессограмма являє собою середнє тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регрессограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медиан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний зглажувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійко по відношенню до великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоциклах ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13995</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13995"/>
				<updated>2012-03-13T11:37:53Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Методи  крос-валідації */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцієваності і гладкості отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстаповскі  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради об'єктивності підкреслимо, що подані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації засновані на основі найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну средньоквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; див. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значенях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельної мінімізації, а також його обчислювальна складність.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальний наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні зглажування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів нев'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і його зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN зглажування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє зміних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' являє собою середнє, зважене в мінливих ділянок. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; по евкліду ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних зглажувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочіно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропусколись через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значенях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризовавша оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональніх розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування c допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Зглажування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Зглажування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точкам, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регрессограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регрессограмма являє собою середнє тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регрессограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медиан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний зглажувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійко по відношенню до великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоциклах ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13994</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13994"/>
				<updated>2012-03-13T11:35:08Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Ядерне згладжування */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцієваності і гладкості отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстаповскі  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради об'єктивності підкреслимо, що подані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації заснований на основе найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну среднеквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; см. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значенях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельної мінімізації, а також його обчислювальна складність.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальний наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні зглажування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів нев'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і його зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN зглажування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє зміних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' являє собою середнє, зважене в мінливих ділянок. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; по евкліду ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних зглажувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочіно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропусколись через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значенях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризовавша оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональніх розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування c допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Зглажування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Зглажування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точкам, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регрессограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регрессограмма являє собою середнє тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регрессограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медиан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний зглажувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійко по відношенню до великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоциклах ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13993</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13993"/>
				<updated>2012-03-13T11:31:17Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: /* Відмінність від параметричних підходів */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі є поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже малою. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованої параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малої розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкості засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцируємості і гладкісті отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстраповские  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради охайності підкреслимо, що диктовані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації заснований на основе найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну среднеквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; см. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значенях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельної мінімізації, а також його обчислювальна складність.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальний наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні зглажування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів нев'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і його зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN зглажування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє зміних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' являє собою середнє, зважене в мінливих ділянок. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; по евкліду ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних зглажувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочіно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропусколись через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значенях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризовавша оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональніх розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування c допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Зглажування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Зглажування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точкам, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регрессограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регрессограмма являє собою середнє тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регрессограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медиан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний зглажувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійко по відношенню до великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоциклах ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13992</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13992"/>
				<updated>2012-03-13T11:27:52Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналізу'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі являє собою поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже мале. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованого параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малою розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкі засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцируємості і гладкісті отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстраповские  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради охайності підкреслимо, що диктовані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації заснований на основе найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну среднеквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; см. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значенях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельної мінімізації, а також його обчислювальна складність.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальний наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні зглажування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів нев'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і його зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN зглажування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє зміних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' являє собою середнє, зважене в мінливих ділянок. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; по евкліду ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних зглажувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочіно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропусколись через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значенях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризовавша оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональніх розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування c допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Зглажування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Зглажування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точкам, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регрессограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регрессограмма являє собою середнє тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регрессограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медиан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний зглажувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійко по відношенню до великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоциклах ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13765</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13765"/>
				<updated>2012-03-06T12:20:04Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета ''регресійного аналіза'' полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі являє собою поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже мале. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованого параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малою розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкі засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцируємості і гладкісті отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстраповские  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради охайності підкреслимо, що диктовані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації заснований на основе найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну среднеквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; см. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значенях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельної мінімізації, а також його обчислювальна складність.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальний наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні зглажування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів нев'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і його зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN зглажування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє зміних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' являє собою середнє, зважене в мінливих ділянок. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; по евкліду ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних зглажувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочіно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропусколись через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значенях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризовавша оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональніх розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування c допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Зглажування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Зглажування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точкам, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регрессограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регрессограмма являє собою середнє тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регрессограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медиан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний зглажувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійко по відношенню до великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоциклах ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	<entry>
		<id>https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13763</id>
		<title>Непараметрична регресія</title>
		<link rel="alternate" type="text/html" href="https://wiki.tntu.edu.ua/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%BD%D0%B0_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%96%D1%8F&amp;diff=13763"/>
				<updated>2012-03-06T12:18:42Z</updated>
		
		<summary type="html">&lt;p&gt;Vova: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{Невідредаговано}}&lt;br /&gt;
{{Студент | Name=Володимир | Surname=Шостак | FatherNAme=Михайлович |Faculti=ФІС | Group=СН-51 | Zalbook=СН-11-222}}&lt;br /&gt;
'''Непараметрична регресія''', на відміну від параметричних підходів, використовує модель, яка не описується кінцевим числом параметрів.&lt;br /&gt;
&lt;br /&gt;
:Мета регресійного аналіза полягає у наступному, здійсненні розумної апроксимації невідомої функції відгуку &amp;lt;math&amp;gt;Y(X)&amp;lt;/math&amp;gt; по відомим точкам &amp;lt;math&amp;gt;(X_i,Y_i)_{i = 1}^{m}&amp;lt;/math&amp;gt;. У випадку малих помилок спостереження стає можливим сконцентрувати увагу на важливих деталях середньої залежності &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; від &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; при її інтерпретації.&lt;br /&gt;
&lt;br /&gt;
== Відмінність від параметричних підходів ==&lt;br /&gt;
:Процедура апроксимації зазвичай називається '''''згладжуванням'''''. По суті ця апроксимація функції відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; може бути виконана двома способами. Досить часто використовується параметричний підхід, що полягає у припущенні, що функція відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; має деяку визначену функціональну форму, наприклад, це пряма лінія з невідомим вільним членом і нахилом. Альтернативою цьому може служити спроба оцінити &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; непараметричним чином, без вказівки конкретного її виду. Перший підхід до аналізу регресійної залежності називається параметричним, оскільки передбачається, що вид функції повністю описується кінцевим набором параметрів. Типовий приклад параметричної моделі являє собою поліноміальне рівняння регресії, коли параметрами є коефіцієнти при невідомих. Однак при параметричному підході передбачається, що крива може бути представлена в термінах параметричної моделі, або, принаймні, є впевненість в тому, що помилка апроксимації для найкращого параметричного наближення є дуже мале. Навпаки, в непараметричної моделі регресійної залежності не проводиться проектування даних в &amp;quot;прокрустове ложе&amp;quot; фіксованого параметризації. Попереднє завдання параметричної моделі може виявитися занадто обмежувальним, або надто малою розмірності для апроксимації непередбачених характеристик, в той час, як непараметричне згладжування надає гнучкі засобам аналізу невідомих регресійних залежностей.&lt;br /&gt;
&lt;br /&gt;
:Непараметричний підхід приводить, таким чином, до гнучкого функціонального виду кривої регресії.&lt;br /&gt;
&lt;br /&gt;
== Різновиди ==&lt;br /&gt;
&lt;br /&gt;
== Ядерне згладжування==&lt;br /&gt;
:Одним із найпростіших методів є [[ядерне згладжування]]. Цей метод простий у застосуванні, не вимагає додаткових математичних відомостей і зрозумілий на інтуїтивному рівні. Ядерне згладжування в багатьох випадках є підходящим засобом. Існують різноманітні альтернативні методи згладжування такі, наприклад, як сплайни, але в [Хардле В., Заг 3] показується, що в асимптотичному сенсі вони еквівалентні [[ядерне згладжування | ядерному згладжуванню]].&lt;br /&gt;
&lt;br /&gt;
: Ключем до проведення '''якісного непараметричного оцінювання''' є вибір відповідної ширини вікна для наявного завдання. Хоча ядерна функція &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; залишається важливою, її головна роль полягає в забезпеченні диференцируємості і гладкісті отримуваної оцінки. Ширина вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;, з іншого боку, визначає поведінку оцінки в кінцевих вибірках, що ядерна функція зробити просто не в змозі. Існують чотири загальні підходи до вибору ширини вікна:&lt;br /&gt;
#референтні евристичні правила; &lt;br /&gt;
#методи підстановки; &lt;br /&gt;
#методи  крос-валідації; &lt;br /&gt;
#бутстраповские  методи.  &lt;br /&gt;
&lt;br /&gt;
Заради охайності підкреслимо, що диктовані дані методи вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; не завжди гарантують гарний результат.&lt;br /&gt;
:Виходячи з мінімізації глобальної помилки потрібно &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; брати рівним:&lt;br /&gt;
::&amp;lt;math&amp;gt;h_{opt}=\[ \frac{\int{K^2(z)dz}}{ \(\int{z^2K^2(z)dz} \)^2 \int{\[y''(x)\]^2dx}   }\]^{-1/5} m^{-1/5} &amp;lt;/math&amp;gt;, де &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; - невідома апроксимируюча залежність. &lt;br /&gt;
&lt;br /&gt;
=== Референтні евристичні правила ===&lt;br /&gt;
:Референтні евристичні правила вибору ширини вікна використовують стандартне сімейство розподілів для визначення &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;. &lt;br /&gt;
Розглянемо оцінку Парзена-Розенблата для одновимірної функції щільності&lt;br /&gt;
:: &amp;lt;math&amp;gt;\hat{y}(x)=\frac{1}{mh} \sum_{i=0}^m{K\( \frac{X_i-x}{h}\)}&amp;lt;/math&amp;gt;.&lt;br /&gt;
:У випадку сімейства нормальних розподілів і гаусівського ядра &amp;lt;math&amp;gt;h_{opt}=1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt;. На практиці застосовується &amp;lt;math&amp;gt;\hat{\sigma}&amp;lt;/math&amp;gt;, вибіркове стандартне відхилення.&lt;br /&gt;
&lt;br /&gt;
=== Методи підстановки ===&lt;br /&gt;
Методи  підстановки, такі  як  в Sheather,  Jones  (1991), полягають у підстановці оцінок невідомої константи &amp;lt;math&amp;gt;\int{\[y''(x)\]^2dx&amp;lt;/math&amp;gt; в формулу для оптимальної ширини вікна на основі первинної оцінки &amp;lt;math&amp;gt;y''(x)&amp;lt;/math&amp;gt;, яка в свою чергу заснована на «'''''попередній'''''» ширині вікна, наприклад, знайденої за правилом &amp;lt;math&amp;gt;1.059*\sigma m^{-1/5}&amp;lt;/math&amp;gt; . Всі інші константи у виразі для &amp;lt;math&amp;gt;h_{opt}&amp;lt;/math&amp;gt;  відомі після вибору ядерної функції &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; (отже  &amp;lt;math&amp;gt;\int{K^2(z)dz}&amp;lt;/math&amp;gt;  і &amp;lt;math&amp;gt;\int{z^2K^2(z)dz}&amp;lt;/math&amp;gt; відомі). Хоча такі правила популярні, зацікавлений читач може звернутися до праць Loader (1999), де обговорюються відносні переваги методів підстановки в порівнянні з іншими методами вибору ширини вікна, обговорюваними нижче.&lt;br /&gt;
&lt;br /&gt;
=== Методи  крос-валідації ===&lt;br /&gt;
:Методи  крос-валідації заснований на основе найменших квадратів – це повністю автоматичний і диктуються даними методу вибору згладжуваного параметра. Цей метод заснований на принципі вибору ширини вікна, мінімалізує інтегральну среднеквадратичну помилку отримуваної оцінки. Інтеграл квадрата різниці &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; и &amp;lt;math&amp;gt;\hat{y}(x)&amp;lt;/math&amp;gt; має вигляд &lt;br /&gt;
&lt;br /&gt;
::&amp;lt;math&amp;gt;\int{\[y(x) - \hat{y}(x)\]^2dx } = \int{y^2(x)dx} - 2*\int{y(x)\hat{y}(x)dx} + \int{\hat{y}^2(x)dx}&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Файл:300px-Example_density.jpg|300px|thumb|right|Рис. 1. Оцінка щільності правила підстановки крос-валідаціїна на основі найменших квадратів]]&lt;br /&gt;
:Можна замінити ці величини їх вибірковими аналогами, зробити поправку на зсув і отримати цільову функцію, яку потім можна мінімізувати за допомогою чисельних методів. Цей підхід був запропонований в роботах Rudemo (1982) і Bowman (1984). Для розуміння сутності коментарів у Loader (1999) на '''Рис. 1''' зображені оцінки бімодальної щільності - ядерна оцінка при застосуванні правила підстановки і крос-валідації на основі найменших квадратів. '''Рис. 1'''показує, що насправді правило підстановки надмірно згладжує, приводячи до істотного зсуву в лівій вершині. Крос-валідація на основі найменших квадратів виправляє це, як зазначає Loader (1999), але ціною додаткової варіації в правій вершині.&lt;br /&gt;
: Одна з проблем даного підходу - його чутливість до наявності округлених або Дискретизований даних, а також до дрібномасштабних ефектів у даних.&lt;br /&gt;
:З прикладу випливає, що, можливо, ядерну оцінку з фіксованим параметром &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; можна поліпшити, і існують «адаптивні» ядерні оцінки, які дозволяють &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; змінюватися в точці &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; або &amp;lt;math&amp;gt;X_i&amp;lt;/math&amp;gt;; см. Abramson (1982) і Breiman, Meisel, Purcell (1977). Ці оцінки, однак, сприяють введенню помилкового шуму в оцінку щільності. Однак метод з фіксованим &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; домінує в прикладних дослідженнях.&lt;br /&gt;
&lt;br /&gt;
=== Бутстраповскі  методи ===&lt;br /&gt;
: Faraway, Jhun (1990) запропонували метод вибору ширини вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt; на основі бутстрапа, шляхом оцінювання інтегральної середньоквадратичної помилки для кожної фіксованої ширини вікна, і потім мінімізації  її по всіх значенях. Даний підхід використовує згладжений бутстраповский метод на основі початкової оцінки щільності. Один з недоліків цього підходу в тому, що цільова функція є випадковою, що може привести до проблем при чисельної мінімізації, а також його обчислювальна складність.&lt;br /&gt;
&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
Ядерні ваги визначають деяку ділянку навколо точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; що лежить на сітці. Наступне питання згладжування - поліноміальний наближення функції &amp;lt;math&amp;gt;y&amp;lt;/math&amp;gt; в цій ділянці.&lt;br /&gt;
==== Локально поліноміальні наближення ====&lt;br /&gt;
[[Файл:300px-Example_polynom.jpg|300px|thumb|right|Рис. 2. Локально поліноміальні зглажування]]&lt;br /&gt;
:Найпростішим поліномом наближення в такій околиці є константа. Ядерна оцінка мінімізує суму квадратів нев'язок в околиці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, форма і розмір якої визначається ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt;. &lt;br /&gt;
:Локально поліноміальні наближення і його зв'язок з ядерним згладжуванням детально досліджені в працях (Muller 1987), де показана їх '''еквівалентність'''.&lt;br /&gt;
:Детальніше також див. [[Алгоритм LOWESS]]&lt;br /&gt;
&lt;br /&gt;
== k-NN оцінки==&lt;br /&gt;
[[Файл:300px-Example_knn.jpg|300px|thumb|right|Рис. 3. k-NN зглажування]]&lt;br /&gt;
:Конструкція оцінок [[Метод найближчих сусідів | найближчих сусідів]] відрізняється від ядерних оцінок. Ядерна оцінка визначається як зважене середнє зміних відгуку у фіксованій ділянці точки &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt;, причому ваги визначалися ядром &amp;lt;math&amp;gt;K&amp;lt;/math&amp;gt; і шириною вікна &amp;lt;math&amp;gt;h&amp;lt;/math&amp;gt;. Оцінка '''''k-найближчих сусідів''''' являє собою середнє, зважене в мінливих ділянок. Ця ділянка визначається тільки тими значеннями змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt;, які в &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; є найближчими до &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; по евкліду ('''звичайної''') віддалі. Послідовність &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; ваг була введена в роботі Loftsgaarden, Quesenberry (1965) для близької задачі оцінювання щільності і використовувалася в Cover, Hart (1967) для цілей класифікації.&lt;br /&gt;
: Параметр згладжування &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; визначає ступінь гладкості оцінки кривої. Він грає ту ж роль, що і ширина вікна для ядерних зглажувань. Вплив змінного &amp;lt;math&amp;gt;k&amp;lt;/math&amp;gt; на якісні характеристики оцінки '''аналогочіно випадку ядерних оцінок з прямокутним ядром'''.&lt;br /&gt;
&lt;br /&gt;
:На '''Рис. 3.''' Зображений приклад порівняння ядерного згладжування з [[ядерне згладжування | квартіческім ядром]] і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; згладжування. Ширина вікна вибиралася методом [[крос-перевірки]]. Дані пропусколись через вікна шириною &amp;lt;math&amp;gt;h = 0.25&amp;lt;/math&amp;gt; для ядерного згладжування на відрізку &amp;lt;math&amp;gt;[0,3]&amp;lt;/math&amp;gt; і &amp;lt;math&amp;gt;h = 0.15&amp;lt;/math&amp;gt; для осі значень. Отримані криві регресії практично збігаються для &amp;lt;math&amp;gt;x\le 1&amp;lt;/math&amp;gt;, де лежить велика частина даних. При більших значенях &amp;lt;math&amp;gt;x&amp;lt;/math&amp;gt; спостерігається істотна розбіжність кривих: ядерна оцінка показує очевидне бімодальне співвідношення, а симетризовавша оцінка найближчих сусідів вказує або на асимптоту, або навіть на слабке спадання із зростанням доходу. В контексті завдання, здається, що останнє містить більше сенсу з точки зору економіки ...&lt;br /&gt;
&lt;br /&gt;
== Оцінки ортогональніх розкладань ==&lt;br /&gt;
[[Файл:300px-Example_fur.jpg|300px|thumb|right|Рис. 4. Згладжування c допомогою ортогональних розкладань]]&lt;br /&gt;
Припустимо, що функція регресії може бути представлена у вигляді ряду Фур'є&lt;br /&gt;
::&amp;lt;math&amp;gt;y(x)=\sum_{j=0}^{\infty}\beta_j\varphi_j(x)&amp;lt;/math&amp;gt;, &lt;br /&gt;
:де  &amp;lt;math&amp;gt;{\{\varphi_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - відома система базисних функцій, а &amp;lt;math&amp;gt;{\{\beta_j\}}_{j=0}^\infty&amp;lt;/math&amp;gt; - невідомі коефіцієнти Фур'е. В работі Szego (1959) наведені умови, за яких таке подання можливе. Добре відомими системами базисних функцій є [[поліноми Лагерра]] та [[поліноми Лежандра]]. Як тільки фіксований базис функцій, проблема оцінювання функції регресії може бути зведена до оцінювання коефіцієнтів Фур'є. Звичайно, існує певна складність, яка полягає в тому, що може бути нескінченно багато ненульових коефіцієнтів &amp;lt;math&amp;gt;\beta_j&amp;lt;/math&amp;gt;. Таким чином, при заданому кінцевому обсязі вибірки &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt; можна ефективно оцінити лише підмножину коефіцієнтів.&lt;br /&gt;
&lt;br /&gt;
: Приклад застосування показаний на'' 'Рис. 4.'' '&lt;br /&gt;
&lt;br /&gt;
== Зглажування сплайнами ==&lt;br /&gt;
[[Файл:300px-Example_spline.jpg|300px|thumb|right|Рис. 5. Зглажування за допомогою сплайнів]]&lt;br /&gt;
Загальною мірою близькості до даних для деякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; є сума квадратів нев'язок&lt;br /&gt;
::&amp;lt;math&amp;gt;\sum_{i=1}^{n}{(Y_i-g(X_i))}^2&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
:Якщо &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt; може будь кривою - необмеженої в функціональному сенсі - то цей захід, що має сенс відстані, дорівнює нулю для всякої кривої &amp;lt;math&amp;gt;g&amp;lt;/math&amp;gt;, інтерполюється дані. Підхід, заснований на згладжуванні сплайнами, виключає цю небажану інтерполяцію даних за рахунок досягнення компромісу між двома суперечливими цілями: отримати гарну апроксимацію даних і отримати криву, яка не має надто швидких локальних змін.&lt;br /&gt;
:Відомі різні способи кількісної оцінки локальних змін. Можна визначити міру плавності кривої, засновану, наприклад, на першій, другій, і більш старших похідних. Для успішного розкриття основної ідеї найзручніше ввести інтеграл від квадрата другої похідної, тобто для кількісної оцінки локального зміни використовувати '''''штраф за порушення плавності'''''  &lt;br /&gt;
::&amp;lt;math&amp;gt;\int {(g''(x))}^2dx&amp;lt;/math&amp;gt;.&lt;br /&gt;
:Приклад згладжування сплайнами представлений на '''Рис. 5.'''Інтерпретація даних: дані про мотоциклі [Значення &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; (в мс) після змодельованого зіткнення з мотоциклом. Мінлива відгуку &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt; - прискорення (в g) посмертного тестування об'єкта. З Schmidt, Mattern, Schiiler (1981)]&lt;br /&gt;
&lt;br /&gt;
== Перелік менш поширених методів==&lt;br /&gt;
[[Файл:300px-Example_regr.jpg|thumb|right|300px|Рис. 6. Регрессограмма]]&lt;br /&gt;
=== Рекурентні методи ===&lt;br /&gt;
:Припустимо, що дані &amp;lt;math&amp;gt;\{(X_i,Y_i)\}_{i\ ge l}&amp;lt;/math&amp;gt; спостерігаються не як вибірка фіксованого обсягу &amp;lt;math&amp;gt;m&amp;lt;/math&amp;gt;, а як послідовність пар &amp;lt;math&amp;gt;(X_1,Y_1), (X_2,Y_2),\ldots&amp;lt;/math&amp;gt; надходять з виходу деякого пристрою спостереження. Такі пристрої присутні в задачах контролю (surveillance problems), управління (control operations) або втручання (intervention problems). У загальному випадку можна розглядати дані як часовий ряд. Оскільки непараметричні оцінки зазвичай визначаються по всій вибірці, її доводиться перераховувати при надходженні нових даних. Отже, з обчислювальної точки зору краще, щоб оцінка регресії, заснована на &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; точках, будувалася виходячи з &amp;lt;math&amp;gt;(n + 1)&amp;lt;/math&amp;gt; -го спостереження &amp;lt;math&amp;gt;(X_{n + i},Y_{n +1})&amp;lt;/math&amp;gt; та оцінки, отриманої за першими &amp;lt;math&amp;gt;n&amp;lt;/math&amp;gt; точкам, без виклику попередніх даних з пам'яті комп'ютера.&lt;br /&gt;
&lt;br /&gt;
=== Регрессограмма ===&lt;br /&gt;
: Цей термін був введений Тьюкі (Tukey, 1961) для того, щоб підкреслити зв'язок цієї оцінки з гістограмою. Регрессограмма являє собою середнє тих значень змінних відгуку, для яких відповідні величини &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; потрапляють в один з інтервалів розбиття простору спостережень змінної &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; Tukey (1947) - її можна розглядати як апроксимацію &amp;lt;math&amp;gt;y(x)&amp;lt;/math&amp;gt; ступінчастою функцією, і вона фактично є ядерною оцінкою (з прямокутним ядром), обчисленої в середніх точках інтервалів розбиття. На '''Рис. 6.''' Зображені дані про роботу мотоцикла і регрессограмма при кроці розбиття 4.&lt;br /&gt;
&lt;br /&gt;
=== Медіанне згладжування ===&lt;br /&gt;
[[Файл:300px-Example_med.jpg|300px|thumb|right|Рис. 7.  Медіанне згладжування]]&lt;br /&gt;
:Припустимо, що метою апроксимації є крива умов медіани &amp;lt;math&amp;gt;med(Y|X = x)&amp;lt;/math&amp;gt;, а не крива умовного середнього. Послідовність '''''&amp;quot;локальних медиан&amp;quot;''''' для значень змінної відгуку визначає э '''''медіанний зглажувач'''''. Медіанне згладжування зіграло важливу роль в історичному розвитку методів згладжування.&lt;br /&gt;
&lt;br /&gt;
: Ця оцінка має очевидну аналогію з &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінкою, але відрізняється, принаймні, у двох аспектах: медіанне згладжування стійко по відношенню до великих викидів, і за допомогою цього методу з'являється можливість моделювати розриви кривої регресії &amp;lt;math&amp;gt; med(Y|X = x)&amp;lt;/math&amp;gt;. На '''Рис. 7.''' На прикладі даних про мотоциклах ('''див. Пояснення до Рис. 5''') наведено порівняння двох методів оцінювання - медіанного згладжування і &amp;lt;math&amp;gt;k-NN&amp;lt;/math&amp;gt; - оцінки.&lt;br /&gt;
: Цей приклад виявляє властивість робастності медіанного згладжування. Медіанна оцінка не схильна до впливу групи можливих викидів в районі точки &amp;lt;math&amp;gt;x = 35 &amp;lt;/math&amp;gt;, і вона трохи ближче до основної маси даних у двох '''''«областях сплесків»''''' &amp;lt;math&amp;gt;(x = 20,32)&amp;lt;/math&amp;gt;. Деякий недолік полягає в тому, що за своєю природою оцінка медіанного згладжування є грубою характеристикою.&lt;br /&gt;
&lt;br /&gt;
== Література ==&lt;br /&gt;
# ''Хардле В.'' [http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm/Прикладная непараметрическая регрессия.]- 1989.&lt;br /&gt;
# ''Расин,  Джеффри'' «Непараметрическая эконометрика:  вводный  курс». - Квантиль,  №4,  2008. - 7–56стр.&lt;br /&gt;
&lt;br /&gt;
== Ссилки == &lt;br /&gt;
&lt;br /&gt;
# ''Abramson,  I.S.'' On  bandwidth  variation  in  kernel  estimates  –  a  square  root  law.  Annals  of  Statistics 10. – 1982 . -   1217–1223 стр.&lt;br /&gt;
# ''Bowman, A.W.'' An alternative method of cross-validation for the smoothing of density estimates. Biometrika 7. - 1984 . - 353 –360 стр.&lt;br /&gt;
# ''Breiman, L., W. Meisel,  E. Purcell'' Variable kernel estimates of multivariate densities.  Technometrics 19. - 1977 . - 135 –144 стр.&lt;br /&gt;
# ''Cover, T. M. and Hart, P. E.'' Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13. - 1967 . - 21 -27 стр.&lt;br /&gt;
# ''Faraway,  J.,  M.  Jhun'' Bootstrap  choice  of  bandwidth  for  density  estimation.  Journal  of  the  American Statistical Association  85.- 1990.-1119–1122 стр.&lt;br /&gt;
# ''Loader, C.R.''Bandwidth selection: Classical or plug-in? Annals of Statistics  27.-1999. - 415–438 стр.&lt;br /&gt;
# ''Loftsgaarden, D. O., Quesenberry, G. P.'' A nonparametric estimate of a multivariate density function. Annals of Mathematical Statistics, 36.-1965.-1049-1051 стр.&lt;br /&gt;
# ''Muller H. G.'' Weighted local regression and kernel methods for nonparametric curve fitting. Journal of the American Statistical Association, 82.-1987.-231-238 стр.&lt;br /&gt;
# ''Rudemo, M.'' Empirical choice of histograms and kernel density estimators. Scandinavian Journal of Statistics 9.-1982. -65–78 стр.&lt;br /&gt;
# ''Schmidt, G. Mattern, R.,  Schiiler, F.'' Biomechanical investigation to determine physical and traumatological differentiation criteria for the maximum load capacity of head and vertebral column with and without protective helmet under effects of impact. EEC Research Program on Biomechanics of Impacts. Final Report Phase III, Project 65, Institut fur Rechtsmedizin, Universitat Heidelberg, West Germany.-1981.- 231-238 стр.&lt;br /&gt;
# ''Sheather, S., M. Jones'' A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, Series B  53.-1991. - 683–690 стр.&lt;br /&gt;
# ''Szego, G.'' Orthogonal polynomials. Amer. Math. Soc. Coll. PubL, 23.-1959.&lt;br /&gt;
# ''Tukey, J. W.'' Nonparametric estimation II. Statistically equivalent blocks and tolerance regions. The continuous case. Annals of Mathematical Statistics, 18.-1947. - 529-539 стр.&lt;br /&gt;
&lt;br /&gt;
==Див. також==&lt;br /&gt;
* [[Ядерне зглажуваня]]&lt;br /&gt;
* [[Регресійний аналіз]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Категорія:Планування експерименту]]&lt;br /&gt;
&lt;br /&gt;
==Посилання==&lt;br /&gt;
*[http://www.machinelearning.ru/wiki/index.php?title=%D0%9D%D0%B5%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F#.D0.9C.D0.B5.D0.B4.D0.B8.D0.B0.D0.BD.D0.BD.D0.BE.D0.B5_.D1.81.D0.B3.D0.BB.D0.B0.D0.B6.D0.B8.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5/ Непараметрическая регрессия]&lt;/div&gt;</summary>
		<author><name>Vova</name></author>	</entry>

	</feed>