Гістограмний аналіз
Гістогра́ма (від грецького ἱστός — стовб + γράμμα — буква, напис) — один з найбільш поширених спосіб графічного представлення емпіричних данних. Являє собою графічне зображення залежності частоти потрапляння елементів вибірки у відповідний інтервал групування.
Зміст
З історії виникнення
Гістограма являється одним із сучасних методів графічного аналізу даних. Зі історичної перспективи метод цей заснований на тезисі, що усі параметри виміру помилок являються інтегральними. Цілком зрозуміло, що виходячи виключно з цього твердження не можливо отримати інформацію про характер помилок. Таким чином не можливо було зрозуміти чи виникли помилки у каналі зв'язку статистично, чи усі вони з'явилися за 1-2 секунди і, відповідно, є наслідком якоїсь несправності, адже відповіді на це інтегральні параметри дати не можуть. Для вирішення цього питання в середині 70-х рр. були розроблені методики виміру G.821/G.826/M.2100, котрі за рахунок використання похідних параметрів ES, SES, US та ін. намагалися компенсувати вище зазначене методичне протиріччя. В «еру», коли прилади ще не мали графічних екранів така методика була чи не єдиним можливим порятунком. Сьогодні ж, для оцінки природи виникнення помилок можна побудувати графік їх появи й безпосередньо відразу оцінити усі процеси й причини їх виникнення. Такий графік одержав назву гістограма.
Поняття та властивості φ-серій
Нехай існує реалізація ритмічного сигналу ξ(t) з періодом Т. Як відомо, методи статистичного аналізу за звичай орієнтовані на використання ЕОМ. Тому, коли вихідною є реалізація неперервного аргументу, її необхідно попередньо дискретизувати з деяким кроком дискретизації h. Отримується:
вкладена по відношенню до стохастично Т періодичного процесу ξ(t) послідовність, причому N – кількість відліків на одному періоді. Нехай φі - деяке число (фаза), що належить проміжку [0, Т) причому
Для заданої фази φі на дійсній осі вводиться впорядкована множина точок:
яку називають φі-сіткою. Тут L=- кількість добових циклів. Сітку, що є обєднанням φі-сіток, позначають через
На -сітці визначається вкладена відносно стохастично періодичного процесу ξ(t)-послідовність:
Якщо в ній зафіксувати значення параметру і то отримаємо наступну вкладену відносно процесу ξ(t) послідовність:
Таку послідовність називають φі-серією. Зрозуміло, що областю визначення будь-якої φі-серії є відповідна φі-сітка.
Порядок побудови гістограм на основі φ-серії:
1) Для кожної фази розглядаються варіаційні ряди;
2) Ряди розбиваються на інтервали для кожної фази. При малому числі інтервалів можна втратити характерну деталь, при великому – затушувати загальну картину невеликими випадковими величинами;
3) Підраховується кількість попадань (частота) випадкових значень у відповідні інтервали;
4) Побудова гістограми.
Число інтервалів при побудові гістограм
Гістограма і її ймовірнісні характеристики суттєво залежать від інтервалу побудови гістограми і від кількості інтервалів розбиття. Якщо при заданому N елементів вибірки і досить малих інтервалах групування гістограма буде багато вершинною, то при доволі великих інтервалах втрачаються характерні особливості теоретичної щільності розподілу. Існує низка альтернативних формул для визначення кількості інтервалів: формули Стерджеса (Sturges, 1926), Скотта (Scott, 1979), Фрідмана і Діаконіса (Freedman and Diaconis, 1981), теорема Гливенко та інші.
Скотта (Scott, 1979):
де h – довжина ряду, s – стандартне відхилення зміни значень рядку.
Фрідмана і Діаконіса (Freedman and Diaconis, 1981):
де (IQ) – різниця між верхнім і нижнім квантилем.
Список використаних джерел
1. Дослідження особливостей енергоспоживання в умовах ритміки методом гістограмного аналізу / МацюкО.В., Приймак М.В., Назаревич О.Б., Шимчук Г.В. - ТНТУ ім. Івана Пулюя, 2010.
2. Методичні вказівки до виконання лабораторних робіт з курсу "Моделювання та аналіз ІУС в умовах ритміки" / Загородна Н.В. - ТНТУ ім. Івана Пулюя, 2010.
3. Статистика и планирование эксперимента в технике и науке (Т.1 - Методы обработки данных) / Джонсон Н., Лион Ф. - М: издательство "Мир", 1980