Ряди розподілу

Деякі формули тут ніяким чином чомусь прописуватися не хочуть. ((( Пробував різними методами, доступними в MathType 6.7. На uk.wikipedia всьо файно грає, а тутка чомусь не хоче. ((( Чому?

Статистичні ряди розподілу є одним з найбільш важливих елементів статистики. Вони являють собою складову частину методу статистичних зведень і групувань. Проте практично жодне із статистичних досліджень неможливо провести без попереднього представлення результатів зведення й групування матеріалів статистичного спостереження. А подібні результати подаються у вигляді статистичних рядів розподілу.
Статистичний ряд розподілу — впорядкований розподіл одиниць досліджуваної сукупності на групи за групувальною (варіативною) ознакою. Вони характеризують склад (структуру) досліджуваного явища, дозволяють судити про однорідність сукупності, межі її зміни, закономірності розвитку досліджуваного об'єкта. Залежно від ознаки статистичні ряди розподілу діляться на:

  1. атрибутивні (якісні);
  2. варіаційні (кількісні):
    • дискретні;
    • інтервальні.

Атрибутивні ряди розподілу

Атрибутивні ряди утворюються за якісними ознаками, якими можуть виступати посада, професія, стать, освіта тощо.

Приклад 1
Освіта робітників Кількість робітників
абсолютне, чол. відносне, %
вища 20 15,4
неповна вища 25 19,2
середня спеціальна 35 26,9
середня 50 38,5
Разом 130 100

Тут групувальною ознакою виступає освіта працівників підприємства (вища – середня). Дані ряди розподілу є атрибутивними, оскільки варіаційна ознака представлена не кількісними, а якісними показниками.

Варіативні ряди розподілу

Варіаційні ряди будуються на основі кількісної групуючої ознаки. Варіаційні ряди складаються з наступних елементів:

  • варіант — окремих значень варіаційної ознаки, що їх приймає ця ознака в ряді розподілу. Варіанти можуть бути позитивними й негативними, абсолютними й відносними;
  • частот — чисельностей окремих варіант або кожної з груп варіаційного ряду.

Частоти, виражені в частках одиниці або у відсотках, називаються частостями. Сума частот називається обсягом сукупності й визначає число елементів усієї сукупності (повна сума дорівнює одиниці або 100%). Заміна частот частостями дозволяє зіставляти варіаційні ряди з різним числом спостережень.

Варіаційні ряди залежно від характеру варіації підрозділяються на дискретні й інтервальні. Дискретні ряди розподілу засновані на дискретних (перервних) ознаках, що мають лише цілі значення (наприклад, тарифний розряд робітників, число дітей у родині тощо); інтервальні ряди розподілу базуються на неперервно змінному значенні ознаки, що приймає будь-які (у тому числі й дробові) кількісні вирази, тобто значення ознак таких рядів задається у вигляді інтервалу.

За наявності досить великої кількості варіантів значень ознаки первинний варіаційний ряд стає важкооглядовим, і тому лише безпосередній його розгляд не дає повного уявлення про розподіл одиниць за значенням ознаки в сукупності, що розглядається. У цьому випадку першим кроком в упорядкуванні ряду є його ранжирування — розташування всіх варіант у зростаючому (спадаючому) порядку.

Для побудови дискретного ряду з невеликим числом варіант спочатку виписуються всі ці варіанти та значення ознаки, а потім підраховується частота повторення варіант. Ряд розподілу прийнято оформляти у вигляді таблиці, що складається із стовпчиків (або/та рядків), де в одних представлені варіанти, а в інших — частоти. Для побудови ряду розподілу дискретних ознак, представлених у вигляді інтервалів, необхідно встановити оптимальне число груп (інтервалів), на які слід розбити всі одиниці досліджуваної сукупності.

Розрахунок середніх величин рядів розподілу

Середні величини розраховуються, як правило, для отримання узагальнених кількісних характеристик рівня певної варіаційної ознаки за сукупністю однорідних основних властивостей одиниць конкретного явища або процесу. У статистиці всі середні величини позначаються як [math]\bar {\rm X}[/math].
Існує кілька видів середніх величин. Основною середньою величиною є середня степенева. Вона має такий вигляд:
[math]\bar {\rm X} = \sqrt[m]{{\frac{{\sum {\mathop {\rm X}\nolimits^m } }}{n}}}[/math],
де [math]\bar {\rm X}[/math] — середня величина,

[math]\rm X[/math] — змінна величина ознаки варіанти,
[math]\rm m[/math] — показник степеня середньої,
[math]\rm n[/math] — кількість ознак чи варіант.

В залежності від значення показника степеня середньої, вона приймає наступний вид:

  • невиважена середня арифметична — коли [math]m=1[/math]:
[math]\bar{X}=\frac{\sum{X}}{n}[/math];
  • виважена середня арифметична — присутні частоти (або маси) [math]f[/math]:
[math]\bar{X}=\frac{\sum{Xf}}{\sum{f}}[/math].

Розрахунок моди й медіани

Особливим видом середніх величин, що стосуються рядів розподілу, є структурні середні. Вони застосовуються для вивчення внутрішньої будови й структури рядів розподілу значень ознаки. До структурних середніх величин зокрема належать мода й медіана.
Мода — це величина ознаки (варіанти), яка найбільш часто зустрічається в даній сукупності; мода — це варіанта, що має найбільшу частоту.
В інтервальному ряді розподілу моду можна знайти з допомогою наступної формули:
[math]{{\Mu }_{o}}={{\Chi }_{Mo}}+{{\Iota }_{Mo}}\times \frac{{{f}_{Mo}}-{{f}_{Mo-1}}}{({{f}_{Mo}}-{{f}_{Mo-1}})+({{f}_{Mo}}-{{f}_{Mo+1}})}[/math]
де [math]{{\Chi }_{Mo}}[/math] — мінімаальна границя модального інтервалу,

[math]{{\Iota }_{Mo}}[/math] — величина модального інтервалу (визначається за найбільшою з частот модальних інтервалів),
[math]{{f}_{Mo}}[/math], [math]{{f}_{Mo-1}}[/math], [math]{{f}_{Mo+1}}[/math] — частоти поточного, попереднього й наступного модальних інтервалів.

Медіана — варіанта, що перебуває в середині ряду розподілу. Вона ділить ряд на дві рівні (за числом одиниць) частини: зі значеннями ознаки, меншими за медіану, та зі значеннями ознаки, більшими за медіану.
У випадку, коли варіаційний ряд має парне число значень варіант, то розрахунки медіани проводиться з допомогою наступної формули:
[math]{{\Mu }_{e}}=\frac{{{\Chi }_{Me}}+{{\Chi }_{Me+1}}}{2}[/math] ,
де [math]{{\Chi }_{Me}}[/math], [math]{{\Chi }_{Me+1}}[/math] — варіанти, що знаходяться всередині варіаційного ряду розподілу.
В інтегральному ряді розподілу медіана знаходиться наступним чином:
[math]{{\Mu }_{e}}={{\Chi }_{Me}}+{{\Iota }_{Me}}\frac{\frac{\sum{f}}{2}-{{S}_{Me-1}}}{{{f}_{Me}}}[/math] ,
де [math]{{\Chi }_{Me}}[/math] — нижня границя медіанного інтервалу,

[math]{{\Iota }_{Me}}[/math] — величина медіанного інтервалу,
[math]\frac{\sum{f}}{2}[/math] — півсума частот ряду,
[math]{{S}_{Me-1}}[/math] — сума накопичених позаду медіанного інтералу частот,
[math]{{f}_{Me}}[/math] — частота власне медіанного інтервалу.

Мода й медіана мають досить велике значення в статистиці й широке застосування. Мода є саме тим числом, яке в дійсності зустрічається найчастіше. Медіана має важливі властивості для аналізу явищ: вона виявляє типові риси індивідуальних ознак явища, враховує вплив крайніх значень сукупності. Медіана знаходить практичне застосування в маркетинговій діяльності внаслідок особливої властивості — сума абсолютних відхилень чисел ряду від медіани є найменшою величиною:
[math]\sum{(x-{{M}_{e}}})\to \min[/math] .
Як правило, мода й медіана відрізняються від значення середньої. Але у випадку симетричного розташування частот варіаційного ряду значення цих трьох величин можуть збігатися.

Графічне зображення статистичних даних рядів розподілу

Ряди розподілу зручно вивчати за допомогою графічного методу. Статистичний графік — це креслення, на якому статистичні сукупності, що характеризуються певними показниками, описуються за допомогою умовних геометричних образів або знаків. Представлення даних таблиць у вигляді графіка справляє більш сильне враження, ніж цифри, дозволяє краще осмислити результати статистичного спостереження, правильно їх витлумачувати, значно полегшує розуміння статистичного матеріалу, робить його наочним і доступним. Це, однак, зовсім не означає, що графіки мають лише ілюстративне значення. Вони дають нове знання про предмет дослідження, будучи методом узагальнення вихідної інформації. Значення графічного методу в аналізі й узагальненні даних велике. Графічне зображення дозволяє здійснити контроль вірогідності статистичних показників, оскільки останні, будучи представлені на графіку, яскравіше виражають наявні неточності, пов'язані або з наявністю неточностей/помилок спостереження, або із сутністю досліджуваного явища. З допомогою графічного зображення можливі вивчення закономірностей розвитку явища, установлення існуючих взаємозв'язків. Просте зіставлення даних не завжди дає можливість уловити наявність причинних залежностей, у той же час їх графічне зображення сприяє виявленню причинних зв'язків, особливо у випадку встановлення первісних гіпотез, що підлягають подальшій розробці. Графіки також широко використовуються для вивчення структури явищ, їх зміни в часі й розміщення в просторі. У них виразніше проявляються порівняльні характеристики й чітко окреслюються основні тенденції розвитку й взаємозв'язків, властивих досліджуваному явищу або процесу.

Приклад 2
Роки 2004 2005 2006 2007 2008 2009 2010
Валовий внутрішній продукт
у фактичних цінах, млн. грн
345 113 441 452 544 153 712 945 948 056 913 345 1 000 086
Діагр1 ряди розп.JPG

Для зображення й внесення суджень про розвиток того чи іншого явища в часі й складі сукупності використовують також і діаграми: стовпчикові, стрічкові, квадратні, кругові, лінійні та ін. Вибір виду діаграми залежить в основному від особливостей вихідних даних й мети дослідження. Наприклад, якщо є ряд динаміки з декількома не рівновідносними рівнями в часі (1913, 1940, 1950, 1980, 1995, 2009 рр.), тоді задля кращої наочності використовують стовпчикові, квадратні або кругові діаграми; коли ж число рівнів у ряді динаміки велике, доцільно застосовувати лінійні діаграми, які відтворюють безперервність процесу розвитку у вигляді неперервної ламаної лінії.
Основне призначення структурних діаграм полягає в графічному представленні складу статистичних сукупностей, що характеризуються як співвідношення різних частин кожної із сукупностей. Склад статистичної сукупності графічно може бути представлений за допомогою абсолютних та відносних показників. У першому випадку не тільки розмір окремих частин, але й розміри графіка в цілому визначаються статистичними величинами й виміряються відповідно до змін останніх; у разі представлення відносними показниками розміри графіка не змінюються (оскільки сума всіх частин будь-якої сукупності становить 100%), а зміняються лише розміри окремих його частин. Графічне зображення складу сукупності за абсолютними й відносними показниками сприяє проведенню більш глибокого аналізу й дозволяє проводити зіставлення й порівняння, наприклад, міжнародних соціально-економічних явищ.
Зобразити графічно ряд розподілу з прикладу 1 можна наступним чином:

Приклад 3 — Діаграми до прикладу 1
Діагр2 ряди розп.JPG Діагр3 ряди розп.JPG

Розрахунок показників варіації

Варіація — це відмінність у значеннях якої-небудь ознаки в різних одиниць даної сукупності у той самий період або момент часу. Дослідження варіації в статистиці має велике значення, оскільки допомагає пізнати сутність досліджуваного явища. Показники варіації характеризують коливання окремих значень варіант поблизу середніх величин цих варіант, а також визначають відмінності індивідуальних значень ознаки усередині досліджуваної сукупності. Існує кілька видів показників варіації:

  • розмах варіації [math]R[/math] являє собою різниця між максимальним і мінімальним значеннями ознаки:
[math]\text{R}={{\text{X}}_{\text{max}}}-{{\text{X}}_{\text{min}}}[/math] ;
  • середнє лінійне відхилення:
    • виважене: [math]\bar{d}=\frac{\sum{\left| X-\bar{X} \right|}f}{\sum{f}}[/math] ;
    • невиважене: [math]\bar{d}=\frac{\sum{\left( X-\bar{X} \right)}}{n}[/math] ;
  • дисперсія — показник варіації, що виражає середнє квадратичне відхилень варіант від середніх величин залежно від утвореного варіаційного фактору:
    • виважена: [math]{{\sigma }^{2}}=\frac{\sum{{{(X-\bar{X})}^{2}}f}}{\sum{f}}[/math] ;
    • невиважена: [math]{{\sigma }^{2}}=\frac{\sum{{{(X-\bar{X})}^{2}}}}{n}[/math] ;
  • середнє квадратичне відхилення:
    • виважене: [math]\sigma =\sqrt{\frac{\sum{{{(X-\bar{X})}^{2}}f}}{\sum{f}}}[/math] ;
    • невиважене: [math]\sigma =\sqrt{\frac{\sum{{{(X-\bar{X})}^{2}}}}{n}}[/math] ;
  • показник варіації:
[math]V=\frac{\sigma }{{\bar{X}}}[/math] ;

де [math]X[/math] — варіанти,

[math]{\bar{X}}[/math] — середня величина,
[math]n[/math] — кількість ознак,
[math]{{f}}[/math] — частоти.

Показник варіації відображає тенденцію розвитку явища, тобто дію головних факторів; показник варіації виражається в % або коефіцієнтах; середнє квадратичне відхилення є показником надійності середньої: чим менше середнє квадратическое відхилення, тем краще середня арифметична відбиває собою всю статистичну сукупність; показник дисперсії більш об'єктивно відбиває захід варіації на практиці; розмах варіації показує лише крайні відхилення ознаки й не відображає відхилень усіх варіант у ряді; лінійне відхилення враховує відмінності усіх одиниць досліджуваної сукупності.

Літературні джерела

  1. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. - М.: «Инфра-М» 1998.
  2. Гусаров В.М. Теория статистики: - М.: «Аудит», « ЮНИТИ» 1998.
  3. Теория статистики: Учебник под редакцией профессора Шамойловой Р.А. -М.: «Финансы и статистика» 1998.
  4. Практикум по статистике: Учебное пособие для вузов/ под редакцией В.М. Симчеры/ВЗФЭИ.-М.: ЗАО «Финстатинформ», 1999.
  5. Общая теория статистики:/Статистическая методология в коммерческой деятельности: учебник для вузов/под редакцией А.С. Спирина и О.Е. Башиной. – М.: Финансы и статистика, 1994.
  6. Российский статистический ежегодник 2002. Статистический сборник. Госкомстат
  7. Сироткина Т.С., Каманина А.М. Основы теории статистики: учебное пособие. – М.: АО «Финстатинформ», 1995.
  8. Ряузов Н.Н. Общая теория статистики: Учебник для вузов.-М.: Финансы и статистика, 1984.