Задача дисперсійного аналізу

Задача дисперсійного аналізу

В будь-якому експерименті середні значення досліджуваних величин змінюються у зв'язку зі зміною основних факторів (кількісних та якісних), що визначають умови досліду, а також і випадкових факторів. Дослідження впливу тих чи інших факторів на мінливість середніх є задачею дисперсійного аналізу.

Дисперсійний аналіз використовує властивість адитивності дисперсії випадкової величини, що обумовлено дією незалежних факторів. В залежності від числа джерел дисперсії розрізняють однофакторний та багатофакторний дисперсійний аналіз. Дисперсійний аналіз особливо ефективний при вивченні кількох факторів. При класичному методі вивчення змінюють тільки один фактор, а решту залишають постійними. При цьому для кожного фактору проводиться своя серія спостережень, що не використовується при вивченні інших факторів. Крім того, при такому методі досліджень не вдається визначити взаємодію факторів при одночасній їх зміні. При дисперсійному аналізі кожне спостереження служить для одночасної оцінки всіх факторів та їх взаємодії.

Дисперсійний аналіз полягає у виділенні і оцінці окремих факторів, що викликають зміну досліджуваної випадкової величини. При цьому проводиться розклад сумарної вибіркової дисперсії на складові, обумовлені незалежними факторами. Кожна з цих складових є оцінкою дисперсії генеральної сукупності. Щоб вирішити, чи дієвий вплив даного фактору, необхідно оцінити значимість відповідної вибіркової дисперсії у порівнянні з дисперсією відтворення, обумовленою випадковими факторами. Перевірка значимості оцінок дисперсії проводять по критерію Фішера. Коли розрахункове значення критерію Фішера виявиться меншим табличного, то вплив досліджуваного фактору немає підстав вважати значимим. Коли ж розрахункове значення критерію Фішера виявиться більшим табличного, то цей фактор впливає на зміни середніх. В подальшому ми вважаємо, що виконуються наступні припущення:

  • випадкові помилки спостережень мають нормальний розподіл;
  • фактори впливають тільки на зміну середніх значень, а дисперсія спостережень залишається постійною.

Фактори, що розглядаються в дисперсійному аналізі, бувають двох родів:

  • з випадковими рівнями та
  • з фіксованими.

В першому випадку мається на увазі, що вибір рівнів проходить з безмежної сукупності можливих рівнів та супроводжується рандомізацією. Якщо рівні вибираються випадковим чином, математична модель експерименту називається модель з випадковими рівнями факторів (випадкова модель). Коли всі рівні фіксовані - модель з фіксованими рівнями факторів. Коли частина факторів розглядається на фіксованих рівнях, рівні решти вибираються випадковим чином - модель змішаного типу. Дисперсійний аналіз застосовується в різних формах в залежності від структури об' єкту, що досліджується; вибір відповідної форми є однією з головних трудностей в практичному застосуванні аналізу.


Приклади задач дисперсійного аналізу

У виробничій практиці часто виникає така задача. Апаратники, працюючи позмінно на одному й тому ж апа¬раті, виробляють продукт з різними якісними показника¬ми. Наприклад, один апаратник досягає більшої стабіль¬ності вологості готової продукції, інший — меншої. Треба з'ясувати, що є причиною появи незадовільних результатів: недосконала конструкція апарату, що не дає змоги добитися якісної відтворюваності, чи неоднакова робота апаратників.

Розглянемо іншу задачу — складнішу. Припустимо, що на якість продукту впливають десять факторів. Щоб звес¬ти коливання показника до мінімуму, треба з'ясувати вплив кожного фактора на розмах цих коливань і усунути або хоча б знизити вплив найбільш сильно діючих факторів. Тільки таким чином можна добитися реальних результатів у поліпшенні якості продукту при мінімальних витратах часу і коштів.

Виникають задачі й іншого типу. При автоматизації певного процесу його аналізують з точки зору впливу ряду факторів, які одночасно діють на основний показник, що підлягає автоматичній стабілізації. Тільки оцінивши міру впливу кожного з факторів, можна правильно вибрати ка¬нал регулювання або той фактор, який треба вимірювати і враховувати в першу чергу Наступний за силою впливу фактор може бути використано для корекції роботи системи регулювання за першим фактором. На стадії конструкторських розробок проектувальник шукає оптимальну комбінацію елементів створюваного ним виробничого агрегату і знає ступінь впливу кожного з них на умови роботи агрегату в цілому.

У загальному вигляді подібні задачі можуть бути сфор¬мульовані так За допомогою поточного контролю або спе¬ціальних досліджень виробництва встановлюють несталість того чи іншого процесу або якості продукту. Разом з тим дані контролю не вказують безпосередньо на головну при¬чину цієї несталості. Як проаналізувати ці дані, щоб з незалежною вірогідністю визначити вплив кожного з факто¬рів на коливальність чи змінюваність показника, який вивчається?

Ця ж задача може бути поставлена і дещо в іншій форми Характер коливань розглядуваної ознаки відносно сталий, проте розмах коливань набагато більший припустимого або бажаного. Необхідно зменшити розмах і виявити для цьо¬го, яку частку розмаху викликає той чи інший з відомих нам факторів процесу.

Подібні задачі виникають і в сільськогосподарських галузях. Припустимо, що треба визначити урожайність різ¬них сортів однієї й тієї ж культурної рослини. Дослід можна поставити так. На кожній з трьох ділянок виро¬щують чотири сорти рослини, причому одна частина рослин живиться одним видом добрив, а друга — іншим. Ділянки розташовано на відкритому повітрі в однакових умовах так, щоб від рослин на одній ділянці не падала тінь на рос¬лини іншої ділянки. На кожному майданчику ділянки вирощують однакову кількість рослин (ця вимога може порушуватися).

У загальному випадку урожай залежатиме від сорту рослини, складу добрива і ділянки. Можливий вплив на урожай і взаємодії цих факторів. Задачі, що стоять перед агрономом, можна сформулювати так:

  • чи залежить урожай, усереднений за двома видами доб¬рив і трьома ділянками, від сорту рослини?
  • чи свідчать рівні урожаю про різний вплив сортів на різних ділянках?
  • як якісно оцінити ці відмінності із заданим рівнем на¬дійності?

Метод розв'язання перелічених задач (дисперсійний аналіз) основано на властивості адитивності дисперсії, яка характеризує коливальність. Іншими словами, повна дисперсія показника, що нас цікавить, дорівнює сумі скла¬дових її часткових дисперсій.

Список використаної літератури:

1. Чайківський Т. Дисперсійний аналіз.:Лекція - 2003. 2. Аністратенко В.О., Федоров В.Г. Математичне планування експерименту в АПК. К.: Вища школа, 1993. – 84 с.