Відмінності між версіями «Розпізнавання образів»

Рядок 27: Рядок 27:
  
  
== Підходи до розпізнавання образів ==
+
== Методи  розпізнавання образів ==
  
У цілому, можна виділити три підходи до розпізнавання образів:
+
'''Лінгвістичний (синтаксичний) метод'''
перший використовує '''метод перебору'''. У цьому випадку проводиться порівняння з базою даних, де для кожного виду об'єктів представлені всілякі модифікації відображення. Наприклад, для оптичного розпізнавання образів можна застосувати метод перебору виду об'єкта під різними кутами, масштабами, зміщеннями, деформаціями і т. д. Для літер треба перебирати шрифт, властивості шрифту і т. д. У випадку розпізнавання звукових образів, відповідно, відбувається порівняння з деякими відомими шаблонами (наприклад, слово, вимовлене декількома людьми).  
+
Якщо опис образів здійснюється за допомогою підобразів і їх співвідношень, то для конструювання системи розпізнавання використовують лінгвістичний або синтаксичний підхід з використанням принципу загальності властивостей. Основне припущення, яке робиться в цьому методі, ґрунтується на тому, що образи, які належать одному і тому ж класу, володіють рядом загальних властивостей або ознак, які відображають подібність таких образів. Ці загальні властивості можна частково ввести в пам’ять системи розпізнавання. Коли системі представити некласифікований образ, то вибирається набір ознак, що визначаються, причому останні інколи кодуються, а потім вони порівнюються з ознаками, закладеними в пам’яті системи розпізнавання. При використанні даного методу основна задача полягає у виділенні загальних властивостей за вибором образів, належність яких шуканому класу відома.
Другий підхід - проводиться '''більш глибокий аналіз характеристик образу'''. У разі оптичного розпізнавання це може бути визначення різних геометричних характеристик. Звуковий зразок у цьому випадку піддається частотного, амплітудному аналізу і т. д.  
+
 
Наступний метод - '''використання штучних нейронних мереж (ШНМ)'''. Цей метод вимагає або великої кількості прикладів задачі розпізнавання при навчанні, або спеціальної структури нейронної мережі, що враховує специфіку даної задачі. Тим не менш, його відрізняє більш висока ефективність і продуктивність.  
+
Вибір методу синтезу системи не розв’язує до кінця проблеми складання конкретної програми і проблеми реалізації. В більшості випадків є образи, що представляють кожний з розглядуваних класів. В таких випадках можна скористатися методами розпізнавання, які називаються "навчання з учителем". У схемі "навчання з учителем" система навчається розпізнавати образи за допомогою різного роду адаптивних схем. В деяких прикладних задачах для елементів, що належать до визначеного класу, навчаючі множини невідомі. У таких випадках, властиво, і можна звернутися до методів "розпізнавання з учителем". Розпізнавання по схемі навчання з учителем характеризується тим, що відома правильна класифікація кожного навчаючого образу. У випадку навчання без учителя потрібно конкретно вивчити класи образів, які є в даній інформації [1].
 +
Типовим прикладом лінійного представлення є блок-схеми, технічні і архітектурні креслення і т.д. Лінійні структури можуть бути описані аналітично, а з використанням ЕОМ можна порівняно легко формувати складні структури. Ці структури використовують також в тих випадках, коли для вводу зображення застосовують методи слідкування за контуром чи іншими траєкторними точками. Яка б структура не використовувалась, в машинному представленні найкраще використовувати єдиний вид структури даних – ланцюговий код. Це послідовність з восьми цифр.
 +
 
 +
Перевага ланцюгового коду – його компактність. Код дозволяє представити складні дані про зображення, що складається з великого числа областей, у стиснутому вигляді. Оскільки ланцюгові коди представляють дані про границю, їх зручно застосовувати в ЕОМ до задач, що потребують зберігання форми областей. Границі для цілої області можуть зберігатися в формі лінійних списків.
 +
 
 +
 
 +
'''Математичний метод'''  
 +
 
 +
В основу математичного підходу покладені правила класифікації, які формулюються і виводяться в рамках визначеного математичного формалізму з допомогою принципів загальності властивостей і кластеризації. Коли образи деякого класу представляють собою вектори, компонентами яких є дійсні числа, то цей клас можна розглядати як кластер. Побудова системи розпізнавання, яка базується на реалізації даного принципу, визначається просторовим розміщенням окремих кластерів. Якщо кластери, що відповідають різним класам, рознесені далеко один від одного, то можна користуватися простими схемами розпізнавання, наприклад, класифікацією за принципом мінімальної відстані.
 +
 
 +
Інший підхід відомий як метод потенціальних функцій, відрізняється тим, що об’єднуються деякі розмиті множини, що описуються так званою потенціальною функцією. При цьому здійснюється апроксимація не розв’язуючою, а дискримінантною функцією. Її значення вираховується шляхом складання значень «потенціалу», який зменшується в міру зникання від деяких центрів, що вибираються в процесі навчання. Цей підхід є еквівалентним апроксимації дискримінантної функції за допомогою функціонального ряду. Суть полягає в тому, що на просторі вхідних векторів Х задається функція, яка називається «потенціалом». Потенціал визначається наближенням двох точок і задається як функція відстані між точками. Потенціальна функція така, що вона монотонно зменшується із збільшенням відстані.
 +
 
 +
Таким чином, результатом побудови є потенціальне поле, яке розбиває весь простір на дві частини: де значення додатні і від’ємні. Поверхня, на якій потенціал дорівнює нулю, називається розділяючою
 +
 
 +
 
 +
'''Евристичний метод'''  
 +
За основу евристичного підходу взяті інтуїція і досвід людини: в ньому використовуються принципи перерахування членів класу і загальні властивості. Зазвичай системи, побудовані такими методами, включають набір специфічних процедур, розроблених для конкретних задач розпізнавання. Хоча евристичний підхід відіграє велику роль в розпізнаванні, небагато може бути сказано про загальні принципи синтезу, оскільки розв’язання кожної конкретної задачі потребує використання специфічних прийомів розробки. Це означає, що структура і якість евристичної системи в значній мірі визначається талантом та досвідом роботи тих, хто її розробляє. Найпоширенішими є такі підходи розпізнавання [3].
 +
 
 +
В більшості випадків зображення одного класу зберігають більш-менш постійні розміри і форми. В цих випадках розпізнавання можна здійснити шляхом порівняння зображень з зразками. Такі зразки називають масками, трафаретами, еталонами.
 +
 
 +
Найпростіший підхід до розпізнавання образів базується на порівнянні їх з еталонами. В цьому випадку деяка множина образів, по одному з кожного класу образів, знаходиться в пам’яті машини. Вхідний образ, що потрібно розпізнати (невідомого класу) порівнюється з еталоном кожного класу. Класифікація базується на раніше вибраному критерії співставлення подібності. Іншими словами, якщо вхідний образ краще відповідає еталону і-го класу образів, ніж в будь-якому іншому еталоні, то вхідний образ класифікується як належність до і-го класу образів. Такий підхід використаний в більшості випадків для читання друкованих літер і банківських чеків. Недоліком цього підходу, тобто співставлення з еталоном, є те, що важко вибрати еталон, який найбільше підходить з кожного класу образів і встановити необхідний критерій відповідності. Ці труднощі особливо суттєві, коли образи, які належать одному класу, можуть мати значні спотворення. Типовим прикладом цього явища є розпізнавання рукописних літер.
 +
Більш вдосконалений підхід ґрунтується на тому, що замість порівняння вхідного образу з еталоном, класифікація базується на деякій множині відібраних вимірів. Ці відібрані виміри називаються ознаками, і є малочутливими щодо звичайних змін і спотворень. В цьому випадку розпізнавання образу можна розглядати в двох задачах.
 +
 
 +
Перша задача ґрунтується в визначенні, які вимірювання повинні були б бути зроблені на вхідному образі. Звичайний розв’язок задачі про те, що міряти, є певною мірою суб’єктивний, а також залежать від практичних обставин. На сьогодні дуже мало зроблено в конструюванні загальної теорії вибору вимірювальних ознак.
 +
 
 +
Друга задача розпізнавання образів базується на класифікації (тобто прийнятті розв’язку, чи належить вхідний образ до того чи іншого класу), що має основу на вимірюваннях відібраних ознак
 
  <br>
 
  <br>
 +
 +
 +
 +
  
 
== Класифікація методів виявлення розладки ==
 
== Класифікація методів виявлення розладки ==

Версія за 22:40, 22 лютого 2012

{{{img}}}
Імя Марія
Прізвище Прошина
По-батькові Юріївна
Факультет ФІС
Група СНм-51
Залікова книжка СНм-11-243


Репозиторія
Презентація доповіді на тему Розпізнавання образів
є розміщеною в Репозиторії.


Проедмет розпізнвавання образів –об'єднує ряд наукових дисциплін. Їх пов'язує пошук рішення загальної задачі - виділити елементи, що належать конкретному класу, серед множини розмитих елементів, що відносяться до кількох класів.

  • Клас образів - деяка категорія, що визначається рядом властивостей загальних для всіх її елементів.
  • Образ - це опис будь-якого елементу як представника відповідного класу образів.

У випадку коли множина образів розділяється на класи, що не перетинаються, бажано використовувати для віднесення цих образів до відповідних класів якийсь автоматичний пристрій.

Між образами та класами образів існує деяке ієрархічне підпорядкування.

Букви алфавітів і цифри є образами, якщо буквенно-цифрові символи розглядаються як клас образів.

Друковані і рукописні зображення, наприклад букви А є образами букви англійського алфавіту А, яка представляє в цьому випадку клас образів.


Історія формування теорії розпізнавання образів

Як наука, теорія розпізнавання образів почала формуватися наприкінці 50-их років. Спочатку це була змістовна постановка задачі ( але не формальна!) Вона полягала в тому, що треба було побудувати машину, яка б могла класифікувати різні ситуації так, як це робили живі істоти. Така загальна постановка задачі привела до того, що виникли різні напрямки досліджень. Деякі вчені будували моделі процесу сприйняття. Інші вважали, що головне-це створення алгоритмів навчання розпізнаванню образів, щоб розв”язувати конкретні задачі. Дехто шукав постановки нових математичних проблем. Якщо спочатку досить успішно вдалося просунутись по всіх напрямках, то з часом успіхи значно зменшились. Виникло дві протилежні точки зору на проблему розпізнавання. Перша полягала в тому, що потрібно знайти такий опис об”єктів, використовуючи апріорні дані про них, що знаходження принципу класифікації вже не буде важким. Друга бачила головну проблему в пошуку правила класифікації серед заданої множини вирішальних правил.


Проблема розпізнавання образів

В цілому проблема розпізнавання образів складається з двох частин:

  • навчання;
  • розпізнавання.

Навчання здійснюється шляхом показу окремих об'єктів з вказанням їх приналежності тому або іншому образу. В результаті навчання розпізнаюча система повинна набути здатність однаково реагувати на всі об'єкти одного образу і по-різному – на всі об'єкти різних образів. Дуже важливо, що процес навчання повинен завершитися лише шляхом показів скінченого числа об'єктів без будь-яких інших підказок. Об'єктами навчання можуть бути або картинки, або інші візуальні зображення (букви), або різні явища зовнішнього світу, наприклад звуки, стани організму тощо. Важливо, що в процесі навчання вказуються лише самі об'єкти і їх приналежність образу. За навчанням слідує процес розпізнавання нових об'єктів, який характеризує дії вже навчанної системи. Автоматизація цих процедур і складає проблему навчання розпізнаванню образів. У випадку, коли людина сама розгадує або придумує, а потім нав'язує машині правило класифікації, проблема розпізнавання вирішується частково, оскільки основну і головну частину проблеми (навчання) людина бере на себе.


Методи розпізнавання образів

Лінгвістичний (синтаксичний) метод Якщо опис образів здійснюється за допомогою підобразів і їх співвідношень, то для конструювання системи розпізнавання використовують лінгвістичний або синтаксичний підхід з використанням принципу загальності властивостей. Основне припущення, яке робиться в цьому методі, ґрунтується на тому, що образи, які належать одному і тому ж класу, володіють рядом загальних властивостей або ознак, які відображають подібність таких образів. Ці загальні властивості можна частково ввести в пам’ять системи розпізнавання. Коли системі представити некласифікований образ, то вибирається набір ознак, що визначаються, причому останні інколи кодуються, а потім вони порівнюються з ознаками, закладеними в пам’яті системи розпізнавання. При використанні даного методу основна задача полягає у виділенні загальних властивостей за вибором образів, належність яких шуканому класу відома.

Вибір методу синтезу системи не розв’язує до кінця проблеми складання конкретної програми і проблеми реалізації. В більшості випадків є образи, що представляють кожний з розглядуваних класів. В таких випадках можна скористатися методами розпізнавання, які називаються "навчання з учителем". У схемі "навчання з учителем" система навчається розпізнавати образи за допомогою різного роду адаптивних схем. В деяких прикладних задачах для елементів, що належать до визначеного класу, навчаючі множини невідомі. У таких випадках, властиво, і можна звернутися до методів "розпізнавання з учителем". Розпізнавання по схемі навчання з учителем характеризується тим, що відома правильна класифікація кожного навчаючого образу. У випадку навчання без учителя потрібно конкретно вивчити класи образів, які є в даній інформації [1]. Типовим прикладом лінійного представлення є блок-схеми, технічні і архітектурні креслення і т.д. Лінійні структури можуть бути описані аналітично, а з використанням ЕОМ можна порівняно легко формувати складні структури. Ці структури використовують також в тих випадках, коли для вводу зображення застосовують методи слідкування за контуром чи іншими траєкторними точками. Яка б структура не використовувалась, в машинному представленні найкраще використовувати єдиний вид структури даних – ланцюговий код. Це послідовність з восьми цифр.

Перевага ланцюгового коду – його компактність. Код дозволяє представити складні дані про зображення, що складається з великого числа областей, у стиснутому вигляді. Оскільки ланцюгові коди представляють дані про границю, їх зручно застосовувати в ЕОМ до задач, що потребують зберігання форми областей. Границі для цілої області можуть зберігатися в формі лінійних списків.


Математичний метод

В основу математичного підходу покладені правила класифікації, які формулюються і виводяться в рамках визначеного математичного формалізму з допомогою принципів загальності властивостей і кластеризації. Коли образи деякого класу представляють собою вектори, компонентами яких є дійсні числа, то цей клас можна розглядати як кластер. Побудова системи розпізнавання, яка базується на реалізації даного принципу, визначається просторовим розміщенням окремих кластерів. Якщо кластери, що відповідають різним класам, рознесені далеко один від одного, то можна користуватися простими схемами розпізнавання, наприклад, класифікацією за принципом мінімальної відстані.

Інший підхід відомий як метод потенціальних функцій, відрізняється тим, що об’єднуються деякі розмиті множини, що описуються так званою потенціальною функцією. При цьому здійснюється апроксимація не розв’язуючою, а дискримінантною функцією. Її значення вираховується шляхом складання значень «потенціалу», який зменшується в міру зникання від деяких центрів, що вибираються в процесі навчання. Цей підхід є еквівалентним апроксимації дискримінантної функції за допомогою функціонального ряду. Суть полягає в тому, що на просторі вхідних векторів Х задається функція, яка називається «потенціалом». Потенціал визначається наближенням двох точок і задається як функція відстані між точками. Потенціальна функція така, що вона монотонно зменшується із збільшенням відстані.

Таким чином, результатом побудови є потенціальне поле, яке розбиває весь простір на дві частини: де значення додатні і від’ємні. Поверхня, на якій потенціал дорівнює нулю, називається розділяючою


Евристичний метод За основу евристичного підходу взяті інтуїція і досвід людини: в ньому використовуються принципи перерахування членів класу і загальні властивості. Зазвичай системи, побудовані такими методами, включають набір специфічних процедур, розроблених для конкретних задач розпізнавання. Хоча евристичний підхід відіграє велику роль в розпізнаванні, небагато може бути сказано про загальні принципи синтезу, оскільки розв’язання кожної конкретної задачі потребує використання специфічних прийомів розробки. Це означає, що структура і якість евристичної системи в значній мірі визначається талантом та досвідом роботи тих, хто її розробляє. Найпоширенішими є такі підходи розпізнавання [3].

В більшості випадків зображення одного класу зберігають більш-менш постійні розміри і форми. В цих випадках розпізнавання можна здійснити шляхом порівняння зображень з зразками. Такі зразки називають масками, трафаретами, еталонами.

Найпростіший підхід до розпізнавання образів базується на порівнянні їх з еталонами. В цьому випадку деяка множина образів, по одному з кожного класу образів, знаходиться в пам’яті машини. Вхідний образ, що потрібно розпізнати (невідомого класу) порівнюється з еталоном кожного класу. Класифікація базується на раніше вибраному критерії співставлення подібності. Іншими словами, якщо вхідний образ краще відповідає еталону і-го класу образів, ніж в будь-якому іншому еталоні, то вхідний образ класифікується як належність до і-го класу образів. Такий підхід використаний в більшості випадків для читання друкованих літер і банківських чеків. Недоліком цього підходу, тобто співставлення з еталоном, є те, що важко вибрати еталон, який найбільше підходить з кожного класу образів і встановити необхідний критерій відповідності. Ці труднощі особливо суттєві, коли образи, які належать одному класу, можуть мати значні спотворення. Типовим прикладом цього явища є розпізнавання рукописних літер. Більш вдосконалений підхід ґрунтується на тому, що замість порівняння вхідного образу з еталоном, класифікація базується на деякій множині відібраних вимірів. Ці відібрані виміри називаються ознаками, і є малочутливими щодо звичайних змін і спотворень. В цьому випадку розпізнавання образу можна розглядати в двох задачах.

Перша задача ґрунтується в визначенні, які вимірювання повинні були б бути зроблені на вхідному образі. Звичайний розв’язок задачі про те, що міряти, є певною мірою суб’єктивний, а також залежать від практичних обставин. На сьогодні дуже мало зроблено в конструюванні загальної теорії вибору вимірювальних ознак.

Друга задача розпізнавання образів базується на класифікації (тобто прийнятті розв’язку, чи належить вхідний образ до того чи іншого класу), що має основу на вимірюваннях відібраних ознак




Класифікація методів виявлення розладки

  • Послідовні алгоритми - алгоритми, призначенні для вирішення задачі якнайшвидшого виявлення розладки
  • Апостеріорні алгоритми - алгоритми, призначенні для вирішення задач оцінювання моменту появи розладки post factum.
  • Параметричні методи - методи, що вимагають інформації про розподіли випадкової послідовності.
  • Непараметричні методи - методи, що дозволяють відмовитися від інформації про розподіли випадкової послідовності.

Сфера застосування

Виявлення розладки випадкової послідовності знаходить своє застосування в багатьох сферах:

  • В геофізиці за заданою вибіркою даних сейсмоприймачів можна якомога точніше визначити момент появи сейсмічних хвиль та їх фаз, що допомагає точніше визначити епіцентр землетрусу.
  • У областях прикладних досліджень , наприклад, у технічної та медичної діагностики, де вся доступна інформація міститься в кінцевих вибірках багатовимірних спостережень, виникає необхідність по можливості точно відповісти на питання: наскільки істотно відрізняються властивості аналізованих сигналів, що характеризують різні стани досліджуваного об'єкта? Відповідь на питання зводиться до задачі виявлення розладки випадкового процесу.
  • В аналізі історичних текстів . Відомо, що багато давніх історичних джерела (літописи, хроніки тощо) складені з окремих фрагментів (шматків) різної природи. Ці окремі шматки могли бути написані в різний час різними авторами (у різних країнах), а тому можуть істотно відрізнятися один від одного своїм характером, мовою і стилем викладу, емоційним забарвленням і т.д. Потім могло трапитися так, що ці фрагменти були об'єднані якимось пізнішим автором в одну книгу. Після цього первісне походження текстів фрагментів забувалося, і вони починали існувати як єдина літопис. З плином часу в результаті, під впливом різних редакторів та в силу багатьох інших причин, початкові зовнішні відмінності між окремими фрагментами поступово стиралися. Виникає важливе питання: чи можна, спираючись на статистичний аналіз різних частотних характеристик, виявити сьогодні всередині "єдиного великого тексту" ці первинні складові частини?

Список літературних джерел

  • Ширяев А. Н. Статистический последовательный анализ. М.: Наука, 1969, 231 с.
  • Дарховский Б. С, Бродский Б. Е. Апостериорное обнаружение момента «разладки» случайной последовательности.— Теория вероятн. и ее примен., 1980
  • Дарховский Б. С, Бродский Б. Е. Анализа исторических текстов.
  • Никифоров И.В. Последовательное обнаружение изменения свойств временных рядов.