Розпізнавання образів

Blue check.png Дана стаття являється неперевіреним навчальним завданням.
Студент: Прошина М.
Викладач: Назаревич О. Б.
Термін до: 10 березня 2012

До вказаного терміну стаття не повинна редагуватися іншими учасниками проекту. Після завершення терміну виконання будь-який учасник може вільно редагувати дану статтю і витерти дане попередження, що вводиться за допомогою шаблону.


{{{img}}}
Імя Марія
Прізвище Прошина
По-батькові Юріївна
Факультет ФІС
Група СНм-51
Залікова книжка СНм-11-243


Репозиторія
Презентація доповіді на тему Розпізнавання образів
є розміщеною в Репозиторії.
Невідредагована стаття
Цю статтю потрібно відредагувати.
Щоб вона відповідала ВИМОГАМ.


Предмет розпізнвавання образів

Предмет розпізнвавання образів –об'єднує ряд наукових дисциплін. Їх пов'язує пошук рішення загальної задачі - виділити елементи, що належать конкретному класу, серед множини розмитих елементів, що відносяться до кількох класів.

  • Клас образів - деяка категорія, що визначається рядом властивостей загальних для всіх її елементів.
  • Образ - це опис будь-якого елементу як представника відповідного класу образів.

У випадку коли множина образів розділяється на класи, що не перетинаються, бажано використовувати для віднесення цих образів до відповідних класів якийсь автоматичний пристрій.

Між образами та класами образів існує деяке ієрархічне підпорядкування.

Букви алфавітів і цифри є образами, якщо буквенно-цифрові символи розглядаються як клас образів.

Друковані і рукописні зображення, наприклад букви А є образами букви англійського алфавіту А, яка представляє в цьому випадку клас образів.

Історія формування теорії розпізнавання образів

Як наука, теорія розпізнавання образів почала формуватися наприкінці 50-их років. Спочатку це була змістовна постановка задачі ( але не формальна!) Вона полягала в тому, що треба було побудувати машину, яка б могла класифікувати різні ситуації так, як це робили живі істоти. Така загальна постановка задачі привела до того, що виникли різні напрямки досліджень. Деякі вчені будували моделі процесу сприйняття. Інші вважали, що головне-це створення алгоритмів навчання розпізнаванню образів, щоб розв”язувати конкретні задачі. Дехто шукав постановки нових математичних проблем. Якщо спочатку досить успішно вдалося просунутись по всіх напрямках, то з часом успіхи значно зменшились. Виникло дві протилежні точки зору на проблему розпізнавання. Перша полягала в тому, що потрібно знайти такий опис об”єктів, використовуючи апріорні дані про них, що знаходження принципу класифікації вже не буде важким. Друга бачила головну проблему в пошуку правила класифікації серед заданої множини вирішальних правил.

Проблема розпізнавання образів

В цілому проблема розпізнавання образів складається з двох частин:

  • навчання;
  • розпізнавання.

Навчання здійснюється шляхом показу окремих об'єктів з вказанням їх приналежності тому або іншому образу. В результаті навчання розпізнаюча система повинна набути здатність однаково реагувати на всі об'єкти одного образу і по-різному – на всі об'єкти різних образів. Дуже важливо, що процес навчання повинен завершитися лише шляхом показів скінченого числа об'єктів без будь-яких інших підказок. Об'єктами навчання можуть бути або картинки, або інші візуальні зображення (букви), або різні явища зовнішнього світу, наприклад звуки, стани організму тощо. Важливо, що в процесі навчання вказуються лише самі об'єкти і їх приналежність образу. За навчанням слідує процес розпізнавання нових об'єктів, який характеризує дії вже навчанної системи. Автоматизація цих процедур і складає проблему навчання розпізнаванню образів. У випадку, коли людина сама розгадує або придумує, а потім нав'язує машині правило класифікації, проблема розпізнавання вирішується частково, оскільки основну і головну частину проблеми (навчання) людина бере на себе.

Методи розпізнавання образів

Лінгвістичний (синтаксичний) метод

Якщо опис образів здійснюється за допомогою підобразів і їх співвідношень, то для конструювання системи розпізнавання використовують лінгвістичний або синтаксичний підхід з використанням принципу загальності властивостей. Основне припущення, яке робиться в цьому методі, ґрунтується на тому, що образи, які належать одному і тому ж класу, володіють рядом загальних властивостей або ознак, які відображають подібність таких образів. Ці загальні властивості можна частково ввести в пам’ять системи розпізнавання. Коли системі представити некласифікований образ, то вибирається набір ознак, що визначаються, причому останні інколи кодуються, а потім вони порівнюються з ознаками, закладеними в пам’яті системи розпізнавання. При використанні даного методу основна задача полягає у виділенні загальних властивостей за вибором образів, належність яких шуканому класу відома.

Вибір методу синтезу системи не розв’язує до кінця проблеми складання конкретної програми і проблеми реалізації. В більшості випадків є образи, що представляють кожний з розглядуваних класів. В таких випадках можна скористатися методами розпізнавання, які називаються "навчання з учителем". У схемі "навчання з учителем" система навчається розпізнавати образи за допомогою різного роду адаптивних схем. В деяких прикладних задачах для елементів, що належать до визначеного класу, навчаючі множини невідомі. У таких випадках, властиво, і можна звернутися до методів "розпізнавання з учителем". Розпізнавання по схемі навчання з учителем характеризується тим, що відома правильна класифікація кожного навчаючого образу. У випадку навчання без учителя потрібно конкретно вивчити класи образів. Типовим прикладом лінійного представлення є блок-схеми, технічні і архітектурні креслення і т.д. Лінійні структури можуть бути описані аналітично, а з використанням ЕОМ можна порівняно легко формувати складні структури. Ці структури використовують також в тих випадках, коли для вводу зображення застосовують методи слідкування за контуром чи іншими траєкторними точками. Яка б структура не використовувалась, в машинному представленні найкраще використовувати єдиний вид структури даних – ланцюговий код. Це послідовність з восьми цифр.

Перевага ланцюгового коду – його компактність. Код дозволяє представити складні дані про зображення, що складається з великого числа областей, у стиснутому вигляді. Оскільки ланцюгові коди представляють дані про границю, їх зручно застосовувати в ЕОМ до задач, що потребують зберігання форми областей. Границі для цілої області можуть зберігатися в формі лінійних списків.

Математичний метод

В основу математичного підходу покладені правила класифікації, які формулюються і виводяться в рамках визначеного математичного формалізму з допомогою принципів загальності властивостей і кластеризації. Коли образи деякого класу представляють собою вектори, компонентами яких є дійсні числа, то цей клас можна розглядати як кластер. Побудова системи розпізнавання, яка базується на реалізації даного принципу, визначається просторовим розміщенням окремих кластерів. Якщо кластери, що відповідають різним класам, рознесені далеко один від одного, то можна користуватися простими схемами розпізнавання, наприклад, класифікацією за принципом мінімальної відстані.

Інший підхід відомий як метод потенціальних функцій, відрізняється тим, що об’єднуються деякі розмиті множини, що описуються так званою потенціальною функцією. При цьому здійснюється апроксимація не розв’язуючою, а дискримінантною функцією. Її значення вираховується шляхом складання значень «потенціалу», який зменшується в міру зникання від деяких центрів, що вибираються в процесі навчання. Цей підхід є еквівалентним апроксимації дискримінантної функції за допомогою функціонального ряду. Суть полягає в тому, що на просторі вхідних векторів Х задається функція, яка називається «потенціалом». Потенціал визначається наближенням двох точок і задається як функція відстані між точками. Потенціальна функція така, що вона монотонно зменшується із збільшенням відстані.

Таким чином, результатом побудови є потенціальне поле, яке розбиває весь простір на дві частини: де значення додатні і від’ємні. Поверхня, на якій потенціал дорівнює нулю, називається розділяючою

Евристичний метод

За основу евристичного підходу взяті інтуїція і досвід людини: в ньому використовуються принципи перерахування членів класу і загальні властивості. Зазвичай системи, побудовані такими методами, включають набір специфічних процедур, розроблених для конкретних задач розпізнавання. Хоча евристичний підхід відіграє велику роль в розпізнаванні, небагато може бути сказано про загальні принципи синтезу, оскільки розв’язання кожної конкретної задачі потребує використання специфічних прийомів розробки. Це означає, що структура і якість евристичної системи в значній мірі визначається талантом та досвідом роботи тих, хто її розробляє.

В більшості випадків зображення одного класу зберігають більш-менш постійні розміри і форми. В цих випадках розпізнавання можна здійснити шляхом порівняння зображень з зразками. Такі зразки називають масками, трафаретами, еталонами.

Найпростіший підхід до розпізнавання образів базується на порівнянні їх з еталонами. В цьому випадку деяка множина образів, по одному з кожного класу образів, знаходиться в пам’яті машини. Вхідний образ, що потрібно розпізнати (невідомого класу) порівнюється з еталоном кожного класу. Класифікація базується на раніше вибраному критерії співставлення подібності. Іншими словами, якщо вхідний образ краще відповідає еталону і-го класу образів, ніж в будь-якому іншому еталоні, то вхідний образ класифікується як належність до і-го класу образів. Такий підхід використаний в більшості випадків для читання друкованих літер і банківських чеків. Недоліком цього підходу, тобто співставлення з еталоном, є те, що важко вибрати еталон, який найбільше підходить з кожного класу образів і встановити необхідний критерій відповідності. Ці труднощі особливо суттєві, коли образи, які належать одному класу, можуть мати значні спотворення. Типовим прикладом цього явища є розпізнавання рукописних літер. Більш вдосконалений підхід ґрунтується на тому, що замість порівняння вхідного образу з еталоном, класифікація базується на деякій множині відібраних вимірів. Ці відібрані виміри називаються ознаками, і є малочутливими щодо звичайних змін і спотворень. В цьому випадку розпізнавання образу можна розглядати в двох задачах.

  • Перша задача ґрунтується в визначенні, які вимірювання повинні були б бути зроблені на вхідному образі. Звичайний розв’язок задачі про те, що міряти, є певною мірою суб’єктивний, а також залежать від практичних обставин. На сьогодні дуже мало зроблено в конструюванні загальної теорії вибору вимірювальних ознак.
  • Друга задача розпізнавання образів базується на класифікації (тобто прийнятті розв’язку, чи належить вхідний образ до того чи іншого класу), що має основу на вимірюваннях відібраних ознак.

Практичне застосування

Коло завдань, які можуть вирішуватися за допомогою систем, що розпізнають, надзвичайно широкий. Прикладами таких завдань можуть бути :

  • технічна діагностика;
  • медична діагностика;
  • розпізнавання букв;
  • розпізнавання штрих-кодів;
  • розпізнавання автомобільних номерів;
  • розпізнавання осіб та інших біометричних даних;
  • розпізнавання мови ;
  • розпізнавання складних процесів і явищ, що виникають, наприклад, при виборі доцільних дій керівником підприємства або виборі оптимального управління технологічними, економічними, транспортними або військовими операціями та ін.


Список літературних джерел

  • Дэвид А. Форсайт, Джин Понс [Computer Vision: A Modern Approach Компьютерное зрение. Современный подход]. — М.: «Вильямс», 2004. — 928 с.
  • Джордж Стокман, Линда Шапиро [Computer Vision Компьютерное зрение]. — М.: Бином. Лаборатория знаний, 2006. — 752 с.
SeminarSpeech.png
Студент: Користувач:Марія
Виступ відбувся: 31 січня 2012
Тема: Розпізнавання образів