WWW.KNIGA.LIB-I.RU
БЕСПЛАТНАЯ  ИНТЕРНЕТ  БИБЛИОТЕКА - Онлайн материалы
 

«Лекция №2 Общая схема алгоритмов распознавания Антон Конушин Введение в компьютерное зрение, Весна 2009 Примеры практических задач Практически все ...»

Лекция №2

Общая схема алгоритмов распознавания

Антон Конушин

Введение в компьютерное зрение,

Весна 2009

Примеры практических задач

Практически все задачи решают одну из (или обе)

задачи:

• поиск определенных объектов на изображении

• измерение параметров объектов на изображении

Медицинские приложения

Пример – анализ концентрации клеток определенного типа в

крови

Неразрушающая диагностика

Поиск и анализ дефектов без разрушения объекта исследования

Автоматизированный поиск дефектов по изображениям Пример – автоматический поиск трещин в асфальте по ИК изображениям Обнаружение естественных объектов

Примеры:

Обнаружение лиц Обнаружение красных глаз на фото (для коррекции) Обнаружение антропометрических точек лица Анализ спутниковых снимков Погода Геологические процессы (напр. таяние ледников) Экология Примеры заданий Электронный кассир Примеры заданий Сахар и ложки Примеры заданий Распознавание циферблата аналоговых часов Примеры заданий Поиск клада Как обычно анализируются изображения Предобработка изображения для упрощения анализа (например – шумоподавление) Выделение на изображении областей-кандидатов в которых может находится искомый объект Проверка – является ли фрагмент изображения изображением нужного нам объекта Расчет параметров реального объекта по характеристикам изображения объекта Схема алгоритма Как обычно анализируются изображения Предобработка изображения для упрощения анализа (например – шумоподавление) Выделение на изображении областей-кандидатов в которых может находится искомый объект Проверка – является ли фрагмент изображения изображением нужного нам объекта Расчет параметров реального объекта по характеристикам изображения объекта Изображение Изображение оптическое – картина, получаемая в результате прохождения через оптическую систему лучей, распространяющихся от объекта, и воспроизводящая его контуры и детали.

Физический энциклопедический словарь.

Компьютерное представление изображения:

Функция интенсивности (яркости) канала, заданная на 2х мерной сетке (матрице) I = g ( x, y ),{x [ x0, x1 ], y [ y0, y1 ]} Используется дискретное представление I = g (i, j ),{i = 1, n, j 1, m} Дискретизация и квантование 8, 16-битные 1 битные (ч/б) Как получается цифровое изображение?

Свет, падая на светочувствительный элемент преобразуется в электрические сигналы Сигналы оцифровываются, превращаются в массив чисел f ( x) = y x – характеристика яркости света y – яркость пиксела изображения Виды изображений Многоканальные / одноканальные RGB, CMYK, LAB Grayscale (в градациях серого) Почему оно может получиться плохо?

Ограниченный диапазона чувствительности датчика “Плохой” функции передачи датчика Обработка изображений Семейство методов и задач, где входной и выходной информацией являются изображения.

Примеры :

Устранение шума в изображениях Улучшение качества изображения Усиления полезной и подавления нежелательной (в контексте конкретной задачи) информации Что такое гистограмма?

Гистограмма – это график распределения тонов на изображении.

На горизонтальной оси - шкала яркостей тонов от белого до черного, на вертикальной оси - число пикселей заданной яркости.

Изменение контраста изображения

Что может не устраивать в полученном изображении:





• Узкий или смещенный диапазон яркостей пикселей (тусклое или «пересвеченное» изображение)

• Концентрация яркостей вокруг определенных значений, неравномерное заполнение диапазона яркостей (узкий диапазон - тусклое изображение) Коррекция - к изображению применяется преобразование яркостей, компенсирующий нежелательный эффект:

–  –  –

Компенсация узкого диапазона яркостей – линейное растяжение:

Линейная коррекция Линейное растяжение – «как AutoContrast в Photoshop»

Линейная коррекция Линейная коррекция помогает не всегда!

Нелинейная коррекция

–  –  –

Нелинейная компенсация недостаточной контрастности

Часто применяемые функции:

• Гамма-коррекция

• Изначальная цель – коррекция для правильного отображения на мониторе.

y = c x

• Логарифмическая

• Цель – сжатие динамического диапазона при визуализации данных y = c log(1 + x) Гамма-коррекция Гамма-коррекция

• Изначальная цель – коррекция для правильного отображения на мониторе. Так называют преобразование вида:

y = cx

–  –  –

Пример Борьба с шумом изображения Подавление и устранение шума

Причины возникновения шума:

Несовершенство измерительных приборов Хранение и передача изображений с потерей данных

–  –  –

Пример бинарного изображению с сильным шумом Бинарное изображение – изображение, пиксели которого принимают всего два значения (0 и 1).

Шум в бинарных изображениях По одному пикселю невозможно определить – шум или объект?

Нужно рассматривать окрестность пикселя!

Подавление и устранение шума Устранение шума в бинарных изображениях Бинарное изображение – изображение, пиксели которого принимают всего два значения (0 и 1).

Широко известный способ - устранение шума с помощью операций математической морфологии:

Сужение (erosion) Расширение (dilation) Закрытие (closing) Раскрытие (opening) Математическая морфология A B Множество A обычно является объектом обработки, а множество B (называемое структурным элементом) – инструментом.

Расширение в дискретном случае

–  –  –

Коммутативный закон A (+) B = B (+) A A (-) B B (-) A Ассоциативный закон A (+) (B (+) C) = (A (+) B) (+) C A (-) (B (-) C) = (A (-) B) (-) C Применения сужения к бинарному изображению с сильным шумом

–  –  –

Результат морфологических операций во многом определяется применяемым структурным элементом.

Выбирая различный структурный элемент можно решать разные задачи обработки изображений:

–  –  –

Морфологическое раскрытие (opening) open(A, B) = (A (-) B) (+) B Морфологическое закрытие (closing) close(A, B) = (A (+) B) (-) B Образовательные материалы по мат.

морфологии доступны по адресу:

http://courses.graphicon.ru/main/cg/library Применения открытия к бинарному изображению с сильным шумом

–  –  –

Сужение Открытие Устранение шума в бинарных изображениях Пример бинарного изображению с дефектами распознаваемых объектов Применения закрытия к бинарному изображению с дефектами объектов

–  –  –

Устранение шума в полутоновых и цветных изображениях Усреднение (box filter) Фильтр Гаусса (gaussian blurring) Медианный фильтр Операция «свертка» (convolution) Свертка двумерной функции f по функции g в непрерывном и дискретном случае.

–  –  –

g(l,k) – ядро (kernel) свертки или фильтра размером (n1-n0)x(m1-m0) Часто, свертка изображения по какой-либо функции называется применением фильтра к изображению.

Применение фильтров

–  –  –

Подводные камни:

• Выход за границы массива

• Выход за пределы допустимого диапазона яркости пикселей

• Обработка краев.

Свойства фильтров

1. Результат фильтрации однотонного (константного) изображения – константное изображение. Его цвет равен

–  –  –

3. Следствие: если сумма коэффициентов фильтра равна нулю, то он переводит однотонные области в нулевые.

Устранение шума в полутоновых и цветных изображениях Пример: изображение с равномерным шумом.

I (i, j ) = g r (i, j ) + Err (i, j ) Err(i,j) – нормально распределенная случайная величина.

Усреднение (box filter) Операция усреднения значения каждого пикселя –

cвертка по константной функции:

n m I (i, j ) = I (i + l )( j + k ) 4nm l = n k = m

–  –  –

Параметр задает степень размытия.

На графике функция с = 5.

Маленькая экскурсия к Фурье + Низкие частоты Высокие частоты Фильтр Гаусса (gaussian blurring) Результаты свертки по функции Гаусса и по константной функции (усреднения).

–  –  –

Исходное изображение Важное свойство фильтра Гаусса – он по сути является высокочастотный фильтром.

Подавление и устранение шума Устранение шума в полутоновых, цветных и бинарных изображениях с помощью медианного фильтра - выбор медианы среди значений яркости пикселей в некоторой окрестности.

Определение медианы:

Ai, i = 1,n; - отсортированный набор чисел, A[n / 2 ] медиана набора.

Медианный фильтр радиусом r – выбор медианы среди пикселей в окрестности [-r,r].

Медианный фильтр Результат применения медианного фильтра с радиусом 5 пикселей.

Результат применения медианного фильтра с радиусом в 7 пикселей к изображению с шумом и артефактами в виде тонких светлых окружностей.

Очистка изображения с помощью медианного фильтра Фильтр с окрестностью 3x3 Компенсация разности освещения Пример Компенсация разности освещения

Идея:

Формирование изображения:

I (i, j ) = l (i, j ) f (i, j ) Плавные изменения яркости относятся к освещению, резкие - к объектам.

–  –  –

Предобработка изображения для упрощения анализа (например – шумоподавление) Выделение на изображении областейкандидатов в которых может находится искомый объект Проверка – является ли фрагмент изображения изображением нужного нам объекта Расчет параметров реального объекта по характеристикам изображения объекта Выделение областей-кандидатов Проверять все возможные фрагменты изображения ничего не пропускает больше вариантов перебирать Разделить (сегментировать) изображение на области однородные по каким-то признакам и анализировать области отдельно меньше перебирать вариантов (только области) не понятно, что делать, если объект состоит из многих деталей Проверка всех фрагментов Проверяем все области размера от N1xN1 до N2xN2 • Так ищутся лица и т.д.

• Выделение областей-кандидатов Варианты сегментации (вообще-то их масса) Бинаризация изображения, анализ связных компонент Цветовая или текстурная сегментация изображения на однородные области Подробнее рассказывается на следующих лекциях Бинарное изображение Пример изображения для обработки Как получить бинарное изображение?

Общая цель – выделение на изображении интересных нам объектов.

Простейший вариант - пороговая фильтрация (thresholding) Пороговая фильтрация Простейший случай – выделение областей, яркость которых выше/ниже некоторого порога заданного «извне».

Пороговая фильтрация Более интересный способ – определение порога автоматически, по характеристикам изображения;

Анализ гистограммы Анализ симметричного пика гистограммы Применяется когда фон изображения дает отчетливый и доминирующий пик гистограммы, симметричный относительно своего центра.

Сгладить гистограмму;

1.

Найти ячейку гистограммы hmax с максимальным значением;

2.

На стороне гистограммы не относящейся к объекту (на примере – 3.

справа от пика фона) найти яркость hp, количество пикселей с яркостью = hp равняется p% (например 5%) от пикселей яркости которых = hmax;

Пересчитать порог T = hmax - (hp - hmax);

4.

Адаптивная бинаризация Необходима в случае неравномерной яркости фона/объекта.

Адаптивная бинаризация Необходима в случае неравномерной яркости фона/объекта.

–  –  –

Определение связной области:

Множество пикселей, у каждого пикселя которого есть хотя бы один сосед, принадлежащий данному множеству.

Соседи пикселей:

–  –  –

Постобработка - переразметка с учетом эквивалентностей областей Разметка связных областей путем последовательного сканирования

Случай конфликта:

Постобработка - переразметка с учетом эквивалентностей областей Сегментация полутоновых и цветных изображений

Выделение областей однородных по:

Яркости Цвету Текстуре и т.д.

Метод k-средних Сегментация изображения на области однородной яркости методом k-средних.

–  –  –

Дано:

Набор векторов xi i=1,…,p;

k – число кластеров, на которые нужно разбить набор xi;

Найти:

k средних векторов mj j=1,…,k (центров кластеров);

отнести каждый из векторов xi к одному из k кластеров;

Метод k-средних – метод кластеризации данных.

Целью задачи кластеризации является разбиение множества объектов на классы (кластеры) на основе некоторой меры сходства объектов.

Алгоритм k-средних Случайным образом выбрать k средних mj j=1,…,k;

1.

Для каждого xi i=1,…,p подсчитать расстояние до 2.

каждого из mj j=1,…,k, Отнести (приписать) xi к кластеру j’, расстояние до центра которого mj’ минимально;

Пересчитать средние mj j=1,…,k по всем кластерам;

3.

Повторять шаги 2, 3 пока кластеры не перестанут 4.

изменяться;

Алгоритм k-средних Вариант k-средних для бинаризации Выбрать порог T равным середине диапазона яркостей;

1.

Вычислить среднюю яркость всех пикселей с яркостью T 2.

m1, аналогично m2 для пикселей с яркостью T;

Пересчитать порог T = (m1 + m2) / 2;

3.

Повторять шаги 2, 3 порог не перестанет изменяться;

4.

Пример кластеризации в 2D

–  –  –

Случайная инициализация центров кластеров (шаг 1) Пример кластеризации в 2D Updated Memberships and Boundary at Iteration 1 Пересчет центров кластеров после первой итерации (шаг 3) Пример кластеризации в 2D Updated Memberships and Boundary at Iteration 2 Стабильная конфигурация после четвертой итерации Применение k-средних для сегментации изображений по яркости Рассматриваем одномерное пространство яркостей пикселей и производим в нем кластеризацию с помощью k-средних. Это дает автоматическое вычисление яркостных порогов.

(Для получения бинарного изображения k=2) Сравнение k-средних с порогом по средней яркости После лекции был задан вопрос: чем отличается сегментация с помощью kсредних на 2 кластера от простейшей пороговой бинаризации по средней яркости изображения?

Пример:

–  –  –

В причинах предлагается разобраться самостоятельно Применение k-средних K-средних не учитывают пространственное расположение пикселов, что не всегда удобно.

Для K-средних требуется знать число k изначально Выделение однородных областей методом последовательного сканирования

–  –  –

Пример:

Сегментация цветных изображений Можно применять большинство методов сегментации полутоновых, заменив:

скалярную величину яркости на вектор цвета: (R, G, B), разность яркостей на длину вектора разности двух цветов Как обычно анализируются изображения Предобработка изображения для упрощения анализа (например – шумоподавление) Выделение на изображении областей-кандидатов в которых может находится искомый объект Проверка – является ли фрагмент изображения изображением нужного нам объекта Расчет параметров реального объекта по характеристикам изображения объекта Как анализировать найденные области?

Для машинного анализа требуется вычислить некоторые числовые характеристики (признаки) областей:

Например:

геометрические признаки фотометрические признаки На основе этих характеристик можно классифицировать получаемые области.

Геометрические признаки Для каждой области можно подсчитать некий набор простейших числовых характеристик:

–  –  –

1. Пиксель лежит на границе области, если он сам принадлежит области и хотя бы один из его соседей области не принадлежит.

(внутренняя граница)

2. Пиксель лежит на границе области, если он сам не принадлежит области и хотя бы один из его соседей области принадлежит.

(внешняя граница) Периметр зависит также от того 4-х или 8-ми связность используется для определения соседей.

Пример периметров области Область Внутренняя граница Внешняя граница Операция оконтуривания объекта При работе с бинарными изображениями контуры объекта можно получить с помощью операций математической морфологии Внутреннее оконтуривание CI = A – (A (-) B) Внешнее оконтуривание CO = (A (+) B) – A Пример оконтуривания объекта Статистические моменты области Дискретный центральный момент mij области определяется следующим образом:

–  –  –

Для распознавания нас интересуют характеристики инвариантные по отношению к масштабированию, переносу, повороту:

Удлиненность, нецентрированность (эксцентриситет)

–  –  –

Y Пример изображения с подсчитанными характеристиками областей Другие инвариантные характеристики области Фотометрические признаки Для каждой области можно подсчитать некий набор простейших числовых характеристик:

• Средняя яркость

• Средний цвет (если изображение цветное)

• Гистограмма распределения яркостей (или три гистограммы распределения R, G, B)

• Дисперсию (разброс) яркостей или цвета Разумеется, все это считается не по бинарному изображению Как анализировать признаки Пример – ложки и сахар Как анализировать признаки Как воспользоваться признаками для классификации?

Подобрать диапазоны значений для разных классов вручную, экспериментально (может быть весьма трудоемко) Подобрать диапазоны значений графически (нужна база для тренировки, трудно, если признаков много) Найти диапазоны с помощью методов машинного обучения (нужна база для тренировки и знания в области машинного обучения) Ручной подбор

Из общих соображений:

Ложки более вытянутые, чем сахарные кусочки Ложки больше чем сахарные кусочки Сахарные кусочки квадратные Области появляющиеся из-за шума обычно небольшие и неквадратные Пытаемся сконструировать решающее правило, проверяем экспериментально Может быть весьма утомительно Графический анализ Собрать тренировочную базу изображений Где только ложки Где только сахар Где только шум Как получить такие? Да просто закрасить все остальное.

Брать признаки и строить графики Графический анализ Диаграмма распределения эксцентриситета (проблема – не получается отличить шум от ложек)

–  –  –

Собрать тренировочную базу изображений Где только ложки Где только сахар Где только шум Как получить такие? Да просто закрасить все остальное.

Заложить эти данные в один из алгоритмов машинного обучения

Похожие работы:

«Эмоции и "Отдача" Неврология: врач невролог А.А.Пономаренко 14.04.2013 21:00 Решившись поразить какую нибудь цель из огнестрельного оружия стрелок знает, что будет "отдача". Это значит, что пуля вылетая из ствола обязательно ударит стрелка в плечо с той же силой, с какой она войдёт в цель (за вычетом веса оружия). А при чё...»

«ТОКСОПЛАЗМОЗ Токсоплазмоз – широко распространенная паразитарная инфекция, характеризующаяся многообразием клинических проявлений и значительной вариабельностью течения процесса – от бессимптомн...»

«Должностная инструкция главного администратора футбольного стадиона рк Поиск успешен! 763 704 000 Документов в базе. Обновления ежедневно! Скачать dolzhnostnaya-instruktsiya-glavnogo-administratora-futbolnogo-stadionark.pdf Крепить его...»

«НИЧАЙ Наталия Романовна Роль дополнительного источника легочного кровотока в этапной гемодинамической коррекции унивентрикулярных врожденных пороков сердца 14.01.26 Сердечно-сосудистая хирургия Автореферат...»

«Канон Ангелу Хранителю Обновлено 14.03.2011 00:34 Тропарь, глас 6-й Ангеле Божий, хранителю мой святый, живот мой соблюди во страсе Христа Бога, ум мой утверди во истиннем пути, и к любви горней уязви душу мою, да тобою направляем, получу от Христа Бога велию милость. Слава, и ныне: Богородичен Святая Владычице, Христа Бога нашего...»

«mini-doctor.com Инструкция Бетаметазон крем 0,64 мг/г по 15 г в тубах ВНИМАНИЕ! Вся информация взята из открытых источников и предоставляется исключительно в ознакомительных целях. Бетаметазон крем 0,64 мг/г по 15 г в тубах Д...»

«Голуб Сергей Вениаминович КОМБИНИРОВАННОЕ И КОМПЛЕКСНОЕ ЛЕЧЕНИЕ НЕХОДЖКИНСКИХ ЛИМФОМ ЖЕЛУДКА. 14.01.13 лучевая диагностика, лучевая терапия 14.01.12 онкология АВТОРЕФЕРАТ диссертация на соискание ученой степени кандидата медицинских наук Москва – 2015 г. Работа выполнена в Федеральном государственном бюджетном учреждении "Российский научный центр...»

«Рабочую тетрадь распечатать и заполнить от руки! Филенко А.Б. ГБОУ ВПО Первый Санкт-Петербургский государственный медицинский университет им. академика И.П.Павлова РАБОЧАЯ ТЕТРАДЬ для оформления протоколов самостоятельных и практических работ по нормальной физиологии для студентов факультета ВС...»

«Программа разработана в соответствии с требованиями, предъявляемыми к образовательным программам, сотрудниками радиологического отделения отдела радиационной онкологии ФГБНУ "РОНЦ им. Н.Н.Блохина" и ФГБОУ СПО "Медицинский колледж" РАМН.Авторский коллектив: Ткачев Сергей Иванов...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФГБОУ ВО "СГУ имени Н.Г. Чернышевского" Факультет нанои биомедицинских технологий УТВЕРЖДАЮ _ 20 г. Рабочая программа дисциплины ЭВМ в физическом практикуме Направление по...»








 
2017 www.kniga.lib-i.ru - «Бесплатная электронная библиотека - онлайн материалы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.