Рего Г. Э. Распознавание лиц на изображениях с низким качеством съемки // StudArctic forum. Выпуск 1 (13), 2019, DOI: 10.15393/j102.art.2019.3861


Выпуск № 1 (13)

Компьютерные и информационные науки

pdf-версия статьи

Распознавание лиц на изображениях с низким качеством съемки

Рего Григорий Эйнович
Петрозаводский государственный университет, студент (Проспект Ленина, 31),
regoGr@yandex.ru
Научный руководитель:
доктор технических наук
профессор Рогов Александр Александрович
Ключевые слова:
Распознавание лиц
алгоритм Виолы-Джонса
разработка классификатора.
Аннотация: В работе описано исследование по проблеме распознавания лиц на изображениях с низким качеством съемки. Существующие классификаторы с высокой долей вероятности распознают лица на изображениях с высоким качеством съемки, но являются неэффективными при применении их на изображениях с низким качеством съемки. Описано создание классификатора, настроенного на распознавание лиц на изображениях с низким качеством съемки, а также классификатора, настроенного на распознавание изображения лица конкретного человека.
Статья поступила: 08.06.2019; Принята к публикации: 21.06.2019;

Основной текст

Распознавание объектов широко используется в современных приложениях и программных продуктах. Существующие классификаторы показывают высокие результаты в распознавании лиц при условии качественных изображений. При работе с изображениями с низким качеством те же самые классификаторы имеют низкий процент распознавания объектов и высокий процент ложных срабатываний. Данная работа посвящена решению этой проблемы. Ранее исследованиями на эту тему занимался Талбонен А.Н. [1]

Самым распространенным алгоритмом в распознавании лиц является алгоритм Виолы-Джонса[2][3]. Суть его заключается в том, что по изображению двигается окно с некоторой длиной шага, и на каждом шаге в рамках окна ищутся признаки Хаара, соответствующие лицам. Признаки Хаара – это некоторые примитивы, обычно являющиеся черно-белыми прямоугольниками, с различными вариантами деления на цвета (рис.1).

 

Рисунок 1 Примитивы Хаара

Алгоритм опирается на предположении о том, что любые схожие объекты (лица, глаза, машины, собаки и т.д.) имеют схожий набор примитивов Хаара. Следовательно, при передвижении окна поиска по изображению и его масштабировании, можно найти искомые объекты, сравнивая получаемые примитивы с примитивами обучающей выборки. Существует множество программных продуктов, позволяющих производить поиск объектов и задавать критерии поиска (полнота, точность и т.д.). В данной работе использовалась библиотека компьютерного зрения OpenCV.

В ходе экспериментов было использовано 250 изображений из архива музея ПетрГУ. В архиве содержатся изображения, начиная с 1920-х гг. и заканчивая нашим десятилетием. Целью работы являлось повышение процента распознаваемых лиц на изображениях и снижение процента ложных срабатываний.

Процедура поиска проводилась в нескольких режимах: производился поиск как профилей лиц, так и анфасов, а также производился поиск лиц с наклоном окна в 45 градусов. Для поиска была использована функция detectMultiscale из библиотеки OpenCV со следующими параметрами: шаг окна поиска был равен 1.05, а количество соседей 1. Такие параметры позволяют добиться максимальной полноты поиска, не перегружая память компьютера. Чем больше увеличивалась полнота поиска, тем сильнее повышалась вычислительная сложность алгоритма. В связи с этим, выработалась следующая рекомендация для пользователей: лучше начинать поиски с обычных методов, чтобы отсеять качественные изображения и облегчить работу более глубокого поиска.

В ходе работы изображения были поделены на 2 части: обучающая (200 изображений) и тестовая (50 изображения). Фотографии из обучающей выборки были разбиты на 3 категории:

1. Изображения, на которых стандартные параметры функции DetectMultiScale имеют высокие результаты. На таких изображениях количество распознанных лиц достигало 80%. В дальнейших исследованиях по распознаванию они не использовались, ввиду отсутствия такой необходимости. (79 изображений из 200).

2. Изображения, на которых стандартные параметры функции DetectMultiScale имеют средние результаты. На таких изображениях количество распознанных лиц достигало 30-70%. В дальнейших исследованиях данные изображения представляли наибольший интерес, ввиду возможности качественного улучшения распознавания объектов на них. (74 изображения из 200).

3. Изображения, на которых стандартные параметры функции DetectMultiScale имеют низкие результаты. Работа с данными изображениями была продолжена. (47 изображений из 200).

  Для тренировки классификатора использовались результаты работы стандартного классификатора с изображениями второй и третьей категории. В качестве положительных примеров использовались нераспознанные лица, в качестве негативных ложные срабатывания.

  После этого классификатор тренировался на полученных данных. Результаты работы нового классификатора добавлялись в обучающую выборку положительных и негативных примеров. Такой цикл был повторен 4 раза.

  В результате получилось 187 положительных примеров и 361 отрицательных. Далее работа стандартного классификатора тестировалась вместе с работой нового классификатора на тестовой выборке. На фотографиях с низким качеством съемки полнота выросла более чем на 10%. На рис.2 приведен пример работы стандартного классификатора, а на рис.3 пример работы нового классификатора.

  Второй целью исследования стало создание классификатора для распознавания изображения лица конкретного человека. В качестве примера для разрабатываемого классификатора были взяты изображения лица ректора Петрозаводского государственного университета Воронина Анатолия Викторовича. В качестве положительных примеров использовались фотографии лица ректора с сайта ПетрГУ. В качестве негативных примеров использовались все положительные примеры из предыдущей задачи, дополненные негативными.   

 

Рисунок 2 Результат работы стандартного классификатора

 

Рисунок 3 Результат работы нового классификатора

  В результате удалось создать классификатор, способный распознавать изображение лица ректора ПетрГУ в 90% случаев (Рис.4).

 

Рисунок 4 Поиск изображения лица ректора ПетрГУ Воронина А.В.

  В заключение стоит отметить, что подобные классификаторы могут помогать исследователям в области истории и архивоведения, так как позволяют находить ранее неопознанные или нечеткие лица на архивных фотографиях.


Список литературы

1. Талбонен, А.Н., Рогов, А. А. Модели и методы поиска людей на фотографиях из исторического альбома ; М-во образования и науки Рос. федер. гос. бюджет. образоват. учреждение высш. образования Петрозавод. гос. ун-т. – Петрозаводск : Изд-во ПетрГУ, 2012. – 52 с

2. Волченков, М. П. Об автоматическом распознавании лиц [Электронный ресурс] /М.П. Волченков, И.Ю.Самоненко. — Режим доступа: http://www.intsys.msu.ru/magazine/archive/v9(1-4)/volchenkov-135-156.pdf.Дата обращения: 15.01.2019.

3. Лифшиц, Ю. Методы распознавания лиц [Электронный ресурс] / Ю. Лифшиц. — Режим доступа: http://yury.name/modern/08modernnote.pdf. Дата обращения: 15.01.2019.



Просмотров: 210; Скачиваний: 36;

DOI: http://dx.doi.org/10.15393/j102.art.2019.3861