Победителем мирового чемпионата по распознаванию лиц MegaFace вновь стала компания «Вокорд» (резидент IT-кластера Фонда «Сколково»). Она выставила на состязание свой новый алгоритм - deepVo V3

Программа компании «Вокорд» с большим отрывом от преследователей оказалась на первом месте сразу в двух номинациях конкурса, связанных с оценкой качества идентификации лиц. В третей номинации, "Верификация", сколковская команда принципиально улучшила свой результат и практически догнала лидера в этой категории. Как пояснил в интервью Sk.ru технический директор «Вокорда» Алексей Кадейшвили, это удалось сделать благодаря новым архитектуре сети и подходам к обучению.

Фото: "Вокорд"

MegaFace - это база данных, состоящая из одного миллиона фотографий. На них изображено около 700 тысяч человек, снятых в «естественных» условиях, т.е. в случайной позе, со свободным выражением лица, освещением и экспозицией. Задача соревнования, организованного исследователями из университета Вашингтона - оценить точность алгоритмов распознавания лиц из галерейной выборки при возрастающем количестве «отвлекающих лиц» (от 10 до 1 миллиона) из базы MegaFace. В соревновании участвуют десятки ведущих мировых команд разработчиков, в том числе из Google.В декабре прошлого года алгоритм распознавания лиц компании «Вокорд», deepVo1.2, основанный на глубоких нейронных сетях, обошел в конкурсе MegaFace разработку Google.

MegaFace -  не единственное состязание для разработчиков алгоритмов по распознаванию лиц.  «Но этот конкурс имеет ряд отличий,  которые делают его наиболее репрезентативным для наших задач, - рассказывает А. Кадейшвили. - Во-первых, в MegaFace одна из самых больших баз лиц (в отличие от LFW), что позволяет измерить результаты распознавания при малых значения  FAR (менее 10^-6). Это наиболее интересно для задач с большими базами лиц и большими потоками входных данных. Во-вторых, в базе собраны снимки из очень разнообразных источников с преобладанием снимков низкого качества (в отличие от базы FERET), что опять же приближает тест к реальной жизни. В-третьих, результаты публикуются постоянно по мере их получения (в отличие от тестов NIST), что позволяет в каждый момент времени иметь актуальный срез состояния алгоритмов распознавания»

В рамках «Сколково» - статус резидента получен в 2011 году – команда разрабатывает трехмерную систему некооперативного распознавания лиц VOCORD FaceControl 3D. В отличие от большинства других проектов IT-кластера, связанных в основном с программированием, эта система является аппаратно-программным комплексом. Игорь Богачев, вице-президент «Сколково», исполнительный директор кластера информационных технологий Фонда, высоко отозвался о деятельности компании: «Проект 3D-идентификации получил поддержку в «Сколково», в том числе грант в размере 20 млн рублей. Система создается с использованием уникальных разработок команды в области биометрической идентификации, методов поиска и распознавания в видеоизображениях. Проект, прежде всего, направлен на обеспечение безопасности, в том числе стратегических объектов, таких, как метро, аэропорты и других. Уже сейчас мы видим высокий спрос на подобные решения как в России, так и за рубежом. Например, совместно с TAL Secure Systems началось продвижение интеллектуальных решений VOCORD на международный рынок: Индия, в ближайшее время – ближневосточные страны и государства Персидского залива. Считаю, что опыт команды "Вокорд" - прекрасный пример создания в России высокотехнологичного продукта, превосходящего зарубежные аналоги, который позволит повысить безопасность наших городов».

Алексей Кадейшвили. Фото: Sk.ru

Sk.ru не раз писал об успехах этой сколковской команды в коммерциализации научных разработок. Компьютерные системы справляются с распознаванием лиц лучше людей. Мы хорошо распознаем только знакомые лица - родственников, друзей соседей и т.д. Если человеку дать стопку из тысячи фотографий и попросить найти снимок, аналогичный тому, что хранится в базе, у него возникнут сложности. Конечно, специалисты делают это лучше нетренированных людей, но машина уже несколько лет обгоняют этих экспертов в случае с распознаванием лиц незнакомцев. Основная проблема распознавания лиц в публичных местах, в первую очередь, на транспортных узлах – невозможность заставить людей «сотрудничать» с системой. Пассажиры смеются, хмурятся, разговаривают, едят, не всегда смотрят прямо на камеру. Эти факторы сильно снижают достоверность работы традиционных систем распознавания лиц. В отличие от некоторых биометрических систем, которые требуют четкого позиционирования лица человека относительно камеры, VOCORD FaceControl работает в полностью некооперативном режиме. Это означает, что человеку не нужно занимать определенную позицию перед камерой – система выхватывает лицо из потока людей, которые вообще могут не знать, что находятся в зоне видеонаблюдения (например, в метро, на вокзалах, стадионах, кинотеатрах, магазинах и т.д. Системы распознавания лиц применимы и востребованы, например, в розничной торговле, где VOCORD FaceControl позволяет решить две больших группы задач, связанных с безопасностью (снижение потерь от воровства и помощь в расследовании инцидентов) и маркетингом (повышение уровня сервиса, определение целевой аудитории и оптимизация затрат на рекламу).

Алгоритм «Вокорда», который победил в конкурсе MegaFace, используются и в решениях, предлагаемых этой компанией рынку. «Именно этот алгоритм мы используем в наших коммерческих продуктах. Он не только стал лучше распознавать, но мы еще и существенно его ускорили (что никак не измеряется в MegaFace). Сейчас на одном стандартном сервере мы можем вычислять 1600 шаблонов в секунду, судя по всему, это еще не предел оптимизации», - отмечает Алексей Кадейшвили.