Анализи

Какво е лицево разпознаване? Изкуствен интелект за Биг брадър

Иван Гайдаров

Лицевото разпознаване става все по-точно, но някои системи показват расистки предпочитания, а някои начини на употреба на технологията са доста противоречиви

Може ли Биг брадър да идентифицира лицето ви от уличните камери за видеонаблюдение и да каже дали сте щастливи, тъжни или ядосани? Може ли това удостоверяване да доведе до ареста ви с неплатена съдебна гаранция? Какви са шансовете идентификацията да е неправилна и на практика да ви свърже с друг човек? Можете ли да победите видеонаблюдението изцяло с помощта на някакъв трик?

От друга страна, можете ли да влезете в трезор, защитен от камера и софтуер за идентификация на лица, като носите отпечатък на лицето на упълномощено лице? Ами ако сложите триизмерна маска на лицето на упълномощено лице?

Добре дошли в света на лицевото разпознаване, както и на измамите на лицевото разпознаване.

Тестове на доставчиците на технологии за лицево разпознаване
Националният институт на САЩ по стандарти и технологии NIST от 2000 г. насам осъществява тестове на алгоритмите за лицево разпознаване - Face Recognition Vendor Test (FRVT). Използваните бази данни с изображения са предимно снимки от правоохранителни органи, но също така включват случайни снимки като тези в Wikimedia, както и изображения с ниска разделителна способност от уеб камери.

Алгоритмите FRVT са най-често представени от доставчици на комерсиални технологии. Сравненията спрямо предходната година показват голямо подобрение на производителността и точността им; според доставчиците това се дължи преди всичко на използването на задълбочени мрежи (deep convolutional neural networks).

Свързаните с NIST тестови програми за разпознаване на лица са изследвали демографски ефекти, откриване на морфинг на лице, идентифициране на лица, публикувани в социалните медии, както и идентифициране на лица във видео. Предишна поредица от тестове са проведени през 90-те години на миналия век под различно име, а именно технология за разпознаване на лица (FERET).

Какво всъщност е лицево разпознаване?
Разпознаването на лица е метод за идентифициране на неизвестен човек или удостоверяване на самоличността на конкретен човек само чрез лицето му. Това е клон на компютърното зрение, но разпознаването на лица е специализирано и често е придружавано от "социален багаж" за някои приложения, както и някои уязвимости, които да се използват за измама на технологията.

Как работи лицевото разпознаване?
Ранните алгоритми за разпознаване на лица (които все още се използват днес в подобрена и по-автоматизирана форма) разчитат на биометрични данни (като например разстоянието между очите), за да превърнат измерените черти на лицето от двумерно изображение в набор от числа (функция вектор или шаблон), описващ лицето. След това процесът на разпознаване сравнява тези вектори с база данни с известни лица, които са съпоставени с характеристики по същия начин. Едно усложнение на този процес е настройването на лицата към нормализиран изглед, за да се отчетат въртенето и накланянето на главата, преди да се извлекат показателите. Този клас алгоритми се нарича геометричен.

Друг подход за разпознаване на лица е да се нормализират и компресират двуизмерни изображения на лицето и да се сравнят с база данни с нормализирани по подобен начин и компресирани изображения. Този клас алгоритми се нарича фотометричен.

Триизмерното разпознаване на лица използва триизмерни сензори за заснемане на лицевото изображение или реконструира триизмерното изображение от три двумерни проследяващи камери, насочени под различни ъгли. 3-D разпознаването на лица може да бъде значително по-точно от 2-D разпознаването.
Анализът на текстурата на кожата създава карта на линиите, шарките и петната по лицето на човек чрез друг характерен вектор. Добавянето на анализ на текстурата на кожата към двумерното или триизмерното разпознаване на лица може да подобри точността на разпознаване с 20 до 25 процента, особено в случаите на близнаци или много силно приличащи си хора. Можете също така да комбинирате всички методи и да добавите мултиспектрални изображения (видима светлина плюс инфрачервена светлина) за постигане на още по-голяма точност.

Разпознаването на лица се подобрява всяка година след започването на разработките в тази област през 1964 г. Процентът на грешките намалява средно наполовина на всеки две години.

Приложения за лицево разпознаване
Приложенията за разпознаване на лица попадат най-често в три основни категории: сигурност, здравеопазване и маркетинг/продажба на дребно. Сигурността включва правоприлагането и този клас разпознаване на лица може да бъде толкова полезен, колкото по-бързо открие съвпадение на лицето на човека със снимката от паспорта му, като го прави по-точно от проверяващия служител. Същевременно може да е зловещ като в сценария за криминалния сериал "Под наблюдение" (Person of Interest), в който хората се проследяват чрез видеонаблюдение и се сравняват с бази данни със съпоставими снимки. Сигурността, която не е свързана с правоприлагане, включва често срещани приложения като отключване с лице за мобилни телефони и контрол на достъпа до лаборатории и трезори.

Здравните приложения за разпознаване на лица включват проверка на пациенти, откриване на емоции в реално време, проследяване на пациента в дадено медицинско заведение, оценка на нивата на болка при "невербални" пациенти, откриване на определени заболявания и състояния, идентифициране на персонала и сигурност на медицинското заведение. Приложенията за разпознаване на лица за целите на маркетинга и търговията на дребно включват идентифициране на членовете от програмите за лоялност, идентифициране и проследяване на известни крадци от магазини, както и разпознаване на хората и техните емоции за целенасочено предлагане на интересуващи ги продукти.

Противоречия, пристрастия и забрани при лицевото разпознаване
Да се каже, че някои от тези приложения са противоречиви, би било подценяване на ситуацията. Както обсъжда статия в "Ню Йорк таймс" от 2019 г., технологията за разпознаването на лица създава вихър от противоречия - от използването му за наблюдение на стадиона до расистки софтуер. Наблюдение на стадиона? Разпознаването на лица беше използвано на финала на бейзболния сезон (Super Bowl) през 2001 г. Тогава софтуерът идентифицира 19 души, за които се смята, че са обект на неплатени гаранции, но нито един не е арестуван (не заради липсата на опити за това).

Расистки софтуер? Има няколко проблема, като се започне със софтуера за проследяване на лица от 2009 г., който може да проследява белите, но не и чернокожите, и продължава с проучването на MIT от 2015 г., което показва, че софтуерът за разпознаване на лица по онова време работи много по-добре с бели мъжки лица, отколкото с женски и/или чернокожи лица.

Този вид проблеми доведоха до категорични забрани на софтуера за разпознаване на лица на определени места
или за конкретни цели. През 2019 г. Сан Франциско стана първият голям американски град, който забрани на полицията и на други правоприлагащи органи да използват софтуер за разпознаване на лица. Microsoft призова за федерални разпоредби в областта на лицевото разпознаване; а MIT показаха, че Amazon Rekogmination има повече проблеми с определянето на жените, отколкото с мъжете при изображения на лица, както и повече проблеми с черните женски лица, отколкото с белите.

През юни 2020 г. Microsoft обяви, че няма да продава и не е продала своя софтуер за разпознаване на лица на полицията. Amazon забрани на полицията да използва Rekogmination за една година, IBM изостави технологията си за разпознаване на лица. Цялостна забрана на разпознаването на лица обаче няма да е лесна, като се има предвид широкото му проникване в iPhone (чрез Face ID) и други устройства, софтуер и технологии.

Не всеки софтуер за разпознаване на лица страда от едни и същи пристрастия. Проучването на NIST през 2019 г. за демографски ефекти, последвано от работата на MIT, показа, че алгоритмичните демографски пристрастия варират значително сред разработчиците на софтуер за разпознаване на лица. Да, има демографски ефекти върху степента на фалшиво съвпадение и честотата на фалшиво несъвпадение на алгоритмите за идентификация на лица, но те могат да варират на порядък, а и с времето намаляват.

Хакване на лицевото разпознаване и техники срещу измами
Като се има предвид потенциалната заплаха за поверителността заради приложение за лицево разпознаване и желанието на мнозина да получат достъп до ценни ресурси, защитени чрез удостоверяване на лицето, се наблюдават много усилия за хакване или фалшифициране на технологията. Можете да представите отпечатана снимка на лице вместо живо лице или изображение на екран, или триизмерна отпечатана маска, за да измамите удостоверяването. За системата за видеонаблюдение можете да възпроизвеждате видеоклип. За да избегнете видеонаблюдението, можете да изпробвате тъканите и гримовете и/или инфрачервени излъчватели, за да заблудите софтуера и той да не разпознае лицето ви.

В резултат има усилия за разработване на техники за справяне с всички тези атаки. За да разкрият отпечатани изображения, доставчиците използват тест за жизненост, например изчакват обектът да премигне или извършват анализ на движението, използват инфрачервена светлина, за да различат живо лице от отпечатано изображение. Друг подход е да се направи анализ на микротекстурата, тъй като човешката кожа е оптически различна от отпечатъците и материалите за маски. Най-новите техники за борба с подправянето са базирани на дълбоки конволюционни невронни мрежи.

Този област се развива непрекъснато. Води се ожесточена война между нападателите и разработчиците на софтуер срещу подправяне, провеждат се и академични изследвания за ефективността на различните техники за атака и за защита.

Доставчици на технологии за лицево разпознаване
Според фондация "Електронни граници" MorphoTrust, поделение на Idemia (позната преди като OT-Morpho, или Safran), е един от най-големите доставчици на лицево разпознаване и други технологии за биометрична идентификация в САЩ. Компанията е разработила системи за щатските отдели за МПС, за федерални и щатски правоприлагащи агенции, служби за граничен контрол и летища, както и за министерства. Други познати доставчици са 3M, Cognitec, DataWorks Plus, Dynamic Imaging Systems, FaceFirst и NEC Global.

Тестът за лицево разпознаване на NIST дава списък с алгоритмите на много повече производители от целия свят. Има и редица алгоритми с отворен код, както няколко големи облачни услуги, които предлагат лицево разпознаване.

Amazon Rekognition е услуга за анализ на снимки и видео, която може да идентифицира обекти, хора, текстове, сцени и действия, включително анализ на лица и специални етикети. Приложният интерфейс Google Cloud Vision API е предварително обучена услуга за анализ на изображения, която може да засече обекти и лица, да прочете печатен и ръкописен текст, да създаде метаданни във вашия каталог със снимки. Google AutoML Vision ви позволява да обучите персонализирани шаблони на снимки.

Същевременно Azure Face API е лицево разпознаване, което възприема лица и атрибути в изображения, извършва идентификация на лица, което съответства на човек от вашето частно хранилище, което може да побере до 1 милион души, както и да извършва разпознаване на емоции. Face API може да работи в облака или в контейнери в периферията.

Набор от данни за лица за обучение на разпознаването
Има десетки набори от данни, които могат да бъдат свалени и използвани за обучение на алгоритъма за разпознаване. Не всички са еднакви. Те се различават по размер на изображението, по брой представени хора, брой изображения на даден човек, условия на снимките, осветление. Органите на реда също имат достъп до непублични набори от данни за лица като текущи снимки и изображения от шофьорските книжки.

Някои от по-големите бази данни за лица в САЩ са Labeled Faces in the Wild с приблизително 13 000 уникални снимки; FERET, използвана за първите NIST тестове; базата данни Mugshot , използвана за текущия тест NIST FRVT; базата данни от камери за наблюдение SCFace, достъпна и с лицеви маркери; и Labeled Wikipedia Faces с около 1500 уникални самоличности. Някои от тези бази данни съдържат множество изображения на даден човек. Изследователят Итън Майерс предлага някои убедителни съвети за избора на набор от данни за лице с конкретна цел.

В обобщение лицевото разпознаване се подобрява и доставчиците се учат да откриват повечето фалшификации, но някои приложения на технологията са противоречиви. Процентът на грешките при разпознаване на лица намалява наполовина на всеки две години според NIST. Доставчиците са подобрили техниките си срещу фалшифициране чрез включване на конволюционни невронни мрежи.

Междувременно има инициативи за забрана на използването на лицевото разпознаване при наблюдение, особено от полицията. Да се забрани изцяло разпознаването на лица обаче ще бъде трудно, като се има предвид широката му употреба.

X