Вы выходите в прямой эфир у двери подъезда: старые камеры над домофонами в Москве теперь распознают лица в режиме онлайн. В эту же минуту полицейский получает Push-уведомление на смартфон, если в объектив попадает человек из розыска. Или просто нужный ему человек: в августе 2018-го через подобную систему в метро на станции «Спортивная» задержали политического активиста Михаила Акселя. Он ехал домой с концерта и не совершал преступлений — его просто кто-то внес в базу.

В московском метро зону face recognition (распознавания лиц) скоро расширят с юга красной ветки на всю подземку. Мэрия Москвы (второго города мира по числу камер) называет все это «пилотными проектами», то есть экспериментами. На самом деле эксперимент начался гораздо раньше: больше двух лет к этой сверхспособности — мгновенно найти человека по лицу среди сотни миллионов других незнакомцев — имели доступ обычные люди, благодаря уникальному сервису FindFace. Но этим летом разработчики внезапно закрыли проект. Теперь услугу продают только властям и крупному бизнесу.

The Village рассказывает полную историю революционной технологии, которую сначала подарили народу, а затем отняли у него, а также объясняет, почему русские алгоритмы лучшие в мире, где в городе вы уже попадаете в их поле зрения и кто получит доступ к «FindFace-2».

Текст

Дамир Нигматуллин

Иллюстрации

Иван Анненков


Оглавление


I

Что мы наделали


Некто набирает на клавиатуре заголовок: «ТРАВИМ ШКУР, КОТОРЫЕ СНИМАЛИСЬ В ПОРНО ИЛИ РАБОТАЛИ ПРОСТИТУТКАМИ» — так аноним запускает чудовищный флешмоб на форуме «Двач». Первый комментарий в теме появляется через 30 секунд, первое «разоблачение» — через три минуты. Рецепт одинаковый: девушек находили во «ВКонтакте» по лицам, через сайт FindFace.ru. Затем двачеры рассылали скриншоты из порнороликов их мужьям, родственникам, однокурсникам, коллегам и друзьям. Над ними издевались, вымогали деньги и заставляли увольняться с работы. «Приятно наблюдать, как тянка врет и вертится, аки уж на сковородке, — пишет один из авторов травли. — Для опытных троллей тут немало вкусной еды, хитрые евреи могут нажиться на шлюхах, а омежки могут отомстить шалавам». Чудовищный флешмоб продолжался два года. Постепенно двачеры подали идею рядовым маньякам: теперь просто случайных девушек стали фотографировать в общественных туалетах, чтобы затем шантажировать. Зло сработало как вирусная реклама: о сервисе FindFace, «распознающем лица», узнали массы.

Два года спустя, весной 2018-го, Мориц Ракужицкий сидит перед ноутбуком и наблюдает, как в чате Slack’a без остановки вспыхивают сообщения — расследовательская группа Bellingcat раскрывает военное преступление. Зимой к Морицу приходил юрист, американец, представляющий Украину в гаагском суде. Он предложил команде «сделать экспертизу» инцидента в Мариуполе. На обычный спальный район тогда упали ракеты «Град» — кто-то метил в блокпост украинской армии, но промахнулся. Погиб 31 человек, горело несколько кварталов.

Мориц спокойно рассказывает The Village, как с помощью того же самого сервиса Findface группа Bellingcat вычисляла конкретных российских офицеров, якобы отдававших приказ: «Среди них был человек по кличке „Воронеж“, в котором мы опознали подполковника Андрея Гращенко (имя изменено. — Прим. ред.). Его отправили на Украину всего на полгода, но незадолго до возвращения домой „Воронеж“ стал названивать своей девушке, соскучился. Мы знали оба номера, потому что украинские власти передали нам массив прослушки, но телефоны оказались «левыми», найти по ним ничего не получалось. Потом мы вбили номер девушки в один из мессенджеров, Viber, — и там вдруг всплыл профиль с аватаркой». Маленький юзерпик прогнали через FindFace — сервис узнал в нем пользовательницу «ВКонтакте» Тамару (имя изменено. — Прим. ред.). На снимках она позировала то с самим Гращенко, то с его машиной в разных городах. «Всего мы тогда вычислили восемь командированных на Украину русских военных, — продолжает Мориц, — в трех случаях только благодаря FindFace. Это будет первый раз, когда расследование Bellingcat станет вещдоком в Гааге (международный суд ООН уже принял материалы к рассмотрению. — Прим. ред.). Второе такое дело — про сбитый на Украине малазийский «Боинг» MH-17. Там мы нашли через распознавание лиц около 30 контрактников, которые делали селфи с ополченцами. Это массовый метод».

Второе такое дело — про сбитый на Украине малазийский «Боинг» MH17. Там мы нашли через распознавание лиц около 30 контрактников, которые делали селфи с ополченцами. Это массовый метод

Той же весной 2018-го в разработчика FindFace, российскую компанию Ntechlab, внезапно инвестировала государственная оборонная корпорация «Ростех» вместе с миллиардером Рубеном Варданяном. Вливание оказалось крупнейшим (даже Роман Абрамович и замдиректора Tele2 вкладывались скромнее). Только что FindFace отпраздновал 700 тысяч заходов в месяц — «народный» сервис стабильно окупался, а авторы хотели расширять его на «Одноклассники» и Twitter... Как вдруг в июне компания объявляет о закрытии публичного поисковика. Паникующие фанаты даже организовали сбор подписей против, а спекулянты с еще работающими (платными) аккаунтами перепродавали услугу поиска человека по фото за несколько сотен рублей.

Технология FindFace очень понравилась мэрии Москвы. Алгоритм NtechLab подключили к 120 тысячам тех самых подъездных камер, которые мы привыкли считать бесполезными (на самом деле сейчас распознавание лиц активно работает только на части из них), а еще успешно продается торговым центрам и супермаркетам (для таргетированной рекламы), казино и банкам (для безопасности). Все они ищут по своим собственным базам. «Если кто-то захочет, он, конечно, может купить нашу лицензию на алгоритм, проиндексировать базу «ВКонтакте» и запустить клон FindFace. Но его пришлось бы постоянно дорабатывать, оптимизировать и обновлять», — говорит Артем Кухаренко, создатель. Он уточняет, что пока никто из клиентов не просил настроить поиск по соцсетям. Но полиция через его систему распознавания лиц уже задержала 180 человек во время чемпионата мира по футболу: 15 из них были в базе федерального розыска, остальные просто «жулики, карманники и нежелательные болельщики».

Инженеры в этой магической отрасли «компьютерного зрения» обещают скоро избавить аэропорты и вокзалы от паспортного контроля, сделать город абсолютно прозрачным. Но прямо сейчас распознавание лиц — «люксовый» товар, которым торгует узкий круг изобретателей. Обычные люди доступ к нему потеряли — никто не делает второй FindFace. Мориц Ракужицкий из Bellingcat собирается это исправить, частично: «Bellingcat намерен независимо пересоздать такой публичный поисковик, но в этот раз давать доступ только журналистам и правозащитникам, чтобы сервис не использовали для травли. Уже проводили тесты на бесплатных алгоритмах — они работают отлично. Теперь нужно время, чтобы их оттренировать, и деньги на аппаратуру. Мы ищем инвестора прямо сейчас».


II

Как устроен алгоритм: все,
что вы хотели спросить


Откуда вообще возник хайп вокруг технологий распознавания? Разве у спецслужб их раньше не было? Я видел в сериалах.

Сериалы врут. На самом деле мир перевернулся только пять лет назад, благодаря британцу Джеффри Хинтону. Он привез на айтишный конкурс  Imagenet в Стэнфорде свою программу анализа изображений. К лицам тогда это еще не имело отношения, задача конкурса была примитивнее: на 10 миллионах фотографий отличить стулья от кошек, мотоциклы от газонокосилок, бананы от слизней и так далее. Сможешь это — научишься различать и людей.

Конкуренты справлялись из рук вон: все известные алгоритмы ошибались минимум в четверти картинок. Никто не знал, что Хинтон уже запускал свою нейросеть на обычном домашнем компьютере с двумя новыми геймерскими видеокартами Nvidia. Они идеально подошли под задачу: множество мелких вычислений ложились на множество мелких процессоров в видеокарте — другим алгоритмам требовались для этого целые вычислительные шкафы. Хинтон выиграл конкурс с точностью алгоритма в 85 %. Это был резкий скачок, началась эпоха нейросетей и всеобщая истерия, технологию стали применять повсюду — от беспилотных автомобилей до фондовых бирж. Хинтона «схантили» в Google, а математика Яна Лекуна, описавшего сами «сверточные нейросети» 30 лет назад, забрали в Facebook — создавать искусственный интеллект.

Одна ошибка на миллион — к такой точности пришли современные нейросети для распознавания лиц. Это «студийные» условия, в уличных результаты могут падать — до одной ошибки на 100 тысяч. Все топовые компании в мире, торгующие этой технологией, встречаются в американском рейтинге NIST. В конкурсе есть несколько номинаций, «уличные» условия распознавания называются «wild» — «дикие». NtechLab (создатель FindFace) регулярно выигрывает именно здесь. В лидерах мирового рынка еще две российские компании — VisionLabs и «Вокорд». Именно русские алгоритмы последние несколько лет получают в NIST призовые места. Конкуренцию им составляют только китайцы.

Почему так происходит? Антон Мальцев занимается «машинным зрением» уже десять лет. Он считает, что ответ простой: «У нас страна шлагбаумов. На слежке все повернуты, и к тому же есть государственный заказ. Хотя все же не так сильно, как в некоторых китайских провинциях. В целом в мире распознавание лиц никому на хрен не сдалось в таких масштабах». Это правда: например, в Англии, попытки государства использовать face recognition на футбольных стадионах даже сталкиваются с протестами общества, а в Штатах такую же волну поднимают сами сотрудники IT-гигантов вроде Amazon и Google, которых заставляют разрабатывать такие алгоритмы по заказу властей.


Нейросеть

— это математический алгоритм принятия решений. Нейросеть может анализировать любые образы — фотографии, музыку, текст, — а затем делать оценочный выбор: например, стоит ли машине ехать на красный, или какой человек изображен на снимке.


Как именно нейросеть видит мое лицо?

Фотография — это прямоугольник с кучей пятен и линий. Сначала нейросеть выделяет из этого «информационного шума» лицо человека, а потом ищет разницу между «пятнами» на одном лице и «пятнами» на другом. В процессе некоторые пятна можно объединять, чтобы упростить картинку (такие нейросети называют «сверточными»). Находка в том, что нейросеть обучается сама, с нуля, методом проб и ошибок, как крыса в лабиринте, которая постоянно тыкается в стены. С каждым столкновением она чуть-чуть «подкручивает» свои настройки в случайную сторону, и «крыса» поворачивает по-другому, пока наконец не начнет уклоняться от стен или не научится выбирать нужные пятна на снимке (это называется «обратное распространение ошибки»). Еще лица можно распознавать 3D-сканером (как в айфоне), но для потока людей, например в метро, это не подходит, а уже существующие нейросети для фото или видео оказываются гораздо точнее.

Чтобы научиться узнавать лица, нейросети нужен альбом фотографий, где люди уже подписаны по именам. Затем инженер ставит рядом два снимка из базы и спрашивает у нее, один ли это человек (такой метод обучения называется Triplet Loss). Если алгоритм путает лица, происходит «столкновение крысы со стеной». Инженер «дрессирует» нейросеть в лаборатории, будто готовит жеребца к очередным скачкам, гоняя его по ипподрому.

Инженер Антон Мальцев рассказывает, что русские программисты полюбили базу аватарок пользователей «ВКонтакте» и начали тренировать свои нейросети на ней: «Так делало большинство лидирующих теперь компаний по распознаванию лиц. Это был самый простой способ за месяц достать базу из миллионов подписанных лиц для обучения. Раньше «ВКонтакте» с этим вообще не боролись (в отличие, например, от Facebook). Сейчас на рынке также активно выкачивают Instagram». Есть база — значит, есть, на чем тренировать свой алгоритм.


Тренировка нейросети

— обучение алгоритма на больших базах «правильных ответов». Делая ошибки на старых данных, нейросеть сама находит закономерности, чтобы уже с новыми данными делать правильный выбор.


Все еще не понял. Как компьютер за секунду сравнивает новый снимок с миллионом других?

Видели, как Shazam за пару секунд угадывает песню в шумном баре? Там точно такая же нейросеть, просто ее тренировали на музыке. И она не сравнивает сами звуковые дорожки, как и не прикладывает фотографии друг к другу на просвет. Нейросеть выделяет из пятен лицо, а затем выплевывает ряд цифр — бочонки в лотерее. Что это за цифры?

Представим, вы спускаетесь в метро, и камера сняла вас на эскалаторе в неудобном ракурсе — под этим углом неуверенная программа выдает бочонок № 8, хотя в базе вы уже были записаны как № 10. Нейросеть попала «где-то рядом», будто не разглядев пару букв в вашем имени. Она все равно не спутает вас с парнем на соседней ступеньке, потому что его лицо — это бочонок № 500, а в этой лотерее всегда побеждает именно ближайшее по величине число к сохраненному в памяти. Ваши «№ 8» ближе к «№ 10». Это не аналогия, так буквально и происходит: одно такое число-бочонок называется «признаком», или «фичей» (feature). Обычно нейросеть выплевывает ряд из 128 отдельных чисел-бочонков по одному портрету, чтобы точно описать именно ваше лицо. Такой ряд еще называют «фичамапа» (feature map), то есть карта признаков, потому что по ней вас можно даже нарисовать на чистом листе, будто в игре «соедини точки».


ФИЧА

— некий признак изображения, который нейросеть сама выбирает «важным» и отличительным, если сравнивает картинку с другими. Фича — это число, и оно не связано с «чертами лица», вроде размера носа или цвета глаз. Как правило, для лица одного человека достаточно ряда из 128 фич, чтобы нейросеть смогла узнавать его из миллиона других лиц.


Даже если в базе нейросети хранится миллион портретов, ей не нужно снова обрабатывать старые снимки — каждому человеку уже соответствует набор чисел. Достаточно получить фичи со свежего снимка камеры, послать их в базу, а затем найти ближайший ряд чисел из уже сохраненных наборов. Нестрашно, если цифры не будут совпадать абсолютно: на самом деле фичи — это векторные, то есть «растяжимые» величины, а их вычитание — математическая операция, которая называется расчетом «расстояния Хэмминга». Так работают вообще все сервисы поиска на нейросетях: и Shazam, и FindFace, и Google Images и многие другие. Сравнивается не сам контент, а только ряды чисел, присвоенные каждой отдельной картинке.

Значит фичи, которые выбирает нейросеть, — это параметры лица? Вроде цвета глаз и размера ушей?

Нет, и это очень важно понять. Ядро нейросети — это почти черный ящик. Программисты часто сами не знают, какие признаки и детали их нейросеть описывает фичами, то есть выбирает «важными» для себя. Через миллион попыток она сама находит эффективный путь сравнения «пятен». Итоговый, «выстраданный» алгоритм у каждой команды уникален. Его держат в тайне, шифруют и не раскрывают другим компаниям. При этом фичами для него могут оказываться родинки на вашем лбу, цвет отдельного пятна на снимке, длина носа или просто яркость пикселя в конкретной точке. «Сейчас любой может взять даже бесплатные нейросети, выложенные в общий доступ, например гугловские, обучить их за неделю и сделать свой проект, — продолжает инженер Мальцев. — Обучать нейросеть можно разными методами или тренировать ее на больших базах очень разных лиц. В этом плане база «ВКонтакте» была проблемная — там мало азиатов, афроамериканцев, арабов. Поэтому, например, все системы на рынке в России плохо различают девочек-китаянок».


Расстояние Хэмминга

— результат вычитания двух векторов. В случае с нейросетями векторы — это наборы фич, то есть ряды чисел, которыми описывается одно лицо. Алгоритмы распознавания вычитают фичи двух разных фотографий, чтобы найти между ними сходство. Чем меньше расстояние Хэмминга, тем больше вероятность, что на фотографиях один человек.



III

Кто на нем зарабатывает


Что за люди продают эту технологию в России?
Они связаны с властью? И почему все-таки закрыли FindFace?

Максим Перлин — мастер скандальной рекламы. Именно благодаря ему NtechLab получил центральное место на рынке. Перлин ожидал, что девушек начнут травить, когда придумывал FindFace: «Мы тоже пришли к порно, еще когда только разрабатывали сайт. Правда, думали, что выстрелит скорее поиск проституток». Перлин сам предложил Кухаренко сделать публичный поисковик: «Артем тогда честно ответил, что это какая-то хрень. Я сказал: „Давай я возьму твою технологию, сам сделаю демонстрационный сервис, а у тебя там будет доля“». В итоге с 2015 года NtechLab из шести программистов превратился в международную компанию, стал получать по пять предложений в день, а сам FindFace — десятки жалоб от пострадавших и даже несколько судебных исков. «Мне лично тоже угрожали, но это скорее забавляло, завораживало, все было по-рок-н-ролльному, — продолжает Перлин. — Я купался в идее о том, что FindFace стал феноменом, символом нового времени, технологией, которую резко открыли обществу и к которой общество вообще не было готово. Жалко ли мне было этих девушек? Жалко, реально. Это ужасно, унизительно, будет преследовать их всю жизнь. Считаю ли я, что в этом мы виноваты? Нет, не считаю».

Артем Кухаренко создает ядро, сам алгоритм, который продает NtechLab. Он настоящий ученый, инженер, даже дипломную работу в МФТИ уже писал по компьютерному зрению. Недавно, когда NtechLab доросла до стоимости в сотню миллионов долларов, Кухаренко отдал пост гендиректора — просто чтобы вернуться «в цех» и меньше заниматься бизнесом. Ему не интересна политика, но его партнерами почему-то часто оказываются люди, либо симпатизирующие Кремлю (тот же Перлин выступал на митинге сторонников Путина, в его кабинете в агентстве Blacklight висит благодарность от избирательного штаба, рядом с портретом Наполеона), либо буквально сотрудничающие с администраций президента (подробнее — в сноске). По его словам, первые инвесторы NtechLab — это «одна тусовка знакомых». Кухаренко считает, что ограничивать технологии бессмысленно, потому что они развиваются независимо от психологии общества: «Если у человека что-то не так с головой, то не важно, какие технологии давать ему в руки, он будет делать зло. Но я не могу придумать суперзлодеяние, которое можно сделать с помощью распознавания лиц. А вот позитивных вещей — куча».


Сооснователи NtechLab (FindFace), — Александр Кабаков, Анатолий Гусев и Олег Братишко. Выходцы из влиятельного пиар-агентства «Михайлов и партнеры» гендиректора ТАСС Сергея Михайлова. Ранее вместе с Алексеем Гореславским они основали фирму Agency One, выигравшую множество тендеров на пиар госкорпораций и президентских выборов. (Гореславский затем ушел в администрацию президента, «курировать интернет-проекты».) Александр Кабаков до недавнего времени — вице-президент Mail.ru Group, его кабинет там сотрудники компании в шутку называли «филиалом АП»: «Ролики, стикеры, группы во „ВКонтакте“ — Кабаков занимается всем, что касается Путина», — заявлял источник The Bell. Последний важный сооснователь NtechLab — Игорь Симонов. Политтехнолог, председатель совета директоров «Михайлов и партнеры». В 2017 году — общественный советник замглавы АП Сергея Кириенко.

Сейчас доли в кипрской компании N-tech.lab ltd сохранили первые четыре сооснователя (по 11,4 %) и сам Артем Кухаренко (16,2 %) — все они скрыты под офшорными юрлицами. Оставшиеся 12,5 % принадлежат дочерней фирме госкорпорации «Ростех» и еще 25 % — фонду миллиардера Рубена Варданяна вместе с его партнерами.


Два собеседника The Village на венчурном рынке заявили, что инвесторы Ntechlab могли потребовать закрыть публичный поисковик FindFace, испугавшись проблем с персональными данными и скандальности. Кухаренко опровергает опасения: компания никогда не хранила даже фотографий пользователей — только «поисковые индексы», а это ведь просто числа (наборы фич. — Прим. ред.) и под определение закона они не подходят. Кроме того, NtechLab отключается от системы клиента сразу после установки, так что к чужим базам лиц компания тоже не имеет доступа. При этом Кухаренко не отрицает, что у того, кто захочет вновь создать открытый сервис, могут возникнуть проблемы: «Риски с персональными данными все равно будут, с этическими вопросами и по взаимодействию с владельцами соцсетей. Если взвесить все за и против, то нам как разработчику алгоритма оказалось выгоднее продавать его другому бизнесу, у которого уже есть права на использование персональных данных своих клиентов». Источник The Village на венчурном рынке это подтверждает: «Есть, допустим, сочинское казино. Оно фотографирует всех на входе, создает базу фотографий, а затем прокатывает их через FindFace и тратит копейки (чтобы искать неограниченное количество раз, на FindFace нужно было купить платный тариф. — Прим. ред.). Как только FindFace исчезает, они вынуждены прийти к NtechLab и купить у них такую же услугу по контракту, скажем, за полмиллиона долларов в год».

Какие у NtechLab есть конкуренты в России?
Чем они отличаются? Где можно встретить их алгоритмы?

NtechLab не просто самый громкий игрок — у него люксовые цены: «Среди российских алгоритмов, вообще-то, можно найти и дешевле. Просто у Ntech всегда была очень агрессивная реклама», — заявляет собеседник The Village из IT-отрасли. Другие топовые компании сейчас можно встретить в пилотном проекте Московского метрополитена. На таких проектах компании не зарабатывают (они ставят системы за свой счет в надежде получить контракт позже. «Выгорает в итоге только один пилот из 50, о которых вы читаете в новостях», — убеждает источник на рынке). Детали держат в тайне, но издание CommNews в августе рассказало некоторые подробности. Распознавание лиц в метро тестируют с марта 2018 года, систему строят для того, чтобы ей пользовались силовые структуры.

Известно о шести фирмах, которые соревнуются между собой: NtechLab, VisionLabs, «Вокорд», «Центр речевых технологий», «Видеотэк» а также белорусский «Синезис». Сам проект уже признан успешным. Пока тестирование проходит только на юге красной ветки метро (потому что там была фан-зона чемпионата), а в оставшиеся два месяца 2018 года распознавание запустят еще на нескольких станциях (какой ветки — неизвестно). В следующем году метрополитен выберет из участников только одного поставщика, с которым, вероятно, заключат контракт на создание системы для всей подземки.

На самом деле, солидных проектов (а не бесплатных «пилотов на раз») у этих компаний не так и много: алгоритм NtechLab встречает вас в Москве (и еще в нескольких городах) у подъездов жилых домов, тестируется на полицейских машинах в Рязанской области и на неназванных стратегических объектах «Ростеха», а еще пользуется популярностью у частников в премиум-сегменте: отели и казино в Сочи, множество бутиков. Компания VisionLabs делает упор на алгоритмы для банков (например, «Почта-Банк»), а также проводит масштабные пилоты в супермаркетах «Пятерочка» и «Вкусвилл».

Ему не интересна политика, но его партнерами почему-то часто оказываются люди, либо симпатизирующие Кремлю, либо буквально сотрудничающие с администраций президента

Лидеры рынка:


Ntechlab

Самая молодая компания из списка (на рынке с 2015 года), но и самая технологичная. Разработчик культового приложения FindFace, фаворит и партнер мэрии Москвы, лидер международных рейтингов по классу распознавания «в диких условиях». Владельцы — выходцы из пиар-агентства «Михайлов и партнеры». Среди инвесторов — сам «Ростех», венчурные фонды Варданяна, Абрамовича и других.


«Вокорд»

«Ветеран» компьютерного зрения в России, на рынке с 1999 года, продавала распознавание лиц еще задолго до нейросетей. Подробнее — см. статью «Секрета фирмы». Судя по тендерам, до недавнего времени — фаворит государства в регионах, в том числе и по провальной госпрограмме «Безопасный город». Главный инвестор — управляющая компания «Лидер» пенсионного «Газфонда» (бенефициаром Forbes называл близкого к президенту миллиардера Юрия Ковальчука, а директором — Юрия Шамалова, предполагаемого брата зятя Путина). Источники The Village заявляют, что сейчас компания переживает «кадровый кризис».


VisionLabs

На рынке с 2012 года, делает фокус на решениях для банков, резидент «Сколково». В числе крупных инвесторов — АФК «Система» и Сбербанк. Также лидирует в международных рейтингах по точности распознавания. Среди крупнейших клиентов — «Почта-Банк». Подробнее — см. статью «Секрета фирмы».


«Видеотэк» — самая маленькая компания из перечисленных, однако их алгоритм распознавания лиц уже работает в аэропорту Домодедово. «Вокорд» собеседники The Village на рынке называют «темной лошадкой» — компания крупная, существует с 1999 года и давно получает госконтракты на системы видеонаблюдения (в десятках городов России, по госпрограмме «Безопасный город»), вот только, где конкретно они внедряют именно распознавание лиц, а не просто ставят камеры, — неизвестно. Кстати, именно их пилотному алгоритму «не повезло» фигурировать в истории с задержанием в метро политического активиста Михаила Акселя этим летом.

Цены на «подключение» системы распознавания лиц сильно зависят от того, где вы ходите ее подключать: насколько большой «на объекте» поток людей, как близко к ним можно поставить камеру и что, собственно, с лицами нужно делать — просто классифицировать и узнавать, искать по собственным базам, оценивать пол/возраст и другую социологию либо сразу рассылать какие-то уведомления. По сути, систему «под ключ» собирают для каждого клиента индивидуально. Прайс-листов на сайтах никто обычно не размещает, но технологию часто продают по принципу «лицензии пользователя». Она обходится минимум в 1 миллион рублей в год и достигает 100 миллионов при сложных и больших объектах (вроде крупных производств, сети супермаркетов или транспортном узле целиком).


IV

Как от него спрятаться


Можно ли специально обмануть алгоритм?

Можно, но удобного способа нет. Летом 2017 года Григорий Бакунов из «Яндекса» попробовал макияж: на лице нужно было нарисовать футуристичные черные полосы, которые меняли черты лица с точки зрения нейросети. Это сработало. «У вас на руках должен быть конкретный алгоритм, который вы хотите запутать, — объясняет Артем Кухаренко. — В том эксперименте он [Бакунов] выбрал один алгоритм (какой — неизвестно.  Прим. ред.) и обманывал только его. Если я параллельно запущу две нейросети, чуть-чуть отличающиеся, придется придумывать новый макияж, потому что вторая нейросеть будет выдавать другие фичи». Подробнее это свойство нейросетей мы разбирали в предыдущем разделе. Любопытно, что Бакунов так и не выложил в открытый доступ свой «антиалгоритм», а осенью 2017 года, когда The Village предложил ему повторить эксперимент, он отказался от участия и больше не возвращался к этой теме публично. То же самое в мире пытается делать, например, нью-йоркский дизайнер Адам Харви в своем проекте CV Dazzle еще с 2010 года (правда, он скорее художественный, чем научный). Для повседневного использования сейчас такой макияж все равно не подходит, он сам слишком привлекает внимание — сразу ясно, что вы что-то скрываете. Так, вероятно, будет рассуждать и полиция: «Обычному человеку нет смысла играть в эти игры, потому что, если его нет в базе розыска, ему нечего бояться», — рассуждает Кухаренко.

Очки не особо помогают (даже солнцезащитные ухудшают распознавание максимум на 30 %), как и усы, бороды, кепки и любые другие головные уборы. По старинке от алгоритмов вас скроет все, что и так закрывает лицо полностью — то есть маски или балаклавы. Тут уже не важно, как они выглядят, но художники все равно соревнуются: например, Стерлин Криспин делает маски будто бы «мятыми», потому что их генерирует похожий антиалгоритм, как у Бакунова, только в 3D. Другой художник, Лео Сельваджио, для тех же целей продает через интернет буквально свое лицо, напечатанное на 3D-принтере.

Читайте также

Как мы прятались от камер в маске против распознавания лиц

перейти

Я не хочу, чтобы меня вообще кто-то искал по лицу! Я могу попросить удалить меня из базы?

Какой базы? Они же у всех разные. «Удалить вас из базы федерального розыска мы точно не вправе, — рассуждает Кухаренко. — Если же мы говорим про идентификацию магазинных воров в супермаркетах, то в базе шоплифтеров по факту будут только те, кто был ранее замечен за этим службой безопасности магазина, а ваша фотография сразу удалится, как только камера не найдет совпадений. А если это просто база покупателей супермаркета для какой-нибудь «карты лояльности», то да, вы можете удалиться оттуда. У вас же есть возможность не пользоваться телефоном, чтобы ваш трафик нигде не сохранялся? Не общаться с друзьями, чтобы не оставлять переписку в соцсети? Просто скоро это станет для вас слишком неудобно, и вы решите не отказываться».

Точно известно только о базах полицейского розыска (они бывают федеральные, и местные — в субъектах федерации), а также о «базе пропавших людей», которые власти подключали к алгоритмам в Москве и еще нескольких регионах. Источник The Village на рынке заявляет, что базу паспортов и фотографий обычных людей тоже подключают — только тем клиентам, которые работают с Единой системой биометрических данных — сейчас это в основном банки. Все эти данные шифруются и хранятся в виде наборов «фич», или индексов, так что украсть их и использовать без разрешения было бы сложно. В остальные «базы» люди обычно вносят себя добровольно. Например, методично заполняют профили в соцсетях. Тот же NtechLab не сообщает, что стало с базой фотографий, проиндексированных из «ВКонтакте» за время работы Findface. Но сейчас проще скрыть свой профиль от новых попыток индексации, чем бороться с торговцами технологией.

«Вообще, наше общество привыкло, что мы живем в романе Оруэлла и большой брат хочет нам зла, — подытоживает Максим Перлин. — А большой брат, вообще-то, может иногда и что-то хорошее принести — например, таргетированную рекламу».