Вы используете устаревшую версию браузера. Для оптимальной работы с MSN используйте поддерживаемую версию.

Директор Центра речевых технологий о перспективах биоидентификации в финансовой сфере

Логотип Деловой Петербург Деловой Петербург 05.06.2017 Игорь Чубаха
© Центр речевых технологий

Какова на сегодняшний день ситуация со сроками старта пилотного проекта? Ведь в начале года Минкомсвязи обещало запустить его чуть ли не с июня.

— Старт действительно должен произойти нынешним летом. Регуляторы и вендоры не настроены откладывать этот шаг. Тем не менее конкретная дата запуска пилота зависит от ожидаемых изменений "антиотмывочного" ФЗ–115. В существующем виде он удаленную идентификацию не допускает.

Технически все готово?

— Завершаются подготовительные работы. Прорабатывается общая архитектура процесса и механизмы внедрения на местах. Знаковых изменений в задуманную схему реализации пилота уже никто не ожидает.

Сначала было неясно, на каких параметрах остановятся регуляторы. Например, упоминались отпечатки пальцев и радужка глаза. Что выбрано в итоге?

— На данный момент действует решение, что верификация будет проводиться по так называемой бимодальной системе биометрии: лицо (селфи) плюс голос. Но в перспективе планируется расширять возможности платформы до мультимодальной.

На уровне регуляторов заявлялось, что пилот продлится до конца года и после этого удаленная идентификация станет возможна в любом российском банке. Но в пилоте будет участвовать лишь порядка 10 банков…

— С одним уточнением. Порядка десяти банков через филиальную сеть будут именно собирать биометрию для наполнения единой централизованной базы. Далее любой банк сможет открывать клиентам счета удаленно — пользуясь этой общей базой данных.

Планируется, что система будет работать совместно с Единой системой идентификации и аутентификации (ЕСИА). И за базовую часть отвечает "Ростелеком". А компании–вендоры поставляют биометрические программные компоненты.

Недавно завершившийся ваш пилотный проект по голосовой идентификации с ВТБ24 имеет похожие решения?

— ВТБ24 заявил о завершении пилотного проекта, заключающегося в узнавании клиента по голосу. То есть, когда вы звоните в контакт–центр, вместо того чтобы отвечать на много вопросов, вы просто представляетесь, и система вас узнает. Впрочем, такое решение уже не первый год работает в минском Райффайзенбанке. Для банка удобство заключается в экономии непродуктивного времени обслуживания — вместо 40 секунд, которые требуются на идентификацию личности "вручную", проверка происходит за 15–20 секунд.

Между тем сейчас мы совместно с ВТБ24 заканчиваем тестирование нескольких других инструментов. И в итоге получится система, объединяющая уже знакомую нам бимодальную биометрию плюс liveness detection (детекция живого пользователя). То есть проверку, не используется ли фотография или видеозапись.

Как это будет происходить?

— В целом все выглядит следующим образом: чтобы провести финансовую операцию через мобильное приложение, клиент смотрит в камеру устройства. Далее система предлагает прочитать с экрана случайную последовательность из четырех цифр. Каждый раз цифры и порядок меняются. Клиент надиктовывает цифры, а система синхронно проверяет совпадение лица и голоса со слепками, те ли цифры произнес клиент, а также синхронны ли движения губ со звучащей речью.

То есть ближайшее будущее биометрии за бимодальными системами?

— Привлекательность двух–трехмодальных систем заключается в том, что, когда есть два или более не коррелирующих признака, надежность системы увеличивается на порядки, а вероятность ошибки падает до сотых долей процента.

А если речь идет о планируемом мошенничестве?

— Внедрение мультимодальных систем делает, например, невозможным мошенничество с использованием видеозаписи, аудиозаписи или фотографии.

Далее — уже существующие техники позволяют синтезировать на небольшой выборке довольно качественные копии любого голоса. Но система биометрической идентификации, в отличие от человека, несовпадения выявит. Отслеживаются склейки и любые подозрительные трансформации.

По внешности и голосу, наверное, можно как делать оценку эмоционального состояния, так и определять общий психологический портрет. Отсюда вопрос: позволяет ли нынешний уровень биометрии использовать полученные данные, например, при определении добропорядочности и готовности возвращать долги потенциального заемщика кредита?

— Для оценки эмоционального состояния выделяются физические моменты, которые можно измерить: тонированность и скорость речи, основной тон, производные от основного тона… В сочетании с семантикой — тем, что человек говорит, — это позволяет выявить стрессовые состояния и всплески эмоций. И наши разработки по речевой аналитике уже активно используются для привлечения внимания к проблемным разговорам в тех же контакт–центрах РЖД, Газпромбанка и опять же ВТБ24.

В то же время среди всех направлений, которыми мы занимаемся, эмоции являются, наверное, самой неформализованной и наименее исследованной областью. В итоге их удается определить только в первом приближении. И до разработки технологии, позволяющей достоверно оценивать, например, дисциплинированность клиента, еще очень далеко.

То же самое относится и к лицу. Какие–то простые настроенческие формы определяются, но до фиксации нюансов еще очень далеко. Поэтому появление аудиовизуальных "детекторов лжи" пока не ожидается.

Какова ваша оценка — отстает ли Россия в данной сфере от ведущих мировых держав?

— Это одна из немногих областей в IT, да и вообще в сегменте современных технологий, где Россия является одним из лидеров. Достаточно сказать, что разработки нашей компании используются и в банках США.

Или, например, напомню недавнее заявление Microsoft, что они создали технологию, которая позволяет распознавать слова речи столь же хорошо и даже лучше, чем это делает человек. И один из методов, которые они при этом использовали, был нашей разработкой, на которую они честно сослались.

Ожидаете ли вы, что в перспективе известные голоса, например популярных певцов, будут копироваться в коммерческих целях? Допустим, кто–то для роста продаж решит поставить на автоответчик голос Агузаровой.

— Рано или поздно такая проблема возникнет. И тогда появятся юридические нормы, по которым при серьезном совпадении голосовых параметров нужно будет запрашивать разрешение на использование у собственника.

Деловой Петербург

Деловой Петербург
Деловой Петербург
image beaconimage beaconimage beacon