Кто-нибудь еще играет в Pictionary? Игра в угадайку, в которой кто-то из вашей команды рисует картинку, а вы должны угадать, что это такое. Я был хорошим игроком в Pictionary. Я думаю, что я лучше «угадывал», чем «рисовал». Я мог достаточно хорошо рисовать неодушевленные предметы, но если меня когда-нибудь просили нарисовать что-то более сложное, например, кошку или жирафа, все становилось уродливым. Кто-нибудь помнит ту старую серию «Симпсонов», где отец Миллхауса пытался нарисовать «достоинство»?

Google на этой неделе выпустила игру под названием Quick, Draw! где вам, рисовальщику, дается объект, который нужно нарисовать, а ИИ Google попытается угадать, что это такое. Вот что произошло, когда я попытался завести грузовик:

Да, я рисую как пятилетний. Кому интересно, можете поиграть в игру здесь.

Я мог бы нарисовать грузовик миллионом способов. Его можно было нарисовать под другим углом, с разным уровнем детализации и с разными пропорциями, так как я рисую его настольной мышью. Несмотря на эти вариации, технология Google смогла его распознать.

Почему я говорю об онлайн-игре Google Sketch?

Что ж, на этой неделе один из наших клиентов спросил меня о том, что аналитика данных может сделать для их бизнеса. Это онлайн-брокерская компания, и люди, с которыми я разговаривал, работали в отделе комплаенса. Одной из их основных обязанностей является оценка рисков клиентов.

Риск — это одна из тех областей, где прогностическая аналитика имеет большое значение, поскольку она очень субъективна и зависит от профессионального суждения. У отделов комплаенса обычно уже есть способы оценки клиентских рисков. Чаще всего риск определяется с использованием комбинации фильтров порогов и критериев. Например, если клиент работал на работе, которую наш клиент считал связанной с высоким риском, отдел нормативно-правового соответствия может захотеть пометить этого клиента как работу с высоким уровнем риска. Установка этих критериев и пороговых значений может быть довольно дорогостоящей и трудоемкой, потому что знающему профессионалу требуется время, чтобы обдумать все возможные сценарии, которые не складываются, а затем написать для них правило.

Например, если эта компания просматривает свою базу данных клиентов и видит, что учитель начальной школы вносит 5000 долларов каждую неделю, возможно, они сочтут это немного необычным. Возможно, они захотят, чтобы их система проверила этого человека. Но если вы начнете думать обо всех различных сценариях, которые можно было бы считать необычными, сложность и огромное количество правил, которые вам нужно написать, очень быстро станут очень запутанными.

Вернемся к моему дудлу грузовика. Как вы думаете, как Google распознал мой рисунок? Может быть, они наняли армию стажеров, чтобы они просмотрели словарь и запрограммировали сложные правила для каждого объекта? «Привет, Билли, добро пожаловать в Google, сегодня мы попросим тебя записать все мыслимые способы рисования грузовика. После этого мы собираемся пересадить вас на автомобили. Если хорошо сработаете, мы вас тоже на фургонах посадим».

Как вы понимаете, это не совсем так.

Если вы вернетесь и посмотрите на мой дудл с грузовиком, вы увидите, что на странице результатов написано: «Вы нарисовали это, и нейронная сеть это распознала».

Нейронная сеть — это метод, используемый для «обучения» результатов, если вы можете привести достаточно примеров. Скормите нейросети достаточным количеством рисунков грузовиков, и со временем она распознает, что это грузовик, а не автомобиль или черепаха.

Возвращаясь к риску, если мы сможем передать модели достаточно «рисунков» рискованных клиентов, со временем мы сможем получить очень точный прогноз того, какие новые клиенты считаются высокорисковыми. Следствием этого является то, что мы можем получить более точную оценку риска клиента, тем самым снизив риск для всей организации. Более того, мы также сможем сократить время, необходимое для тщательного изучения клиентов, отнесенных к категории высокого риска, которые изначально не должны были быть классифицированы таким образом.

Нам еще предстоит преодолеть препятствия, в том числе нормативные ограничения и прозрачность использования передовых алгоритмов. Однако по мере того, как использование этих технологий становится все более распространенным, я полагаю, что мы начнем видеть, как все больше и больше организаций используют эти методы в качестве своего предпочтительного подхода к оценке рисков.

Первоначально опубликовано на www.glassbeans.com 18 ноября 2016 г.