Невероятная интуиция глубокого обучения для прогнозирования поведения человека

Одно из самых многообещающих приложений Deep Learning (DL) - это его использование для улучшения взаимодействия с компьютерами. DL особенно подходит для этого, поскольку обладает интуитивными возможностями, аналогичными биологическому мозгу. Он может справиться с непредсказуемостью и нечеткостью природного мира.

Это, однако, означает, что улучшение взаимодействия ИИ с человеком потребует некоторого уровня способности ИИ предсказывать поведение человека. Это необходимая возможность и достаточно интересная, что недавно были проведены некоторые исследования по этой теме.

Традиционный подход, основанный на поведенческих моделях, заключается в том, что социологи создают аналитические модели (в большинстве случаев статистические модели) человеческого поведения и используют упражнение по подгонке распределения для проверки достоверности модели. Однако подход DL отличается, поскольку априорная модель не требуется для начала. Предпочтительно, чтобы система DL училась предсказывать, наблюдая за поведением участников-людей. Мы можем получить представление об этой новаторской технике, изучив некоторые недавние исследования, в которых используется этот подход.

Массачусетский технологический институт обучил систему Predictive Vision на видеороликах YouTube из таких шоу, как Офис и Отчаянные домохозяйки, чтобы предсказать, будут ли два человека обниматься, целоваться, пожимать руки или шлепать пятерых. Обученная система Deep Learning на 600 часах видео. Система была способна предсказать действие в 43% случаев. Это сравнимо с предыдущими алгоритмами, которые могли предсказывать только 36 процентов времени.

Одно из практических применений предсказания человеческого поведения - это делать это в ограниченном пространстве автомобиля. Brains4Cars использует систему глубокого обучения слияния датчиков, основанную на LSTM, чтобы предвидеть поведение водителя за 3,5 секунды до того, как оно произойдет. Он использует набор датчиков, таких как камеры, тактильные датчики и носимые устройства, чтобы делать свои прогнозы:

В недавней статье NIPS 2016 используется Глубокое обучение для прогнозирования стратегического поведения. В большинстве систем предполагается, что участники действовали совершенно рационально и основывались на выводах когнитивной психологии и экспериментальной экономики. Однако в этой системе, основанной на глубоком обучении, система изучает когнитивную модель без необходимости в экспертных знаниях. Эта система может превзойти систему, основанную на умело сконструированных функциях:

Помимо прогнозирования, системы глубокого обучения использовались для помощи в контексте переговоров между людьми. В статье Обучение с подкреплением политик ведения диалога по нескольким вопросам авторы использовали обучение с подкреплением и политику, составленную вручную, и оценили их, заставляя каждого вести переговоры друг с другом в разных условиях. Что было обнаружено, так это то, что модель RL неизменно превосходила модель, основанную на расписании, созданном вручную. Меня также попросили людей оценить обе системы, и в результате подход, основанный на RL, был оценен как более рациональный.

Наконец, в результате впечатляющего инженерно-технического процесса команда из Чехии и Канады создала систему игры в покер, в которой участвовали 33 профессиональных игрока в покер из 17 стран, и показатель выигрыша был на порядок выше, чем у хорошего игрока. Команда придумала свое творение DeepStack:

DeepStack использует принципиально иной подход. Он продолжает использовать рекурсивные рассуждения CFR для обработки асимметрии информации. Однако он не вычисляет и не сохраняет полную стратегию до начала игры и поэтому не нуждается в явной абстракции. Вместо этого он рассматривает каждую конкретную ситуацию по мере ее возникновения во время игры, но не изолированно. Это позволяет избежать рассуждений обо всем оставшейся части игры, заменяя вычисление за пределами определенной глубины быстрой приближенной оценкой. Эту оценку можно рассматривать как интуицию DeepStack: внутреннее ощущение ценности владения любыми возможными частными картами в любой возможной покерной ситуации. Наконец, интуицию DeepStack, как и человеческую интуицию, необходимо тренировать. Мы тренируем его с помощью глубокого обучения, используя примеры, созданные из случайных покерных ситуаций. Мы показываем, что DeepStack теоретически надежен, дает значительно меньше возможностей для использования, чем методы, основанные на абстракции, и является первой программой, которая побеждает профессиональных игроков в покер на HUNL со средним показателем выигрыша более 450 МБ / г.

Алгоритм DeepStack состоит из трех компонентов: надежного вычисления локальной стратегии для текущего общедоступного состояния, упреждающего просмотра с ограничением глубины с использованием функции изученного значения для произвольных покерных ситуаций и ограниченного набора предварительных действий.

Дополнительный комментарий к DeepStack в Technology Review:

Исследователи сравнивают технику приближения DeepStack с инстинктом человека-игрока, когда оппонент блефует или держит выигрышную руку, хотя машина должна основывать свою оценку на моделях ставок оппонента, а не на языке его или ее тела. «Эту оценку можно рассматривать как интуицию DeepStack», - пишут они. «Инстинктивное ощущение ценности владения любыми возможными частными картами в любой возможной покерной ситуации».

В этом контексте DeepStack не только может выполнять точные прогнозы поведения своих противников, но и делает это таким образом, что его собственное поведение непредсказуемо!

Подводя итог, можно сказать, что глубокое обучение может предсказывать неявное поведение людей, а также рациональное поведение. Способность предугадывать поведение, предсказывать поведение или побеждать в играх с блефом - чрезвычайно полезные инструменты, которые нужно иметь в своем деловом арсенале. Однако, если вы все еще не уверены, что глубокое обучение может предсказывать поведение человека, тогда вам может быть интересно, почему у Facebook есть вакансия в этом виде работы: Загадочный список вакансий в Facebook звучит так, как будто он работает над тем, как читать ваши мысли ».

Невероятная интуиция глубокого обучения для прогнозирования поведения человека

Вопросы по теме