Машинное обучение, большое понимание

Как IC будет использовать достижения в области искусственного интеллекта?

Мелани Д.Г. Каплан

Древняя китайская игра Го имеет простые правила, но чрезвычайно сложна. Говорят, что с большой доской и небольшими ограничениями игра в гугол (в 10 в сотой степени) сложнее, чем шахматы. В Го больше возможных позиций, чем атомов во Вселенной.

Игра, в которой противники по очереди кладут на доску черные или белые камни, во многом основывается на интуиции. Игроки понимают, что ходы, сделанные в начале игры, могут повлиять на ход матча спустя десятки розыгрышей. Тонкости, закономерности и элегантность го пленяли игроков, ученых и математиков на протяжении тысячелетий.

По данным Google DeepMind, создавшей компьютерную программу AlphaGo, Go долгое время рассматривался как вершина, по которой можно сравнивать искусственный интеллект (ИИ). AlphaGo использует форму искусственного интеллекта, называемую глубокими нейронными сетями, чтобы имитировать опытных игроков и достигать 99,8% успеха по сравнению с другими программами, разработанными для игры в го. В октябре 2015 года AlphaGo стала первой компьютерной программой, победившей профессионального игрока в го, а в марте AlphaGo сразилась с чемпионом мира по го Ли Седолем, победив его в четырех матчах из пяти.

Руководители отрасли и ученые часто используют игры в качестве испытательного полигона для алгоритмов. В 1997 году суперкомпьютер IBM Deep Blue победил чемпиона мира по шахматам, а в 2011 году суперкомпьютер компании Watson обыграл двух чемпионов в Jeopardy. Два года назад алгоритмы DeepMind научились играть в десятки игр Atari.

Разведывательное сообщество (IC) обсуждало ИИ на протяжении десятилетий, и через несколько месяцев после успеха AlphaGo сообщество захлестнула волна удивления. Для многих человеческая интуиция, необходимая для успеха в Го, представляет собой переход ИИ на новый уровень.

Многие эксперты думали, что этого не произойдет еще 10 лет, — сказал Майкл Лайелли, технолог по исследованиям и разработкам в Национальном агентстве геопространственной разведки (NGA). Нам очень интересно, как [Google] правильно использовал глубокое обучение в сочетании с другими подходами для решения очень сложной проблемы.

Победа AlphaGo стала тревожным звонком для IC — машинное обучение не только развивается с головокружительной скоростью, но и требует изменений в давно сложившейся культуре.

Эксперты обсуждают точные определения ИИ, машинного обучения и глубокого обучения, а также их отношения друг к другу. В 1959 году Артур Сэмюэл определил машинное обучение как область исследования, которая дает компьютерам возможность учиться без явного программирования. Глубокое обучение обычно считается более углубленным подмножеством машинного обучения. Независимо от терминологии, эксперты соглашаются, что эти технологии обещают кардинальные изменения в решении проблем.

Терри Буш, начальник отдела интегрированного анализа и методологии Разведывательного управления Министерства обороны США (DIA), считает, что машинное обучение и автоматизация позволят его экспертам быть именно экспертами, а не менеджерами данных. По словам Буша, поиск новых способов сбора данных принесет пользу специалистам и даст важные результаты. Но он также знает о проблемах.

Мы примерно в третьем классе, — сказал Буш о возможностях машинного обучения DIA в апреле на втором «Форуме аналитики данных USGIF в Херндоне, штат Вирджиния. — И нам нужно поскорее поступить в аспирантуру».

Большое понимание

Не так давно словосочетание «большие данные» вызвало оглушительный ажиотаж в IC. Теперь акцент сместился — тонким, но глубоким образом — со сбора информации на расширение ее возможностей. Как мы можем извлечь смысл из больших данных? Как мы можем использовать большие данные для изменения результатов? Сегодня в моде «большое понимание», для которого необходимы интеллектуальные машины.

Называем ли мы это искусственным интеллектом или машинным обучением, это разные методологии, которые пытаются воспроизвести мыслительный процесс человека, — пояснила доктор Коллин Келли МакКью, специалист по данным из CACI и автор Data Mining. и прогнозный анализ»: сбор разведывательных данных и анализ преступлений. Мы используем их, чтобы подтвердить то, что мы знаем или думаем, что знаем, и обнаружить новые закономерности, отношения и объекты.

МакКью сказал, что ИИ особенно полезен для достижения двух целей: выполнения задач, которые люди не могут выполнить (например, обработки огромных объемов информации); и выполнение задач, которые люди не должны выполнять (например, тех, которые часто повторяются).

«Независимо от того, пытаетесь ли вы оптимизировать продажи в своем магазине или выяснить, куда пойдет злодей, попытка обработать такой объем данных — не лучшая трата человеческого времени», — сказал МакКью.

Президент Esri Джек Дэнджермонд сказал, что машинное обучение — это поиск иголки в стоге сена. Особенно ему нравится фраза сжечь стог сена. Возможности Esri теперь позволяют пользователям находить пресловутую иголку в стоге сена за минуты, а не недели — будь то обнаружение несоответствий, распознавание закономерностей или выявление мошенничества. Ключевым моментом является интеграция больших данных и искусственного интеллекта в платформу ГИС, которая позволяет пользователю обнаруживать связи между людьми и местами, изменения в изображениях или взаимодействия между людьми, событиями и местами.

«В разведывательном пространстве это может означать обнаружение плохих парней на основе аномалий их пространственных данных, обнаруженных в результате миллиардов человеческих наблюдений», — сказал Данджермонд. «Мы не столько заинтересованы в больших данных и интеллектуальных вычислениях, сколько в создании большого понимания и возможности использовать это понимание и понимание в реальных рабочих процессах или вплоть до тактических операций, которые люди принимают решения».

Автоматизируя некоторые утомительные задачи, обычно выполняемые людьми, такие как ручное сканирование изображения, ИИ дает нам свободу мыслить творчески, что является «одним из лучших качеств человеческого мозга», — отметил Лайелли из NGA. Многие в IC говорят, что машинное обучение — это, по крайней мере, мультипликатор рабочей силы — мощный инструмент для поиска наиболее ценных битов среди огромных объемов данных.

Но чтобы создать по-настоящему интеллектуальные машины, сказал Лайелли, компьютер должен уметь соединять эти биты данных, критически мыслить и в результате проводить целостный анализ.

Глубокое обучение

Конкурс крупномасштабного визуального распознавания ImageNet начался в 2010 году и с тех пор стал эталоном для крупномасштабного распознавания объектов. Конкуренты в промышленности и научных кругах обучают свои алгоритмы, используя более одного миллиона помеченных изображений в более чем 1000 категорий. Во время конкурса перед их программным обеспечением стоит задача давать имена немаркированным изображениям, и в 2012 году событие достигло важной вехи: впервые команда-победитель использовала глубокое обучение для повышения точности.

В общих чертах основанное на нейронной сети мозга — но не столь сложное — глубокое обучение питается большими данными. Поскольку он разработан, чтобы работать как мозг, машине с поддержкой глубокого обучения не нужно понимать (или быть явно запрограммированной) правила вселенной для каждого возможного сценария. Скорее, его алгоритм учится. По сути, разработчики учат и направляют алгоритм. Например: «Это кошка; иди опознай других кошек».

Машины, которые учатся на собственном опыте, теперь решают интуитивные задачи, такие как распознавание речи, лиц и предпочтений. Глубокое обучение, считающееся отраслью машинного обучения, уже бесчисленным образом затрагивает человеческие жизни: DeepMind помогает врачам выявлять случаи острой почечной недостаточности; Netflix рекомендует фильмы для просмотра; CaptionBot от Microsoft описывает фотографии; Спам-фильтр Google использует искусственную нейронную сеть для перехвата 99,9% нежелательных писем; Facebook DeepFace распознает ваших друзей; Google и Chrysler строят беспилотные минивэны, способные распознавать пешеходов; а Alexa от Amazon отслеживает ваш список покупок. Некоторые говорят, что вскоре машина будет просматривать входящие сообщения, отфильтровывать шум и показывать нам только те электронные письма, которые требуют нашего внимания.

Вы обучаете машину, как новорожденного, — объяснил доктор Деннис Беллафиоре, преподающий на факультете географии в Университете штата Пенсильвания и изучающий машинное обучение. Но как только вы это сделаете, мальчик, они быстры. И [машина] выйдет за рамки повторяющихся задач. Он начнет рассматривать различные сценарии, возможности и вещи, которые могут быть связаны с географической и временной точки зрения.

Эндрю Дженкинс, главный специалист по данным в DigitalGlobe, сказал, что, возможно, одной из самых важных задач, решаемых машинным обучением, является извлечение признаков, которое традиционно полагалось на человеческий опыт.

«То, что обеспечивает глубокое обучение, — это неконтролируемый процесс, который позволяет алгоритму учиться и извлекать лучшие функции, исключая человека из цикла», — сказал Дженкинс. «Если вы хотите, чтобы машина научилась распознавать автомобиль, например, на картинке, вы должны дать ей множество образцов автомобиля, и алгоритм улавливает такие особенности, как четкие края, цвет и формы. Затем он мог увидеть изображение другого автомобиля и сказать: «У меня 95-процентная уверенность, что это машина».

Лаелли сказал, что исторически визуальное распознавание было сложной проблемой для машин. «[Достижение этого] вывело компьютеры на уровень, возможно, не уступающий людям в выполнении определенных визуальных задач».

Он добавил, что глубокое обучение значительно повысило способность машин учиться на больших объемах данных. Глубокое обучение — это не просто шумиха, подчеркнул Лаелли. Академия, правительство и промышленность следят за тем, как другие секторы применяют эту технологию, и некоторые описывают усилия по привлечению экспертов по глубокому обучению как виртуальную гонку вооружений. NGA, например, обращает внимание на исследования, проводимые такими компаниями, как Uber, Facebook, Apple и Google. Банковский и финансовый секторы вкладывают значительные средства в эту область. Достижения в области неврологии продолжают помогать людям понимать, как работает мозг и как мы учимся, что, в свою очередь, помогает специалистам по данным разрабатывать более интеллектуальные компьютерные программы.

Сара Баттерсби, старший научный сотрудник Tableau Software, сказала, что глубокое обучение особенно полезно для IC: Было бы невозможно иметь достаточно обученных аналитиков и время для оценки всех доступных данных датчиков, — сказала она.

Однако хорошо обученная система машинного обучения может просеять данные, а затем аналитики-люди смогут оценить меньший набор более релевантных данных.

Но эти методы хороши ровно настолько, насколько хороши ваши данные и методы обучения, добавил Баттерсби. «Никогда не следует внедрять систему машинного обучения для предоставления «ответа» без оценки потенциальных проблем с качеством результата», — сказала она.

Потенциальные приложения GEOINT для глубокого обучения включают управление реагированием на кризисные ситуации, эксплуатацию беспилотных транспортных средств, управление воздушным движением и управление производственными процессами. Алгоритмы глубокого обучения могут следить за событиями, которые происходят в разное время и в разных местах, искать объекты в огромных географических районах или находить слова в обширных репозиториях социальных сетей. Например, используя спутниковые снимки, аналитику погоды и человеческую деятельность, глубокое обучение может помочь предсказать голод и засуху, которые могут привести к восстаниям, или принять обоснованные решения о лучшем месте для посадки вертолета. Машина помогает людям понимать, рассуждать и учиться; и чем больше он работает, тем умнее становится.

Машины в нашей команде

Важным компонентом машинного обучения является предоставление машинам достаточной обратной связи, чтобы они знали, когда они правы или нет. Хотя эксперты согласны с тем, что люди должны оставаться в курсе событий, найти золотую середину баланса между человеком и компьютером в лучшем случае непросто. Опасения по поводу полной замены людей машинами могут быть необоснованными. Тем не менее, эксперты во многих областях ИИ все еще говорят о потенциальной опасности интеллектуальных компьютеров и выражают озабоченность по поводу технологической сингулярности — когда компьютерный интеллект превосходит человеческий мозг с ужасными последствиями.

Самая большая проблема 21-го века, как для отдельных лиц, так и для организаций, заключается в том, чтобы определить, как достичь правильного баланса между людьми и автоматизацией для оптимизации результатов, — сказал Ричард Бойд, генеральный директор SZL, которая предлагает систему когнитивного машинного обучения. то же имя.

В качестве примера такого баланса Бойд описал сканирующую машину, которая на 85 процентов уверена в своей оценке. Человек следует за ним, исправляет ответы, а машина учится. Те, кто внедряет ИИ, смотрят на машины как на неотъемлемого члена команды и видят цель как синергию между машинной обработкой и человеческим вниманием и заботой.

«Пытаетесь ли вы выполнять расчеты для космических миссий или работаете над геномом человека, машины хороши для чего-то, а люди — для чего-то», — сказал Бойд. «Сочетание их совместной работы — это мощный способ получить неструктурированные данные — и отделить зерна от плевел — от болтовни в социальных сетях до спутниковых изображений».

Хотя машины иногда могут уловить незаметные для человека тонкости, Патрик Билтген, технический директор по аналитике Vencore, подчеркивает, что машины не понимают нюансов. Это сразу становится ясно, когда вы загружаете немного неоднозначные фотографии в CaptionBot от Microsoft. Классический пример: компьютер видит изображение кота — возможно, в необычной позе — и говорит: Я не совсем уверен, но я думаю, что это кот, тогда как трехлетний человек узнает однозначно. , что это кошка.

Компьютеры также с трудом понимают обман и сарказм, что может привести к ложным тревогам.

«Если вы научите компьютер распознавать, как выглядит вторжение, он может быть сбит с толку фальшивым вторжением», — сказал Билтген. «С ИИ есть надежда, но путь очень разочаровывает, особенно с GEOINT».

Он привел пример бортового датчика движения, который сбивал с толку движение деревьев при сильном ветре. Это создало предупреждение о том, что в городе было 50 000 «движущихся» — и только человек понял, что этот сценарий неправдоподобен в городе с населением менее 50 000 человек.

«Итак, вы возвращаетесь и настраиваете алгоритм», — сказал Билтген. «[Часто] довольно очевидная ложная тревога, которую человек должен был бы исправить».

Возможности для ошибки безграничны: компьютер может сообщить, что большое количество транспортных средств нехарактерно для него появилось в месте, где раньше он не видел автомобилей. Чего машина не знает — пока ее не обучит человек — так это того, что сегодня первое воскресенье футбольного сезона, и машины собираются на парковке стадиона.

«Это пример проблемы «нормальности», — сказал Билтген. «Это нормально — пустая парковка или футбольный сезон каждую осень — это нормально?»

В другом широко цитируемом примере системы видеосъемки могут быть откалиброваны для обнаружения праздношатания и разворотов, исходя из предположения, что любой, кто слоняется без дела или развороты, не замышляет ничего хорошего. Но как насчет праздношатающихся такси? Или почтовые грузовики, которые часто разворачиваются? Системы машинного обучения требуют обширной настройки для устранения ложных срабатываний.

Компьютеры также испытывают затруднения, когда дело доходит до суждений — вот почему БПЛА Predator не решают, куда стрелять, а роботы не выступают в роли присяжных. Машина может обнаружить, что в сирийском городе есть новые укрепления, или определить, что взлетно-посадочная полоса увеличилась вдвое, но она не может сказать нам, было ли это построено друзьями или врагами. Машина — по крайней мере, пока — не может различить, лжет ли противник.

Гейб Чанг, федеральный технический директор IBM, написал статью о глубоком обучении для Отчета о состоянии GEOINT USGIF за 2016 год. Чанг сказал, что спецслужбам еще предстоит пройти долгий путь, прежде чем они смогут воспользоваться преимуществами машинного обучения для аналитиков и военных.

«Нам нужно найти более быстрый способ перехода от инновационного к повседневному», — сказал Чанг. Он добавил, что лица, принимающие решения, традиционно избегающие риска, должны быть «более склонны в этом когнитивном мире совершать ошибки и учиться на них».

Проблемы реализации значительны. В то время как академические круги ищут способы использования нетехническими людьми инструментов обработки данных на рабочем месте, лидеры отрасли пытаются внедрить ИИ в рабочий процесс таким образом, чтобы это было бесшовно, актуально и действенно.

«Если вы представляете что-то слишком сложное или несвоевременное, это аналитическая версия дерева, падающего в лесу», — сказал МакКью. «Конечный пользователь должен иметь возможность понимать вывод, а вы должны иметь возможность анализировать данные в движении. Вы не можете сказать: «Просто приостановите расследование на три дня, пока я работаю над этими алгоритмами».

Она добавила, что из-за давно укоренившейся среди аналитиков культуры «узнаю, когда увижу» важно постепенно внедрять ИИ.

«Некоторые модели настолько сложны, что вам нужно просто посмотреть на показатели и сказать, что они работают», — сказал МакКью. «Это не то, что аналитики сразу устраивают. Вы можете завоевать доверие аналитика, включив немного машинного обучения, а затем нарастив некоторые из более ресурсоемких вычислительных возможностей».

На апрельском форуме USGIF по аналитике данных Скип Маккормик, специалист по данным из ЦРУ, сказал, что даже самые лучшие алгоритмы не имеют шансов без достоверной информации, с которой можно сравнивать.

«Если у вас нет какой-либо достоверной информации, с которой можно сравнить ваш прогноз, вы не сможете узнать, хорош ли ваш алгоритм, и не сможете убедить аналитика обратить на него внимание», — сказал Маккормик.

Несмотря на культурные и логистические проблемы, МакКью сказал, что глубокое обучение в пространстве GEOINT является важным следующим шагом для IC, и время пришло.

«Огромный контент, высокопроизводительные вычисления и алгоритмы объединились. Время прекрасное», — сказала она. «Это меняет правила игры».

Чтобы узнать больше о trajectory, посетите наш веб-сайт и следите за нами в Twitter и Facebook.