Укрощение утомительного, преодоление сложностей и просто улучшение нашей повседневной жизни: взгляд на глубокое обучение

Питер Хэнсон; Лиза Спурия; Тодд М. Бэкастов; Кордула А. Робинсон, доктор философии; Барри Тилтон; Роберт Олбриттон; Дэвид Фостер; и Даниэль Боннель

Эта статья была первоначально опубликована в отчете USGIF о состоянии и будущем GEOINT за 2017 год. Загрузите полный отчет здесь.

Со времен промышленной революции технологические достижения постоянно меняли отношения между человеком и машиной. Автоматизация процессов, экономия времени и повышение эффективности изменили утомительные повседневные задачи и значительно улучшили образ жизни людей. Благодаря значительным достижениям в области вычислений и доступу к огромному объему данных, следующим важным изменением станет эволюция глубокого обучения (ГО), подмножества машинного обучения (МО). Достижения в методах разработки алгоритмов и доступность доступного оборудования, в первую очередь графических процессоров (GPU), позволили DL продолжать совершенствоваться, масштабироваться и становиться все более полезными для различных дисциплин и сообществ, помимо нескольких избранных ученых. Ускоряя потребление, обработку и синтез когда-то невообразимых объемов и разнообразия данных, DL предлагает аналитикам объективное представление о мире и позволяет им проводить более полный и информированный анализ за долю времени. DL, как и большинство технологий, расширяет возможности, которые раньше считались недоступными.

Машины дополняют человеческий анализ

Начав с базовых задач, люди стали полагаться на огромные возможности машин. Прошла эпоха посещения банка для получения денег у кассира-человека, теперь мы считаем само собой разумеющимся, что банкоматы доступны в любое время и в любом месте. Хотя банкоматы сильно отличаются от DL, признание человеком способности машины дополнять человеческие задачи должно было где-то начинаться. Перенесемся на несколько десятилетий вперед, и мы окажемся во времена более умных машин, которые могут выполнять больше задач, даже тех, которые носят когнитивный характер.

Сложные машины перенесли нас в эпоху, когда возможности обработки и сортировки огромных объемов информации, вспоминания тысяч деталей и, что наиболее важно, оценки связей, закономерностей и выявления альтернатив при анализе данных значительно превзошли возможности человека. делать в одиночку. Эта новая эра DL дает возможность усилить и дополнить способность аналитиков принимать более обоснованные решения.

DL дает исследователям, аналитикам, ученым и даже потребителям множество преимуществ.

· Объективный аналитик. Хотя аналитики-люди всегда стремились к объективности в своих анализах, предоставление непредвзятой точки зрения продолжает вызывать трудности даже у лучших аналитиков. Люди могут видеть альтернативы или находить и рассматривать информацию, которая может опровергнуть их гипотезу. Но личные предубеждения часто лежат на заднем плане нашего сознания, тем самым затуманивая нашу способность видеть все объективно. Иногда в нашем анализе играют роль человеческие эмоции, которые трудно преодолеть; мы влюбляемся в собственные теории и ищем информацию, подтверждающую наше мышление, и отбрасываем информацию, которая может ему противоречить. Алгоритмы глубокого обучения предназначены для повышения объективности человека за счет автоматизации обнаружения и категоризации данных, беспристрастного выявления новых корреляций, новой информации и взвешенных альтернатив для рассмотрения. Аналитики принимают окончательное решение, но сила объективного аналитического партнера предлагает более точные результаты, более сбалансированную точку зрения и более строгое обоснование нашего собственного анализа.

· Распознавание образов: обучение машин распознаванию образов открывает совершенно новые возможности не только для «разгрузки» утомительных задач, но и для значительного улучшения способности находить новые связи и понимание данных, которые потребовали бы значительных усилий на часть человека. В то время как традиционные методы требовали, чтобы человек жестко программировал алгоритмы, тем самым распознавая только то, что человек уже знает, что нужно искать, DL адаптирует и совершенствует свои алгоритмы для распознавания шаблонов в данных и позволяет автоматически выявлять аномалии, возникающие тенденции, сдвиги в данных и связи в данных. ранее неизвестные данные. Эта способность ускоряет аналитические усилия в медицинских исследованиях, опережающей разведке, автоматическом распознавании целей и обработке изображений, финансовых рынках и многих других. Распознавание образов не заменяет взаимодействие человека с данными, но предоставляет ему ценную новую информацию потенциально быстрее, чем раньше.

· Альтернативы в данных. Способность машины быстро оценивать огромные объемы данных может помочь в процессе сортировки. В современной информационной среде аналитики сталкиваются с огромными объемами данных. Один из мифов о данных заключается в том, что все они новые и уникальные. Скорее, аналитики обнаруживают, что просеивают информацию, которая является дублирующей, противоречивой, ошибочной или лишь косвенно относящейся к интересующей теме. Этот процесс фильтрации является обременительным для человеческого мозга и препятствует способности различать новую и уникальную информацию. Незамеченная, действительно новая информация часто является ключом к предвидению новых и возникающих тенденций и событий. Аналитики часто обнаруживают при криминалистическом анализе данных после события недостающую часть информации, которая могла бы дать им более глубокое понимание. Ответ не всегда скрыт в данных, но чаще всего то, что кажется ошибочной информацией, на самом деле является критическим. С помощью алгоритмов глубокого обучения и возможностей машинного просмотра данных данные можно быстро сортировать, фильтровать и сводить к ключевым точкам. Те же самые алгоритмы могут также идентифицировать потенциально связанные точки данных, которые человек не распознал или не учел. Возможность быстрой обработки и оценки данных для поиска новых и уникальных закономерностей или аномалий, взвешивания и ранжирования альтернатив, а также расчета вероятности взаимосвязи делает глубокое обучение чрезвычайно ценным для аналитика.

· Работа в фоновом режиме. Машины могут работать как «тихие» помощники людей и могут быть точно настроены для работы «в фоновом режиме». Как только машина обучена понимать рассматриваемые вопросы, пробелы в знаниях и запрашиваемые данные, она может работать автоматически и при необходимости выдавать необходимую информацию. В некоторых сценариях это партнерство можно рассматривать не только как помощь, но и как упреждающий процесс, чтобы подсказывать людям новую информацию, предупреждать о событиях и при необходимости указывать на возникающие тенденции.

Продолжение этого перехода в более когнитивную область, в которой машины думают за нас, открывает бесчисленные возможности для расширенного анализа и решения проблем. Этот шаг следует приветствовать, однако люди по-прежнему скептически относятся к этому новому миру на многих уровнях. Часть их дискомфорта связана с технологией и уровнем ее зрелости. Другая часть носит более фундаментальный характер — некоторые чувствуют угрозу от этих новых возможностей и по-прежнему обеспокоены тем, что эта эволюция направлена ​​на замену человека. Как упоминалось ранее, банкомат позволил клиентам банка иметь свободный доступ к деньгам на их собственных условиях и графиках, высвободил сотрудников банка для решения более сложных вопросов клиентов и сэкономил деньги банкам, не нанимая столько кассиров. Но достижения в области глубокого обучения выходят далеко за рамки примера с банкоматами. Более глубокая аналитика, обеспечивающая преимущество при принятии решений, более разумные решения и спасающие жизни ответы, находится в пределах нашей досягаемости и уже применяется на практике.

Текущее использование глубокого обучения

Медицина

Идти в ногу с огромным потоком данных исследований рака молочной железы является сложной задачей для ученых. В 2016 году в Camelyon Grand Challenge группа из Медицинского центра Beth Israel Deaconess при Гарвардской медицинской школе использовала DL для выявления метастатического рака молочной железы. Конкурс направлен на определение того, как алгоритмы могут помочь патологам лучше идентифицировать рак на изображениях лимфатических узлов. Результаты подтвердили гипотезу гарвардской группы: анализ человека в сочетании с DL достиг 99,5% успеха, тем самым доказывая, что индивидуальная работа патологоанатома может быть улучшена в сочетании с системами искусственного интеллекта (ИИ), сигнализируя о важном прогрессе в практике выявления и лечения. рак.

Автоматизированное управление культурами

Blue River Technology разработала решение для глубокого обучения под названием LettuceBot, которое анализирует урожай с помощью трактора, фотографируя 5000 молодых растений в минуту и ​​используя алгоритмы и машинное зрение для идентификации каждого ростка как салата или сорняка. LettuceBot помогает фермерам бороться с конвергентными тенденциями: повышение устойчивости сорняков к гербицидам и отказ от доступных химических обработок. Технология LettuceBot может помочь фермерам сократить использование химикатов на 90 процентов. LettuceBot уже используется на полях, которые обеспечивают 10% поставок салата в США.

Географический объектный анализ изображений (GEOBIA)

DL сделало анализ изображений на основе географических объектов (GEOBIA) мощным инструментом в усилиях по обнаружению и подтверждению деятельности по добыче полезных ископаемых в конфликтных зонах в Демократической Республике Конго (ДРК). В то время как стандартное обнаружение изменений в данных дистанционного зондирования может идентифицировать потенциальные участки добычи, подтверждение деятельности, характеристик и вероятного назначения этих участков добычи трудно установить без дополнительных контекстных знаний. Разработка географических объектно-ориентированных моделей и анализ, которые обеспечивают эти дополнительные контекстуальные знания, являются трудоемкими без помощи автоматизированной итеративной классификации изображений и разделения изображений на объекты изображений. DL позволяет масштабировать подходы GEOBIA для более крупных географических областей исследования, более сложного объектно-ориентированного моделирования и более точной и сложной аналитики. В ДРК DL привела к целенаправленным военным действиям и целенаправленной гуманитарной помощи, направленной на борьбу с незаконной добычей полезных ископаемых и сокращение связанного с этим насилия.

Автоматизированное управление радиочастотным спектром

Ученые, инженеры и аналитики применяют DL для моделирования распространения акустических волн, гидролокационного анализа и различных сегментов радиочастотного (РЧ) спектра. Представьте себе поле боя, в котором войскам не нужно было бы беспокоиться об управлении использованием спектра. Автоматизированная система будет назначать радиочастоты, уменьшать помехи и предотвращать вторжение противника в сети связи США. DL может помочь избавиться от беспорядка во все более переполненном спектре боевых действий, изучая радио и схемы использования спектра дружественными войсками, силами противника и местными жителями. Модели глубокого обучения могут изучать эти шаблоны и принимать решения о распределении активов намного быстрее, чем люди. По мере того, как беспроводные технологии становятся все более распространенными в боевом пространстве, управление спектром частот и устранение конфликтов частот становится невозможным для людей. Модели DL и другие системы с искусственным интеллектом потребуются для расширения человеческих возможностей по управлению использованием спектра.

Краудсорсинг и глубокое обучение

Наборы данных для обучения и тестирования остаются ключевыми входными данными, необходимыми для глубокого обучения, поскольку, как и люди, эта форма ИИ учится на примерах и подкреплении. Обучающие наборы — это эталоны, к которым алгоритмы обращаются и учатся. Эти обучающие данные могут быть созданы с помощью человеческого ввода и курирования, а краудсорсинг — это один из методов, используемых для создания больших объемов обучающих данных.

За последние несколько лет краудсорсинг стал надежным средством для быстрого получения геопространственных данных, когда группы людей объединяются вокруг общей цели, например, для реагирования во время стихийных бедствий или после них. Картографические онлайн-платформы, такие как OpenStreetMap и Tomnod, предоставляют пользователям простые инструменты для идентификации и картографирования объектов на изображениях сверху. Такие картографические данные помогают работникам быстрее и полностью оценить ущерб и оказать помощь там, где она больше всего нужна. Наборы геопространственных данных из краудсорсинга также могут служить входными данными для обучения моделей глубокого обучения, предоставляя примеры слоев карты, таких как здания и дороги, которые можно извлекать автоматически. Использование DL для автоматизации идентификации и извлечения признаков улучшит скорость, масштаб и частоту создания таких геопространственных данных, что, в свою очередь, подпитывает дальнейшую аналитику.

Краудсорсинг также может быть частью итеративного процесса повышения производительности модели. Если точность таких моделей ниже определенного порога, дополнительные примеры краудсорсинговых данных могут быть возвращены в алгоритм для улучшения результатов посредством процесса активного обучения. По мере того как алгоритм DL обучается на большем количестве данных, точность обычно возрастает. Это также очевидно при увеличении количества проходов через данные. Прогнозы можно разделить на истинно отрицательные, ложноотрицательные, истинно положительные и ложноположительные истинные, где степень ложноотрицательных результатов требует дальнейшего уточнения.

Помимо использования в качестве средства для получения обучающих данных, DL, в свою очередь, может повысить эффективность краудсорсинга. Такие алгоритмы могут работать за кулисами, чтобы идентифицировать ключевых участников в толпе, выявлять закономерности в данных или анализе или сосредотачивать толпу на аналитических задачах, требующих участия человека для повышения производительности алгоритма путем целенаправленной настройки. Возможность использовать методы DL для улучшения краудсорсинга — это один из способов преодолеть проблемы контроля качества, присущие привлечению большого количества участников с разным опытом и опытом.

Краудсорсинг служит важным средством как для включения DL с обучающими данными, так и для улучшения алгоритмов производительности. ImageNet, один из крупнейших массивов помеченных обучающих данных для компьютерного зрения, использовал Amazon Mechanical Turk для маркировки миллионов фотографий. В геопространственной области аналогичные толпы используются для маркировки объектов на спутниковых снимках для создания обучающих данных. Хотя ручной краудсорсинг доказал свою эффективность для генерации данных в относительно небольших географических районах в течение коротких периодов времени, автоматизация извлечения признаков поможет сделать наборы геопространственных данных более полными и актуальными. Что еще более важно, автоматизация создания основных элементов карты и простых аналитических задач позволит людям делиться специальными знаниями и сосредоточиться на более сложном анализе.

Неструктурированные данные

Случайность (или полное отсутствие) критически важных метаданных является одним из самых больших препятствий для перехода GEOINT от использования широкоформатных изображений из запланированных и контролируемых сборщиков к использованию изображений с камер смартфонов и другого мобильного оборудования. Точно так же многие отчеты, истории, статьи и другие текстовые сообщения содержат информацию, из которой можно получить место и время, но в которой эта информация не является явной. Оба этих обстоятельства открывают возможности для применения методов эксплуатации неструктурированных данных. Алгоритмы интеллектуального поиска, предназначенные для обнаружения информации о местоположении и времени из данных, должны быть разработаны и использованы для предоставления контекстных данных для почти универсального общедоступного потока данных. Эти данные также могут быть сопоставлены с информацией от официальных источников сбора данных, таких как коммерческие спутники, для еще большей полезности.

Сверточные нейронные сети и другие модели глубокого обучения значительно превосходят традиционные методы компьютерного зрения в таких задачах, как распознавание изображений, обнаружение объектов и выделение признаков. Анализ изображений — лучшее место для современных подходов к глубокому обучению. Однако DL может применяться ко многим форматам данных, отличным от повсеместно распространенных типов растровых данных изображений. Аналитики могут значительно ускорить аналитический рабочий процесс, применяя модели DL к радару, интерферометрическому радару с синтезированной апертурой, радару с синтезированной апертурой и другим источникам данных на основе активных сигналов.

Заключение

В эпоху более умных машин, которые облегчили бремя утомительных повседневных задач, люди столкнулись с необходимостью принять системы с когнитивными способностями, которые сейчас разрабатываются. Мы можем сопротивляться внедрению глубокого обучения в нашу повседневную жизнь и продолжать тонуть в огромном количестве данных, или мы можем воспользоваться возможностью выйти на новый уровень анализа данных, решить ранее непреодолимые проблемы и обогатить нашу повседневную жизнь с помощью алгоритмов глубокого обучения. .

Чтобы узнать больше о USGIF, посетите веб-сайт Фонда и следите за нами в Facebook, Twitter или LinkedIn.