Машинное обучение: поверхностный анализ… и несколько возможностей

Одна из самых сложных задач для преподавателя инноваций в наши дни - заставить своих учеников представить себе потенциал той или иной технологии, а затем заставить их применить их в будущем, чтобы понять, какие конкретные инновации они могут привнести. Пожалуй, самой сложной разработкой с концептуальной точки зрения и с учетом его безграничных возможностей и приложений является машинное обучение.

Как ни странно, одна из самых сложных задач для любого менеджера в отношении проектов машинного обучения - это определение целей, потому что, по всей вероятности, вы не будете иметь большого представления о том, как это использовать. Имея это в виду, я решил обрисовать некоторые недавние практические применения машинного обучения либо в качестве вдохновения, либо для лучшего понимания некоторых изменений в нашей жизни, которых мы можем ожидать в ближайшие несколько лет.

Что нужно для проекта машинного обучения? По сути, data. Я мог бы написать главу и стих о характеристиках таких данных, их структуре и подготовке, что обычно занимает больше всего времени, но мы оставим это для более подробной записи в какой-то момент в будущем. Сегодня я расскажу о практических примерах:

  • Устранение материалов в социальных сетях, дезинформирующих и распространяющих язык вражды: текущий приоритетный проект Facebook пытается найти сообщения, разжигающие насилие в отношении сообщества рохинджа в Мьянме. Это очень сложная задача, учитывая универсальность человеческого языка и бесконечное количество способов подстрекательства к насилию, но она облегчается тысячами уже имеющихся примеров. Компания наняла 60 человек, которые поручили им маркировать записи. К концу года он намерен нанять 100 человек, все из которых являются экспертами примерно из 100 языков, на которых говорят в Мьянме в дополнение к официальному языку, на котором говорят две трети населения. Затем информация будет введена в алгоритм. Марк Цукерберг говорит, что алгоритму потребуется от пяти до 10 лет, чтобы получить полностью надежные результаты, но когда это произойдет, он будет очень полезен для социальной сети, чья роль в подстрекательстве к насилию в Мьянме против мусульманского меньшинства там подвергается сомнению. . По оценкам Facebook, алгоритм способен обнаруживать 52% сообщений, потенциально разжигающих насилие, до того, как пользователи сообщат о них.
  • Снова в Facebook, еще одно неотъемлемое приложение: замена закрытых глаз на открытые на фотографиях. Это обычная проблема с групповыми фотографиями, и если у кого-то и будет много примеров, то это будет Facebook. Его алгоритм найдет больше фотографий данного человека с учетом ракурса, освещения и других характеристик и вставит их глаза на исходную фотографию. Это задача для Генеративно-состязательной сети (GAN), двух нейронных сетей, которые конкурируют друг с другом, одна генерирует изображения, а другая оценивает их уровень реализма, используя фотографии человека с открытыми глазами.
  • Еще одно приложение Facebook, хотя и не связанное с его деятельностью в социальной сети: сокращение времени, необходимого для проведения магнитного резонанса до нескольких минут, что снижает стресс и дискомфорт для пациентов и увеличивает количество тестов. Facebook намеревается выпустить этот проект с открытым исходным кодом, надеясь использовать его для улучшения обучения алгоритмов. Ключевым моментом здесь является получение правильных данных. Компания объединила усилия с Нью-Йоркским университетом, чья клиника имеет файл с 10 000 анонимных магнитных резонансов, чтобы с помощью глубокого обучения обучить алгоритм распознавания костей, мышц, связок и других компонентов человеческого тела. Как только эта модель будет построена, машина сможет обнаруживать аномалии магнитного резонанса.
  • Google и охлаждение центров обработки данных: еще несколько лет назад охлаждение было одной из основных статей расходов центров обработки данных. В наиболее современных версиях этот показатель был снижен до 10%, но даже в этом случае все еще существует значительная потенциальная экономия. Задача центров обработки данных - получить правильную температуру и влажность за счет правильного сочетания воздуха или воды, вентиляции, аэрации или кондиционирования. Для этого он использовал обучение с подкреплением, алгоритм, который позволяет ему видеть, что программный агент должен выбрать в данной среде, чтобы максимизировать определенную функцию, в данном случае расходы на электроэнергию. Существует определенный уровень человеческого надзора, который позволяет увидеть, является ли выбор алгоритма чрезмерно рискованным, но в настоящий момент алгоритм уже обеспечивает экономию около 40%.
  • Опять Google: на этот раз с помощью приложения для обработки медицинских изображений, аналогичного Facebook, которое может исследовать изображения глаза, полученные с помощью оптической когерентной томографии (ОКТ). Случай с МРТ не похож на предыдущий: ОКТ не сложны и относительно быстро выполняются, но проблема в том, что до сих пор их анализировал врач, что требовало времени и допускало человеческую ошибку. Компания создала команду с Офтальмологической клиникой Мурфилдс, которая ежедневно анализирует около 1000 изображений этого типа в двухэтапном процессе: сегментация с помощью нейронной сети, которая преобразует ОКТ в карту трехмерных тканей с четко определенными изображениями. цветные сегменты, которые могут обнаруживать до 50 возможных заболеваний, обученные с помощью 877 изображений, сегментированных вручную офтальмологами, за которыми следует вторая классификационная сеть, которая анализирует трехмерную карту тканей и принимает диагностические решения о типе заболевания и о том, насколько срочно лечение. Эта вторая сеть была обучена с помощью 14 884 карт тканей, созданных сетью сегментации, которые были просмотрены офтальмологами и оптометристами. Полученный в результате процесс уже может повысить эффективность медицинских диагностических бригад.
  • Выявление рака: с помощью медицинской визуализации уже можно распознавать рак кожи (95% успеха против 87% командой из 28 дерматологов), опухоли простаты, головы и шеи, толстой кишки, прямой кишки и груди.
  • Предотвращение стихийных бедствий: Microsoft разработала инструмент, способный использовать аэрофотоснимки высокой четкости, а затем алгоритмически распознавать каналы, реки, деревья, поля, дороги и здания, что в сочетании с показаниями метеорологических датчиков позволяет прогнозировать, планировать и готовиться к возможным наводнения. По мере того как в алгоритмы пополняется все больше и больше таких карт, они учатся распознавать больше объектов, например, деревья, здания разных видов и т. Д. - и его применение становится более надежным.
  • Мой личный фаворит по очевидным причинам: алгоритм, позволяющий оценивать экзамены типа эссе, который работает на китайском и английском языках и может создавать базу знаний для интерпретации общей логики и смысла эссе, а также в тестах на 60 000 учебных заведений, в которых обучается 120 миллионов студентов, в 92% случаев соглашались с оценками учителей. Более того, он улучшается по мере того, как выставляется больше экзаменов. Представьте, что я мог бы делать со своим временем, если бы мне не приходилось тратить его на выставление оценок, без сомнения, задачу, которая отнимает большую часть времени учителя и которую мы ненавидим больше всего.

Это всего лишь несколько идей, которые были представлены в новостях, которые я собирал с мая. Небольшая выборка, но та, которая охватывает ряд областей и дает нам пищу для размышлений о безграничных возможностях технологии, о которой мы едва прикоснулись, и которая изменит мир в том виде, в каком мы его знаем; фактически, он уже меняет это.

(En español, вода)