Сценарии использования и охват рынка для нетехнических специалистов

В надежде ускорить процесс исследования пандемии ученые используют технологии обработки естественного языка (NLP), чтобы помочь им разобраться в огромном количестве научных работ о COVID-19. Между тем, приложения для распознавания лиц могут находить совпадения с точностью до 98%, как и люди. И исследования, проведенные учеными Массачусетского технологического института и клиницистами из Стэнфордского университета, показывают, что цифровые сканы биопсийных препаратов можно окрашивать с помощью вычислений с использованием алгоритмов глубокого обучения.

Я мог бы продолжать, но я думаю, что моя точка зрения ясна — искусственный интеллект (ИИ) выбивает технологии из парка, особенно в отношении машинного обучения (МО). Тем не менее, эти темы все еще окружают много путаницы, и здесь я отвечу на некоторые из самых популярных вопросов:

  • Что на самом деле может машинное обучение и каковы его ограничения?
  • Каковы текущие практические приложения для машинного обучения?
  • Какие самые популярные инструменты и языки программирования для его разработки?

Начнем с первого вопроса.

Демистификация машинного обучения

ИИ — это отрасль компьютерных наук, которая занимается созданием систем для демонстрации «интеллектуальности». Это слово заставляет задуматься о машинах, понимающих абстрактные задачи, понятные любому человеку. Однако это значение на самом деле называется искусственным общим интеллектом, и это все еще гипотетично. Термин ИИ обычно определяет более узкий, но очень интересный набор возможностей.

ML — это подмножество ИИ, целью которого является научить компьютеры автоматически учиться на примерах (то есть данных) и выполнять задачи без явного программирования для этого. Цель состоит в том, чтобы системы, созданные с помощью машинного обучения, со временем улучшались и становились более эффективными — так же, как это сделал бы человек с опытом.

В качестве примера предположим, что вы хотите, чтобы ваш компьютер знал цену на распространенное лекарство — в данном случае на опиоиды — без вашей помощи. Первое, что вы должны сделать, это предоставить ему соответствующие факторы, такие как стоимость лекарства и стоимость страховой доставки.

Теперь вместо того, чтобы тратить часы на кодирование того, как должна действовать программа, если опиоидом является оксиконтин, оксикодон или любой из миллиардов других опиоидов, а затем добавлять страховую стоимость для каждого, что заняло бы целую вечность, вы бы снабдили ее образцами опиоидов. другие лекарства и их цены.

Теперь программа должна возиться со значениями факторов и вычислить комбинацию, которая может дать правильные результаты. С помощью множества проб и ошибок алгоритм или формула научились бы точно делать прогнозы и предоставлять информацию о других таблетках без получения дополнительных данных.

Компьютер не понимает концепций, он не понимает, почему результаты такие, какие они есть. И, честно говоря, большую часть времени вы тоже! Это суровая правда о ML. Вы не развиваете абстрактный мозг, вы разрабатываете функциональную автоматизированную программу, которая может использовать шаблоны для предоставления вам необходимых результатов, не говоря ему, что делать каждый раз. Разочаровывает? Может быть. Эффективный? Абсолютно.

Популярные области применения (и их методы)

Давайте взглянем на некоторые области машинного обучения и на удивительные результаты, которые они могут дать.

Обработка естественного языка и здравоохранение

Существует около 69 000 научных работ, связанных с COVID-19, и их число растет с каждым днем. Каждый ученый, работающий над лекарством или вакциной, должен понимать информацию, содержащуюся в этих статьях, чтобы избежать ошибок и дублирования. Тем не менее, чтобы прочитать их все, потребуются годы. Приложения машинного обучения для обработки естественного языка (NLP), такие как COVDScholar, могут помочь им получить немедленные сводки. Но как?

NLP — это область машинного обучения, которая фокусируется на создании программ, которые могут читать, анализировать и обобщать человеческое общение. Будь то письменные или устные, эти программы призваны облегчить наше взаимодействие с компьютерами и помочь нам быстрее обрабатывать необработанные формы данных. В этой области используется широкий каталог алгоритмов, каждый из которых имеет свою собственную цель для достижения своих целей. Мы узнаем о них больше на примере исследования COVID-19.

Итак, как приложения, основанные на НЛП, могут извлекать пользу из статей о COVID-19? Они используют стратегию, известную как «ансамблирование», что означает использование более чем одного типа алгоритма обучения для создания высокоточного процесса анализа данных. Приложения для исследования коронавируса работают как минимум с тремя различными типами алгоритмов, по одному для каждого этапа процесса.

Во-первых, алгоритмы «кластеризации» проверяют все данные и классифицируют их как объекты, которые затем группируются с использованием набора категорий. Например, в категории «мутации» приложение собирает документы, содержащие такие ключевые слова, как «адаптация», «электронные гены» и «белки».

Затем алгоритмы «классификации» анализируют данные, чтобы определить, какие части имеют решающее значение, а какие нет. Несмотря на формальность научного исследования, не каждое слово является существенным для читателя. Документ может содержать такую ​​фразу: «Несмотря на мой многолетний опыт, я глубоко впечатлен адаптивностью этого нового вируса». Задача этого алгоритма состоит в том, чтобы резюмировать: «COVID-19 адаптируется удивительно быстро». Эти алгоритмы очень важны для создания легко читаемых ответов на важные вопросы.

Наконец, алгоритмы «регрессии» дают результаты, к которым стремятся ученые. То есть они предоставляют реальные значения и прогнозы, основанные на данных, таких как предполагаемая скорость заражения COVID-19, факторы риска (включая астму или слабый иммунитет) у молодых людей, эффективность лекарств для лечения симптомов, скорость мутации и т. д. Говоря эта информация является ценной большое преуменьшение.

Анализ настроений для социальных сетей и управления продуктами

Вы заметили, как YouTube, Amazon и Netflix улучшают свои рекомендации так быстро, что вам кажется, что они шпионят за вами? Это магия анализа настроений.

Анализ настроений напрямую связан с тем, как клиенты взаимодействуют с продуктами и делятся мнениями о них. Его также можно использовать для изучения реакции пользователей. Система использует неконтролируемое машинное обучение в дополнение к базовой процедуре распознавания для классификации вовлеченности.

Итак, обзоры продуктов, называемые «выражениями», классифицируются как положительные, отрицательные или нейтральные. Например, утверждение «Мне нравится этот блендер! Я использую его для всего», положительно. "Я не уверен, насколько выгоден этот блендер" — нейтральное, "Этот блендер — мусор" – отрицательное.

Таким образом, предприятия могут анализировать реакцию своих клиентов и действовать соответствующим образом. Однако автоматическое определение эмоций, стоящих за отзывами, становится в два раза сложнее, когда мы пытаемся применить его к социальным сетям. Например, в твите может быть сказано:

«Мне так нравится эта лазанья, что я подарил ее своей собаке! #спасибони за что”

Человек может легко увидеть, что это сарказм, но как машина может это знать? Расширенный анализ настроений использует такие категории, как тема, мнение, хэштеги и даже ответы на эти сообщения. Кроме того, специалисты по данным обычно подкрепляют программу правильными ответами, чтобы помочь ей быстрее идентифицировать метафоры и сарказм. Процесс использования примеров для помощи машине в обучении называется обучением с учителем. Это похоже на учителя, который показывает учащимся правильные решения некоторых математических задач, чтобы они узнали схему получения правильного ответа. Учащиеся должны продолжать практиковаться, чтобы, когда перед ними встают новые задачи, они могли решать их таким же образом.

Компьютерное зрение и классификация необработанных данных

Алгоритмы компьютерного зрения описывают необработанное содержимое изображения, сопоставляя его характеристики с характеристиками доступных образцов. Изображение разбито на ключевые функции, которые используются в качестве ориентиров. Таким образом, программа может распознать лицо, потому что его характеристики совпадают с образцами фотографий, на которых оно обучалось.

Таким образом, сверхъестественная способность Facebook распознавать вас на самых размытых фотографиях ваших друзей является результатом высококлассного компьютерного зрения. Помимо распознавания лиц, его можно использовать для распознавания рукописного текста или отпечатков пальцев, оптического распознавания символов и визуального поиска.

Топ-10 новейших и самых креативных приложений на основе машинного обучения

ML — это не просто футуристическая технология, которая когда-нибудь может пригодиться людям. Он уже работает во многих приложениях, включая перечисленные здесь.

Приятель мигрени: Если у вас когда-либо была мигрень, вы знаете, что самая сложная часть облегчения — это обнаружение триггеров. Чего из всей пищи, которую мы едим, и занятий, в которых мы участвуем, нам следует избегать? Migraine Buddy помогает вам записывать свои мигрени по мере их возникновения и использует машинное обучение для отслеживания ваших потенциальных триггеров. Мало того, это приложение также прогнозирует вероятность мигрени на основе вашей предыдущей истории и триггеров. Он даже генерирует подробные отчеты, которые позволяют врачам понять, работает ли назначенное вам лекарство или нет!

Snapchat: если вы никогда не использовали фильтр собак в Snapchat, не стесняйтесь отметить меня и мою команду с помощью @beontechstudio и доказать, что мы ошибаемся. Эти знаменитые фильтры возможны только при машинном обучении и распознавании лиц. Алгоритм Snapchat был обучен с тысячами лиц, находя общие ориентиры, такие как рот, глаза, щеки и т. д., чтобы понять, куда прикрепить все дополнительные функции, такие как красная помада, морда собаки или соломенная шляпа на вашем лице!

Реплика: Сегодня люди чувствуют себя одинокими как никогда. Если перегрузка на работе и зависимость от социальных сетей уже создавали трудности, то социальное дистанцирование и изоляция делают людей беспомощными перед чувством изоляции. Существует множество причин, по которым ни с кем не разговаривать в течение длительного времени может быть опасно, одна из которых — неспособность видеть положительную сторону вещей, когда вы застряли в мрачных мыслях. Replika — это современный чат-бот, который может предотвратить худшие сценарии, выступая в качестве друга, готового помочь, когда вам это нужно. Он использует высококлассную обработку естественного языка, чтобы учиться на том, как люди общаются и реагируют, как человек.

Sea Hero Quest: Вы представляли себе, каково было бы на самом деле спасать людей в роли героя видеоигры? Sea Hero Quest позволяет вам сделать это! В то же время он помогает ученым исследовать деменцию. . Самым ранним симптомом слабоумия является потеря навыков пространственной навигации, поэтому игра собирает данные о возможностях пространственной навигации игроков. Пока вы играете в игру, ваша информация и результаты анонимно используются учеными для создания ведущего в мире эталона пространственной навигации человека. Играя в нее, вы становитесь виртуальным иреальным героем истории.

Овальные деньги: это приложение работает как личный помощник, который помогает вам управлять своими деньгами оригинальными, но практичными способами. Он использует машинное обучение для анализа тысяч привычек расходов и коллективных финансовых знаний со всего мира, чтобы создать для вас индивидуальную стратегию.

ImprompDo: Вы знаете того друга, который всегда знает, что нужно сделать, чтобы повеселиться? Это приложение выполняет аналогичную функцию, используя машинное обучение для анализа ваших личных предпочтений, бюджета, свободного времени, средств передвижения и т. д. Затем оно определяет, какое занятие будет лучше, и предлагает его. Его можно использовать даже в группах, учитывая потребности всех участников и внося предложения, которые удовлетворят всех. Он также может создать альтернативный план на случай непредвиденных изменений.

Aipoly Vision: это приложение призвано стать глазами слепых, используя распознавание изображений для идентификации огромного количества объектов в режиме реального времени и без использования Интернета. Он может распознавать растения и животных, читать текст на нескольких языках, распознавать деньги в долларах США и различать более 1400 цветов! Хотя у него все еще есть ограничения, рано или поздно он станет идеальным помощником для слепых людей, нуждающихся в руководстве.

Данго: Иногда мелочи в жизни имеют самое большое значение. Цель Dango — предложить правильные GIF-файлы и смайлики для добавления в ваши тексты, и он делает свою работу невероятно хорошо. Итак, когда вы пишете Давай поедим пиццу! Он предлагает смайлик пиццы.

Призма: Художественные фильтры очень популярны, ведь с их помощью любое изображение можно превратить в произведение искусства! Prisma является одним из самых опытных в этом. Он использует алгоритмы глубокого обучения для обработки ваших изображений на собственных серверах, а не в вашем локальном приложении. Их изготовление может занять немного больше времени, но качество того стоит.

LeafSnap: это приложение для машинного обучения может идентифицировать любое дерево или вид растений, просто взглянув на фотографии их листьев. Этот процесс стал возможным благодаря визуальному распознаванию, так как алгоритм был обучен идентифицировать отдельные листья на исходной выборке из 1000 фотографий. Он был разработан Колумбийским университетом, Университетом Мэриленда и Смитсоновским институтом, и, хотя он еще не безупречен, он развивается день ото дня.

Нет сомнений в том, что машинное обучение меняет то, как мы взаимодействуем с миром. Приложения, которые мы упоминали до сих пор, обсуждаются в GeeksforGeeks top 10, но это только верхушка айсберга. Многие другие помогают нам с большими и маленькими задачами, такие как Mathway, Deep Art Effects и всегда популярное FaceApp.

Популярные инструменты для разработки машинного обучения в 2020 году

Доступно множество инструментов, которые помогут вам разработать собственное приложение для машинного обучения. Ниже я назвал некоторые из самых популярных. Если вы считаете, что я пропустил что-то важное, оставьте комментарий! Мне нравится узнавать больше об этом предмете.

Scikit-Learn Это приложение представляет собой платформу Python для машинного обучения, которая позволяет работать с регрессией, классификацией, кластеризацией, уменьшением размерности, выбором модели и алгоритмами предварительной обработки. Он был создан Дэвидом Курнапо в 2007 году, и сейчас им руководят исследователи из Французского института исследований в области компьютерных наук и автоматизации. Одним из известных брендов, использующих Scikit-Learn, является Spotify. Это помогло им создать современную систему рекомендаций, и они настоятельно рекомендуют ее.

TensorFlow TensorFlow — это платформа с открытым исходным кодом, предназначенная для поддержки приложений машинного обучения. Он имеет обширный каталог инструментов, библиотек и ресурсов сообщества, которые позволяют исследователям оставаться на переднем крае своей области. Этот инструмент вносит невероятные изменения в сферу здравоохранения. Сегодня он используется для создания приложений, которые отслеживают респираторные заболевания с помощью таких методов, как НЛП, и даже помогают врачам прописывать правильные антибиотики. TensorFlow также имеет самую продвинутую библиотеку для расчета числового распределения. Он позволяет эффективно обучать и выполнять обширные нейронные сети, распределяя вычисления на сотнях серверов с несколькими графическими процессорами.

Keras Этот инструмент представляет собой высокоуровневый API глубокого обучения. Его цель — предоставить разработчикам понятный каркас для создания приложений глубокого обучения без дополнительных усилий. Его передовые методы упрощают обучение и выполнение нейронных сетей. Вы можете использовать его в TensorFlow, Theano или Microsoft Cognitive (ранее известном как CNTK). Например, Keras использовался для обнаружения логотипов брендов на изображениях и преобразования текста с бумаги в цифровые документы.

Cloud ML Engine Являясь одной из лучших сред глубокого обучения для начинающих, этот инструмент помогает разработчикам и специалистам по данным в прогнозировании в различных областях и областях. Одной из отличительных особенностей является то, что он обрабатывает обучение и прогнозы независимо друг от друга. Его также можно использовать для развертывания модели, обученной во внешней среде. Большим достижением для его разработчиков стало то, что облачная платформа Google позволила Американскому онкологическому обществу выполнять анализ изображений на платформе для эпидемиологических исследований рака молочной железы, что представляет собой огромный шаг вперед в науке о здравоохранении.

Shogun Набор инструментов Shogun предназначен для того, чтобы сделать инструменты машинного обучения доступными для всех бесплатно. Он обеспечивает эффективную реализацию всех стандартных алгоритмов. Это фреймворк с открытым исходным кодом, совместимый с C++. Разработчики могут использовать его для разработки алгоритмов и структур данных, в основном для обучения и исследований. Такие компании, как Lattice Engines, использовали его для создания приложений для маркетинга и продаж, которые предсказывают, кто будет покупать, а также что они могут купить и когда.

Стоит ли использовать машинное обучение в своем следующем проекте?

С машинным обучением можно делать бесконечное количество вещей, но найти подходящих специалистов для своего проекта, пытаясь уложиться в сроки, может быть непросто. Здесь, в BEON, я работал с выдающимися талантливыми разработчиками машинного обучения, поскольку они создавали передовые механизмы для больших и малых компаний в рекордно короткие сроки. Итак, если вам нужна эффективная и доступная помощь с проектом машинного обучения, напишите нам. Мы будем рады познакомиться с вами!