Ускорение внедрения машинного обучения

На прошлой неделе у меня была прекрасная возможность рассказать о машинном обучении и инновациях 110 руководителям моей компании. Это была смешанная аудитория технических и нетехнических людей.

Я хочу сказать, что машинное обучение должны понимать все в бизнесе, а не только специалисты по данным. Особенно народные лидеры! Знания предметной области с помощью машинного обучения действительно помогут реализовать успешные проекты по работе с данными.

Вот мои слайды и некоторые заметки

Несколько месяцев назад я следил за учебным пособием на http://course.fast.ai и участвовал в конкурсе Kaggle.com. Задача конкурса заключалась в том, чтобы пометить 20 000 изображений кошек и собак с помощью компьютерного зрения. Было 1300 заявок со всего мира.

Я скачал имеющийся в свободном доступе алгоритм vgg16 и немного модифицировал его, чтобы получить точность 87%.

Я подумал, что это отличный результат. Компьютерам ДЕЙСТВИТЕЛЬНО сложно определить, что изображено на этих картинках. 5 лет назад команда ученых получила точность 57% с тем же набором данных.

Однако, как оказалось, у меня не очень получилось :) Я пришел 600-м! Победители приблизились к точности 97%.

Мы никогда не станем учеными данных, но технология находится на таком этапе, когда любой, кто плохо знаком с машинным обучением, может загрузить отличные решения и начать решать эти проблемы. Вы, как эксперты в предметной области, лучше всего видите эти возможности и начинаете экспериментировать.

Что такое машинное обучение и чем оно отличается от того, что мы делаем сейчас? Это очень упрощенно, но с традиционными вычислениями мы бы точно сказали компьютеру, какой результат нам нужен для заданного набора входных данных. С помощью машинного обучения мы даем компьютеру большой объем информации и просим компьютер дать нам представление о данных.

Мы не пишем явных программ. «Программа» является результатом данных и будет меняться в зависимости от данных.

Он делает это, используя хорошо известную и хорошо изученную математику. У дата-сайентистов даже есть шпаргалка, какой алгоритм использовать. Для более сложных аспектов машинного обучения, таких как глубокое обучение, есть несколько очень хороших бесплатных онлайн-моделей. Я скачал один из них для кошек и собак.

Но мы здесь не для того, чтобы изучать шпаргалку, так что забудьте о деталях.

Просто помните, что алгоритмы хорошо известны для данной задачи.

Что дает компаниям преимущество в машинном обучении, так это их данные.

У нас здесь невероятное количество пользователей. И они дают нам отличные данные. Обработка всех этих данных стоит денег.

Одна из причин, по которой в последнее время вы много слышите о машинном обучении, заключается в том, что вычислительная мощность стала очень дешевой. Я потратил всего 150 долларов за несколько часов вычислений на Amazon для кошек и собак.

Почему сейчас? Экспоненциальные инновации…

Каждые несколько лет в течение последних 100 лет количество вычислительной мощности, которое можно купить за 1000 долларов, удваивалось. Мы находимся в самом конце самого последнего технологического прогресса — полупроводников. Этот шаблон означает, что прямо сейчас примерно за 1000 долларов вы можете купить такое же количество вычислительной мощности, как мозг мыши.

Если эта траектория продолжится, то к 2024 году за те же 1000 долларов вы сможете купить столько же вычислительной мощности, сколько человеческий мозг.

Это дурацкая идея, и я сам в нее не верю. Но это совершенно нормально! Люди действительно плохо умеют мыслить экспоненциально.

Если я попрошу вас пройти 30 шагов по прямой, то это легко представить, 30 метров. Однако если я попрошу вас пройти 30 шагов в геометрической прогрессии, удваивая каждый шаг — 1 м, 2 м, 4 м, 8 м. Тогда к 30-му шагу вы пройдете миллиарды метров. На последнем этапе вы совершите 26 кругосветных путешествий!

Мы не можем так думать, но именно так быстро и дешево становятся компьютеры.

Есть три вещи, которые мы можем сделать, чтобы ускорить внедрение машинного обучения в бизнесе.

Поймите, что машинное обучение абсолютно доступно, и это не волшебство, если вы знаете, какие типы проблем можно решить.

Существует 5 основных типов проблем…

Классификация

Регрессия

Кластеризация

Рейтинг

Обнаружение аномалий

Подумайте о проблемах в вашей части бизнеса, которые можно сформулировать таким образом.

Нам нужно собирать более качественные данные, а не просто больше данных. Нам необходимо собрать соответствующие данные, и именно здесь знание вашего домена имеет жизненно важное значение.

Вы также находитесь в идеальном положении, чтобы выявить пробелы в наших текущих данных. Мы должны найти их как можно скорее и начать подключать их.

Нам необходимо определить любые возможные внешние источники данных, например, данные совета.

Вы должны определить области бизнеса, в которых мы принимаем субъективные решения. Если мы сможем устранить двусмысленность и субъективные решения в бизнесе, мы сможем принимать лучшие решения.

Сотрудничайте с учеными по данным — ваши знания в области в сочетании с навыками нашей науки о данных — это то, что даст наилучшие результаты.

Не разделяйте данные. спросите у своей группы данных, куда вы должны отправлять данные, чтобы все в бизнесе могли получить к ним доступ.

Не бойтесь конфиденциальных данных. Мы можем анонимизировать данные и по-прежнему извлекать из них ценную информацию.

У нас есть несколько слабых каналов. Подключиться к каналам может любой желающий. Мы все учимся, и это безопасное пространство для любого уровня знаний в области машинного обучения.

Мы будем проводить занятия, начиная от такого типа обзорной информации и заканчивая внедрением реальных решений.

Так что не бойтесь машинного обучения. Здесь у нас есть огромная база лояльных пользователей, и они генерируют потрясающие данные, у нас есть группа лучших технических и деловых талантов в стране.

Но наша отрасль меняется быстрее, чем мы можем себе представить, и нам нужно использовать все доступные инструменты, чтобы сохранить свое преимущество в будущем.

Думайте о машинном обучении как о другой технологии или инструменте, таком как Word, Excel или Photoshop. Узнайте об этом. Втягиваться.

Пожалуйста, свяжитесь с нами, если вам нужна дополнительная информация.

Некоторые изображения из этой удивительной статьи ждут, но почему: http://waitbutwhy.com/2015/01/artificial-intelligence-revolution-1.html

Слайды и идея экспоненциальных инноваций из великолепного выступления Кайлы Колбин: https://www.youtube.com/watch?v=XwxwVSJcOGU

Курс: http://course.fast.ai

Ускорение внедрения машинного обучения

Вопросы по теме