ИИ и машинное обучение развиваются быстрыми темпами; Теперь эти технологии лежат в основе рабочих процессов, помогая авторам и руководителям бизнеса автоматизировать рутинные задачи и лучше контролировать рабочие процессы. Немногие в бизнесе видели этот прогресс так ясно, как Тим Конверс. Он старший директор в команде Sensei & Search, управляющий командой прикладных наук и машинного обучения. Его команда помогает внедрить инновационные функции на основе машинного обучения в продукты Adobe, сочетая новаторское моделирование машинного обучения и передачу технологий. Это позиция, к которой он был хорошо подготовлен.

С 2004 года Тим работал в сфере машинного обучения в таких компаниях, как Yahoo, время от времени уезжая, чтобы присоединиться к стартапам или даже запускать их в этой сфере. Его переход в Adobe был особенным, потому что он представил новый способ работы с технологией машинного обучения. «Хотя я работал в области машинного обучения в течение долгого времени, оно было в основном нацелено на приложения для социальных сетей, поиска и электронной коммерции с использованием« неглубоких »методов машинного обучения для поведенческих данных», - сказал он.

«Одно из удовольствий моей работы в Adobe - это огромное разнообразие продуктов и областей, над которыми мы работаем с помощью методов глубокого обучения: изображения, видео, текст, дизайн, а вскоре и аудио и музыка». Читайте дальше, чтобы получить больше информации от Тима о том, что нужно для создания долгой и успешной карьеры в области машинного обучения, и прочитайте его мысли о том, что будет дальше в этой области, которая, несмотря на беспрецедентный рост, по-прежнему демонстрирует огромный потенциал для дальнейшей революции в мире вокруг нас.

Какие препятствия вам пришлось преодолеть на пути внедрения технологий машинного обучения в цифровые продукты в Adobe и других местах?

Чтобы принять решения на основе машинного обучения, разработчикам и разработчикам продуктов часто требуется изменение мышления. Они привыкли определять каждый аспект того, как работает программный продукт, и могут применять очень четкие стандарты к тому, работает он или нет. Когда программное обеспечение работает некорректно, это ошибка, и кто-то должен ее исправить. Это не всегда применимо к решениям на основе машинного обучения.

Это было наиболее очевидно на моей предыдущей работе, когда я работал над поиском в Интернете и электронной коммерцией. Кто-то в роли продукта может сказать: «Привет, я выполнил этот запрос, и результат номер четыре не очень хороший». Подходящим ответом будет что-то вроде «Хорошо, спасибо за отзыв, мы рассмотрим это». Вероятный ответ на * это * - услышать «ОК, когда это будет исправлено? Вы свяжетесь со мной, когда результат №4 будет исправлен? »

И хотя это сделает вас непопулярными, на самом деле вам следует сказать: «Вы знаете, мы не исправляем отдельные поисковые запросы». Это потому, что существует почти бесконечное количество возможных запросов и результатов. В природе машинного обучения заложено то, что, когда оно работает хорошо, оно может делать все правильно почти всегда, но никогда. Конечно, мы можем исправить конкретный запрос / результат, если есть серьезная проблема с общественностью или юридическая проблема с этим конкретным запросом. В общем, тем не менее, мы можем потратить свое время либо на исправление запросов по одному, либо на выполнение работы машинного обучения, которая улучшит миллионы запросов.

Вы все еще хотите посмотреть на плохие примеры, потому что они могут указывать на какую-то систематическую ошибку, но наличие некоторого уровня ошибок просто неотъемлемо для процесса машинного обучения. И, если вы примете это полностью, тогда вам придется работать на шаге, удаленном от фактического поведения программы - не на уровне того, что должно происходить, а на косвенном уровне моделей и данных обучения. Взамен этой сравнительной потери контроля вы получаете решения, которые масштабно масштабируются как для многих пользователей, так и для многих ситуаций.

Чем разработка ML-решений для креативов и творческих рабочих процессов отличается от других типов цифровых продуктов?

Большая часть работы, которую я проделал до прихода в Adobe, связана с рейтингом или рекомендациями. Разделение труда между пользователем и машиной действительно четкое. Пользователь не ожидает, что ему придется выполнять ранжирование, а поисковая система не делает ничего, что является работой пользователя. С помощью творческих инструментов вы хотите создать функцию машинного обучения, которая вносит подходящие предложения. Возможно, вы хотите создать функцию, которая указывает на проблемы, критикует, помогает цифровому креативу. Кроме того, если есть что-то очевидное, вы хотите создать функцию, которая поможет пользователю выполнить свою задачу как можно быстрее.

Мы сосредоточены на том, чтобы избавить творческую работу от рутинной работы. Представьте, что вам нужно смотреть на каждую фотографию и менять цвета, чтобы они соответствовали бренду. Когда дело доходит до того, что вам приходится делать снова и снова, но вы не ожидаете, что компьютерная программа сделает за вас, это очень приятный момент. Мы надеемся, что такие функции, которые автоматизируют неинтересные аспекты творческой работы, позволят пользователю делать более сложные вещи, требующие большего человеческого творчества.

Сложно определить эту границу того, что находится в сфере творчества; что вы можете творчески делать в программном обеспечении, не выходя за рамки или неверно истолковывая намерения пользователя. Я думаю, что это гораздо более тонкий танец, чем со службами, где договор гораздо лучше понимается.

Часто переход по этой линии означает совместную работу нескольких команд. Он сотрудничает с людьми, работающими над моделями ИИ, людьми, работающими над поисковой инженерией, разработчиками пользовательского интерфейса и исследователями, расширяющими фундаментальные возможности. Это связано с большим количеством движений вперед и назад, поскольку мы все сотрудничаем над визуальным и UX-выражением основной работы машинного обучения.

Что вы посоветуете тем, кто хочет долгую и здоровую карьеру в сфере машинного обучения?

Если вы только начинаете, у вас нет недостатка в способах изучить основы машинного обучения. Это особенно верно для людей, которые уже являются разработчиками программного обеспечения. Онлайн-курсы, книги, видеолекции, поясняющие статьи и примеры кода в проектах Github - все это точки входа. Изучите Python, а затем одну из сред моделирования, например TensorFlow или PyTorch, и попробуйте создавать модели. Соревнования Kaggle - это хорошая вещь, которую стоит попробовать, потому что они дают вам нетривиальные наборы данных для работы. Это может дать вам представление о работе.

Однако эту легкость обучения и вступления можно легко переоценить. В этом мире МООК, инкубаторов и учебных лагерей у вас может сложиться ложное представление о том, что есть скоростной путь, который заменит 10 лет обучения на степень бакалавра наук. а затем докторскую степень. Это просто неправда. Люди, которые сделали это, хорошо владеют всей математикой и теорией, лежащими в основе этих моделей, поэтому есть аспекты такого рода работы, к которым краткий онлайн-курс просто не может вас подготовить. Но ML хорош тем, что есть способы внести свой вклад на всех уровнях и на всех уровнях сложности.

Самый важный вопрос, который нужно задать, - понравится ли вам работа. Если внезапно навыки решения кроссвордов станут востребованными и прибыльными, у вас могут появиться люди, которые спрашивают: «Эй, как я могу получить одно из этих заданий по разгадыванию кроссвордов?». Первый вопрос, который следует задать: «Ну, а вам вообще * нравится * разгадывать кроссворды?» Потому что, если вы получите одну из этих работ, вы будете этим заниматься весь день. Это должно быть что-то, что вам нравится, иначе у вас все равно не получится. Основное занятие в промышленном машинном обучении - это «возиться с данными» и возиться с данными, настраивать программы и писать не очень интересный вспомогательный код, который позволяет вообще добраться до модели машинного обучения. Некоторым эта работа кажется очень скучной, а другим она невероятно увлекательной, поэтому первый вопрос, на который вы захотите ответить: какой вы человек?

Что дальше у машинного обучения?

Произошел огромный взрыв возможностей моделей глубокого машинного обучения, которые позволили автоматизировать множество задач, особенно тех, которые начинаются с низкоуровневых входных данных, таких как пиксели изображения или слова и буквы в тексте, и делают из них выводы высокого уровня. (как обычно люди). Людям довольно легко смотреть на фотографию и давать названия типам объектов, которые на ней изображены, и впервые у нас есть компьютерные программы, которые могут делать то же самое, но довольно надежно.

В то же время, действительно сложные проблемы ИИ - суждения, здравый смысл, мировоззрение, практическое планирование, объединение различных источников знаний - кажутся почти такими же далекими, как и когда-либо, несмотря на успех моделей глубокого обучения. Действительно интересно, что глубоко изученные модели видения могут так много понять о структуре изображений или структуре текстов без каких-либо реальных знаний о физическом или социальном мире, который их произвел. Модель с глубоким изучением может легко идентифицировать все возможные породы собак на изображениях, например, не имея представления о том, что собаки дышат, бегают, едят или становятся хорошими домашними животными. Еще остается огромное пространство для изучения убедительных и полезных глубоко изученных способностей, которые все еще не предполагают, что эти проблемы «полного ИИ» решены.

Все эти достижения в области компьютерного зрения значительно упростят поиск объектов в изображениях и видео, а мультимодальное слияние с языковыми моделями упростит разговор с компьютером о том, что находится в изображениях и видео (возможно, в в то же время, когда вы их делаете).

Диалоговые системы все еще довольно хрупкие, но очень быстро становятся лучше, и круг вещей, о которых вы можете подробно «поговорить» с компьютером, растет. Понимание изображений и видео поможет автоматизировать большую часть рутинной части творческой работы, давая возможность создателю реализовать свое видение и / или быстрее выполнять свою работу. Понимание языка позволит задавать вопросы огромным хранилищам документов и получать реальные ответы, независимо от того, как вопросы и ответы сформулированы. Будет интересно увидеть, какое влияние окажет на общество в мире, когда машинный перевод станет действительно качественным, дешевым и повсеместным; когда вы понимаете новостное видео из далеких стран, как если бы вы слушали его, например, на своем родном языке.

Почему вы так увлечены своей работой в области машинного обучения?

Приятно видеть, как машины делают что-то действительно сложное, чего нельзя было ожидать от машины.

Но это еще и потому, что ML является таким умножителем силы. На заре Apple Стив Джобс мотивировал людей работать над улучшением медленной загрузки, умножая время ожидания на количество пользователей и сравнивая его с человеческими жизнями. Он говорил что-то вроде: «Вы только что спасли десять жизней!» Это похоже на то, когда вы доставляете функцию или улучшение на основе машинного обучения миллионам пользователей - даже если это делает чей-то день лишь немного лучше или легче, совокупный эффект может быть огромным. Это очень приятно.

Чтобы узнать больше о том, как Adobe использует передовые технологии искусственного интеллекта и машинного обучения для революции в творческих рабочих процессах, перейдите в Центр Adobe Sensei в нашем техническом блоге и ознакомьтесь с последними новостями и обновлениями в Adobe Sensei в Twitter. .