Моя должность выдумана? Как найти свою роль в машинном обучении

Я помню, каким напряженным был поиск моей первой работы в области науки о данных. Только что получив степень магистра, я провел недели вслепую, просматривая LinkedIn и заполняя объявления о вакансиях такими приложениями, как resume_(insert job title here).pdf. Забавный факт: в Greenhouse мне отказывали в работе, о которой я даже не подозревал в течение нескольких месяцев после того, как устроился на свою первую работу.

В то время как огромное количество разосланных резюме было определенно побочным продуктом моего беспокойства, распространение резюме на любую должность, содержащую слово «данные», было не так уж и далеко. В мире поиска работы для специалистов по науке о данных есть две страшные истины:

1. Все компании, которые знают, чего хотят от должности, называют ее по-разному.

Наиболее распространенный пример этого можно увидеть ниже. Аналитик продукта в Google — это, по сути, «ученый данных». В то время как специалист по данным в Facebook может быть больше похож на традиционного «аналитика данных». Компании будут следовать своим собственным внутренним правилам при назначении должностей.

2. И компании, которые не… называют это Data Scientist

Еще одна вещь, которой следует опасаться при поиске работы, — это ванильный общий термин специалиста по данным. Хотя работа специалиста по данным, о которой вы мечтаете, вероятно, также называется специалистом по данным, сейчас в сфере машинного обучения много неправильного маркетинга вакансий.

В недавнем обзорном документе MLOps это называется наем безголовых цыплят. Это происходит, когда организации знают, что хотят повысить уровень своих возможностей в области обработки данных и искусственного интеллекта. Им нужна очистка озер данных, построение конвейеров ETL, кто-то для создания визуализаций и создания отчетов и/или любая другая потенциальная задача, связанная с данными. И чтобы найти людей для этого, они используют тот же подход, что и я, безработный в LinkedIn в подвале моих родителей, просто бросая заголовок с данными в названии и думая: Ну, достаточно.

Получение достаточно хорошей титулованной должности при поиске традиционной роли специалиста по данным оставляет многих разработчиков недовольными. Это одна из причин, по которой текучесть кадров специалистов по данным на 55% выше, чем уже существующие отраслевые стандарты высоких технологий. Поэтому очень важно найти позицию, которая соответствует вашим ожиданиям.

Вот почему мой совет номер один для людей, которые знают, что они ищут при поиске работы, — прочитать описание работы.

Бонусные баллы для тех, кто не только оценивает описание работы, чтобы понять, что они ищут, но и адаптируют свое резюме, чтобы оно соответствовало формулировке публикации, чтобы оптимизировать алгоритмы отбора резюме. (Расширения Google Chrome, такие как Jobalytics, автоматически сравнивают ваше резюме с объявлениями о вакансиях и дают процентное совпадение).

Но… остаются те, кто точно не знает, что они ищут. И для них мой второй совет заключается в том, чтобы…

Начните с понимания традиционных ролей данных по навыкам, наборам инструментов и роли в жизненном цикле машинного обучения.

Просматривая объявления о вакансиях Google, вы, возможно, заметили, что я сравнил их роль с «традиционным специалистом по данным». Как мы установили, существует довольно много должностей с данными в названии. Приступая к поиску работы в рамках ИИ, важно понимать, какова традиционная разбивка этих ролей:

Может быть полезно выбрать роль, на которую вы хотели бы пойти, а затем адаптировать свое резюме и/или повышение квалификации, чтобы соответствовать ей. Вы можете начать с некоторых навыков/инструментов, перечисленных выше, и свериться с объявлениями о вакансиях на LinkedIn, чтобы убедиться, что они актуальны.

Но, все эти навыки такие разные? Как вам все эти роли ИИ?

Еще одна вещь, о которой следует подумать при подаче заявки на роль в ИИ, — это понимание того, как должность, на которую вы претендуете, вписывается в экосистему машинного обучения. Хотя я уверен, что расскажу о тренде сквозного специалиста по данным в будущем информационном бюллетене, большинство организаций все еще используют систему передачи проекта. Все перечисленные выше роли работают вместе для создания проектов машинного обучения.

Понимание того, где находятся различные роли в этой системе, может помочь соискателям представить себе общую картину своих будущих ролей:

На этом изображении мы можем увидеть эти передачи в действии. Инженер данных берет необработанные данные из «реального мира» — в данном случае из любого внешнего источника данных — и преобразовывает их в пригодные для использования форматы. Они поддерживают инфраструктуру данных, создавая озера данных и, в последние годы, хранилища функций, из которых могут извлекать данные ученые и аналитики.

Затем начинается конвейер анализа и экспериментов, поскольку организованные данные берутся из озер данных или хранилищ функций. Аналитики данных/ученые преобразуют эти данные для бизнес-идей/результатов. Аналитики данных обычно больше внимания уделяют аналитической части этого уравнения. Когда внешние заинтересованные стороны задают бизнес-вопросы, аналитики данных преобразуют и анализируют данные, чтобы дать ответы. Эти ответы могут быть в форме диаграмм, отчетов или даже презентаций.

С другой стороны, конвейер экспериментов специалистов по данным также начинается с анализа данных. Однако для них этот анализ редко определяется ответом на вопрос; вместо этого их просят решить проблему. Например, вместо ответа на вопрос «Как изменился уровень мошенничества с кредитными картами по сравнению с прошлым годом?» их просят усовершенствовать систему выявления мошенничества с кредитными картами. Для этого они часто работают с аналитиками данных для изучения данных, связанных с проблемой, и используют свой статистический опыт и знания в предметной области для оценки решений. Эти решения часто представляют собой статистические модели или модели машинного обучения.

Следующая передача происходит после того, как модель создана и готова к производству (для предоставления конечным пользователям). Хотя инженеры машинного обучения часто участвуют в экспериментах с моделями, они играют важную роль в этой передаче, забирая готовую модель у специалистов по данным. Решения, созданные после конвейера анализа/экспериментирования, являются частью производственного конвейера.

Инженеры машинного обучения отвечают за помощь в оценке моделей специалистов по обработке и анализу данных, чтобы убедиться, что они готовы к работе. Затем они оптимизируют код с помощью таких методов, как распараллеливание данных и модель, с помощью таких методов, как уменьшение размера модели. Наконец, они сами готовятся к развертыванию модели, начиная с настройки инфраструктуры, тестирования производственных сред, проверки конвейеров CI/CD и поддержания этого развертывания посредством мониторинга.

После развертывания своей модели инженеры машинного обучения предоставляют бэкенд-инженерам или разработчикам определение API, которое определяет, как взаимодействовать с их развернутой моделью. С помощью этого API разработчики бэкэнда интегрируют его в существующую архитектуру и инфраструктуру бэкэнда. Они также часто помогают инженерам машинного обучения отслеживать и поддерживать модель машинного обучения, например, отлаживать обработку данных или реализовывать обработку ошибок.

Это последняя передача, поскольку модель ML начинает работать в производстве. В этот момент он начинает делать прогнозы по данным. Эти данные, а также эти прогнозы обычно хранятся в базах данных организации. И цикл продолжается…

В общем, если вы ищете техническую роль в создании систем ИИ, это определенно достижимо. Вам просто нужно знать, с чего начать и какие навыки развивать. Хотя мы обязательно расскажем о некоторых более конкретных навыках в будущих информационных бюллетенях, некоторые отличные места для начала — это Coursera, Udemy и даже Youtube (крупнейшая в мире платформа онлайн-обучения).

Кроме того, важно отметить, что это не единственные роли, доступные в ИИ. Командам нужны продакт-менеджеры (менеджеры продуктов, проектов и программ), технические писатели, дизайнеры и многие другие для разработки своих систем и продуктов ИИ!