Я пишу эту статью в прекрасный поздний час, время, когда я нахожу все свое вдохновение…

Часто описывается как «самая сексуальная работа в мире» или во вселенной, как бы я не ненавидел этот термин. Однажды я попытался сказать женщинам, что я был специалистом по данным, и попытался объяснить, как работает линейная регрессия, а это противоположно сексуальности.

Короче говоря, профессия Data Scientist продолжает меняться. Я объясню, почему, основываясь на своем опыте работы с учеными данных и особенно на том, что я был рядом, что правление сексуальных ученых данных подходит к концу.

Auto-ML и API

Злые языки скажут, что наука о данных всегда нужна в наших проектах. Да, именно так, но не забывайте различать специалиста по данным (должность) и предметную область.
Auto-ML или автоматизированное машинное обучение позволяет создавать все более надежные модели, не изобретая велосипед. Потому что, как и многие специалисты по данным, многие модели, которые просматриваются и проверяются, становятся все более и более доступными благодаря развитию облака.
Таким образом, например, облако Azure или Google позволяет выполнять машинное обучение даже без написания кода. и более легкое развертывание. Потому что проблематично развертывание модели, на которую приходится 80% работы. Работа непосредственно в облаке и его API упрощает разработку и запуск модели в производство.

Что подводит нас к следующему пункту…

Развертывание и масштабируемость модели

Чтобы представить модель ИИ, это мило, блокноты, анаконда, маленький плюшевый мишка… Но компании хотят подняться на ступеньку выше. Почему? Коронавирус также ускорил трансформацию бизнеса. Точно так же специалисты по данным часто связаны с исследованиями и разработками в течение многих лет, но мы почти в 2021 году, и экосистема становится все более и более зрелой. Отсюда необходимость интеграции и производства крупномасштабных моделей. И в этих последних пунктах наука о данных вступает в новую внешнюю парадигму, отличную от старой записной книжки локально: конвейеры, управление версиями моделей, переобучение, докеризация, вызовы API, мониторинг, автоматические сравнения или руководство по производительности… DevOps и инженерия данных.

Появление инженера по машинному обучению

И это еще одно красивое модное слово, но это то, что компании ищут, потому что ценность приносит развертывание и управление всей цепочкой создания стоимости модели. Он включает в свой подход… барабанную дробь другого модного слова…. MLOPS — это своего рода devops, применяемый для управления моделью.

Слишком много специалистов по данным

После разговора с несколькими рекрутерами, а также с довольно техническими людьми всегда возникает один и тот же паттерн. «Нам не нужен специалист по данным». И это часто говорят грубо.

Другая компания, куда я подал заявку в качестве инженера данных, фирма, четко сказала мне, вы видите их там, они убийцы, особенно не выдвигайте свои навыки в области науки о данных в дополнение к вашим навыкам обработки данных, а только ваши данные инженерные навыки.

Еще один, «нам не нужен датасайентист, их слишком много», единственные датасайентисты, которых они держат под локтем, это верхушки топа, гуру…

Еще на этот раз на LinkedIn: «Мне становится противно, когда я вижу термин «ученый по данным» в профиле», поэтому избыток специалистов по данным может вызвать у некоторых людей тошноту…

После работы в компании IT Consulting поиск миссии исследователя данных был похож на получение награды. Ведь на одного специалиста по данным в компании нужно несколько разработчиков, инженеров данных, devops…

Нам все еще нужны специалисты по данным

Специалист по данным по-прежнему востребован для исследований или для очень специфических нужд. Но, конечно же, речь идет об data science очень хорошего уровня, исследователе…

Что должны сделать наши друзья-исследователи данных, чтобы выделиться?

Сначала перестаньте быть специалистом по данным.
Специализируйтесь на инженере по машинному обучению, инженере по искусственному интеллекту, инженере по компьютерному зрению… Что бы ни случилось, необходимо также освоить новые навыки, особенно техно, такие как облако, докер и немного DevOps.

Есть также способ двигаться в сторону инженерии данных, но уровень кода, инфраструктуры… выше. Наконец, бывший специалист по данным должен заниматься программной инженерией больше, чем обычно, а не только чистой математикой и статистикой…

Так что добавь немного техники!

Пока...