Я специалист по данным и последние 5 лет работаю в сфере Data Science. Я узнал все о науке о данных самостоятельно и работая над клиентскими проектами. Как опытный специалист по данным, я своими глазами видел, как развивалась наука о данных в последние годы. Наша основная задача как специалистов по данным состоит в том, чтобы брать сложные бизнес-задачи, преобразовывать их в технические спецификации, а затем строить вокруг них аналитическое решение. Аналитические решения могут быть логическими или прогнозными, и все самое интересное заключается в прогнозной части (по крайней мере, так думает большинство из нас), а прогнозное аналитическое решение в основном связано с созданием и экспериментированием с алгоритмами ML и, в некоторых случаях, с глубоким обучением ( большинство бизнес-задач, требующих решений прогнозной аналитики, могут быть решены с помощью алгоритмов машинного обучения). Теперь вот проблема, в большинстве случаев (я хочу сказать, что во всех) мы вызываем `.fit()` в тех или иных API ML (sklearn, tensorflow, keras и т. д.) для создания этих прогностических решений.

Однако с ростом автоматизации алгоритмов машинного обучения и интеграции мощных систем искусственного интеллекта, таких как ChatGPT или GPT-4, в такие платформы, как GCP и AWS, вызов метода .fit() в API-интерфейсах машинного обучения становится все более простым и упорядоченным. Это означает, что специалистам по данным уже недостаточно просто понимать алгоритмы машинного обучения и знать, как вызывать .fit(), чтобы повысить ценность компании.

В связи с этим возникает вопрос: какую ценность представляет специалист по данным в наш век ИИ?

Прежде всего, нам нужно понять бизнес и область, в которой мы работаем. Это означает выйти за рамки технических аспектов науки о данных и получить глубокое понимание того, как работает бизнес. Нам нужно уметь задавать правильные вопросы, понимать проблему с разных сторон и предлагать практичные и эффективные решения. Другими словами, нам нужно быть хорошими рассказчиками.

Но повествования недостаточно. Вам также необходимо уметь упрощать сложные концепции и эффективно доносить их до заинтересованных сторон. Это требует сильных коммуникативных навыков и умения переводить технический жаргон на простой язык. Это также означает способность понимать потребности различных заинтересованных сторон, от руководителей до конечных пользователей (поверьте мне, это будет самая сложная часть вашей работы).

К сожалению, этим навыкам нельзя научиться на 11-месячном курсе, который охватывает только технические материалы. Начинающие специалисты по данным должны сосредоточиться на развитии глубокого понимания бизнеса, с которым они работают, и оттачивании своих коммуникативных навыков, как письменных, так и устных. Несмотря на то, что есть сотни объявлений о курсах, которые претендуют на то, чтобы сделать вас специалистом по данным менее чем за год… ааа, чушь собачья, пожалуйста, поймите это, наука о данных больше не причудливая область, это сложная область, которая требует значительного опыта и навыков, и если вы просто вызовут `.fit()`, возможно, вы не сможете повысить ценность компании.

Я не говорю, что эти курсы плохие, они определенно могут помочь, если вы опытный человек и у вас есть какие-то знания в предметной области. Но если вы просто первокурсник, эти курсы могут быть не лучшим выбором (я не уверен, что будет, но этих 11 месяцев курсов вам недостаточно).

Таким образом, роль специалиста по данным вышла за рамки простого построения моделей машинного обучения. Чтобы быть ценным специалистом по данным сегодня, вам нужно понимать бизнес и область, в которой вы работаете, быть хорошим рассказчиком, обладать сильными коммуникативными навыками и учиться всю жизнь. Хотя для развития этих навыков могут потребоваться время и усилия, вознаграждение за то, чтобы быть успешным специалистом по данным, того стоит.