Мой личный опыт работы дата-сайентистом

Корпоративная компания идентична ношению костюмов и работе с 9 до 5 в большом здании; таким образом, сотрудника, работающего в корпоративной компании, часто называют «корпоративным рабом». Попадет ли специалист по данным в аналогичный рабочий процесс? Есть ли у специалистов по данным в корпорации другой стиль? Я мог бы ответить на него прямо сейчас — это зависит от компании. Тем не менее, у нас, специалистов по данным, по-прежнему есть деятельность, указанная в корпоративной компании, по сравнению с технологическим стартапом или другой компанией.

Я работаю специалистом по корпоративным данным, и у меня есть несколько лет опыта, которыми я могу поделиться со всеми. Это исключительно мой собственный опыт, и у некоторых людей в том же положении, что и у меня, может быть другой опыт. В этой статье я хочу описать свою общую рабочую деятельность и повседневные вещи, с которыми люди, возможно, никогда раньше не сталкивались.

Почему важно знать опыт работы специалиста по обработке и анализу данных? Для многих людей, которые хотят заняться наукой о данных или сменить профессию, это может послужить сравнением, чтобы узнать, может ли рабочий процесс обработки данных быть за них или нет. Кроме того, процесс собеседования может быть немного проще, если вы знаете рабочий процесс, потому что вы можете ответить на вопрос более конкретно.

Это все для введения. Давайте углубимся в это.

Процесс собеседования

Прежде чем я перейду к своему опыту работы, я хочу поделиться кратким изложением своего опыта собеседования, чтобы меня приняли в качестве специалиста по данным в корпоративной компании.

Процесс собеседования очень похож на процесс собеседования многих людей. После моего первоначального заявления я получаю электронные письма для теста технической оценки, который состоит из тестов Python и SQL для специалиста по данным.

Я хорошо справляюсь с тестом Python, но провалилась на тесте SQL. Я мало работал над тестом SQL и не смог отправить работающий код SQL. Однако, даже несмотря на провальный тест SQL, меня все равно приглашают на дальнейшие собеседования с HR и Business User, что удивительно. Я спросил, почему я все еще получаю интервью даже с проваленным тестом SQL; ответ заключается в том, что мой код все еще сносный, а программирование — не единственное, за что следует оценивать специалистов по данным.

Интервью у тебя прошло хорошо. Следующий шаг — пользовательское интервью, где большинство вопросов носят общий характер — что я делал раньше, мои стремления в компании, мой стиль работы и общие вещи. За ним следует в тот же день собеседование с персоналом, чтобы оценить мою личность и зарплату.

После собеседования я получил электронное письмо с запросом на еще один технический тест: проект по науке о данных, который мне нужно выполнить и представить бизнес-пользователю через неделю. Проект по науке о данных предоставляет модель машинного обучения и объяснимость прогностических функций. Мне нужно объяснить мой рабочий процесс и то, как я пришел к результату, я подробно рассказал. Как я уже делал ранее, не так уж сложно проанализировать данные и обработать результат анализа.

Весь процесс приводит меня к получению предложения о работе, и я принимаю его, но с запасом в несколько месяцев, чтобы закончить свою работу в предыдущих компаниях. Общее время подачи моего заявления о приеме на работу для получения предложений о работе может занять около месяца — довольно быстро, я говорю, для корпоративной компании.

Рабочая деятельность

Я работал как в стартапе, так и в корпоративной сфере в качестве специалиста по данным, чтобы поделиться своим опытом в различных сферах деятельности между стартапом и корпорацией. Однако, поскольку в этой статье речь пойдет только о моем корпоративном опыте, я бы не стал много говорить о своем стартап-опыте. Но я могу сказать, что стартапы развиваются быстрее, чем корпоративные; все в стартапе требует, чтобы я делал все.

Если мне нужно сравнить свой опыт, то мне очень нравится проводить время в качестве специалиста по обработке и анализу данных в корпорации, а не в стартапе. Мне это нравится, потому что я не только работаю за зарплату, но и у меня есть огромные возможности учиться. Обучение — это не только технические вещи, но и социальные навыки, такие как общение, управление проектами, работа в команде и многое другое.

Обучение пришло из моей различной рабочей деятельности. Люди могут представить себе работу специалистом по данным; вы будете разрабатывать модель машинного обучения каждый день или очищать и собирать данные для моей модели — это моя основная обязанность. Тем не менее, моя работа требовала от меня большего. Чтобы объяснить свою работу более эффективно, я бы классифицировал свои обязанности в следующую категорию.

Управлять проектом по науке о данных

В моей деятельности управление проектами по науке о данных не ограничивало строго технический аспект, но также и все, что связано с проектом по науке о данных. Проект по науке о данных — это всегда проект, который инициируется, потому что мы хотим решить бизнес-проблемы, а это значит, что проект начинается с проблемы.

В моей деятельности бизнес-пользователи обращались в мой отдел, потому что им нужно было решить проблему. Мы, как специалисты по данным, проводили мозговой штурм о том, как мы подошли бы к бизнес-проблеме с помощью анализа данных. Кроме того, я буду выступать посредником во всех требованиях бизнес-пользователей и организовывать различные встречи со связанными сторонами для достижения понимания бизнеса.

Могу сказать, что половина моего рабочего времени уходит на конференцию. Зачем много встреч? Корпоративные компании по своей сути отличаются от технологических стартапов. В стартапах компания полагается на технологии для управления своим бизнесом, но корпоративный подход в основном консервативен. Специалистам по данным в корпорации необходимо постоянно доказывать, почему их модель машинного обучения ценна для бизнеса и как ее влияние может быть подтверждено с помощью бизнес-измерений, поэтому требуется постоянное общение с бизнесом. Большая часть моих деловых встреч состоит в том, чтобы узнать, чего хочет бизнес, и представить результат, чтобы бизнес понял.

Управление проектом по науке о данных также включает в себя выполнение всего необходимого администрирования в компании. Администрирование включает в себя доступ к данным, конфиденциальность данных, утверждение проекта, документацию, отчет о ключевых показателях эффективности бизнеса и многое другое. У корпоративной компании много требований к администрированию, и, поскольку специалисты по данным работают со многими частными данными, на работе обязательно будет много административных задач.

Важнейшей частью управления проектом по науке о данных является установление надлежащего графика и рабочих задач в команде. Мы должны соблюдать план, который мы создали, чтобы бизнес мог двигаться хорошо. Даже если мы хотим следовать плану, самая сложная часть — это жонглирование техническими и бизнес-требованиями, которые могут соответствовать графику, потому что во время проекта может произойти многое.

Короче говоря, для корпоративных специалистов по данным нам нужны эти социальные навыки, которые могут очень хорошо управлять проектом по науке о данных. Специалист по обработке и анализу данных должен соединить бизнес- и технические требования для достижения того, что нужно компании.

Посол данных в компании

Что значит стать послом данных? Это означает распространение знаний об аналитике данных и ее полезности в их бизнес-процессах. Это то, о чем я упоминал выше; корпоративная компания не обязательно знает, что такое аналитика данных и насколько ценна сила данных в бизнесе. Вот почему специалисты по данным и эксперты по данным в компании должны распространять информацию о том, насколько достоверны данные в своей повседневной работе.

В моей деятельности мы обучаем людей работе с данными посредством обучения, выездных презентаций и активной работы с бизнес-пользователями. Интегрировать культуру данных внутри компании непросто, но постепенно люди понимают, насколько полезна наша деятельность.

Разработка модели машинного обучения

Когда я не занят на деловой встрече или не обучаю людей работе с данными, мне нужно разработать модель машинного обучения. Я знаю, что это моя главная обязанность и почему меня наняли. Тем не менее, встречи по проекту отнимают у меня рабочее время, а развитие тормозится. Тем не менее, я по-прежнему обязан совмещать все эти действия, чтобы выполнять свою работу, поэтому я научился хорошо управлять своим временем.

Разработка модели машинного обучения для проекта по науке о данных не ограничивается самой моделью, но мне нужно сделать это от начала до конца. Это означает, что от понимания бизнеса до модели я должен проводить мониторинг и оценку бизнеса. Я не работаю один над созданием сквозного проекта, но ответственность по-прежнему лежит на мне.

Создайте руководство по науке о данных

С этой работой может не справиться каждый, но, к счастью, компания доверила мне создание стандарта для нашего проекта данных. Стандарт используется для любого нового и текущего проекта, поэтому все действия в нашей повседневной работе похожи. Также он используется для любого входящего специалиста по данным при начале работы в нашей компании.

Руководство, которое я пытаюсь разработать, включает в себя все действия по науке о данных, такие как разработка модели машинного обучения, хранение данных, необходимые исследования и многое другое. Конечно, это всего лишь схема того, что должен делать специалист по данным, но в реальных работах специалисту по данным разрешается делать много вещей, выходящих за рамки руководства, если это будет сочтено необходимым.

В последнее время я также занимаюсь созданием аналитической платформы, используемой в нашей компании. Я настаивал на некоторых изменениях, чтобы улучшить наш рабочий процесс, и многие согласились с этим, поскольку это полезно в нашей повседневной деятельности.

Заключение

Деятельность по науке о данных сильно различается в зависимости от компании — корпоративный специалист по данным будет отличаться от специалиста по данным в стартапе. В этой статье объясняется мой процесс собеседования, чтобы стать специалистом по корпоративным данным, и моя рабочая деятельность.

Таким образом, мою деятельность в качестве корпоративного специалиста по данным можно классифицировать следующим образом:

  1. Управление проектом по науке о данных
  2. Быть послом данных
  3. Разработать модель машинного обучения
  4. Установите руководство по науке о данных

Я надеюсь, что, зная об этой деятельности, люди смогут получить представление о деятельности специалистов по данным и решить, подходит ли им это поле/корпорация данных или нет.

Я надеюсь, что это помогает!

Посетите меня в моем LinkedIn или Twitter.

Если вам нравятся мои материалы и вы хотите получить более глубокие знания о данных или просто о повседневной жизни специалиста по данным, подпишитесь на мою новостную рассылку здесь.

Если вы не подписаны как участник Medium, рассмотрите возможность подписки через моего реферала.

Запланируйте сеанс DDIChat с Cornellius Yudha Wijaya по ссылке ниже.



Подайте заявку на участие в программе DDIChat Expert здесь.
Работайте с DDI: https://datadriveninvestor.com/collaborate
Подпишитесь на DDIntel здесь.