Я часто слышу вопрос: «Какие навыки мне нужно освоить, чтобы стать эффективным специалистом по данным?» Это проявляется в наставнических сессиях, 1: 1 с членами команды, сессиях вопросов и ответов со студентами и т. Д. Независимо от того, хотите ли вы попасть в эту область или уже являетесь специалистом по обработке данных, это актуальная тема, поскольку всем нам необходимо продолжать совершенствовать свои навыки по мере роста нашей карьеры. Но на каких сферах следует сосредоточиться? Хотя область науки о данных постоянно меняется, мы создали структуру, которая выдержала испытание временем. В этом посте мы рассмотрим три ключевые области, которые помогут вам и дальше совершенствовать свои навыки. Вот несколько быстрых ссылок на каждый раздел (обратите внимание, эти ссылки могут не работать, если вы читаете эту статью на мобильном устройстве):

Диаграмма Венна для анализа данных

  1. Технические навыки
  2. Деловой контекст
  3. Мягкие навыки

Собираем все вместе (нематериальные активы, единорог, напутствие и план)

Часто задаваемые вопросы

Диаграмма Венна для анализа данных

Множество диаграмм Венна было использовано для описания области науки о данных. Конечно, все началось с оригинальной диаграммы Конвея-Венна. Затем идет Битва диаграмм Венна в области науки о данных с рядом вариаций, которые со временем были созданы другими. Каждый из этих вариантов не только увлекателен, но и предлагает хорошие моменты и перспективы. И разнообразие точек зрения имеет смысл, поскольку область науки о данных развивается, и она также разнообразна.

Мы хотели бы суммировать многие навыки, которые объединяют специалиста по обработке данных, в три основные категории:

Я не рисовал эту диаграмму в каком-либо масштабе, чтобы вы могли обсудить относительные размеры этих трех категорий. Однако «технический», вероятно, является одной из самых больших категорий, учитывая множество аспектов, которые он влечет за собой, поэтому мы начнем с него.

Технические навыки

«Технические» охватывает широкий набор возможностей. В этом разделе мы рассмотрим, что означает каждая из этих областей технических навыков и как применить их в своей работе.

Аналитическое решение проблем. Прежде чем вы получите какие-либо данные, вы сначала должны понять проблему, которую пытаетесь решить. Наличие такой точки зрения, которая поможет наметить дальнейший путь, является ключом к достижению цели. Кроме того, эффективное суждение для оценки подходов, выбор правильной формулы и применение соответствующих точек данных - все это ключ к успешному результату. Без него вы можете непреднамеренно показать соотношение в обратном направлении, подставить неправильные точки данных или иным образом манипулировать данными некорректным образом. Роли в области науки о данных часто определяют количественные области обучения в качестве предпочтительных ученых степеней для поощрения такого рода критического мышления.

Статистические концепции и методы. Еще одним важным навыком для правильной обработки данных является статистика. Сюда входят такие концепции, как распределения вероятностей, доверительные интервалы, регрессионный анализ и проверка гипотез. Статистика - одна из многих образовательных сфер, хорошо согласующихся с наукой о данных. Для всех специалистов по обработке данных важно иметь достаточный фундамент в области статистики, чтобы развить интуицию в отношении разумных подходов, а также понимание ключевых концепций. Опасность заключается в том, что если вы не знаете, что необходимо проверить дополнительные соображения (например, размер выборки, распределение и статистическую значимость), вы можете поделиться непроверенным анализом с заинтересованной стороной и ввести их в заблуждение, сообщив результаты.

Языки (SQL, Python, R и Kusto): свободное владение одними языками программирования и способность изучать другие - ключ к вашей эффективности и продуктивности на своей должности. Эти языки используются для управления данными, реализации моделей машинного обучения и разработки программных решений. На любом собеседовании по науке о данных в какой-то момент вам будут заданы вопросы, чтобы убедиться, что вы знакомы с общими концепциями запросов, такими как объединения, а также с синтаксисом программирования на выбранном вами языке. Также полезно иметь опыт работы с такими инструментами, как записные книжки Jupyter и R Studio, как с эффективными средами, в которых вы можете создавать и обмениваться документами с помощью живого кода.

Моделирование машинного обучения. Машинное обучение - одна из областей, о которой вы больше всего слышите в науке о данных, и она, безусловно, захватывающая и мощная. Существует множество методов моделирования, таких как контролируемое и неконтролируемое обучение, классификация и регрессия, кластеризация, глубокое обучение, обучение с подкреплением и многое другое. Они используются в различных приложениях, таких как рекомендательные модели, обработка естественного языка, модели сегментации, модели прогнозирования и модели склонности. Эти модели помогают нам понять текущую динамику, предсказать будущие результаты и рекомендовать действия пользователей. Полезно получить опыт работы с различными возникающими корпоративными сценариями, такими как обработка зашумленных и / или разреженных данных, предоставление пользователям объяснимости модели, запуск моделей в производственной среде с помощью ML Ops, переобучение моделей с течением времени, включение отзывов пользователей в модель, и отслеживание производительности модели.

Подготовка данных и управление конвейером. Чтобы начать работу, есть нетривиальный первый шаг по подготовке данных. Часто мы работаем с «большими данными» в реальных корпоративных сценариях. Нам необходимо идентифицировать соответствующие наборы данных, получать разрешения, извлекать соответствующие записи и объединяться с соответствующими идентификаторами для создания значимых соединений. Затем мы продолжаем наше первоначальное исследование данных. Это включает в себя проверку качества и полноты данных, а также обработку выбросов и другие потребности в очистке данных. Если вы впервые работаете с набором данных, вам может потребоваться прочитать внутреннюю документацию или протестировать сценарий, чтобы проверить данные, которые он генерирует. Также могут быть случаи, когда телеметрия недоступна, и вам необходимо разработать новые приборы. Если вы настраиваете производственную модель для работы с этим набором данных, вам нужно спроектировать конвейеры таким образом, чтобы обеспечить автоматическое расписание обновления и управление сайтом в реальном времени. Для обеспечения стабильного обслуживания здесь используются концепции DevOps, включая обнаружение аномалий, надежность, время безотказной работы и соглашения об уровне обслуживания. Наконец, вы должны быть знакомы с политиками в отношении конфиденциальности данных, GDPR, этики и безопасности, чтобы гарантировать, что данные обрабатываются надлежащим образом.

Экспериментирование. Проведение экспериментов - ключ к инновациям в культуре, основанной на данных. Последовательные испытания случайного контроля могут помочь команде обнаружить драйверы и выяснить, какой из них оказывает существенное влияние на бизнес-цели. Чтобы эффективно руководить этими действиями, вы должны уметь разрабатывать правильные эксперименты и анализировать результаты. Это включает в себя формирование гипотез, построение надлежащих контрольных групп, учет систематических ошибок, выполнение статистических тестов и заключение результатов. И, наконец, опыт работы с советами по обзору экспериментов, применение этических норм, разработка и использование схем экспериментов, управление пересекающимися экспериментами с множественной атрибуцией и отчетность о результатах экспериментов в масштабе - все это важные навыки на рабочем месте. Опыт применения методов причинного вывода также может быть полезен для анализа воздействия.

Визуализация данных. Когда пришло время представить наши результаты, визуальные эффекты помогут рассказать историю. Важно кратко общаться с заинтересованными сторонами, чтобы очки потреблялись и запоминались, а визуализация данных - эффективный инструмент для достижения этой цели. Несколько передовых практик помогают передать сообщение с помощью визуальных эффектов. К ним относятся выбор оптимального типа диаграммы, упрощение (путем удаления ненужных линий или точек данных), уменьшение цветов, сосредоточение внимания на ключевых моментах, увеличение размера текста и его читабельность, выравнивание по сетке и многое другое. Вот несколько книг, которые нам нравятся и содержат практические советы: Рассказывание историй с помощью данных, Руководство по информационной графике Wall Street Journal, Дизайн информационной панели и Визуальное отображение количественной информации.

Деловой контекст

Один из самых захватывающих аспектов науки о данных - это возможность применять данные в бизнес-сценариях. Это включает использование данных для информирования бизнес-решений и разработку сервисов искусственного интеллекта для повышения качества обслуживания клиентов. Но чтобы добиться успеха в этих корпоративных проектах по науке о данных, вы должны понимать бизнес-сценарии и сценарии клиентов. Фактически, это понимание полезно для любой работы в отрасли. Вот почему сотрудники Starbucks проводят дегустацию, сотрудники Airbnb принимают гостей и останавливаются в отелях, а сотрудники Amazon посещают центры выполнения заказов. Точно так же в Azure мы вместе с нашей группой поддержки принимаем звонки клиентов, пробуем наш продукт и посещаем центры обработки данных. Если вы станете ближе к клиенту, это создаст новый уровень осознания и сочувствия. Он также предоставляет контекст того, как разные отделы должны работать вместе, чтобы обеспечить непрерывную работу. Ориентация на клиента - хороший компас, который поможет вам принять любое решение, основанное на том, что лучше для клиента. Наконец, этот фон может помочь найти идеи о том, как повлиять на вашу роль.

Хотя бизнес-контекст имеет решающее значение для любой бизнес-роли, в этом разделе мы расскажем, почему он особенно важен для науки о данных. Для специалиста по данным бизнес-контекст включает в себя понимание пользовательских сценариев, тесную связь со своим заинтересованным лицом и знание предметной области в наборе данных. Данные могут вводить в заблуждение при неправильном использовании, и один из многих способов неправильного использования данных - неверное истолкование значения поля в базе данных. Поэтому очень важно вести хорошую документацию и понимать, что представляют собой данные. Этот контекст также помогает выявлять проблемы с качеством данных (давая представление об ожидаемых пределах), раскрывать результаты (путем выявления интересных тенденций для бизнеса) и вдохновлять на новые идеи относительно того, что исследовать или моделировать дальше. Понимание целей анализа часто является ключевым отличием для превращения данных в идеи, формулируя результаты в действенной форме.

Хотя ваша конкретная область приложения будет отличаться, в этом разделе мы приведем примеры из нашего опыта работы с продуктами Microsoft, чтобы помочь найти идеи о том, как расширить понимание бизнеса в вашей компании. В Azure нам необходимо иметь техническое представление о службах Azure, которые используют клиенты (показано ниже), и решениях, которые они создают:

Нам также необходимо понимать опыт взаимодействия различных аудиторий с сайтами, программами и службами Microsoft:

Итак, как вы построите этот контекст? Вот несколько подходов:

Используйте учебные материалы. Вероятно, у вашей компании достаточно ресурсов, чтобы пользователи могли научиться пользоваться ее продуктами. Это тоже может быть отличным ресурсом для изучения. Для Azure это включает Azure.com, Документы, MS Learn, Channel9, Вебинары, Шаблоны быстрого запуска, Центр знаний и другие. Если вы учитесь в команде, запланируйте повторяющуюся коричневую сумку и назначьте членов команды, которые будут исследовать и представлять темы на каждом занятии. Вы также можете посмотреть выступления руководителей и демонстрации сессий с внешних выставок, чтобы лучше разбираться в сценариях работы с клиентами. Внутренние общие собрания, отчеты о прибылях и убытках и сессии спросите что угодно - это дополнительные возможности услышать от руководителей о компании и направлениях продукта.

Разработайте проект. Найдите проект, который вы заинтересованы в завершении и который предполагает использование продукта. Это может быть личный проект или инициатива, с которой вы добровольно помогаете на работе. Наличие конкретной конечной цели заставит вас проработать сценарии и в конечном итоге узнать больше, по сравнению с простым просмотром учебных материалов выше. Чтобы держать себя в курсе, вы также можете установить крайний срок, например презентацию события, в качестве функции принуждения к расстановке приоритетов в этой учебной деятельности.

Слушайте клиентов. Присоединяйтесь к звонкам в службу поддержки, мероприятиям или доскам объявлений, чтобы узнать, что думают клиенты. Если у вас нет доступа к ним в вашей организации, занимающейся наукой о данных, спросите заинтересованных лиц своего бизнеса о возможностях, к которым вы можете присоединиться. Конкуренция и направление рынка - тоже хорошие аспекты, о которых следует знать. Подумайте о новых идеях и подходах, которые команда может использовать для достижения стратегических целей.

Задокументируйте свое понимание. По мере обучения документируйте свое понимание, чтобы другие также могли извлечь из этого пользу. Создание документации для пользовательских потоков и взаимодействия может стать мощным шагом для согласования различных частей организации. Это также помогает убедиться, что вы правильно интерпретируете данные, разъясняя бизнес-процесс, который они представляют. Каждый раз, когда вы делитесь черновиком с другим человеком, вы узнаете немного больше о том, как все происходит на самом деле, и в конечном итоге получите артефакт, который является точным отображением истины. (Это улучшенное межгрупповое понимание полезно и для ваших заинтересованных сторон.) По мере роста размера вашей компании и увеличения числа команд, вносящих свой вклад в улучшение качества обслуживания клиентов, общее понимание и письменные артефакты становятся еще более важными. Ниже приведен пример из пользовательского потока Azure Marketplace.

Мягкие навыки

Традиционно учебные материалы по науке о данных сосредоточены на технических навыках. Однако в любой момент времени я обнаруживаю, что области, которые члены моей команды отдают приоритетом для своего карьерного роста, довольно равномерно распределяются между тремя категориями, представленными ранее (технические, деловые и мягкие навыки). Все чаще и чаще я вижу, что эти темы поднимаются на отраслевых конференциях на тему «советы, как стать успешным специалистом по данным на предприятии». Приятно видеть растущее признание этого. Я считаю, что межличностные навыки являются ключевым аспектом способности человека оказывать сильное влияние и продвигаться по карьерной лестнице в организации. Итак, каковы основные мягкие навыки специалистов по данным?

Коммуникация. Как специалисты по обработке данных, если мы разработаем наиболее инновационное решение, но никто о нем не узнает, какое влияние оно действительно может оказать? Ученые должны говорить, и специалисты по данным не исключение. Когда мы говорим, мы также должны быть уверены, что наше сообщение донесено до нас. Чтобы пообщаться с занятым руководителем, общение должно быть четким и лаконичным. Хорошо иметь дополнительные детали в заднем кармане, но многие из них можно сохранить для сеанса вопросов и ответов. Нам также необходимо делиться фактами таким образом, чтобы точно передать информацию, почему это важно и какие действия следует предпринять. Повествование данных - ключевой навык для создания этой сюжетной арки. Чтобы узнать больше, посетите тренинги LinkedIn по Навыкам презентации и Публичные выступления, запишитесь на курс Coursera по научному письму, присоединитесь к Toastmasters, наймите коуча по говорению (у нас был хороший опыт работы с Ричардом Клисом »), А главное: практика, практика, практика. Для быстрых результатов найдите друга по обучению (или вашего менеджера), который будет давать обратную связь после каждой презентации, в том числе о том, что прошло хорошо и что вы можете улучшить.

Влияние. С общением связана способность оказывать влияние. Специалист по анализу данных должен уметь поддерживать цифры, независимо от того, представляют ли они «хорошие» или «плохие» новости. В лучшем случае наука о данных - это тесное сотрудничество с группами заинтересованных сторон. Вместо того, чтобы просто обслуживать точки данных, специалист по анализу данных должен предлагать идеи (на основе анализа данных) относительно стратегической инициативы, которую следует предпринять дальше. Наконец, специалист по анализу данных должен иметь возможность сказать «нет» низкоприоритетным вопросам и вопросам любопытства, чтобы сосредоточиться на проектах с максимальным влиянием на бизнес.

Сотрудничество. В то же время специалисты по анализу данных должны максимально эффективно сотрудничать как с заинтересованными сторонами, так и с другими членами группы специалистов по анализу данных. Хотя есть возможности для достижения результатов независимо, есть также много командных проектов, над которыми можно сотрудничать. Учитывая наш разнообразный опыт, мы склонны создавать среду, в которой члены команды могут собирать идеи и мнения более широкой группы. Это помогает поддерживать последовательность в нашей работе, гарантируя, что мы применяем общие передовые практики.

Организация. Хорошие организаторские навыки важны для эффективности каждого, но особенно для специалистов по данным. Нет недостатка в вопросах, на которые мы хотим ответить с помощью данных, поэтому важно определить приоритетность невыполненной работы. Специалистам по обработке данных необходимо «оценивать» и планировать свои проекты, чтобы другие могли рассчитывать на их выполнение. Документирование требований к проекту, отслеживание рабочих элементов и публикация результатов - все это отличные передовые практики.

Собираем все вместе

Хотя основное внимание в этой статье уделяется «инструментам» или набору навыков специалистов по анализу данных, стоит уделить время обсуждению того, что специалисты по данным делают со всеми этими инструментами. Например, если бы мы определили художника-керамиста по его инструментам (гончарный круг, кусачки, угловые ножи, формовочные инструменты, губка, кисти, штангенциркуль, печь и т. Д.), Мы бы упустили суть того, что они делают ( создают искусство!), и поэтому им не хватает контекста того, для чего они используют эти инструменты.

В более ранней публикации Рона Сиелински Роль специалиста по данным он цитирует следующее определение Жаннетт М. Винг: Наука о данных - это исследование извлечения ценности из данных. Эта ценность (то есть то, что делают специалисты по данным) выражается в аналитических выводах, моделях машинного обучения, результатах экспериментов и многом другом. Для получения дополнительных сведений см. Статью о конкретных результатах работы с данными по ролям.

Подобно гончару, которому необходимо сочетать приобретенные навыки и инструменты с собственным врожденным художественным стилем, специалист по анализу данных также объединяет искусство и науку.

Нематериальные активы

Это подводит меня к «нематериальным активам» - более врожденным характеристикам эффективных специалистов по анализу данных, которые не перечислены ни в одной магистерской программе по науке о данных, но являются ключевыми чертами для тех, кто преуспел в этой области.

Любопытство. Одна из самых забавных сторон работы специалиста по данным - это открывать сюрпризы. Пока мы разрабатываем продукт или программу с учетом конкретного случая использования, пользователи могут найти новые способы воспользоваться этим, а данные телеметрии - это путь к раскрытию истины. Глядя на данные по одной вещи, мы можем также заметить другую тенденцию, которая, как оказалось, может помочь нам в понимании этого вопроса. Но без любопытства это прозрение могло остаться незамеченным. Еще одна ключевая тенденция, которую замечают любопытные специалисты по данным, касается качества данных, что является ключом к возможности проводить высококачественный анализ.

Креативность: В предыдущей статье Рон отметил важность креативности для науки о данных как одного из самых ценных навыков специалиста по данным, но часто наименее подчеркиваемого. , и, безусловно, самый трудный для выращивания . Креативный специалист по данным предложит идеи для новых сервисов искусственного интеллекта, чтобы улучшить качество обслуживания клиентов, соединяя точки с данными. Креативность также помогает справляться с неизбежными препятствиями, которые возникают на пути, и вдохновляет на то, как с ними справиться.

Настойчивость. Твердая решимость и стремление к результатам помогает специалистам по обработке данных справляться с трудностями. (Некоторые также называют это «постоянством».) Для специалиста по данным это может включать в себя работу с разрешениями на доступ к данным, поиск способов объединения разрозненных наборов данных, обработку зашумленных данных с выбросами, повышение производительности модели, навигацию по ограничениям экспериментов. , и обработка ограничений ресурсов.

Установка на рост. Установка на рост - это вера в то, что вы можете научиться всему, чему захотите. Речь идет о столкновении с проблемами, связанных с волнением по поводу предоставляемой ими возможности обучения, а не с разочарованием из-за риска неудачи. Для специалиста по обработке данных установка на рост (или подход учи все) является ключом к овладению многими навыками, обсуждаемыми в этом посте. Это также означает, что вы будете более открыты для обратной связи, что значительно повысит ваше влияние.

Страсть. Конечно, если кто-то увлечен своей работой, тем лучше он ее сделает. Страстные специалисты по данным с энтузиазмом относятся к применению науки в бизнесе и хотят работать в культуре, основанной на данных (а не полагаться на мнение). Я часто вижу кандидатов, обращающихся в нашу команду, которые испытали другие методы принятия решений и хотят быть частью более структурированного подхода.

Единорог

Прочитав этот длинный список, вы можете почувствовать себя немного ошеломленным. Если да, то вы не одиноки. На самом деле существует придуманный термин «единорог-специалист по данным», потому что очень редко можно найти человека, который удовлетворяет всем критериям. Среди профессий набор навыков специалиста по данным является одним из самых разнообразных. Некоторые шутят, что описание должности специалиста по данным - это действительно «список желаний». Хотя каждый навык полезен, можно начать с подмножества, продолжая развивать остальные.

Фактически, диаграмма Венна в области анализа данных можно интерпретировать еще одним способом: она представляет собой команду, занимающуюся анализом данных, а не отдельного человека. То есть, даже если каждый человек не выполняет все задачи, мы можем решить их, наняв команду с дополнительными сильными сторонами. Таким образом, собрать команду - все равно что собрать оркестр. Не каждому человеку нужно быть экспертом во всем - им просто нужно хорошо работать вместе.

Я рекомендую провести собственную оценку навыков. Подумайте о своих настоящих суперсилах и найдите роли, которые их задействуют. В то же время осознавайте себя и осознавайте свои возможности для развития. Затем расставьте приоритеты в планах обучения, исходя из того, что поможет вам быть самодостаточным и окажет наибольшее влияние на вашу работу.

Бодрый разговор

В результате наличия такого длинного списка требований специалисты по обработке данных часто испытывают «синдром самозванца». Это ощущение, что даже если у вас есть работа в области науки о данных или достижения в области науки о данных, вы боитесь, что вы мошенник - что вам «повезло» с этими достижениями - и вы не принадлежите на самом деле. Синдром самозванца часто встречается в индустрии высоких технологий.

Лично мне нравится переворачивать это с ног на голову и сохранять здоровый вид, помня о том, что никто не знает всего в мире технологий. Фактически, чем больше ты знаешь, тем больше осознаешь, что не знаешь. В этом вся прелесть технологий. Он постоянно развивается, поэтому мы можем постоянно исследовать и вносить новые идеи. Если вас радует возможность расти и учиться на протяжении всей жизни, вы найдете это мотивирующим, и вам никогда не будет скучно делать одно и то же снова и снова.

Конечно, наш внутренний критик иногда бывает полезен. Это подталкивает нас к достижению большего и лучшему. Однако когда он достигает слишком высокого уровня, это может быть изнурительным. Внутренний критик, внутренний успех предлагает для этого технику адвоката дьявола. Если вы думаете, что не разбираетесь в какой-то конкретной теме, вы можете использовать обратную психологию, чтобы извлечь все, что вы действительно знаете, а затем опираться на это. В конце концов, цель - достичь здорового уровня самосознания.

Планируйте свою работу и работайте над своим планом

Теперь, когда вы знаете, где стоите, подумайте, куда вы хотите двигаться дальше. Один из инструментов, который вы можете использовать, чтобы понять это, - это шаблон карьерного плана. В Интернете доступно множество версий, поэтому не стесняйтесь выбирать ту, которая вам подходит. Главное - найти время для этого размышления и принять во внимание свои ценности, навыки и увлечения. Вспомните прекрасный день, а затем выясните, что вас больше всего взволновало.

Предполагая, что это по-прежнему ведет вас к карьере в области науки о данных, следующим шагом будет составление плана обучения. Выберите несколько областей, которыми вы хотите заняться, и занятия, которые вас туда приведут. Ниже приведены некоторые примеры. Выберите два-три вида деятельности, на которых вы будете сосредоточиваться каждые три-четыре месяца, а затем назначьте встречу со своим менеджером, чтобы держать себя в руках. Возможно, вам будет полезно назначить конкретное время в своем расписании для проведения этих тренировок. В нашей команде мы выделяем послеобеденное время по четвергам для обучения и развития.

Часто задаваемые вопросы

Эта структура является полезным руководством как для людей, заинтересованных в изучении данных, так и для людей, заинтересованных в развитии своей карьеры в области науки о данных на любом уровне. Вот несколько вопросов, которые я часто получаю:

Какие роли доступны в области науки о данных?

Эта статья основана на наших предыдущих статьях, посвященных этой теме:

Какие ресурсы рекомендуются для обучения техническим навыкам?

Есть много способов приобрести технические навыки в области науки о данных, начиная с учебного лагеря и заканчивая формальной степенью (бакалавр, магистр или доктор философии). Конечно, чем тщательнее программа, тем более комплексным будет обучение. За последнее десятилетие стало доступно все больше программ по науке о данных. Если вы осваиваете эти навыки во время работы (что также дает вам возможность практиковать их на работе), вы можете воспользоваться вечерними программами и программами на выходных, а также книгами и МООК (массовые открытые онлайн-курсы).

Каков идеальный фон для работы в области науки о данных?

Наука о данных привлекает людей с самыми разными знаниями. Хотя большинство инженеров-программистов имеют образование в области компьютерных наук, образование для специалистов по данным более равномерно разделено между математикой, статистикой, физикой, экономикой, инженерией и другими прикладными науками. Специалисты по обработке данных могут иметь опыт работы в области финансов, консалтинга, администрирования баз данных, бизнес-планирования, разработки программного обеспечения и т. Д. Одним из преимуществ объединения разнопланового опыта является то, что мы часто получаем открытые вопросы, что дает нам возможность рассмотреть несколько точек зрения при определении нашего подхода. Учитывая, что большинство университетских программ по наукам о данных было создано в последние пять-десять лет, среди недавних выпускников чаще встречаются дипломы по наукам о данных. Если вам интересно узнать о карьерном росте нынешних членов нашей команды, ознакомьтесь с серией Лица науки о данных.

Я хочу сменить профессию на работу в области науки о данных. (Или я хочу сместить фокус карьеры в области науки о данных с аналитики на машинное обучение.) Что мне делать?

Мои три главных совета - изучить навыки, описанные в этой статье, найти наставника в этой области и получить опыт работы с «практическими» проектами. Преимущество разработки проекта состоит в том, что вы узнаете больше о возможностях и ограничениях инструментов и методов, которые изучаете, преследуя конкретную конечную цель (в отличие от более теоретического изучения). В процессе вы получите лучшее представление о том, что вы знаете и чему вам нужно научиться. Очень важно, вы также подтвердите, действительно ли вам нравится такая работа! Наконец, у вас будет опыт, на который можно будет ссылаться и черпать из него во время собеседования на будущие должности в области науки о данных.

Есть несколько способов начать проект. Один из вариантов - найти его на работе. Вы можете стать волонтером, чтобы помочь команде специалистов по анализу данных (и получить от них наставничество в процессе). Другой вариант - начать новый проект в рамках вашей текущей роли, который принесет пользу бизнесу. Это дает возможность продолжать вносить свой вклад в вашу команду, одновременно осваивая новые навыки и начиная позиционировать себя по-новому. Наконец, вы также можете разработать личный проект и поделиться кодом на GitHub.

Как проходит собеседование?

Наш процесс собеседования состоит из нескольких этапов, включая обзор резюме, первоначальный телефонный звонок с менеджером по найму или подбор персонала, технический экран и, наконец, личное собеседование. (Примечание: личное собеседование в настоящее время проводится удаленно, начиная с марта 2020 года.) В статье из серии интервью Лица науки о данных три члена нашей команды, которые присоединились в начале 2020 года, рассказывают о своем опыте собеседований на Microsoft и предлагает несколько советов и перспектив.

Куда мне подавать документы, если я хочу работать в Microsoft по анализу данных?

Посетите наш сайт вакансий по адресу https://careers.microsoft.com/.

Лиза Коэн в LinkedIn.