Отделение WiMLDS Bay Area в партнерстве с Харнхэмом организовало виртуальную встречу, посвященную смене карьеры в области науки о данных. Три выдающиеся женщины в этой области - Шивон Макнамара, Нандита Дамараджу и Сара Уолман, доктор философии, поделились своим опытом адаптации к новым отраслям, продвижению по службе, смене работы, увольнениям и даже материнству.

Harnham - ведущее глобальное кадровое агентство, специализирующееся на данных и аналитике более 15 лет. Харнхэм открыто выступает за разнообразие и инклюзивность, и они прилагают целенаправленные усилия, чтобы предоставить меньшинствам такие же возможности в мире науки о данных. Их отчеты и опросы по заработной плате и гендерному разрыву дают представление о том, где необходимы улучшения и действия.

Шивон Макнамара: основные компетенции в области науки о данных

Шивон Макнамара - старший специалист по кибербезопасности в Agari. Ее работа включает создание моделей для обнаружения мошеннических писем и фишинга.

Шивон отметила, что наука о данных имеет два направления: техническое и бизнес. Прежде чем приступить к поиску работы, вы обязательно должны решить, над каким аспектом вы хотите работать. Перед собеседованием вам необходимо овладеть четырьмя основными навыками:

Статистика

Шивон подчеркнула важность изучения теории, лежащей в основе центральной предельной теоремы, регрессии (линейной и логистической), t-критериев, анализа временных рядов.

Машинное обучение

Ключевым моментом является выучить несколько концепций, но выучить их очень хорошо. Сосредоточьтесь на некоторых популярных алгоритмах (случайные леса, kNN, регрессия), метриках оценки (матрица неточностей, точность, точность и отзыв) и генерации функций. Убедитесь, что вы знаете не только теорию, лежащую в основе этих тем, но и их использование в бизнесе - как и почему они используются?

При прохождении собеседований вы, вероятно, можете избегать сложных тем, таких как глубокое обучение, внедрение и развертывание, а также NLP (если только этого не требует отрасль).

Код

Python - золотой стандарт для программирования и развертывания в науке о данных. Если вы новичок в Python, изучите основы, прежде чем приступить к манипулированию данными. Некоторые более продвинутые библиотеки - это pandas, matplotlib, numpy, Scikit-learn и tensorflow. Шивон упомянула интервьюcake.com и Lagunita.stanford.edu как прекрасные ресурсы для изучения и практики кодирования.

Для конвейерной разработки хорошо начать с таких фреймворков, как KubeFlow, SageMaker и MLFlow.

Знание предметной области

Измените свой учебный материал в зависимости от домена или отрасли компании. Некоторые примеры:

- Торговые площадки, такие как Amazon и Netflix - освежить в памяти системы рекомендаций и кластеризацию

- Мошенничество и фишинг - ознакомьтесь с несбалансированными данными, обучением без учителя.

- Платформы доставки, такие как Uber и Doordash, - подчеркивают оптимизацию автопарка и равновесие двух рынков.

Шивон закончила свое выступление, подчеркнув важность проявления энтузиазма в интервью - это имеет большое значение!

Нандита Дамараджу: работает специалистом по анализу данных в здравоохранении

Нандита - специалист по машинному обучению в Inflammatix Inc. Ее работа помогает улучшить результаты диагностики инфекционных заболеваний. Нандита рассказал о потенциале пересечения науки о данных и биотехнологии и о том, насколько он уникален.

Данные в науках о жизни прошли долгий путь. Такие процессы, как геномное секвенирование, на которые раньше уходили годы, теперь занимают дни. Существует множество других данных, таких как электронные медицинские карты (EHR), страховые выплаты, носимые фитнес-трекеры и эпидемиология. Кроме того, информационная революция позволила нам эффективно решать насущные проблемы, особенно в клинических испытаниях. Теперь мы можем использовать науку о данных для поиска новых методов лечения рака, прогнозирования реакции пациента на лечение, более быстрой и точной диагностики заболевания.

Сбор данных в науках о жизни сопряжен с множеством проблем. В отличие от финансов и социальных сетей, получение образцов очень дорогое, а вероятность ошибки очень мала. Необходимые законы о конфиденциальности, такие как HIPAA, препятствуют быстрому обмену данными и моделям масштабирования. Ошибки в процессе сбора данных могут привести к потенциально смертельным исходам позже, поскольку Нандита упомянул, как исследования с преимущественно европеоидной выборкой приводили к неоптимальным результатам для меньшинств в течение многих лет.

Барьер для входа в это пространство низкий. Это пересечение подчеркивает передаваемые навыки (Python, манипулирование данными, модели классификации) и знания предметной области, которые можно изучить на работе. Онлайн-курсы по биомедицинской информатике, такие как Stanford Professional Graduate Certificates, могут помочь вам очень быстро овладеть многими необходимыми навыками. В LinkedIn найдите такие названия, как «исследователь биоинформатики» или «вычислительный биолог», и обратитесь к рекрутерам с определенной ролью.

Ощущение того, что ваша работа напрямую помогает людям, - это не то чувство, которое вы получите в других отраслях. Нандита закончила свое выступление, сказав, что ее опыт работы в этой области очень полезен.

Сара Уолман, доктор философии: переход от академической среды к отрасли

Сара является старшим специалистом по обработке данных в Aetna и имеет докторскую степень в области биомедицинской инженерии Северо-Западного университета. Карьера Сары представляла собой серию переходов от академической деятельности к промышленности, от работы в офисе к работе из дома (даже до пандемии!), А затем к материнству. Ее история охватывает ее личную хронологию, поскольку она объясняет плюсы и минусы каждого перехода и то, как она справлялась с ним.

Сара получила степень бакалавра в области биомедицинской инженерии в разгар Великой рецессии в 2009 году. Она решила поступить в докторантуру в Чикаго, где позже напишет диссертацию о моторном контроле мышц большого пальца. Проработав в академии 6 лет, она решила, что хочет применить свои навыки в промышленности. Сара начала работать первым специалистом по обработке данных в компании, занимающейся спортивными технологиями. У них было много высокочастотных данных от датчиков и акселерометров, а также данные потокового видео.

Позже Сара уволилась и переехала в Сан-Франциско, где она присоединилась к стартапу и работала из дома. Ее работа продолжалась с использованием данных датчиков, и ей удалось занять нишу в этом пространстве науки о данных. Сара отметила, что работа на дому изолирует и подтвердила наши текущие опасения по поводу расширенных политик WFH. К сожалению, через год Сара объяснила, что увольнение было похоже на «обряд посвящения в стартап из научной фантастики». Она сразу же начала связываться с рекрутерами, проводить собеседования и через несколько недель получила предложение в Aetna. Сара объясняет свой успех своим опытом работы с сенсорными данными и своим энтузиазмом.

В прошлом году Сара впервые родила и стала мамой. Она отметила, что, хотя она мысленно подготовила себя к жизни в качестве матери, она все же чувствовала, что не справляется. Сара обнаружила, что отдает предпочтение потребностям ребенка, а не работе, но упомянула, что ей повезло с отличным менеджером, который позволил ей работать по гибкому графику. У нее не было очень продолжительного отпуска по беременности и родам, поэтому она также получила краткосрочную нетрудоспособность, чтобы продлить его. Она упомянула, что чувствует себя «отстраненной» от своих сверстниц из-за отпуска по беременности и родам, и теперь работает усерднее, чем когда-либо, чтобы восполнить это.

Сейчас она советует молодым женщинам, столкнувшимся с трудностями на рынке труда, получить ученую степень, чтобы выделиться. Существует несколько магистерских программ, предназначенных только для онлайн-обучения, с отличным учебным курсом по науке о данных, но сначала убедитесь, что у университета отличный послужной список с трудоустройством. Она посоветовала нам продолжать защищать работу других женщин.

Чтобы узнать больше о женщинах, которые также делятся своими инновациями и навыками в области машинного обучения и обработки данных, присоединяйтесь к группе на Meetup, Twitter и подпишитесь на WiMLDS в LinkedIn.

Автор: Намрата Дате