Недавно я получил степень магистра наук о данных после двух лет практической работы в аспирантуре. Учитывая некоторый интерес со стороны людей через LinkedIn и мои прошлые публикации на Medium, я подумал, что некоторым может быть полезно прочитать мою обратную оценку решения и то, что я получил больше всего из этого опыта. Я также хотел обсудить, чего вы должны и чего не должны ожидать от получения степени магистра.

Если вы прочитали заголовок, закатили глаза и подумали: «Вот и снова, другой человек пытается убедить меня, что формальное образование необходимо, чтобы продвинуться в этой профессии», я сразу скажу, что я здесь не для того, чтобы пытаться убедить кого-либо встать на этот конкретный путь. Решение о прохождении магистерской программы было правильным для меня, но не для всех!

Мой путь, описанный ниже, предназначен для помощи тем, кто может оказаться в той же ситуации, в которой я был несколько лет назад. Для тех, кто взвешивает возможность поступить в аспирантуру по науке о данных, но пока не решен, я надеюсь, что эта статья окажется для вас полезной. Кроме того, если вы когда-нибудь захотите поговорить один на один о ваших уникальных обстоятельствах или ситуации, я всегда буду рад поболтать. Вы можете найти мою контактную информацию на моем сайте: www.zach-alexander.com.

Если вы хотите пропустить мой личный путь и перейти к последней части статьи, в которой излагаются несколько ключевых вопросов, которые могут быть полезны при взвешивании вашего решения - смело делайте это!

Мое путешествие

Где я сейчас?

Я сижу здесь сегодня, через три дня после того, как я отправил свой последний проект и завершил все 30 кредитов моей степени магистра в Школе профессиональных исследований CUNY (CUNY SPS). Завтра я официально заканчиваю учебу - и это отличное чувство. Кроме того, шесть месяцев назад я перешел на штатную должность инженера по данным в своей организации. В первую очередь, я помогал быть лидером в создании первого в организации облачного хранилища данных, организовывать конвейеры данных и автоматизировать многие из наших повседневных услуг. В конце концов, мы планируем использовать нашу новую инфраструктуру, чтобы действительно увеличить объем аналитических результатов, настроив нашу систему, чтобы она была более совместимой для машинного обучения и работы с данными. Я очень рад этой работе и возможности работать на должности, которую я хотел найти два года назад, когда я чувствовал себя немного застрявшим в своей карьере. Так как же это случилось? Что ж, во многом я объясняю это поступлением в аспирантуру и тем, что тратил время на работу над проектами, которые дали мне набор навыков, необходимых для того, чтобы продвинуться по этому пути.

Принятие решения

Для меня идея поступить в аспирантуру всегда была в глубине души, особенно когда мне было чуть за двадцать. К тому моменту я закончил бакалавриат около шести лет и чувствовал, что приобрел много ценного опыта работы. Однако я все еще сомневался, в какой области работы я хочу перейти на следующий уровень. У меня было много рабочих интересов - анализ данных, исследования, компьютерное программирование, статистика, математика, веб-разработка и т.д. все путешествие.

В 2017 и 2018 годах я погружался в проекты веб-разработки в нерабочее время и по выходным. Я большой самоучка и лучше всего умею строить вещи самостоятельно, устраняя возникающие проблемы и нахожу ресурсы в Интернете и среди коллег, которые помогут углубить мое понимание. С помощью этого метода я научился создавать простые веб-сайты с помощью фреймворка JavaScript, комфортно работать с командной строкой и получил элементарные знания о том, как настроить интерфейсную и внутреннюю инфраструктуру веб-сайтов. У меня даже было собеседование на вакансию младшего веб-разработчика, но я не смог получить предложение. Я занимался кодированием вместе с очень любезным другом, который научил меня основам функционального и объектно-ориентированного программирования, и многие другие друзья давали советы и идеи о различных карьерных направлениях и программах для выпускников. Благодаря этому опыту я начал сужать различные варианты потенциальной программы аспирантуры.

К началу 2019 года я действительно нервничал на работе. Я знал, что, в конечном итоге, решив поступить в аспирантуру, это решение поможет мне определить направление и по-новому взглянуть на возможные карьерные пути. В то время я недавно переехал в Нью-Йорк, где нашел работу научным сотрудником и специалистом по данным в некоммерческой организации, в которой я работаю сегодня. Я получил эту работу благодаря некоторому предыдущему опыту работы, у меня было довольно хорошее понимание SQL и время от времени я работал с R, но я изо всех сил пытался найти путь вперед, который позволил бы мне проводить более интересные анализы и решать проблемы на работе. Такое чувство сохранялось в течение последних трех-четырех лет, когда я чувствовал, что достиг потолка в том, что я в конечном итоге могу сделать в своей нынешней роли аналитика данных.

Погружение в науку о данных

К тому моменту я много читал о Data Science и постоянно развивающейся области работы с алгоритмами машинного обучения и большими данными, чтобы лучше информировать практику. Все еще не зная, куда я хочу прийти со всем этим, я решил изучить несколько программ аспирантуры, чтобы увидеть, какие темы меня интересовали больше всего. Особо выделялись две программы Data Science, обе базирующиеся в Нью-Йорке: одна была полностью удаленной, а другая - полностью очной. Дополнительно в одной из школ требовался вступительный экзамен. Поэтому перед подачей заявления я прошел исключительный 6-недельный курс линейной алгебры на Coursera и несколько других бесплатных курсов повышения квалификации по SQL и математическому анализу, чтобы пройти вступительный экзамен. К счастью, я прошел большое количество курсов математики в бакалавриате по специальности Биология, и это мне помогло!

В конце концов, меня приняли в обе программы, но я решил продолжить полностью онлайн-программу, учитывая мою сильную склонность к самообучению и потребность работать полный рабочий день.

Основные классы в аспирантуре

Работая полный рабочий день, два курса в семестр казались мне наиболее удобной схемой, когда я чувствовал, что у меня будет достаточно времени, чтобы достаточно глубоко погрузиться в каждый курс, но также я смогу продвинуться по программе менее чем за два года . Программа, которую я выбрал в CUNY SPS, имела онлайн-график, который позволял мне управлять моей работой и графиком жизни (хотя мои выходные и некоторые будние дни были забронированы на два года).

Основные классы программы сосредоточены на нескольких разных вещах:

  • Сбор и управление данными - использование SQL и R для извлечения и упорядочивания данных из множества различных источников (например, текстовых файлов, PDF-файлов, таблиц, json и т. д.). Этот курс был насыщен R и был хорошим введением в использование программного обеспечения для базового анализа, чтения файлов, подключения к базам данных и работы с регулярными выражениями. Мой последний проект для этого курса можно найти здесь.
  • Статистика и вероятность для анализа данных - работа исключительно в R, выполнение базового статистического анализа, а также погружение в байесовскую статистику и гауссовские методы. Класс был чрезвычайно полезен для повторения многого из того, что я узнал в бакалавриате, и был отличным учебником для очень тесной работы в R в течение следующих нескольких семестров.
  • Основы вычислительной математики - более традиционный математический класс, в котором основное внимание уделяется линейной алгебре, исчислению, вероятности, статистической теории и использованию многих из этих методов в R (путем создания собственных функций). Этот курс был для меня одним из самых сложных, но он дал мне гораздо лучшее представление о том, как многие из будущих алгоритмов, которые я буду использовать, работают под капотом.
  • Расширенные методы программирования - это был первый курс, который мы работали исключительно на Python. Большинство заданий было сосредоточено вокруг основ Python, но затем к концу становилось все сложнее, требуя финальных проектов с использованием методов объектно-ориентированного программирования, рекурсии и других более сложных методов программирования.
  • Бизнес-аналитика и интеллектуальный анализ данных - некоторые проходили этот курс раньше в программе, но я дождался своего предпоследнего семестра, чтобы пройти его. Он был в основном на R и много работал с регрессионным и линейным анализом.
  • Знания и визуальная аналитика - этот класс углубился в визуализацию данных и представил работы и проекты во многих библиотеках визуализации. Мы работали с R (Shiny), Python (Plotly) и в конечном итоге перешли к визуализации в JavaScript (D3.js). Я прекрасно провел время в этом курсе, учитывая мои предыдущие знания JavaScript - мой последний проект для этого курса можно найти здесь.

Элективные курсы

  • Рекомендательные системы - безусловно, самый сложный класс, который я выбрал, но тот, из которого я получил больше всего. Это действительно помогло мне получить работу инженера по данным! Мы узнали о различных типах рекомендательных систем, работали над созданием собственных движков на R и Python, и даже были подтолкнули к завершению проекта, который работал с фреймворками больших данных, такими как PySpark и / или Hadoop. И все это за 7 недель, ведь это был летний курс! Мой последний проект можно найти здесь.
  • Веб-аналитика - глубокое погружение в теорию графов и использование данных социальных сетей для поиска связей между сетями. Очень увлекательный урок, чтобы узнать больше о том, как работают графики. Я чувствую, что с этим курсом мы смогли лишь немного коснуться поверхности, учитывая сокращенную продолжительность летнего семестра (также всего за 7 недель).
  • Машинное обучение и большие данные. Это было не столько «большие данные», сколько алгоритмы машинного обучения. Мы коснулись многих основных методов обучения с учителем и без учителя. Это был отличный курс, чтобы задать вопрос, когда использовать определенные алгоритмы, как правильно оценивать выходные данные модели, и поднял мои навыки Data Science на новый уровень.

Замковый проект

  • Создание солнечного калькулятора и развертывание как полнофункционального приложения - я планирую написать отдельную статью об этом проекте, но она в основном включает в себя многие уроки двух последних годы. Это была уникальная задача - интегрировать довольно сложную симуляцию модели в сложную инженерную инфраструктуру с помощью Python, JavaScript и Postgresql; полностью развернут в Google Firebase и Heroku (фронтенд и бэкэнд развертывания). Окончательную версию приложения можно найти здесь.

Полностью представив вам свое путешествие, я хотел вкратце взглянуть на несколько вещей, которые степень магистра может и не может сделать для вас.

Пять ключевых вещей, которые может сделать магистр

  • Получив диплом, я стал намного увереннее в своей новой роли инженера по обработке данных. Имея представление о многих аспектах алгоритмов и анализа данных, которые мы хотели бы применить к нашим данным, я могу критически относиться к определенным инфраструктурным решениям, программному обеспечению и структурам, которые помогут оптимизировать наши рабочие процессы в будущем.
  • Я встретил большое сообщество коллег-специалистов по анализу данных! Хотя программа была полностью удаленной, я постоянно общался с другими через Slack и Google Hangouts. Это был отличный способ учиться у других, сотрудничать в проектах с коллегами с разными навыками и опытом и, в конечном итоге, увидеть, как вы становитесь лучше благодаря этим ежедневным взаимодействиям.
  • Это дало мне больше доверия на работе - теперь я лучше понимаю платформы и системы данных в моей организации, и я помогаю создавать нашу облачную инфраструктуру для более чем 700 сотрудников. Без моей степени мне было бы труднее выступать за то, чтобы меня поставили на эту должность и чтобы мне доверили некоторые из этих решений, которые повлияют на многих людей.
  • Я так много получил от своих портфельных проектов. Большинство семестров требовали большого заключительного проекта, и я действительно старался убедиться, что мои проекты могут быть продемонстрированы будущим работодателям. Сделав этот дополнительный шаг, у меня теперь есть хороший набор проектов, к которым я могу вернуться, и я действительно глубоко погрузился в контент, который я изучил при их создании - это помогает с любыми будущими интервью или проектами.
  • Мои проекты и задания дали мне возможность ближе познакомиться как с R, так и с Python. Теперь я очень уверен, что, если бы мне пришлось работать с любым из языков (сейчас я в основном работаю с Python, но много работал с R в ранней части программы), я смогу использовать его для любого проекта, который я бы попросили сделать.

Пять ключевых вещей, которые не позволяет получить степень магистра

  • Хотя мне посчастливилось использовать свою степень каждый день на работе, получение степени магистра не всегда гарантирует, что вы сможете найти работу в Data Science или Data Engineering. Очевидно, я уверен, но об этом обязательно нужно сообщить.
  • Просто получив степень, вы не приобретете автоматически все необходимые навыки в области науки о данных, которые понадобятся вам для работы. На самом деле получение степени - это только начало. Это определенно верно для меня. Я каждый день изучаю новую информацию о передовых инженерных технологиях. Эта область постоянно развивается, поэтому вы не станете экспертом в предметной области сразу после окончания учебы.
  • Часто степень магистра не подготовит вас к будущим собеседованиям на эти должности. Скорее всего, вам нужно будет по-настоящему попрактиковаться, решить задачи по программированию и тщательно изучить компании / организации, в которые вы подаете заявку. Аспирантура может дать вам множество основ, которые помогут в беседах на собеседовании, но у каждой компании / организации есть уникальный набор задач, которые они надеются решить, наняв специалистов по данным или инженеров.
  • Получение степени отнюдь не является легким делом для вашего времени. Я изучал и работал над проектами по выходным почти два года, поэтому принятие этого обязательства, даже с полностью онлайн-программой, потребует многих из вас. Это не освободит вам много времени, чтобы сосредоточиться на других частях работы, если вы пытаетесь одновременно совмещать работу и аспирантуру.
  • Степень магистра не прощает ошибок на вашем банковском счете. Нет гарантии, что ваши вложения сразу окупятся. К счастью, программа, которую я закончил, была очень доступной по сравнению с большинством других. Однако, если вы надеетесь попасть в одну из «лучших» программ Data Science, вам стоит подумать о таком финансовом обязательстве! От кого-то, кто выбрал более доступный вариант, я скажу, что вам не обязательно идти в «лучшую» школу, чтобы получить отличную работу в области науки о данных / инженерии! Множество компаний и некоммерческих организаций ищут этот набор навыков - и им не требуется степень в «элитной» школе.

Несколько наводящих вопросов для тех, кто думает об аспирантуре по науке о данных

В заключение я подумал, что составлю набор вопросов для тех, кто взвешивает разные варианты обучения в аспирантуре. Исходя из ваших жизненных обстоятельств, есть несколько вещей, которые могут существенно повлиять на ваше решение.

  1. Каков ваш стиль обучения - как вы учитесь лучше всего?

2. Планируете ли вы поступить в аспирантуру, работая полный или неполный рабочий день?

3. Ваш бюджет - давайте посмотрим правде в глаза, аспирантура может быть дорогой. Сколько вы реально можете потратить на свое образование?

Заключение

Мои напутствия: ценность получения степени магистра в области науки о данных в конечном итоге будет зависеть от того, сколько усилий и времени вы вложите в это (если вы в конечном итоге будете этим заниматься) - я знаю, что это клише, но это правда. Если вы решите не поступать в формальную аспирантуру, вы все равно можете получить работу в области Data Science / Engineering! Работа через MOOC, онлайн-программы и бесплатный контент - это абсолютно вариант для тех, кто не заинтересован в более формальном пути.

В конце концов, для тех, кто хочет продолжить карьеру в области науки о данных, делайте то, что лучше для вас, но в конечном итоге найдите среду, которая позволит вам полностью погрузиться в предмет, работать вместе с коллегами и профессионалами, которые Помогу направить вас и найти способы бросить вызов вашей приверженности работе!