У некоторых из вас это название, возможно, вызвало болезненные воспоминания о том, как вы сидели на уроке биологии 101 на первом курсе колледжа и слушали, как профессор бубнит о предстоящем семестре. К счастью для вас, я не буду этого делать; тем не менее, я собираюсь составить свой график на год и обсудить, почему я сделал тот или иной выбор.

Составление расписания

Как только я решил, что собираюсь отправиться в эту Одиссею науки о данных, я понял, что мне понадобится руководство. Лично я лучше всего работаю, когда у меня есть что-то, что говорит мне сделать А в день X и сделать Б в день Y. Я знаю, что жизнь неизбежно встанет у меня на пути; тем не менее, расписание — отличный способ держать себя в руках. Чтобы составить это расписание, я начал с просмотра программ по науке о данных в следующих учреждениях: Стэнфордский, Вашингтонский университет, Калифорнийский университет в Беркли, Технологический институт Джорджии (магистр аналитики), Карнеги-Меллон (магистр машинного обучения) и Корнелл. В каждой из этих школ была какая-то программа по науке о данных, которой руководил их отдел статистики или компьютерных наук. Я собрал курсы, связанные с каждой программой, и их соответствующие описания здесь. Изучив каждую из этих программ, я решил разделить свое расписание на четыре этапа: обзор, основы, приложение и завершающий этап.

Обзор

В то время как большинство библиотек Python и пакетов R, которые кто-либо будет использовать в «диких условиях», обрабатывают большую часть математики, я хочу понять, что происходит под капотом. Понимание базовой статистики и исчисления, которые используются, ничего не даст, кроме как поможет мне в дальнейшем. Хотя я посещал курсы по этим предметам в прошлом, я думаю, что было бы неплохо сделать тщательный обзор.

Январь

Февраль и март

Фонды

Следующее, что нужно сделать после рассмотрения интегралов и непрерывных распределений, — это заложить прочную основу. Я решил выделить на эту часть всего два месяца, чтобы больше времени можно было потратить на изучение тем на этапе подачи заявки и работу над моим псевдозавершающим проектом. Я выбрал вводный курс машинного обучения и промежуточный курс статистики. Причина, по которой я выбрал курс машинного обучения, очень проста: у меня нет опыта машинного обучения. Хотя я знаю, что большинство решений не будут включать ML, я думаю, что хорошее понимание концепций окажется неоценимым. Когда дело доходит до курса статистики, вы, вероятно, думаете, что этому парню действительно нравится математика. Хотя это правда, одно из моих сожалений заключается в том, что я не получил солидного статистического фона, когда учился в бакалавриате или на первом году обучения в аспирантуре. Итак, это моя возможность исправить эту ошибку.

Апрель

май

Применение и развлечения

Первые пять месяцев этого путешествия посвящены пониманию основ. На этапе подачи заявок нужно посмотреть, что я могу сделать с тем, что я уже выучил, и немного повеселиться, пока я этим занимаюсь. Темы, которые будут затронуты в течение следующих четырех месяцев, помогут мне лучше понять то, что меня интересует, например рекомендательные системы и анализ настроений.

июнь

июль

Август

  • "Обработка естественного языка"

Сентябрь

  • Наука о данных в облаке: я собираюсь дать себе месяц, чтобы поиграть с некоторыми доступными облачными технологиями, которые упрощают машинное обучение и интенсивный анализ данных. Если есть книга, которая выйдет в период до сентября, я мог бы прочитать и ее.

Замковый камень

Вы не можете сказать, что действительно освоили что-то, пока не создадите какую-то оригинальную работу. В большинстве академических программ это обычно делается в диссертации, завершающем проекте или диссертации. Мне не очень нравится идея писать статью на 40+ страниц, поэтому я собираюсь заняться завершающим проектом. Этот проект будет сосредоточен на применении всего, что я узнал до сих пор.

Я возьму последние три месяца года и посмотрю, что у меня получится.

Как это сделать

Многие из приведенных выше ссылок связаны с книгами или академическими курсами. На курсах я планирую заниматься домашними заданиями и проектами; что касается книг, я сделаю все возможное, чтобы решить проблемы и выполнить предусмотренные задания.

Хотя к концу этого года у меня не будет никаких сертификатов или степеней, я верю, что у меня останутся вещи, на изучение которых я трачу время, и это важнее любого листа бумаги.

Я буду проверять каждую неделю, чтобы сообщать о своем прогрессе и о том, что я узнал, так что следите за обновлениями!