Многие люди спрашивали меня о моем переходе от химической инженерии к науке о данных. Как я это сделал? Когда я это сделал? Зачем я это сделал? Я чувствовал, что сегодня (6 января 2018 г.) подходящий день, чтобы ответить на эти вопросы, поскольку исполняется третий год с тех пор, как я записался на свой первый курс программирования. Я надеюсь, что поделившись своей историей, я смогу понять, что я сделал, чтобы стать специалистом по анализу данных, и воодушевил бы подающих надежды «все» повсюду неистово преследовать свою страсть.

Мое первое знакомство с наукой о данных произошло из книги, которая не имела ничего общего с наукой о данных.

В марте 2014 года я наткнулся на книгу Чарльза Дахигга Сила привычки: почему мы делаем то, что делаем в жизни и бизнесе. В разделе книги под названием Привычки организаций Чарльз написал о крупной розничной сети, которая использовала данные о покупках женщины-покупательницы для прогнозирования вероятности ее беременности. Проще говоря, я был потрясен, и мне нужно было узнать больше.

Я везде искал, как называлось это колдовство. Через несколько месяцев с помощью друзей я наткнулся на нечто очень похожее на то, что я читал в Сила привычки. Это называлось Бизнес-аналитика.

Это открытие стало для меня переломным моментом, потому что в то время я был на последнем курсе колледжа и только что закончил стажировку в нефтегазовой компании. Мой опыт там заставил меня устать заниматься химической инженерией как карьерой, потому что я чувствовал, что это не для меня. Это осознание также сделало меня открытым для новых вызовов и карьерного роста. Казалось, что бизнес-аналитика как нельзя лучше подходит для этого.

Я создал свой первый путь обучения науке о данных из ответа на Quora

К 2014 году я закончил учебу и начал работу в Национальном молодежном корпусе. Во время учебы в Нью-Йорке я наткнулся на Quora по рекомендации Твиттера, и мне это понравилось.

На случай, если вам интересно, ИДЕАЛЬНО, NYSC - это годичная обязательная программа в Нигерии, в которой вас направляют в штат, к которому вы не связаны, для работы в качестве государственного служащего, учителя или кого-либо еще. .

На Quora я узнал, что у Business Analytics много названий, и одно из них - Data Science. Я также нашел очень полезный ответ, который по сей день рекомендую всем, кто хочет начать свою карьеру в области Data Scientist: Как я могу стать Data Scientist?

Этот ответ помог сформировать мой первый путь обучения науке о данных в январе 2015 года (простите за ужасный почерк).

Я прошел 15 MOOC по Data Science в течение года

В основном я изучал Data Science через онлайн-курсы. Книгой никогда не пользовался (пробовал). Все курсы были бесплатными (потому что мне наплевать на сертификат), и там, где они не были бесплатными, как Coursera, я получал 100% финансовую помощь.

Я целовал много лягушек, когда дело доходило до онлайн-курсов, поэтому, если вы ищете простое руководство о том, как начать работу в Data Science, я избавлю вас от стресса и сосредоточусь только на курсах, которые были стоящими.

1. Изученное программирование

Это было самое первое на моем пути обучения и самое страшное из всех. Это было страшно, потому что у меня не было опыта в области компьютерных наук, и единственный раз, когда я познакомился с программированием в колледже, я это абсолютно возненавидел. Однако на этот раз я почувствовал, что у меня есть все время в мире и мне нечего терять, поэтому я записался на курс Learn Python Codecademy.

Курс был таким трудным, и многое в нем не имело для меня смысла. Я мог потратить до двух недель, пытаясь заставить работать цикл while, и я понятия не имел, что означает ввод-вывод файлов, но с помощью грубой силы я прошел курс.

Это был первый раз, когда я прошел онлайн-курс после многочисленных попыток сделать это ранее. Это придало мне уверенности в том, что я могу продолжать учиться.

2. Изученные основные науки о данных

Многие люди спрашивают меня, почему я предпочитаю использовать R вместо Python. По чистой случайности я впервые познакомился с Data Science в R из курса под названием The Analytics Edge от MIT на edX.

Десятинедельный курс использует подход тематического исследования для обучения различным частям науки о данных от машинного обучения до визуализации и оптимизации с использованием R. Это было очень сложно и очень полезно. Удивительный опыт, полученный на этом курсе, заставляет меня больше склоняться к R, чем к Python. Курс дал мне отличную основу, и я до сих пор иногда обращаюсь к своим заметкам 2015 года.

3. Другие полезные курсы

Еще один курс, который мне понравился и который я прошел в конце 2015 года, был Визуализация данных и коммуникация с Tableau из Университета Дьюка на Coursera. Это пятинедельный курс, который дает отличную основу для использования Tableau. Инструктор потрясающий и лучший из тех, с кем я когда-либо сталкивался.

Следующим в моем списке будет Управление большими данными с помощью MySQL от Университета Дьюка на Coursera. Это четырехнедельный курс с тем же замечательным инструктором, что и курс Tableau, и он учит как MySQL, так и Teradata.

Также стоит упомянуть: Введение в BigData с Apache Spark (серия из четырех курсов) от UCBerkeley на edX и Excel для анализа и визуализации данных от Microsoft на edX .

Как я начал свой блог - где началось настоящее обучение

Если вы прочтете много ответов на Quora или статей о том, как стать лучшим инженером-программистом / специалистом по данным / дизайнером и т.п., вы увидите повторяющийся совет: занимайтесь личными проектами, чтобы углубить свой набор навыков. Я пытался сделать это несколько раз в 2015 году, но не смог сделать ничего разумного, потому что, честно говоря, я был не готов.

К 2016 году я замедлил ход онлайн-курсов, потому что 90% курсов имели одинаковое содержание и предполагали, что вы новичок, поэтому оно стало немного повторяющимся. К этому времени я почувствовал, что готов заняться личными проектами с помощью блога. С письменной частью не было проблем, потому что я писал в старшей школе. Однако моя проблема заключалась в последовательности и творчестве. Достаточно ли у меня творческих способностей, чтобы создавать интересные проекты, и могу ли я делать это постоянно? Никогда не знаешь, пока не попробуешь, правда? Так я начал свой блог Искусство и наука данных в июне 2016 года. Мои знания росли в геометрической прогрессии, работая над контентом для моего блога.

Я написал свои первые два сообщения в течение месяца, а затем ушел на годичный перерыв.

Моим первым сообщением было Прогнозирование турнирной таблицы английской премьер-лиги, которое я опубликовал в сентябре 2016 года, а затем Что Твиттер думает о сетевых провайдерах в Нигерии, который был опубликован в октябре 2016 года. Количество положительных отзывов меня совершенно поразило. Я получил около 1500 просмотров и множество откликов на оба поста и впервые почувствовал уверенность в своих силах.

Этот опыт научил меня, что творчество - это не какой-то талант, который у вас есть или нет. Креативность рождается из опыта и уверенности в своих силах, потому что возможности того, что можно сделать, расширяются по мере того, как вы знаете.

Затем у меня был годичный перерыв в ведении блога. Это произошло по многим причинам.

  1. В декабре 2016 года я попытался написать сообщение в блоге, в котором был большой беспорядок. Позже я очистил его и использовал на своем семинаре Женщины в машинном обучении и науке о данных под названием ABC-XYZ науки о данных.
  2. После этого у меня было то, что я называю «блоком специалиста по данным». Я буквально не имел идей и не мог придумать ничего полезного или интересного.
  3. Мой подход к моему блогу немного отличается от большинства блогов по науке о данных, потому что мой подход включает в себя множество исследований и итераций. Это также делает мой цикл публикаций намного длиннее, чем у других.
  4. Работа была изнурительной, и взрослые догоняли меня, так что я стал бездельником.

В июне 2017 года у меня наконец появилась идея о миллиардерах, и с помощью моих друзей в октябре 2017 года я опубликовал Управляемое данными руководство по тому, как стать последовательным миллиардером (да, мне потребовалось четыре месяца, чтобы собрать вместе).

В течение трех дней после публикации у него было 30 000 просмотров. Это было повсюду. Значительное количество сайтов использовали плагиат для публикации, и мне было все равно. Моя работа была достаточно хороша для плагиата!

Мои маленькие победы до сих пор

Помимо 40 000 просмотров моего поста Руководство на основе данных, чтобы стать последовательным миллиардером, 2017 был для меня интересным годом. Впервые работа, которую я проделал за последние три года, проходила валидацию.

  1. Я выиграл Конкурс визуализации данных Организации Объединенных Наций со своей визуализацией в виде Таблицы Визуализация малярии: болезнь-убийца, убивающая Африку, которая выглядела примерно так.

2. Меня пригласили выступить на Стэнфордской конференции Женщины в науке о данных в Нигерии на ту же тему, что и этот пост.

3. Я устроился на работу в Лондон в качестве специалиста по данным в Ernst & Young и недавно переехал по всему миру.

4. В ноябре 2017 года я организовала семинар в The Women in Machine Learning and Data Science.

Честно говоря, я немного удивлен, что я зашел так далеко. Я помню, как написал в своем блокноте: «Бутон розы, ты никогда не будешь достаточно хорош для этого», но вот я здесь. Мне еще предстоит многому научиться, но я также благодарен за то, где я нахожусь сегодня.

Мой совет для вас

Я не эксперт, как и Джон Максвелл, который дает частички советов по самопомощи, но вот несколько вещей, которые действительно мне помогли.

  1. Не бойтесь отпускать то, что не получается. Мне потребовалось время до 2016 года, чтобы полностью отказаться от своих мечтаний о нефти и газе, хотя я знал, что не был этим увлечен.
  2. Не бойтесь показаться сумасшедшим. Я не могу сосчитать, сколько раз люди тонко и не очень тонко говорили мне, что я сошел с ума от того, что ушел из химической инженерии, особенно когда наука о данных была относительно новой в Нигерии. Раньше это доходило до меня, но теперь я улыбаюсь и говорю себе: «Когда я дую, ты поймешь».
  3. Прочтите. Читать. Прочтите. Книги, которые открыли для меня эту область, не имели ничего общего с наукой о данных. Чтение расширяет ваши возможности.
  4. Люблю учиться. Ставьте цели учебы каждый год и придерживайтесь того средства (книги / аудио / видео / класс), которое лучше всего подходит для вас.
  5. Всегда, всегда делайте все возможное. Пусть ваша работа будет самой лучшей из возможных. Это будет говорить за вас. 99% возможностей, которые я получил сегодня, частично связаны с моим блогом.
  6. Самое главное, вы не остров. Имейте сплоченную систему поддержки, которая скажет вам правду, даже когда вам будет больно. Тебе будет лучше.

Удачи :)

Хочу особо поблагодарить мою замечательную систему поддержки и всех людей, которые помогли мне здесь. Их слишком много, чтобы упоминать, но я так люблю вас, ребята. Я хочу особенно поблагодарить Тоби, Дидуна и Чудо за поддержку, жесткую любовь, жестокую обратную связь и за то, что рассказали мне, где именно поставить апостроф. Вы были там с первого дня. Вы знаете всю мою борьбу. Вы видели меня в самом начале и все еще верили, что я могу это сделать. Спасибо за то, что вы стали лучшим специалистом по данным и лучшим человеком. Я бы не променял вас на мир.