Подход для начинающих к изучению основ науки о данных и машинного обучения с помощью Python

Когда я работал в Apple, у нас была система. Если у вас возникла проблема с устройством, вы можете прийти и сообщить нам о проблеме, и мы либо сообщим вам, как исправить ее на месте, либо запишем ваше имя, чтобы мы могли забронировать для вас индивидуальную встречу. время с техником.

Я был техническим специалистом, поэтому, закончив работу с одним клиентом, я просматривал список имен и переходил к следующему.

Однажды девушка пришла за помощью со своим iPhone. Я подошел к ней, поздоровался и заметил, что она просматривает синее приложение.

Я спросил ее, что это за приложение.

«Курсера», - сказала она.

Что это такое? Я спросил.

Это приложение, в котором вы можете узнать разные вещи.

Да неужели? Ты учишься в университете?

Больше нет, я просто думаю, что всегда хорошо учиться чему-то.

Она не знает, но эта фраза изменила всю мою жизнь. До этого я учился только тогда, когда от меня требовалось: для работы, для учебы. Конечно, были времена, когда я следовал собственному искреннему любопытству (играл в видеоигры, учился готовить), но ее слова проливали свет на тот факт, что если бы я действительно хотел, я мог бы научиться всему, чему захочу. Что-нибудь.

Забавно, как на это влияют случайные встречи.

Мой собственный путь

Той ночью я пошел домой и стал искать название синего приложения, о котором она мне рассказывала. И это было похоже на то, что я обнаружил новую скрытую землю. Вы могли выбрать то, что хотите узнать, и уроки начинались… завтра.

Какие?

До этого я учился (и терпел неудачу) в университете. Я думала, чему учиться, но необходимость быть в определенных местах в определенное время меня не устраивала. Я поступил в институт в 17 лет. Все, что мне хотелось, это сидеть на траве и смотреть на девочек.

Увы, я никогда не использовал Coursera до тех пор, пока через пару лет мне об этом не рассказала девушка из Apple Store.

Я ушел из Apple и решил, что хочу научиться создавать программы, которые помогал устранять.

Во время обучения программированию в четвертый раз (я отказался от первых трех раз), я наткнулся на машинное обучение. Другими словами, написание кода для использования математики для поиска закономерностей в данных.

«Я должен этому научиться», - подумал я.

И поскольку я решил, что провел достаточно времени в университете за предыдущее десятилетие, я составил список онлайн-курсов, чтобы создать свою собственную степень магистра искусственного интеллекта.

И угадай что?

Многие из них были из того синего приложения, которое мне показала девушка.

Ваш собственный путь

Если в 2020 году что-то прояснилось, так это то, что каждый человек должен нести ответственность за свое здоровье и образование.

Сейчас 2021 год (или позже, если вы читаете это в будущем, привет, кстати), и правила физического сбора все еще в воздухе, многие (возможно, вы) обращаются за изучением к онлайн-ресурсам, а не к традиционным источникам.

Эта статья не является аргументом в пользу университета против онлайн-обучения. Делайте то, что вам подходит.

Этот материал демонстрирует, как быстро вы можете составить собственный учебный план по науке о данных и машинному обучению с помощью Coursera.

Однако не забывайте, насколько быстро вы сможете составить учебный план, поскольку работа уже завершена.

Изучать что-нибудь стоящее, особенно онлайн, не для слабонервных. Если у вас его еще нет, вам придется развить чувство ответственности. Вот что делает для вас разработка собственной учебной программы. Это ставит вас на крючок.

Пример учебной программы по науке о данных и машинному обучению

Меня всегда спрашивают, почему бы не использовать бесплатные ресурсы?

И я говорю им, конечно, вы можете использовать бесплатные ресурсы. Но я обнаружил, что они мне не подходят. Когда я впервые использовал Coursera, они платили ежемесячно. Я сразу понял, что плачу. Знание, что я за что-то плачу, заставило меня отнестись к этому более серьезно.

Но разве вы не платили за университет?

да. Но денег со счета не было. Я думал, что это бесплатно, я думал, что это волшебство. Мне потребовалось 5 лет, чтобы получить 3-летнюю степень, и в итоге у меня появился долг в размере 35 000 долларов (значительный, но незначительный по сравнению с другими).

Теперь у Coursera есть сервис под названием Coursera Plus. ~ 537 австралийских долларов (~ 399 долларов США) на целый год доступа к учебным материалам мирового уровня. Хо-хо. Если бы он существовал, когда я начал использовать Coursera, я бы сэкономил кучу.

Пришло время конкретизировать.

Около года назад я написал пост под названием 5 шагов для начинающих по изучению машинного обучения, в котором собрал ресурсы в Интернете для изучения основ машинного обучения.

Сообщение было сосредоточено на том, чтобы как можно скорее заставить читателя перестать ничего знать о программировании и написать код машинного обучения на языке программирования Python.

Итак, чтобы начать 2021 год, я подумал, что воспроизведу этот пост с несколькими курсами Coursera, доступными через Coursera Plus.

Но подождите ... это не просто репликация. Я также собрал Шаблон понятий, который вы можете использовать, чтобы отслеживать свои успехи.

Если вы никогда раньше не использовали Notion, изучите шаблон и нажмите несколько вещей (не волнуйтесь, вы не сможете его сломать), прежде чем нажимать кнопку «дублировать» в правом верхнем углу, тогда вы сможете измените его в соответствии со своими потребностями.

Вы можете увидеть видео-пошаговое руководство по вышеуказанному шаблону Notion и учебной программе ниже на YouTube.

Теперь, как насчет немного меньшей интерактивности со списком шагов.

Примечание. Если вы читаете это и думаете: «Ого, это звучит как реклама Coursera», вы правы. Coursera обратилась ко мне с вопросом, не хочу ли я написать пост, посвященный помощи студентам в составлении собственных учебных программ с помощью Coursera, и я ответил утвердительно. При этом примите это сообщение как раскрытие: если вы нажмете ссылку в этом сообщении и заплатите за что-то, сумма не изменится, но я получу часть суммы, которую вы платите (средства, которые я использую для создания таких ресурсов ).

Шаг 1: Изучение специализации

Что это: Откройте для себя и скопируйте лучшие методы обучения художников, математиков, музыкантов и многих других.

Почему это важно. Если вы собираетесь самостоятельно управлять своим обучением, вы можете научиться учиться. Умение учиться - это высший мета-навык. Потому что, если вы можете научиться учиться, вы можете узнать все.

Я рекомендую пройти этот курс всем, независимо от того, изучают ли они науку о данных, машинное обучение или физику элементарных частиц. Вы можете ознакомиться с моей полной обзорной статьей в моем блоге.

Шаг 2: Специализация Python для всех

Что это такое. Эта специализация поможет вам перейти от нулевых навыков программирования к написанию кода Python.

Почему это важно. Если вы хотите заняться наукой о данных и машинным обучением, скорее всего, вы собираетесь писать код Python. Но будет сложно написать код машинного обучения Python без использования языка раньше. Поэтому используйте эту специализацию, чтобы познакомиться с фундаментальными концепциями Python.

Шаг 3: Прикладная наука о данных с Python

Что это такое. Теперь, когда у вас есть базовые навыки работы с Python, пора приступить к их адаптации для работы с данными. Эта специализация познакомит вас с популярными библиотеками науки о данных Python, такими как pandas, matplotlib и scikit-learn.

Почему это важно. Поскольку Python - это общий язык программирования, с ним можно делать практически все. Но хорошая новость в том, что здесь можно использовать основы, которые вы изучили в специализации «Python для всех». В частности, вы начнете учиться использовать: *

  • Pandas - обширная библиотека анализа данных для работы с данными, подобными тем, которые вы найдете в таблицах Excel (строки и столбцы).
  • Matplotlib - библиотека Python для создания визуальных графиков с вашими данными.
  • Scikit-learn - обширная библиотека машинного обучения со множеством готовых моделей машинного обучения и функций для подготовки и преобразования данных.

Шаг 4: Специализация машинного обучения

Что это такое. Как диагностировать проблему с машинным обучением? Это регресс? Классификация? Кластеризация? Поиск информации? Эта специализация научит вас отвечать на эти вопросы и создавать системы, способные изучать закономерности в наборах данных.

Почему это важно: Специализация "Прикладная наука о данных со специализацией на Python" научила вас манипулировать и визуализировать данные, а теперь, в специализации "Машинное обучение", вы узнаете, как писать код машинного обучения, чтобы находить закономерности в этих данных. .

Шаг 5: Математика для специализации машинного обучения

Что это такое. Если вам интересно, как алгоритмы машинного обучения могут изучать закономерности в данных, есть один ответ: математика. В основном за счет комбинации линейной алгебры и многомерного исчисления (плюс некоторые другие).

Специализация «Математика для машинного обучения» поможет вам понять основную математику, лежащую в основе многих наиболее эффективных алгоритмов машинного обучения.

Что важно: данные - это сжатая форма природы, математические вычисления можно использовать для поиска закономерностей в данных, а код можно использовать для выполнения математических вычислений в масштабе. Приведенные выше шаги направлены на то, чтобы заставить вас написать код как можно скорее. Однако по мере того, как вы узнаете больше, вы, вероятно, захотите узнать, как работает код, который вы пишете.

Эта специализация позволит вам глубже понять, как работают алгоритмы машинного обучения, и еще больше углубит ваше понимание кода, который вы пишете.

Почему именно эти?

На Coursera Plus доступно более 3000 специализаций / курсов. Слишком много, чтобы вы когда-либо проходили.

Те, которые я выбрал, основаны на моем личном опыте (я прошел через них) или потому, что их контент мирового класса и именно то, что вам нужно, чтобы начать работу с наукой о данных и машинным обучением. Но при этом, если что-то вызывает у вас интерес, дерзайте.

Сколько времени нужно на все это?

Двигайтесь со своей скоростью. Но если вы сложите все рекомендованные сроки, вы, вероятно, получите где-то между 12–18 месяцами.

Однако никогда не стоит недооценивать силу скорости. Рекомендуемые сроки для среднего учащегося. Вы средний? Или вы хотите учиться? Если вы второй, помните, ограничения скорости нет.

Нужна ли мне Coursera Plus?

Нет. Вы можете выбрать любой из желаемых курсов индивидуально. Однако, если вы планируете пройти все вышеперечисленное, Coursera Plus предлагает огромную скидку.

Я попробовал, но мне это не нравится ... могу ли я получить возмещение?

да. У вас будет 14 дней после регистрации на Coursera Plus.

Но вот еще один анекдот из моего собственного пути. Раньше я записывалась на курс и боялась, что не смогу это сделать. Поэтому я написал в службу поддержки по электронной почте и спросил, какова политика возврата. Мне сказали две недели.

Оказалось, что мне не вернули деньги. Я прошел курс, боролся, пропустил сроки, но потом вышел с другой стороны, зная гораздо больше, чем когда я начинал.

После основ

Суть этого поста в том, что Интернет сделал его так, чтобы вы могли создать свое собственное учебное путешествие. Coursera - феноменальный ресурс, и я настоятельно рекомендую его, но это только один из многих.

Все, о чем мы говорили, можно узнать за пределами Coursera. Вы даже можете взять шаблон Концептуальный учебный план и воспроизвести его со всеми бесплатными ресурсами и отслеживать свой прогресс.

Допустим, вы это сделали, вы создали свою собственную учебную программу, основанную на Coursera или нет. Что делать дальше?

Этот вопрос заслуживает отдельной статьи. Но как минимум: поделитесь своей работой.

Напишите о том, что вы узнали. Создайте блог под своим именем. Поищите «как создать блог с помощью GitHub Pages» или начните писать на Medium.

Не волнуйтесь, если кто-то уже написал о том, о чем вы хотите написать. Практика написания того, что вы узнали, еще больше поможет вам в обучении.

Что бы вы хотели узнать полгода назад? Напишите это.

Чтобы узнать больше об этом, я бы порекомендовал прочитать Как начинающий специалист по анализу данных, как я, получает опыт?.

А как насчет продвинутых навыков?

В этом посте были рассмотрены основы. Если вы хотите расширить свои знания, я бы порекомендовал все курсы deeplearning.ai и всю учебную программу fast.ai.

После этого вы закончите с курсами. Начни свои собственные проекты. Курсы обучают основам, а самостоятельные проекты помогают изучить специфику (знания, которым невозможно научить).