Большинство массовых открытых онлайн-курсов по науке о данных недостаточно строгие и имеют высокий риск предоставления только знаний черного ящика.

Проблема реализации моделей машинного обучения без хорошего понимания лежащих в основе математики и навыков программирования может привести к использованию подхода черного ящика в обучении науке о данных.

Наука о данных, машинное обучение и аналитика считаются одними из самых популярных направлений карьеры. Спрос на квалифицированных специалистов-практиков в области науки о данных в промышленности, академических кругах и правительстве быстро растет. Это привело к распространению массовых открытых онлайн-курсов (МООК), охватывающих различные области науки о данных и машинного обучения. К наиболее популярным провайдерам МООК можно отнести следующие:

а) edx: https://www.edx.org/

б) Coursera: https://www.coursera.org/

в) DataCamp: https://www.datacamp.com/

г) Udemy: https://www.udemy.com/

д) Udacity: https://www.udacity.com/

е) Линда: https://www.lynda.com/

Важность МООК по науке о данных

МООК по большей части являются бесплатными или недорогими онлайн-курсами, доступными для всех желающих. МООК предоставляют доступный и гибкий способ приобретения новых навыков. МООК охватывают широкий спектр онлайн-курсов по лидерству, аналитике, науке о данных, машинному обучению, профессиональным навыкам, инженерии, бизнесу и менеджменту, гуманитарным наукам, информатике и многому другому. Эти курсы обычно предлагаются ведущими университетами мира, такими как MIT, Гарвард, Калифорнийский университет в Беркли, Мичиганский университет, EPFL, Гонконгский политехнический университет и Университет Квинсленда. Некоторые курсы также предлагаются крупными корпорациями, такими как IBM, Google и Microsoft. Самым большим преимуществом MOOC является возможность учиться у лидеров и экспертов, а также возможность проходить курсы в ведущих университетах мира.

На моем собственном пути к науке о данных я прошел множество MOOC с нескольких платформ, таких как edX, Coursera и DataCamp.

Недостатки МООК по науке о данных

Большинство МООК по науке о данных - это курсы вводного уровня, и, следовательно, они могут оказаться доказательством только обучения методом черного ящика. МООК подходят для людей, которые уже имеют солидный опыт в дополнительных дисциплинах (физика, информатика, математика, инженерия, бухгалтерский учет) и пытаются попасть в область науки о данных. На моем пути к науке о данных я обнаружил, что следующие 3 специализации по науке о данных являются одними из лучших с точки зрения качества и строгости.

а) Профессиональный сертификат в области науки о данных (HarvardX, через edX)

б) Аналитика: основные инструменты и методы (Georgia TechX, через edX)

c) Прикладная наука о данных со специализацией на Python (Мичиганский университет, через Coursera)

Если вы заинтересованы в изучении области науки о данных, я бы порекомендовал начать с МООК, а затем, после создания прочного фона в основах науки о данных, вы можете затем использовать шаги, описанные в следующем разделе, чтобы расширить свои знания в этой области.

Шаги по предотвращению риска обучения по черному ящику на курсах по науке о данных

Следующие ниже шаги позволят вам расширить свои знания и опыт в области науки о данных за пределы предварительного обучения, полученного на МООК.

а) Обучение по учебнику

Обучение по учебнику дает более совершенные и глубокие знания, выходящие за рамки того, что вы получаете на онлайн-курсах. Эта книга представляет собой отличное введение в науку о данных и машинное обучение, включая код: Машинное обучение Python, Себастьян Рашка. Https://github.com/rasbt/python-machine-learning-book-3rd-edition

Автор объясняет фундаментальные концепции машинного обучения в простой форме. Кроме того, включен код, поэтому вы можете использовать предоставленный код для практики и создания собственных моделей. Я лично считаю эту книгу очень полезной в моем путешествии в качестве специалиста по данным. Я бы порекомендовал эту книгу любому соискателю науки о данных. Все, что вам нужно, - это базовая линейная алгебра и навыки программирования, чтобы понять книгу. Другие отличные учебники по науке о данных: Python для анализа данных Уэса МакКинни, Прикладное прогнозное моделирование от Kuhn & Johnson, Интеллектуальный анализ данных: практические инструменты и методы машинного обучения »Яна Х. Виттена, Eibe Фрэнк и Марк А. Холл и так далее.

б) Общайтесь с другими кандидатами в науку о данных

Из своего личного опыта я многому научился из еженедельных групповых бесед на различные темы в области науки о данных и машинного обучения, объединившись с другими кандидатами в науку о данных. Пообщайтесь с другими соискателями в области науки о данных, поделитесь своим кодом на GitHub, продемонстрируйте свои навыки в LinkedIn или Medium - это поможет вам изучить множество новых концепций и инструментов за короткий период времени. Вы также знакомитесь с новыми способами ведения дел, а также с новыми алгоритмами и технологиями.

в) Применяйте знания к реальным задачам науки о данных

Имейте в виду, что одни только онлайн-курсы не сделают вас специалистом по данным. После создания прочной основы в области науки о данных вы можете пройти стажировку или принять участие в конкурсах Kaggle, где вы сможете работать над реальными проектами в области науки о данных.

г) Продолжайте углублять свои знания в области науки о данных

Поскольку наука о данных - это область, которая постоянно развивается из-за технологических разработок в этой области, непрерывное изучение имеет важное значение в науке о данных. Создание сети сотрудничества с другими специалистами по обработке данных позволит вам всегда быть на высоте. Следующие платформы являются отличными ресурсами для создания сетей и непрерывных исследований:

Средний. Средний сейчас считается одной из самых быстрорастущих платформ для изучения науки о данных и создания сетей. Если вы заинтересованы в использовании этой платформы для самостоятельного изучения науки о данных, первым шагом будет создание учетной записи среднего размера. Вы можете создать бесплатную учетную запись или членскую учетную запись. В бесплатной учетной записи есть ограничения на количество статей для участников, к которым вы можете получить доступ в месяц. Для членского аккаунта требуется ежемесячная абонентская плата в размере 5 или 50 долларов в год. Узнайте больше о том, как стать участником со средним уровнем знаний здесь: https://medium.com/membership.

Имея учетную запись участника, вы получите неограниченный доступ к статьям и публикациям на среднем уровне. Medium имеет несколько публикаций по науке о данных, которые могут помочь вам узнать о новых разработках в этой области, а также пообщаться с другими специалистами по данным или соискателями. Две самые популярные публикации в области науки о данных на этом носителе: На пути к науке о данных и На пути к искусственному интеллекту. Каждый день на носителе публикуются новые статьи, охватывающие такие темы, как наука о данных, машинное обучение, визуализация данных, программирование, искусственный интеллект и т. Д. Используя инструмент поиска на веб-сайте среды, вы можете получить доступ к такому количеству статей и руководств, охватывающих широкий спектр вопросов в области науки о данных от базовых до продвинутых концепций.

LinkedIn: LinkedIn - отличная платформа для нетворкинга. В LinkedIn есть несколько групп и организаций по анализу данных, к которым можно присоединиться, например, Towards AI, DataScienceHub, Towards data science, KDnuggets и т. Д. Вы также можете следить за ведущими лидерами в этой области на этой платформе.

KDnuggets: KDnuggets - ведущий сайт по искусственному интеллекту, аналитике, большим данным, интеллектуальному анализу данных, науке о данных и машинному обучению . На этом веб-сайте вы можете найти важные образовательные инструменты и ресурсы по науке о данных, а также инструменты для профессионального развития.

Ключевые выводы

  • МООК в области науки о данных великолепны, поскольку они предлагают разнообразные курсы от нескольких университетов мирового класса по очень доступным ценам.
  • МООК в области науки о данных не очень строгие и, следовательно, могут быть связаны только с обучением по методу черного ящика.
  • Если у вас есть солидный опыт в аналитической дисциплине, такой как физика, математика, экономика, инженерия или информатика, и вы заинтересованы в изучении области науки о данных, лучший способ - начать с МООК. Затем, после создания прочной основы, вы можете искать другие способы расширить свои знания и опыт, такие как изучение учебников, участие в проектах и ​​создание сетей с другими соискателями в области науки о данных.