Практический стартовый набор по науке о данных для непрограммистов

Так что я сталкиваюсь с множеством людей с разным опытом (электроника, механика, бакалавриат (1-2 курс), продажи, финансы и т. Д., Которые хотят изучить область науки о данных, и некоторые из вопросов, которые у них возникают, следующие: даже мне было интересно, когда я начал. -

  • Могу ли я войти в мир науки о данных?
  • Могу ли я обойтись без кодирования?
  • Откуда брать данные?
  • Или, что более важно, где проблема, которую я могу решить?

Что ж, ответ на первый вопрос - Да. Кто угодно может войти в это поле. Все дело в последовательном обучении и применении логики.

А по другим вопросам продолжайте читать -

  • Вам определенно необходимы навыки программирования. Уровень программирования на машинном языке не так высок, как тот, который вам нужен, чтобы стать инженером-программистом (по крайней мере, вначале). Кодирование по-прежнему является неотъемлемой частью ML, потому что независимо от того, сколько инструментов вы используете в начале, например Weka или Alteryx (в котором есть ML с перетаскиванием), в конечном итоге вам понадобится R или Python в долгосрочной перспективе. И SQL важен, никогда не недооценивайте его!
  • Существуют различные обучающие веб-сайты, предлагающие бесплатные курсы по этим языкам / концепциям, например - Udemy, Udacity, DataCamp Team и т. д. На этих веб-сайтах есть разные треки для начинающих, средних и продвинутых курсов Python и R, необходимых для науки о данных, которые очень полезны. А если вы заплатите, вы даже получите сертификат, который сможете опубликовать в Linkedin. Также существует множество каналов YouTube, которые посвящены науке о данных для начинающих и очень полезны.
  • Итак, лучшая часть вышеуказанных курсов / каналов заключается в том, что они в основном предоставляют набор данных, которые вы можете изучать бок о бок. Помимо этого, в наши дни существует множество открытых источников данных, и вы можете просто скачать оттуда данные и начать работу. Есть веб-сайты, которые предоставляют список открытых источников данных, и вы можете выбрать из них: Freecodecamp, Forbes, Learning Hub и т. Д.
  • Следующее лучшее, что случилось с миром, - Kaggle! Для тех, кто не знает (даже я не знал 2 года назад, пока один из моих любимых профессоров не представил нам проект по этому поводу), Kaggle - это онлайн-сообщество ученых и специалистов по машинному обучению, где настоящая организации публикуют формулировку своей проблемы, наборы данных, то, что они хотят, и т. д. Все, что вам нужно сделать, это создать учетную запись (бесплатно !!) и начать работать. Это настоятельно рекомендуется в области науки о данных. Любой желающий может участвовать, загружать, делиться анализом и кодами, и в основном все, что вы хотите начать в области машинного обучения, глубокого обучения или любой другой связанной области.

  • В дополнение к этому существует несколько учебных лагерей и специальных курсов, которые предлагаются на учебных сайтах и ​​предоставляют концепции, данные и проблемы. Иногда они помогают добиться заметности.
  • Попрактикуясь в этом процессе с использованием открытых наборов данных, записных книжек и т. Д., Вы почувствуете себя более уверенно, касаясь реальных данных из своего домена. И что будет для вас преимуществом, так это то, что вы будете обладать знаниями в предметной области помимо машинного обучения, что является основой для решения проблем.
  • Все вышесказанное касается самого процесса. Чтобы понять концепции машинного обучения и новые тенденции в этой области, способы манипулирования данными и т. Д., Полезны некоторые из этих веб-сайтов: KDNuggets, Towards Data Science, Machine Learning Mastery, Analytics Vidhya, Data Science Central и др.

Ладно, думаю, мы подошли к концу. Вы знаете, где изучить концепции, попрактиковаться в кодировании, где взять набор данных и постановки задач, и даже коды! Так чего же ты ждешь? Давай, приступим! : D

Если есть другие вещи, которые также могут повысить ценность, оставьте отзыв! :)

Кроме того, если вы хотите узнать все этапы машинного обучения в одном месте, прочтите мой предыдущий рассказ Data Science for Non-Data Scientists (Part 1).