В моей предыдущей статье я рассказал об инструментах, которые вам нужно освоить, чтобы стать специалистом по данным. Я настоятельно рекомендую прочитать эту статью просто для ознакомления с основами науки о данных. Кто такой Data Scientist и какими инструментами нужно овладеть, чтобы им стать?

Эта статья предназначена для тех, кто знаком с инструментами и технологиями науки о данных, но все еще задается вопросом, как они применяют этот набор навыков. Я поделюсь тем, как я практиковал и оттачивал свои навыки в Python, SQL или машинном обучении.

Вот мой взгляд на это:

Хакерранк

Я настоятельно рекомендую hackerrank попрактиковаться SQL или Python, так как они очень интересны и в то же время имеют множество проблем, и вы можете фильтровать проблемы на основе их сложности. Но теперь вы скажете: Но я практиковал это, когда выучил эту конкретную функцию. Ответ заключается в том, что когда вы видите эти проблемы, они будут иметь огромное разнообразие и заставят вас думать на профессиональном уровне, когда вы пытаетесь решить средние или сложные проблемы. Также, если вы хотите попрактиковаться в SQL, стоит изучить SQLzoo. По крайней мере, попробуйте решить 80% проблем, доступных на этих платформах.

Теперь поговорим о машинном обучении…

Я вижу начинающих специалистов по данным, которые перешли к машинному обучению или глубокому обучению, но когда вы задаете им базовый вопрос, например "Что такое p-значение?", они не имеют ни малейшего представления об этом. . Прежде чем приступить непосредственно к машинному обучению, я бы порекомендовал узнать об описательной и логической статистике.

«Наука о данных без статистики — это как Феррари без тормозов. Вы можете наслаждаться сидением в Ferrari, хвастаться своим новым автомобилем перед другими, но вы не можете долго наслаждаться вождением, потому что скоро вы разобьетесь!»

Я надеюсь, что эта аналогия даст вам представление об этом. Без статистической поддержки ваши выводы уведут по ложному пути и могут нанести колоссальный ущерб бизнесу. Теперь вы скажете: «Хорошо, я понял, что статистика очень важна, но здесь мы говорим о практике? Верно. Да, безусловно.

AnalyticsVidhya для машинного обучения

Чтобы попрактиковаться в машинном обучении, я бы посоветовал вам пройти практические проекты, доступные на различных веб-сайтах, я бы порекомендовал Analyticsvidhya. У них есть много бесплатных практических проектов, в которых вы можете создать модель машинного обучения. Сначала вы столкнетесь с проблемами, но вы можете увидеть коды опытного специалиста по данным, который выполнил тот же проект, просто чтобы понять, как они подходят к этой конкретной проблеме. сложности.

Если вы выполнили вышеуказанные шаги, вы можете участвовать в различных задачах по науке о данных на различных веб-сайтах, таких как Kaggle, Hackerearth и т. д.

У меня есть привычка подводить итоги: практикуйте свои навыки кодирования на Hackerrank, затем изучайте статистику и машинное обучение. После того, как вы закончите с машинным обучением, получите практический опыт в практических проектах, доступных на analyticsvidhya. Вы также можете добавить эти проекты в свое резюме, чтобы продемонстрировать свой опыт в области науки о данных. С этим покончено?

Поздравляем! Теперь вы Data Scientist.

Удачного кодирования!