Стать специалистом по анализу данных стало намного проще

Чтобы стать специалистом по анализу данных, нужно многому научиться. По-настоящему сильным кандидатом в специалиста по анализу данных делает не только надежный набор технических навыков, но и способность критически обдумывать и решать важные для бизнеса проблемы для принятия бизнес-решений.

По сути, развитие острого понимания того, как решать различные бизнес-задачи, выделит вас из поля потенциальных сотрудников во время собеседования.

Итак, как мы можем развить вашу интуицию в отношении данных? В этой статье я собираюсь поделиться с вами одной из моих любимых стратегий развития этих ключевых навыков критического мышления, которая поможет вам встать на путь развития вашей интуиции в отношении данных с помощью проектного обучения.

Что такое проектное обучение?

Проектно-ориентированное обучение (PBL) - это развитие ваших навыков посредством практической работы и применения. В контексте науки о данных это означает выполнение анализа данных по множеству различных типов данных с использованием широкого спектра навыков, которые вы либо освоили, либо в процессе освоения. По сути, чтобы развить свое восприятие данных и интуицию, вам нужно попрактиковаться в их использовании.

Но как?

По мере того, как вы работаете над все большим количеством анализов данных или проектов, вы будете сталкиваться со все большим и большим количеством видов данных из различных областей, которые будут содержать уникальные бизнес-вопросы, которые вам нужно будет найти и решить.

Чем больше проектов вы сможете выполнить, тем больше вы познакомитесь с различными видами данных, бизнес-проблемами и возможностями для развития своего восприятия данных.

Мало того, вот некоторые дополнительные преимущества проектного обучения:

  • Практикуйтесь в написании сложного кода для решения конкретных проблем, связанных с вашими отраслевыми данными.
  • Развивайте свои навыки решения проблем при возникновении различных ошибок (или станьте лучшим гуглером)
  • Практикуйте / изучайте навыки, с которыми вы никогда раньше не сталкивались
  • Повысьте уверенность в своих способностях как ученого-специалиста по данным
  • Хранилище личных проектов, которые можно разместить в резюме и показать работодателям.

Звучит здорово, правда? Позвольте мне показать вам, как вы можете начать.

Создание вашего первого проекта по науке о данных

  1. Выберите набор данных

Вот список БЕСПЛАТНЫХ репозиториев наборов данных, которые вы можете просмотреть и загрузить набор данных по своему вкусу. Я бы выбрал набор данных по теме, которая вам действительно интересна, а не по тому, что, по вашему мнению, хотел бы видеть работодатель.

Не знаете, что выбрать? Начните с Kaggle, если вы новичок. У вас будет доступ к записным книжкам других пользователей, чтобы вы могли черпать вдохновение, чтобы начать работу.

2. Какие вопросы вы хотите решить?

После выбора данных вы захотите загрузить их в Python и выполнить исследовательский анализ данных (EDA), чтобы узнать свои данные. Если вы никогда раньше не проходили EDA или нуждаетесь в переподготовке, не стесняйтесь ссылаться на эту удобную книгу.

После вашего EDA спросите себя: «Если бы компания пришла ко мне с этими данными, о чем они хотели бы узнать больше? Какую важную информацию я мог бы найти, чтобы помочь компании стать лучше? »

Например, если у вас есть данные временных рядов, принадлежащие какой-либо розничной онлайн-компании, такой как Amazon, было бы неплохо поискать сезонные тенденции. Возможно, в ваших данных много непрерывных переменных. Было бы разумно создать корреляционную матрицу, чтобы начать исследование различных отношений, которые могут существовать между различными переменными в ваших данных.

3. У вас достаточно данных?

В зависимости от того, какие вопросы вы задали для анализа, вам может потребоваться найти дополнительные данные, которые можно добавить к анализу, чтобы получить дополнительную информацию. Вам также может потребоваться получить дополнительные наборы данных, которые увеличивают временные рамки ваших исходных данных.

Например, общедоступные наборы данных Airbnb доступны только с интервалом в один месяц. Это неплохо, и с этого можно начать, однако вы могли бы провести гораздо более тщательный анализ, если бы у вас были данные за несколько лет.

4. Начни свой проект

Организуйте свой проект так, чтобы ответить на различные вопросы, которые вы задали на шаге 2, и извлеките как можно больше значимой информации из имеющихся у вас данных.

Здесь происходит волшебство. Теперь вы находитесь в сценарии реальной мировой практики с данными и важными отраслевыми вопросами, которые необходимо решить. У вас есть доступ к всемирной паутине, чтобы получить доступ к тоннам и тоннам ресурсов, которые могут вам помочь, вы это получили.

Это прекрасная возможность для себя приобрести новые навыки и укрепить понимание других. Если вы столкнетесь с ошибками и другими проблемами, Google и документация станут вашим самым большим активом. И вы также можете получить доступ к множеству форумов в Интернете для специалистов по данным, таким как Stackoverflow и Data Science Stack Exchange.

По мере того, как вы создаете и работаете над все большим количеством проектов, вы получаете все больше и больше реальной практики в качестве настоящего специалиста по данным. Это медленно, но верно превратит ваше восприятие данных в инстинкт убийцы данных.

5. Напишите отчет о своих выводах, которым вы сможете поделиться с аудиторией

На мой взгляд, хорошая финальная статья о вашем проекте - отличный способ продемонстрировать свои коммуникативные и письменные навыки. Какие идеи вы смогли найти в ходе анализа? Что вы могли бы посоветовать сделать клиенту / менеджеру?

Заключительная рецензия является обязательной для любого проекта, который вы включаете в резюме. Это дает менеджеру по найму возможность быстро изучить ваши навыки и образ мышления, чтобы увидеть, подходите ли вы для команды. Вы обязательно захотите включить различные наглядные пособия и статистические модели, которые вы использовали, и подробно объяснить, в чем заключались ваши бизнес-проблемы и как ваша работа их решает.

Но увы, это будет тема другого дня :)

Проектное обучение - это наиболее эффективный метод развития вашего восприятия данных, а также ваших технических и коммуникативных навыков. Есть некоторые навыки, которые вы можете получить только на работе, и проектное обучение поможет вам развить эти важные чувства к данным.

Большое спасибо за то, что нашли время прочитать мою статью, не стесняйтесь обращаться ко мне, если у вас есть какие-либо вопросы. До скорого!

Меня зовут Кишен Шарма, я специалист по анализу данных из Залива. Моя миссия - обучать и мотивировать начинающих специалистов по данным со всего мира.

Не стесняйтесь связываться со мной в Instagram и проверять мой дополнительный контент здесь. Вы также можете ознакомиться с другими моими статьями здесь.