Наука о данных, машинное обучение, искусственный интеллект, глубокое обучение, самоуправляемые автомобили, суперинтеллектуальные чат-боты, распознавание лиц и многое другое делают сегодня шум на рынке. Использование этих шумов может повысить оценку стартапа в десять раз или увеличить вашу зарплату в пять раз. Сегодня большое количество разработчиков программного обеспечения, бизнес-аналитиков, аналитиков по качеству программного обеспечения, менеджеров по продукту хотят стать специалистами по анализу данных. Людям всегда интересно понять, как Alexa или Siri понимают голосовые команды и со временем лучше их обслуживают.

Путь к изучению науки о данных прост. Вы начинаете с поиска в Интернете по машинному обучению и науке о данных и получаете множество ссылок, содержащих бесплатные обучающие видео, блоги и практические руководства. Вы выбираете тот, который появляется либо вверху страницы поиска, либо с небольшим содержанием, и начинаете его изучать.

После месяца или двух напряженной работы вы получаете идею: четко различать, что такое машинное обучение и глубокое обучение, можно разделить проблему классификации и регрессии и использовать такой алгоритм, как линейная регрессия или случайный лес, для создания модели на R или python. . Теперь вы чувствуете себя комфортно, начинаете искать работу в области науки о данных, получаете длинный список и составляете резюме с упоминанием ваших навыков. Компании берут ваш профиль, звонят вам и начинают собеседование. Вы в восторге от своей первой работы в области науки о данных. Вы пересматриваете концепцию и готовитесь к собеседованию. Вы уверены, что получите работу.

Интервью начинается с вашего знакомства. Теперь интервьюер переходит к вопросу, задавая более глубокий вопрос о науке о данных, и вы начинаете чувствовать себя некомфортно из-за вашего текущего обучения. Вы знаете, как работает регрессия, но не переоснащение? Что это? Да, вы знаете о регуляризации, но в чем разница между двумя методами? Вы выучили это, но никогда не задумывались о вычислительной разнице между различными методами.

Сегодня доступно большое количество курсов, которые могут научить вас концепции науки о данных, но вам нужно много работать перед собеседованием. В этой и следующих статьях я расскажу о навыках, которые необходимо развить для взлома собеседований по науке о данных. Я буду вести отдельные блоги по каждому из навыков и писать, что для этого нужно.

Чтобы взломать собеседование по науке о данных, нам понадобятся следующие навыки

  • Язык программирования (R, Python, Java)
  • Знание структуры данных и алгоритмов
  • Пайплайн науки о данных (начните с получения данных и создания модели с хорошей производительностью)
  • Хорошее владение статистикой
  • Инструменты для работы с большими данными (для некоторых профилей)
  • Математика (линейная алгебра, исчисление, вероятность)
  • Исследование данных (с помощью инструментов или языка программирования)
  • Форматирование данных
  • Алгоритмы машинного обучения (обязательно !!)
  • Последние достижения в области науки о данных и машинного обучения (как работает чат-бот, как поисковая система генерирует точное ранжирование страниц)
  • Проекты, которые могут подчеркнуть вашу работу в области науки о данных

Я расскажу об этих темах более подробно в следующих статьях блога. Оставайтесь с нами и продолжайте учиться !!