С развитием искусственного интеллекта на рынке появляются новые вакансии. И это еще больше сбивает с толку, особенно когда речь идет о роли инженера по машинному обучению и специалиста по обработке данных, в первую очередь потому, что обе они являются относительно новыми развивающимися областями. После того, как я прочитал разные статьи, блоги и посмотрел видео, я просто почувствовал, что могу представить это более четко с лживыми различиями в них.

Позвольте мне начать с аналогии. В чем разница между писателем и профессором ?. Можно сказать, что оба они знают «правила и грамматику» языка, причем один из них - рассказчик, а другой - строго придерживается «правил».

Специалисты по данным работают с необработанными данными, анализируют их, соединяют точки и рассказывают историю с помощью другого инструмента визуализации. Обычно они обладают более широким набором навыков и могут не слишком углубляться в более чем один или два. Они более творческие. Как художник.

Инженер по машинному обучению, с другой стороны, - это тот, кто смотрит на данные как на что-то, что они должны принять, и выдавать результат в некоторой подходящей форме наиболее эффективным способом. Набор навыков должен быть эффективным с точки зрения деталей реализации. Между ними может быть много общего, но это больше похоже на то, что специалист по данным - это инженер по машинному обучению, но не наоборот. Может быть, по мере того, как они набираются опыта, они и будут.

Наука о данных с точки зрения понимания / обучения и т. Д. С добавлением оттенка деловой хватки, тогда как машинное обучение - это прогнозирование системы. Например:

Наука о данных: «в этой части города примерно каждые 2 мили есть заправочные станции».

Машинное обучение: «мы прошли две мили с тех пор, как увидели заправочную станцию, поэтому начните искать другую в любое время»

Позвольте мне попытаться привести еще один пример с использованием Netflix.

Все мы знаем, насколько у Netflix мудрость рекомендовать фильм на основе нашего предыдущего выбора. Эта система рекомендаций работает с алгоритмами машинного обучения, что дает вам подходящие варианты фильмов с рекомендованными системами.

Когда мы говорим о науке о данных в Nextflix, она изучает такие закономерности, как количество рецензентов, просматривающих в конкретное время, их возраст и пол, и многие другие. Эти решения используются для улучшения деловой перспективы. Когда бизнесу нужно ответить на вопрос или решить проблему с помощью данных, задача специалистов по данным - предоставить полезную информацию на основе необработанных и неструктурированных данных.

Для обеих этих ролей требуется следующий набор навыков.

Необходимый набор навыков для специалистов по данным

  • Статистика
  • Интеллектуальный анализ и очистка данных
  • Визуализация данных
  • Методы управления неструктурированными данными
  • Языки программирования, такие как R и Python
  • Понимать базы данных SQL
  • Используйте инструменты для работы с большими данными, такие как Hadoop, Hive и Pig

Набор навыков, необходимых для инженеров по машинному обучению

  • Основы информатики
  • Статистическое моделирование
  • Оценка данных и моделирование
  • Понимание и применение алгоритмов
  • Обработка естественного языка
  • Дизайн архитектуры данных
  • Техники представления текста

Так что не запутайтесь с этими популярными вакансиями. Определите свою правильную квалификацию и роль, более подходящую для вас, вооружитесь необходимым набором навыков и просто будьте готовы к страстному будущему.

Удачи!!

использованная литература

Https://www.springboard.com/blog/machine-learning-engineer-vs-data-scientist/