С развитием искусственного интеллекта на рынке появляются новые вакансии. И это еще больше сбивает с толку, особенно когда речь идет о роли инженера по машинному обучению и специалиста по обработке данных, в первую очередь потому, что обе они являются относительно новыми развивающимися областями. После того, как я прочитал разные статьи, блоги и посмотрел видео, я просто почувствовал, что могу представить это более четко с лживыми различиями в них.
Позвольте мне начать с аналогии. В чем разница между писателем и профессором ?. Можно сказать, что оба они знают «правила и грамматику» языка, причем один из них - рассказчик, а другой - строго придерживается «правил».
Специалисты по данным работают с необработанными данными, анализируют их, соединяют точки и рассказывают историю с помощью другого инструмента визуализации. Обычно они обладают более широким набором навыков и могут не слишком углубляться в более чем один или два. Они более творческие. Как художник.
Инженер по машинному обучению, с другой стороны, - это тот, кто смотрит на данные как на что-то, что они должны принять, и выдавать результат в некоторой подходящей форме наиболее эффективным способом. Набор навыков должен быть эффективным с точки зрения деталей реализации. Между ними может быть много общего, но это больше похоже на то, что специалист по данным - это инженер по машинному обучению, но не наоборот. Может быть, по мере того, как они набираются опыта, они и будут.
Наука о данных с точки зрения понимания / обучения и т. Д. С добавлением оттенка деловой хватки, тогда как машинное обучение - это прогнозирование системы. Например:
Наука о данных: «в этой части города примерно каждые 2 мили есть заправочные станции».
Машинное обучение: «мы прошли две мили с тех пор, как увидели заправочную станцию, поэтому начните искать другую в любое время»
Позвольте мне попытаться привести еще один пример с использованием Netflix.
Все мы знаем, насколько у Netflix мудрость рекомендовать фильм на основе нашего предыдущего выбора. Эта система рекомендаций работает с алгоритмами машинного обучения, что дает вам подходящие варианты фильмов с рекомендованными системами.
Когда мы говорим о науке о данных в Nextflix, она изучает такие закономерности, как количество рецензентов, просматривающих в конкретное время, их возраст и пол, и многие другие. Эти решения используются для улучшения деловой перспективы. Когда бизнесу нужно ответить на вопрос или решить проблему с помощью данных, задача специалистов по данным - предоставить полезную информацию на основе необработанных и неструктурированных данных.
Для обеих этих ролей требуется следующий набор навыков.
Необходимый набор навыков для специалистов по данным
- Статистика
- Интеллектуальный анализ и очистка данных
- Визуализация данных
- Методы управления неструктурированными данными
- Языки программирования, такие как R и Python
- Понимать базы данных SQL
- Используйте инструменты для работы с большими данными, такие как Hadoop, Hive и Pig
Набор навыков, необходимых для инженеров по машинному обучению
- Основы информатики
- Статистическое моделирование
- Оценка данных и моделирование
- Понимание и применение алгоритмов
- Обработка естественного языка
- Дизайн архитектуры данных
- Техники представления текста
Так что не запутайтесь с этими популярными вакансиями. Определите свою правильную квалификацию и роль, более подходящую для вас, вооружитесь необходимым набором навыков и просто будьте готовы к страстному будущему.
Удачи!!
использованная литература
Https://www.springboard.com/blog/machine-learning-engineer-vs-data-scientist/