В последнее десятилетие многие компании использовали данные для увеличения доходов, прибыли и масштабов. здесь будет рассказано о том, кто обрабатывает данные в компаниях, и основные ноу-хау, необходимые для работы.

Бизнес-аналитик
Требуется несколько основных ноу-хау, в том числе:

  1. знание статистических инструментов/программ: SAS, STATA, SPSS, R.
  2. способен продемонстрировать понимание аналитических методов, включая регрессию, анализ тенденций, прогнозирование и A/B-тестирование.
  3. РС. Мастерство Excel, включая сводные таблицы, функции массива и VBA, инструменты визуализации, такие как таблица, Power BI, QlikView.
  4. Существенный объем знаний предметной области.

Аналитик данных
Требуется базовое понимание нескольких основных ноу-хау, в том числе:

  1. Программирование (питон и R)
  2. Прикладной статистический анализ
  3. Прикладное машинное обучение
  4. Визуализация данных — Tableau, Power BI, QlickView
  5. Манипулирование данными
  6. Сбор и обработка данных

Инженер данных
Набор навыков для инженера данных включает:

  1. Инструменты и экосистема данных, вероятно MapReduce, Hive, Pig, Spark, Kafka
  2. Технологии на базе SQL — MySQL, postgresSQL
  3. Технологии NoSQL — Mongo DB, Cassandra
  4. Решение для хранения данных

Data Scientist
Набор инструментов для Data Scientist Включает в себя несколько концепций, а также упомянутые выше для аналитика данных:

  1. Многомерная статистическая регрессия, анализ основных компонентов и кластеризация
  2. НЛП (обработка естественного языка)
  3. Компьютерное зрение (открытое резюме)
  4. Перспективное и прогнозное моделирование
  5. Облачный сервис — AWS, Google Cloud, Microsoft Azure
  6. Знакомство с механизмами развертывания алгоритмов машинного обучения — Docker, Kubernetes, TIDAL.