В последнее десятилетие многие компании использовали данные для увеличения доходов, прибыли и масштабов. здесь будет рассказано о том, кто обрабатывает данные в компаниях, и основные ноу-хау, необходимые для работы.
Бизнес-аналитик
Требуется несколько основных ноу-хау, в том числе:
- знание статистических инструментов/программ: SAS, STATA, SPSS, R.
- способен продемонстрировать понимание аналитических методов, включая регрессию, анализ тенденций, прогнозирование и A/B-тестирование.
- РС. Мастерство Excel, включая сводные таблицы, функции массива и VBA, инструменты визуализации, такие как таблица, Power BI, QlikView.
- Существенный объем знаний предметной области.
Аналитик данных
Требуется базовое понимание нескольких основных ноу-хау, в том числе:
- Программирование (питон и R)
- Прикладной статистический анализ
- Прикладное машинное обучение
- Визуализация данных — Tableau, Power BI, QlickView
- Манипулирование данными
- Сбор и обработка данных
Инженер данных
Набор навыков для инженера данных включает:
- Инструменты и экосистема данных, вероятно MapReduce, Hive, Pig, Spark, Kafka
- Технологии на базе SQL — MySQL, postgresSQL
- Технологии NoSQL — Mongo DB, Cassandra
- Решение для хранения данных
Data Scientist
Набор инструментов для Data Scientist Включает в себя несколько концепций, а также упомянутые выше для аналитика данных:
- Многомерная статистическая регрессия, анализ основных компонентов и кластеризация
- НЛП (обработка естественного языка)
- Компьютерное зрение (открытое резюме)
- Перспективное и прогнозное моделирование
- Облачный сервис — AWS, Google Cloud, Microsoft Azure
- Знакомство с механизмами развертывания алгоритмов машинного обучения — Docker, Kubernetes, TIDAL.