Наука о данных — обширная область. Есть много путей, по которым вы можете стать специалистом по данным, и все они ведут к совершенно разным конечным целям. Вы можете специализироваться на компьютерном зрении, обработке естественного языка, обнаружении аномалий и так далее. Но независимо от вашей конечной цели, есть несколько инструментов, алгоритмов и программ, которые очень помогут вам на этом пути, если вы хотя бы знаете о них.

Имейте в виду, что этот пост в блоге не охватывает темы машинного обучения, которые вы должны знать, есть масса статей, посвященных этому. Одна вещь, которую я обнаружил, которой сильно не хватало, — это инструменты, которые больше похожи на вспомогательные инструменты, которые будут делать несколько вещей, которые вы должны делать. В конце концов, ваша работа не заканчивается после создания модели.

Итак, давайте начнем.

  1. Создание виртуальной среды и зачем она нужна [pipenv]
  2. Тестирование вашего кода и использование линтера, чтобы убедиться, что он соответствует стандартным нормам кодирования [pytest и pylint]
  3. Развертывание вашего приложения [Flask и Docker]
  4. Как использовать контроль версий [git]
  5. Различия между REST API, Web API и Soap API
  6. Оркестратор конвейера [Airflow]
  7. Вычислительные ресурсы [EC2 и лямбда]
  8. Очереди сообщений [Redis]
  9. Магазины функций
  10. Инструмент «Панель инструментов» [Dash]
  11. Почтальон

Имейте в виду, что это никоим образом не исчерпывающий список. Это некоторые вещи, которые приходят мне в голову. Я буду постоянно обновлять этот список и давать ссылки на статьи, которые, по моему мнению, объясняют их лучше всего. Дайте мне знать, что вы думаете.