Что полезно знать инженеру машинного обучения

Наука о данных — обширная область. Есть много путей, по которым вы можете стать специалистом по данным, и все они ведут к совершенно разным конечным целям. Вы можете специализироваться на компьютерном зрении, обработке естественного языка, обнаружении аномалий и так далее. Но независимо от вашей конечной цели, есть несколько инструментов, алгоритмов и программ, которые очень помогут вам на этом пути, если вы хотя бы знаете о них.

Имейте в виду, что этот пост в блоге не охватывает темы машинного обучения, которые вы должны знать, есть масса статей, посвященных этому. Одна вещь, которую я обнаружил, которой сильно не хватало, — это инструменты, которые больше похожи на вспомогательные инструменты, которые будут делать несколько вещей, которые вы должны делать. В конце концов, ваша работа не заканчивается после создания модели.

Итак, давайте начнем.

Создание виртуальной среды и зачем она нужна [pipenv]
Тестирование вашего кода и использование линтера, чтобы убедиться, что он соответствует стандартным нормам кодирования [pytest и pylint]
Развертывание вашего приложения [Flask и Docker]
Как использовать контроль версий [git]
Различия между REST API, Web API и Soap API
Оркестратор конвейера [Airflow]
Вычислительные ресурсы [EC2 и лямбда]
Очереди сообщений [Redis]
Магазины функций
Инструмент «Панель инструментов» [Dash]
Почтальон

Имейте в виду, что это никоим образом не исчерпывающий список. Это некоторые вещи, которые приходят мне в голову. Я буду постоянно обновлять этот список и давать ссылки на статьи, которые, по моему мнению, объясняют их лучше всего. Дайте мне знать, что вы думаете.

Что полезно знать инженеру машинного обучения

Вопросы по теме