Как самый популярный язык программирования для науки о данных, пакеты Python, фреймворки и библиотеки тянутся миллионами каждый месяц. Пакеты Python от месяца к месяцу отражают растущие тенденции в области науки о данных; поскольку о НЛП говорят все чаще, мы увидим больше пакетов, вытянутых для целей НЛП. Мы изучили статистику PyPI за последний месяц, чтобы увидеть, какие пакеты машинного обучения Python использовались больше всего, и некоторые из результатов ожидаются, а некоторые довольно удивительны.

Имейте в виду, что многие из этих пакетов загружаются как «зависимые пакеты», а не как независимые загрузки.

1. Scikit-learn: 22,3 млн

Пакет машинного обучения Python с наибольшим количеством загрузок на сегодняшний день - это scikit-learn с более 22 миллионами загрузок за последний месяц. Этот пакет высокоуровневого машинного обучения Python стал популярным среди разработчиков машинного обучения благодаря его широким возможностям обрабатывать регрессию, классификацию, кластеризацию и многое другое.

2. TensorFlow: 11,5 млн

Хотя TensorFlow получил примерно вдвое меньше загрузок, чем scikit-learn, этот популярный фреймворк машинного обучения по-прежнему пользуется популярностью в сообществе специалистов по науке о данных. Эта платформа с открытым исходным кодом, изначально разработанная Google, имеет мощную поддержку машинного обучения и глубокого обучения, а гибкое ядро ​​численных вычислений используется во многих других областях науки. В свою очередь, TensorBoard увидел 10 миллионов загрузок.

3. Керас: 5,6 млн

Являясь лидером в области глубокого обучения, Keras за последний месяц зафиксировал 5 миллионов загрузок. Keras, созданный на основе TensorFlow 2.0, позволяет командам легко масштабировать процессы глубокого обучения, развертывать их где угодно и подключаться к более крупной экосистеме TensorFlow 2.0.

4. PyTorch: 4,8 млн

С чуть менее 5M загрузок PyTorch набирает популярность благодаря простоте использования и способности быстро масштабироваться от исследования до производства и развертывания. Первоначально разработанный Facebook AI, PyTorch регулярно используется в машинном обучении, глубоком обучении, компьютерном зрении и НЛП.

5. ONNX: 1,2 млн

ONNX все больше и больше участвует в обсуждении пакета машинного обучения Python, и в прошлом месяце он получил 1,2 миллиона загрузок. Как экосистема с открытым исходным кодом как для машинного, так и для глубокого обучения, ONNX все чаще используется в NLP, работая вместе с Hugging Face для более плавного и упрощенного конвейера NLP.

6. MXNet: 655 КБ

Несмотря на то, что он даже не достиг отметки в 1 млн, Apache MXNet по-прежнему является ценным фреймворком для инженеров глубокого обучения, поскольку он разработан для обеспечения эффективности, производительности и масштабируемости на разных машинах.

Заключение о популярных пакетах машинного обучения Python

Этот список не является исчерпывающим, так как появляется множество новых пакетов машинного обучения Python. Эти данные были взяты за сентябрь 2021 года, поэтому следующий месяц и следующий год могут выглядеть совершенно иначе, поскольку выпускаются обновления, появляются новые фреймворки и меняются совместимости.

Однако в обозримом будущем большая часть экосистемы Python останется неизменной. Чтобы убедиться, что вы готовы использовать эти пакеты - и все, что еще может появиться, - все еще рассмотрите возможность обучения.

На ODSC West 2021 с 16 по 18 ноября это гибридное личное и виртуальное мероприятие будет включать десятки сеансов по Python, чтобы узнать больше о пакетах машинного обучения Python. В ODSC West найдется что-то для всех, от таких тем, как фреймворки машинного обучения до того, как реализовать определенные инструменты для бизнес-аналитики. Выделенные сессии включают:

  • Приложения современного моделирования выживания с помощью Python: Брайан Кент, доктор философии | Data Scientist / Основатель | Змеиный змей
  • Создание системы ответов на вопросы с использованием DistilBERT в Python: Jayeeta Putatunda | Data Scientist | MediaMath
  • Выявление изображений и видео Deepfake с помощью Python с Керасом: Ноа Гиансиракуза, доктор философии | Доцент кафедры математики / науки о данных | Университет Бентли
  • Введение в Scikit-learn: машинное обучение на Python: Томас Фан | Старший инженер-программист | Quansight Lab
  • Введение в обработку естественного языка на основе DL с использованием TensorFlow и PyTorch: Магнус Экман, доктор философии | Директор | NVIDIA

12 октября у нас также будет увлекательное занятие Ai + Training Введение в программирование на Python, на котором вы сможете понять объектную модель пакетов машинного обучения Python и Python. Вы познакомитесь с основными структурами данных, функциями сборки и классами, которые помогут в работе с данными. По завершении курса вы сможете писать и читать код Python, а также знать некоторые идиомы, уникальные для Python.

Оригинальный пост здесь.

Прочтите больше статей по науке о данных на OpenDataScience.com, включая учебные пособия и руководства от новичка до продвинутого уровня! Подпишитесь на нашу еженедельную рассылку здесь и получайте последние новости каждый четверг. Вы также можете пройти обучение по науке о данных по запросу, где бы вы ни находились, с нашей платформой Ai + Training.