Машинное обучение (ML) — это изучение компьютерных алгоритмов, которые автоматически совершенствуются благодаря опыту. Он рассматривается как подмножество искусственного интеллекта. Алгоритмы машинного обучения строят модель на основе выборочных данных, известных как данные для обучения, чтобы делать прогнозы или принимать решения без явного программирования для этого. Википедия

В сегодняшней статье мы поговорим о некоторых платформах машинного обучения с открытым исходным кодом, которые вы можете использовать для своего следующего проекта.

Примечание. В этой статье мы поговорим о некоторых не очень известных, но хороших платформах машинного обучения с открытым исходным кодом, доступных на Github, которые вы можете использовать в своих проектах. Чтобы узнать больше о каждом из них, я рекомендую перейти по ссылке, указанной в проекте.

Обучение — это не только повышение компетентности в своей работе. Это гораздо больше. Datacamp позволяет мне учиться без ограничений.

Datacampпредоставляет вам гибкость, необходимую для прохождения курсов в свободное время и изучения основных навыков, необходимых для перехода к успешной карьере.

Datacamp научил меня быстро улавливать новые идеи и применять их к реальным проблемам. Пока я был на этапе обучения, Datacamp зацепил меня всем, что происходит на курсах, от содержания курсов и отзывов TA до встреч и твитов профессора.

Вот некоторые из моих любимых курсов, которые я настоятельно рекомендую вам изучать, когда это соответствует вашему графику и настроению. Вы можете напрямую применить концепции и навыки, полученные на этих курсах, в новом увлекательном проекте на работе или в университете.

  1. Ученый-данные с Python
  2. Data Scientist-with-r
  3. Ученый-машинное обучение-с-r
  4. Ученый-машинное обучение-с-python
  5. Машинное обучение для всех
  6. Наука о данных для всех
  7. Инженер данных с Python
  8. Аналитик данных с Python
  9. Основы работы с большими данными через pyspark

Возвращаясь к теме —

1. Тензорный поток

Github: 150 000 звезд и 83 200 форков

Ссылка на гитхаб | Официальная документация

Tensorflow — это сквозная платформа с открытым исходным кодом для машинного обучения. Он имеет всеобъемлющую и гибкую экосистему инструментов, библиотек и ресурсов сообщества, которая позволяет исследователям продвигать современное машинное обучение и разработчики легко создают и развертывают приложения на основе машинного обучения.

TensorFlow предоставляет стабильные API Python и C++, а также негарантированную обратную совместимость API для других языков.

TensorFlow изначально был разработан исследователями и инженерами, работающими в команде Google Brain в рамках исследовательской организации Google Machine Intelligenceдля проведения машинного обучения и глубокие исследования нейронных сетей.

2. Керас

Github: 50 200 звезд и 18 700 форков

Ссылка на гитхаб | Официальная документация

Keras — это API для глубокого обучения, написанный на Python и работающий поверх платформа машинного обученияTensorFlow. Он создан для людей, а не для машин.

Keras следует рекомендациям по снижению когнитивной нагрузки: предлагает согласованные и простые API, сводит к минимуму количество действий пользователя, необходимых для распространенных случаев использования, и предоставляет четкие и действенные сообщения об ошибках. Он также имеет обширный документация и руководства для разработчиков.

Поддержка Multi-backend Keras прекращена. В настоящее время мы рекомендуем пользователям Keras, которые используют Keras с несколькими бэкэндами с бэкендом TensorFlow, переключиться на tf.keras в TensorFlow 2.0

Текущий выпуск — Keras 2.4.0, который перенаправляет на tf.keras.

3. Открыть резюме

Github: 50 200 звезд и 40 700 форков

Ссылка на гитхаб| Официальная документация

OpenCV (библиотека компьютерного зрения с открытым исходным кодом)является компьютером с открытым исходным кодом. программное обеспечение для машинного зрения и машинного обучения, созданное для обеспечения общей инфраструктуры для приложений компьютерного зрения и для ускорения использования машинное восприятие в коммерческих продуктах.

Библиотека содержит более 2500 оптимизированных алгоритмов, включая полный набор классических и современные алгоритмы компьютерного зрения и машинного обучения. Он имеетинтерфейсы C++, Python, Java и MATLAB и поддерживает Windows, Linux, Android и Mac OS.

Вы можете использовать эти алгоритмы для обнаружения и распознавания лиц, идентификации объектов, классификации действий человека в видео, отслеживания движений камеры, отслеживания движущихся объектов, извлечения 3D-моделей вещей, создания 3D-облаков точек из стереокамер, сшивания изображений. вместе для создания изображения всей сцены в высоком разрешении, поиска похожих изображений в базе данных изображений, удаления эффекта красных глаз на фотографиях, сделанных со вспышкой, отслеживания движений глаз, распознавания пейзажей и установки маркеров для наложения на них дополненной реальности и т. д..

4. Питорч

Github: 43 800 звезд и 11 500 форков

Ссылка на гитхаб | Официальная документация

PyTorch – это пакет Python, предоставляющий две функции высокого уровня:

  • Тензорные вычисления (например, NumPy) с сильным ускорением графического процессора
  • Глубокие нейронные сети, построенные на системе автоградации на основе лент

PyTorch предоставляет тензоры, которые могут работать либо на ЦП, либо на графическом процессореи значительно ускоряют вычисления.

Он предоставляет различные тензорные подпрограммы для ускорения и удовлетворения ваших потребностей в научных вычислениях, таких как нарезка, индексирование, математические операции, линейная алгебра, редукция. И они быстрые!

PyTorch имеет минимальные накладные расходы на инфраструктуру и спроектирован так, чтобы быть интуитивно понятным, линейным в мышлении, и проста в использовании. Когда вы выполняете строку кода, она выполняется.

5. Scikit Learn

Github: 42 900 звезд и 20 600 форков

Ссылка на гитхаб | Официальная документация

Scikit-learn – это модуль Python для машинного обучения, созданный на основе SciPy и распространяемый по лицензии BSD из трех пунктов. Он предоставляет различные функции, такие как:

  • Простые и эффективные инструменты для прогнозного анализа данных
  • Доступно для всех и многократно используется в различных контекстах
  • Создано на основе NumPy, SciPy и matplotlib
  • Открытый исходный код, коммерческий — лицензия BSD

Он включает в себя модули и библиотеки для таких задач, как:

  • Классификация. Определение категории, к которой принадлежит объект.
  • Регрессия: прогнозирование атрибута с непрерывным значением, связанного с объектом.
  • Кластеризация: автоматическая группировка похожих объектов в наборы.
  • Уменьшение размерности: уменьшение количества учитываемых случайных переменных.
  • Выбор модели: сравнение, проверка и выбор параметров и моделей.
  • Предварительная обработка: извлечение признаков и нормализация.

6. Трансформеры

Github: 36 500 звезд и 8 900 форков

Ссылка на гитхаб | Официальная документация

Трансформеры — это современная обработка естественного языка для Pytorch и TensorFlow 2.0. Трансформеры предоставляют тысячи предварительно обученных моделейдля выполнения задач над текстами, такими как классификация, извлечение информации, ответы на вопросы, обобщение, перевод, генерация текста и т. д. на более чем 100 языках.

Он призван сделать передовые НЛП более простыми в использовании для всех. Трансформеры предоставляют API для быстрой загрузки и использования этих предварительно обученных моделей для заданного текста точной настройки их в ваших наборах данных. В то же время вы можете использовать каждый модуль Python, определяющий архитектуру, как автономный и модифицированный для проведения быстрых исследовательских экспериментов.

Transformers поддерживаются двумя самыми популярными библиотеками глубокого обучения: PyTorch и TensorFlow с бесшовной интеграцией между ними, что позволяет вам тренировать свои модели с помощью одной модели, а затем загружать ее для вывода с помощью другой.

Резюме

В этом посте вы узнали о лучших платформах машинного обучения,доступных в Интернете, которые могут вам помочь.

У вас есть вопросы?
Задавайте свои вопросы в комментариях ниже или свяжитесь со мной через мои учетные записи в социальных сетях, и я сделаю все возможное, чтобы ответить.

Если вам понравилась эта статья, я уверен, что у нас схожие интересы и мы работаем/будем работать в схожих отраслях. Итак, подключаемся через LinkedIn и Github. Пожалуйста, не стесняйтесь отправить запрос на контакт!

Не забудьте поделиться со мной этой статьей и прокомментировать ваши ценные отзывы (это действительно мотивирует меня, ребята). Спасибо за чтение. Счастливого обучения!

Не забудьте подарить нам свой 👏 !