ЛУЧШИЕ БИБЛИОТЕКИ МАШИНОСТРОЕНИЯ В PYTHON, КОТОРЫЕ НЕОБХОДИМО СОБЛЮДАТЬ В 2021 году.

Связаться с Исаак Тонилой.

Начало изучения машинного обучения - непростой процесс, особенно если язык программирования python является предпочтительным. Просто набрав фреймворки python в строке поиска, вы получите тысячи блогов, в которых пропагандируются разные фреймворки. Вы, вероятно, потратите следующую неделю или около того, пытаясь понять, какой вариант выбрать, а какой оставить.

Я поделюсь с вами своим опытом, когда я только начинал, и как я, наконец, начал писать код, вы, вероятно, потратите пару дней, прежде чем сможете развернуть этот первый алгоритм, но в конечном итоге все это того стоит.

Если вы спросите любого, кто был связан с технологиями и написанием кода, о самом простом и наиболее дружелюбном языке программирования, скорее всего, ответом будет python, за исключением нескольких заблудших ребят с энергией и мозгами над облаками, которые сказали бы java.

Помимо использования в Интернете, разработке приложений, написании сценариев и запуске на тысячах встроенных устройств, он также получил признание большинства разработчиков, работающих в области машинного обучения и искусственного интеллекта.

R - близкий конкурент, который существует уже довольно давно, и у него также есть огромное сообщество вокруг него и некоторые удивительные функции, но для новичка его кривая обучения немного круче, особенно если у вас нет твердого понимания статистических понятий.

Я нахожу это удобным для некоторых конкретных задач, например, когда мне нужна продуманная визуализация для сложной проблемы.

Python сумел остаться лучшим выбором для меня и большинства специалистов по обработке данных по всему миру. Одна из основных причин - это обширное предложение и фреймворки, облегчающие жизнь разработчикам. Давайте углубимся и посмотрим на самые популярные библиотеки, которые широко используются в реальных отраслевых приложениях.

В этой статье я предполагаю, что вы ознакомились со всеми основами машинного обучения и его подразделов.

Если нет, нажмите здесь

  1. Scikit Learn.

Одна из самых богатых библиотек, когда дело доходит до инструментов, помимо множества функций классификации, регрессии, уменьшения размерности и кластеризации.

В значительной степени полагается на numpy, matplotlib и Scipy, и поэтому было бы разумно, если бы вы рассмотрели эти три, прежде чем приступить к изучению Scikit.

Ниже я выделю некоторые из функций, которые предлагает Scikit;

-Создание оценок, подгонка модели и прогнозы: в Scikit есть несколько удивительных встроенных алгоритмов, которые облегчают вам жизнь, когда вы хотите обучить модель на основе некоторых данных и сделать некоторые прогнозы. Все, что вам нужно сделать, это знать как применить метод подгонки.

-Кластеризация: Scikit позволяет создавать алгоритмы для простой классификации элементов с помощью модуля scikit.cluter, а также выполнять некоторые удивительные вещи, такие как квантование цвета, специальное группирование изображений с использованием кластерного сегментации , k-означает кластеризацию, примените комплексные методы, такие как монотонный анализ ограничений и анализ дерева решений.

-Если вы готовите свои данные для анализа, вам, вероятно, потребуется их предварительно обработать, как объясняется здесь. Модуль scikit.preprocessing делает это с помощью звукового сигнала таких методов, как KBinsDiscretizer и Function Transformer для выбора столбцов.

-Еще одна функция, которая выделяет Scikit для меня, - это модуль sklearn.feature_extraction.text, который позволяет вам работать с текстовыми документами и позволяет выполнять дальнейший анализ, такой как классификация, кластеризация и многое другое. .

Это не для библиотеки Sckit learn. То, что вы могли бы сделать с этой библиотекой, - это просто из воображения, ее модули охватывают сотни, и все станет еще интереснее, если вы только начинаете. Подробнее об этом в следующем посте, а пока просто ознакомьтесь с их документацией здесь.

2.Панды.

Среди наиболее распространенных фреймворков для машинного обучения на Python. Он известен своим мастерством в анализе данных в реальных сценариях работы с огромными данными.

Помимо того, что он настолько эффективен в управлении данными, он дает своим пользователям гибкость для работы с различными типами наборов данных, например (временные ряды, помеченные данные, CSV, табличные данные и любые другие многомерные данные в матричной форме). .

На этом веселье не заканчивается, когда вы работаете с пандами, в вашем распоряжении есть ряд инструментов, позволяющих легко импортировать данные любого формата. Что ж, вы можете спросить, а что, если в моих данных отсутствуют значения, и они слишком случайны и перепутаны? С пандами вы можете делать с вашими данными все, что хотите, вот только некоторые из них:

-Изменение формы и поворота данных

-Анализ временных рядов, включая такие функции, как генерация и запаздывание частоты и сдвиг данных.

-Вы сможете вставлять новые данные и удалять некоторые данные.

-Вместе с другим фреймворком, известным как Numpy, который мы рассмотрим в следующий раз, вы можете легко правильно выровнять данные для формирования фрейма данных.

Вы бы не хотели работать с фреймворком, который требует вечности для загрузки или выполнения операции, и в этом случае pandas вас покрывает. Поскольку большая часть низкоуровневых алгоритмов уже оптимизирована, пока вы вводите в свою модель качественные данные, гарантируется даже более быстрое выполнение.

Однако стоит отметить, что pandas работает с рядом инструментов, которые мы называем зависимостями, в том числе и с другими фреймворками.

И они обычно важны, когда вы хотите вызвать определенный метод, но хорошая новость заключается в том, что python всегда будет вызывать ошибку, если такой инструмент не установлен в вашей системе.

Вы можете проверить официальный сайт pandas для получения таких и более подробной информации.

3. NUMPY

Массивы почти неизбежны при работе с python, они являются альтернативой спискам и работают быстрее, поскольку в отличие от своих аналогов они занимают меньший объем памяти и, следовательно, с ними быстрее работать.

Помимо предоставления вам гибкости для работы с любым размером массивов, все, что вам нужно сделать, это указать размер с помощью модуля ndim.

Вот еще пара сотрудников, которые можно использовать с numpy.

-Вы можете создать массив, используя формальные списки в Python, или при желании можете использовать функцию массива.

-Возможность распечатать любое измерение массивов, которые затем отображаются в различных формах в соответствии с их размером, например, массивы одного измерения отображаются в виде строки, а трехмерные отображаются в виде матриц и так далее.

-Выполнение базовых операций, таких как перестановка, сложение, вычитание и многие другие. За более подробной информацией обращайтесь к официальной документации.

Итерация, нарезка, индексация массивов и расширенные методы индексирования - это лишь некоторые из операций, которые вы можете выполнять с массивами.

Вы можете работать с сотнями математических функций, встроенных в математический модуль, все, что вам нужно сделать, это импортировать модуль, некоторые из которых есть; тригонометрические, гиперболические, экспоненциальные функции.

Примечание.

Если вы изучали математику высокого уровня в колледже или университете, вас, должно быть, когда-то учили численному анализу. Это единица, которую обычно преподают в инженерных и математических школах по всему миру, и она просто влечет за собой придумывание алгоритмов для числовых приближений в соответствии с Википедией.

MATLAB и S-PLUS являются одними из распространенных программ, известных своей эффективностью в этой области. Numpy as вместе с Scipy также в качестве альтернативы этому программному обеспечению они предоставляют простой набор инструментов для решения больших проблем в этой области.

4. SCIPY.

И Scipy, и Numpy полагаются друг на друга, как я уже упоминал ранее, они также являются кроссплатформенными, и это дает вам преимущество в их изучении, вы можете изучать их одновременно.

Numpy - отличный инструмент для работы с базовыми и расширенными функциями массива, но у Scipy есть довольно много пакетов для различных научных вычислений.

-Помимо основных инструментов Scipy дает вам возможность работать;

- Преобразование Фурье с использованием пакета ffpack.

-Обработка сигналов с помощью пакета Signal Package.

-Доступ практически ко всем статистическим распределениям с помощью пакета stats.

-Применение методов линейной алгебры с использованием пакета linalg.

-Алгоритмы и методы кластеризации с использованием пакета кластера.

Выполнение интегрирования в обыкновенных дифференциальных уравнениях и уравнениях в частных производных с помощью пакета интегрировать.

Помимо этого, вы также можете получить доступ к специальным математическим функциям и даже к некоторым уравнениям физики с помощью специального пакета, некоторые из функций, к которым вы можете получить доступ:

-Функции преобразования Фурье.

- Функции фильтрации и обработки сигналов.

-Тригонометрические функции

-Экспоненциальные функции

-Методы интерполяции.

Scipy занимает одно из первых мест, когда речь идет о пакетах и ​​подпакетах для работы с различными числовыми задачами, это всего лишь набросок того же самого.

Пожалуйста, обратитесь к их официальному сайту, чтобы узнать больше, например, о функциях ввода и вывода для обработки файлов и многомерных методах работы со статистическими данными.

5. TensorFlow.

Одна из новейших разработок в области машинного обучения, но уже получила одобрение большинства разработчиков во всем мире. В последнее время возникло много шума вокруг глубокого обучения и искусственных нейронных сетей, которые являются частью машинного обучения.

Глубокое обучение, по сути, влечет за собой создание моделей, которые преобразуют необработанные данные через ряд слоев для извлечения желаемых функций. Доказал свою эффективность в области обработки и распознавания изображений.

Одной из наиболее важных функций является его способность работать с API, такими как Keras, которые просто упрощают жизнь разработчикам, помимо этого он имеет обширную библиотеку для работы с проблемами классификации, регрессии и нейронных сетей.

В своих последних выпусках TensorFlow обладает гибкостью, позволяя теперь работать на нескольких процессорах и графических процессорах.

Прежде чем вы сможете изучить TensorFlow и другие концепции глубокого обучения, хорошо, что вы сначала познакомитесь с основами машинного обучения и всеми другими библиотеками, которые мы ранее обсуждали.

Я не скажу, что с этой библиотекой сложно работать или изучать, но она может создать множество проблем для новичка, прежде чем вы сможете понять большинство концепций.

Вы можете запустить TensorFlow в своей системе, сначала установив последнюю версию Python 3, а затем запустив теги скрипта, представленные на официальной странице TensorFlow или через Anaconda.

Для получения более подробной информации посетите эту ссылку.

Я, вероятно, почувствую себя виноватым за то, что не добавил в этот список Matplotlib, Pytorch и некоторые другие замечательные библиотеки, но matplotlib, как следует из названия, предлагает несколько удивительных инструментов для построения графиков, которые могут позволить вам общаться с данными.

Автор: Исаак Тонилой.