Прежде всего, давайте ознакомимся с имеющейся у нас информацией

фиксированная кислотность: большинство кислот, присутствующих в вине, либо фиксированные, либо нелетучие

летучая кислотность: количество уксусной кислоты в вине

лимонная кислота: в небольших количествах лимонная кислота может придать винам «свежесть» и аромат

остаточный сахар: количество сахара, оставшееся после прекращения брожения

хлориды: количество соли в вине

свободный диоксид серы: свободная форма SO2 существует в равновесии между молекулярным SO2 (в виде растворенного газа) и ионом бисульфита

общий диоксид серы: количество свободных и связанных форм SO2

плотность: плотность воды близка к плотности воды в зависимости от процентного содержания спирта и сахара

pH: описывает, насколько вино кислое или щелочное по шкале от 0 (очень кислое) до 14 (очень щелочное).

сульфаты: добавка к вину, которая может повышать уровень сернистого газа (S02)

alcohol: процент содержания алкоголя в вине Выходная переменная:

Давайте сравним каждую функцию с функцией качества, чтобы получить больше информации

Давайте обобщим то, что мы можем сделать из приведенного выше анализа.

#### С увеличением показателя качества снижается состав хлоридов и летучих кислот.

#### С увеличением показателя качества увеличивается содержание спирта, сульфатов и лимонной кислоты.

Обработка набора данных дисбаланса

Теперь пришло время создать модель ››››

Логистическая регрессия:

K-ближайший сосед:

Случайный лес:

Машина опорных векторов:

Древо решений:

›››››››››››››››››› Тестовый набор: 0,864376130198915 ‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹

Вывод.Случайный лес обеспечивает максимальную точность.
Спасибо за внимание. Надеюсь, вам понравится этот проект. Я думаю, что это хороший проект для клиентов компании.