Прежде всего, давайте ознакомимся с имеющейся у нас информацией
фиксированная кислотность: большинство кислот, присутствующих в вине, либо фиксированные, либо нелетучие
летучая кислотность: количество уксусной кислоты в вине
лимонная кислота: в небольших количествах лимонная кислота может придать винам «свежесть» и аромат
остаточный сахар: количество сахара, оставшееся после прекращения брожения
хлориды: количество соли в вине
свободный диоксид серы: свободная форма SO2 существует в равновесии между молекулярным SO2 (в виде растворенного газа) и ионом бисульфита
общий диоксид серы: количество свободных и связанных форм SO2
плотность: плотность воды близка к плотности воды в зависимости от процентного содержания спирта и сахара
pH: описывает, насколько вино кислое или щелочное по шкале от 0 (очень кислое) до 14 (очень щелочное).
сульфаты: добавка к вину, которая может повышать уровень сернистого газа (S02)
alcohol: процент содержания алкоголя в вине Выходная переменная:
Давайте сравним каждую функцию с функцией качества, чтобы получить больше информации
Давайте обобщим то, что мы можем сделать из приведенного выше анализа.
#### С увеличением показателя качества снижается состав хлоридов и летучих кислот.
#### С увеличением показателя качества увеличивается содержание спирта, сульфатов и лимонной кислоты.
Обработка набора данных дисбаланса
Теперь пришло время создать модель ››››
Логистическая регрессия:
K-ближайший сосед:
Случайный лес:
Машина опорных векторов:
Древо решений:
›››››››››››››››››› Тестовый набор: 0,864376130198915 ‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹‹