→ Анализ главных компонентов — это метод, при котором размерность наборов данных повышает интерпретируемость, но в то же время минимизирует потерю информации.

в PCA мы находим лучшую «картинку» или «проекцию» точек данных.

В основном это уменьшает размерность больших наборов данных.

Как работает программа PCA: –

→ PCA выполняет следующие операции, чтобы оценить главный компонент для данного набора данных.

  • Стандартизация. Основная цель этого шага — стандартизировать диапазон атрибутов, чтобы каждый из них находился в одинаковых границах.
  • Вычисление матрицы ковариации. Матрица ковариации используется для выражения корреляции между любыми двумя или более атрибутами в многомерном тесте. Ковариация говорит нам, как связаны две или более переменных.
  • Собственные значения и собственный вектор — Собственные значения и собственные векторы являются математическими значениями, которые извлекаются из таблицы ковариаций. Они отвечают за создание нового набора переменных из старого набора переменных, что в дальнейшем приводит к построению главного компонента. Собственные значения — это скаляры или величины собственных векторов. Собственные векторы не меняют направления после линейного преобразования.
  • Векторы признаков — Вектор признаков — это просто матрица, в которой есть собственные векторы компонента, которые мы решили сохранить в качестве столбцов.

Теперь вот ссылка на мой исходный код файла google colab, там все определено, и самое главное, если вы обнаружите что-то не так, пожалуйста, дайте мне знать, я буду рад учиться.

Ссылка → https://colab.research.google.com/drive/10d-vQMI-7QEUfUGSQoDtZtvBceuzY00f?usp=sharing

Моя учетная запись LinkedIn, не стесняйтесь связаться со мной.

Спасибо.