Линейная алгебра для науки о данных

Узнав о машинном обучении, контролируемом, неконтролируемом обучении и всех «соответствующих» алгоритмах для науки о данных, я узнал одну вещь, которую раньше не осознавал, и это также не является частью учебной программы некоторых начинающих специалистов по науке о данных. курсы — это необходимость линейной алгебры в самом начале развития науки о данных. На самом деле, математику, лежащую в основе алгоритмов, можно хорошо понять, если вы немного разбираетесь в линейной алгебре. Поэтому необходимо иметь некоторое представление.

Если вы считаете, что математика не ваша чашка чая, или вы прошли долгий путь после окончания учебы или аспирантуры, то это для вас. Я просто сделаю это очень простым, чтобы вы поняли. Вы всегда можете обратиться к соответствующим книгам и веб-сайтам для более глубокого понимания.

Давайте начнем.

Все начинается с простой матрицы.

Что такое МАТРИЦА?

Матрица — это двумерный или прямоугольный массив чисел, подобный следующему:

Он организован в виде строк и столбцов. Он представлен в виде Aij, где i представляет количество строк, а j представляет количество столбцов.

Строки и столбцы матрицы

Матрица с m строками и n столбцами называется матрицей m × n или m-на-n матрица, а m и n называются ее размерами. Например, приведенная выше матрица A представляет собой матрицу 2 × 2, которую можно представить как A22.

Типы матрицы:

Квадратная матрица: матрица (массив значений) с таким же количеством строк, как и столбцов. Ниже представлена матрица 3x3.

2. Матрица идентичности: Квадратная матрица, у которой 1 на главной диагонали и 0 на всех остальных. Обычно представлен И.

Единичная матрица

3. Диагональная матрица: Квадратная матрица, у которой 0 везде, кроме главной диагонали.

Диагональная матрица

4. Скалярная матрица: Квадратная матрица, имеющая ненулевое одинаковое число на главной диагонали и 0 во всех остальных местах.

Скалярная матрица

5. Нулевая или нулевая матрица: нули везде

Нулевая матрица

6. Матрица строк: матрица только с одной строкой

Матрица строк

7. Матрица столбцов: Матрица только с одним столбцом. Также называется Вектор.

Матрица столбцов

Еще несколько действий с матрицей

Сложение матриц: при добавлении двух матриц обе они должны иметь одинаковые размеры. Если A — матрица размерности mxn, матрица B также должна иметь размерность mxn. Сложите числа в соответствующих позициях.

Вычитание матриц. Для вычитания двух матриц также должны быть одинаковые размеры. Если A — матрица размерности mxn, матрица B также должна иметь размерность mxn. Вычтите числа в совпадающих позициях.

Транспонирование матрицы. Чтобы «транспонировать» матрицу, поменяйте местами строки и столбцы. Мы ставим букву «Т» в верхнем правом углу, что означает транспонирование. Для матрицы mxn транспонирование будет иметь размерность nxm.

Обратная матрица: обратная матрица A может быть записана как A-1. Когда мы умножаем матрицу на ее обратную, мы получаем матрицу идентичности (которая равна «1» для матриц)

A × A-1 = I

Мы можем получить обратную матрицу с помощью кода.

Умножение матрицы на скаляр:умножение матрицы на скаляр или, скажем, на постоянное число. Все элементы матрицы будут умножены на одно и то же число.

Умножение матрицы на скаляр 2

Деление матрицы со скаляром. Деление матрицы со скаляром аналогично умножению матрицы со скаляром. Здесь мы делим каждый элемент на ненулевое скалярное число.

Матричное умножение: матричное умножение двух матриц может происходить только в том случае, если размерность столбца первой матрицы совпадает с размерностью строки второй матрицы, т. е. если A и B являются двумя матрицами, то для скалярного произведения AB размеры A и B должны быть Amn и Bnp.

Матричное умножение матриц

В приведенных выше матрицах мы вычисляем так:

1*7 + 2*9 + 3*11 = 7 + 18 + 33 = 58.

Аналогично для C12 = 1*8 + 2*10 + 3*12 = 8 + 20 + 36 = 64.

Итак, в итоге получаем:

Свойства умножения матриц

Мы увидим два основных свойства:

Умножение матриц не является коммутативным.

Как и в арифметике, мы видим, что 2*5 = 5*2. Тогда как в матрице AB ≠ BA

Умножение матриц является ассоциативным.

(АВ)С = А(ВС). Если мы умножим D=AB, а затем умножим Result1=DC. Опять же, если мы умножим E=BC, а затем умножим Result2=AE, то Result1 должен быть равен Result2.

Подробнее о векторах

Собственные векторы и собственные значения. Собственный вектор — это вектор, направление которого остается неизменным при применении к нему линейного преобразования. Рассмотрим изображение ниже, на котором показаны три вектора. Зеленый квадрат нарисован только для иллюстрации линейного преобразования, применяемого к каждому из этих трех векторов.

Собственные векторы (красные) не меняют направление, когда к ним применяется линейное преобразование (например, масштабирование). Другие векторы (желтые) подходят.

Преобразование в этом случае представляет собой простое масштабирование с коэффициентом 2 в горизонтальном направлении и коэффициентом 0,5 в вертикальном направлении, так что матрица преобразования A определяется как:

Вектор

затем масштабируется путем применения этого преобразования как

На приведенном выше рисунке показано, что это линейное преобразование не влияет на направление некоторых векторов (показаны красным). Эти векторы называются собственными векторами преобразования и однозначно определяют квадратную матрицу A. Именно это уникальное детерминированное отношение является причиной того, что эти векторы называются «собственными векторами» (Eigen означает «конкретный» на немецком языке).

В общем случае собственный вектор

матрицы A является вектором, для которого выполняется следующее:

где

является скалярным значением, называемым «собственным значением». Это означает, что линейное преобразование A на векторе

полностью определяется

Где мы можем увидеть линейную алгебру в науке о данных? Приложения линейной алгебры:

Чтобы изучать статистику, нужно изучить линейную алгебру. Особенно многомерная статистика. Статистика и анализ данных — еще одна основная область математики, поддерживающая машинное обучение. Они в первую очередь связаны с описанием и пониманием данных. Как математика данных, линейная алгебра оставила свой отпечаток во многих смежных областях математики, включая статистику.
Линейная алгебра помогает создавать лучшие алгоритмы машинного обучения и визуализации.
Собственные векторы и собственные значения имеют большое значение во многих методах, используемых в компьютерном зрении и машинном обучении, таких как уменьшение размерности с помощью PCA или распознавание лиц с помощью EigenFaces.
Собственные значения и собственные векторы используются для минимизации шума данных. Мы также можем использовать их для повышения эффективности задач, которые, как известно, требуют больших вычислительных ресурсов. Их также можно использовать для устранения переобучения.

Есть много других. Это лишь некоторые из них.

Надеюсь, вам понравился блог. Пожалуйста, поделитесь и прокомментируйте.