Многие объяснения, которые я вижу по теме линейной алгебры, как правило, сразу перескакивают на такие темы, как скалярные произведения, матрицы и векторы. Я также вижу, что многие люди обращаются к приложениям предмета в различных областях, таких как большие данные, компьютерная графика и машинное обучение. Я хотел сделать шаг назад, чтобы подробно объяснить, откуда именно взялось изучение линейной алгебры и как кто-то может самостоятельно вывести этот предмет с нуля. В этой статье не предполагается, что вы знаете какую-либо математику помимо элементарной алгебры.

Поскольку название предмета заставляет вас предположить, что линейная алгебра связана с линейными уравнениями, уравнениями вида ax + by = c. Который можно изобразить в виде линии.

Обычный подход при анализе сложной проблемы — поиграть с примерами, поэтому мы начнем с рассмотрения системы линейных уравнений.

2x + 4y = 7 (1)

x + 2y = 4 (2)

Обычный способ решить такую ​​систему уравнений — использовать технику, известную как исключение. Мы можем сделать это, умножив наше второе уравнение x + 2y = 4 на 2. Что даст нам

2x + 4y = 8

Затем мы можем вычесть наше первое уравнение (1) из нашего второго (2), что дает нам

2x + 4y-(2x + 4y) = 8–7

0 = 1

Здесь явно что-то не так, на самом деле это так называемая несогласованная система уравнений. Короче говоря, это означает, что наша система уравнений не имеет решения. Мы можем продолжить играть с нашей системой, слегка изменив предыдущую систему уравнений, что даст нам

2x + 4y = 8

x + 2y = 4

Если мы воспользуемся тем же подходом, что и ранее, используя исключение, чтобы попытаться решить эту проблему, мы получим следующий результат.

0 = 0

В отличие от предыдущей системы, которая не имела решения, эта система имеет бесконечное число решений. Система, которая не имеет решений или имеет бесконечное число решений, называется неопределенной, а система линейных уравнений с одним решением называется регулярной. На данный момент вы должны почесать голову и теоретизировать, что при попытке решить систему линейных уравнений у нас остается три возможных случая. У нас может быть одно возможное решение, ни одного решения или бесконечное количество решений. Итак, теперь вам может быть интересно, что именно делает систему линейных уравнений регулярной или неопределенной? Чтобы понять это, мы сделаем то, что обычно делают математики, пытаясь решить проблему, мы придумаем обобщение.

ax + by = s

cx + dy = t

Если оглянуться на вторую изученную нами систему линейных уравнений, мы заметим закономерность. Первое уравнение в каждой системе можно преобразовать во второе, разделив каждое уравнение на два. Это может привести нас к предположению, что если уравнение в нашей системе кратно другому, то система не определена.

Используя нашу обобщенную систему уравнений, мы попытаемся придумать условие, при котором наша система имеет решение. Для этого мы еще раз применим процесс исключения. Мы умножим наше верхнее уравнение ax +by = s на d и наше нижнее уравнение cx + dy = t на b. Это даст нам следующую систему уравнений.

adx + bdy = sd

bcx + bdy = bt

Вычитание нашего верхнего уравнения на нижнее в нашей системе дает нам

adx-bcx = sd-bt

(ad-bc)x = sd-bt

Теперь нам просто нужно делать то, что мы делаем все время в школе. Решите за х!

Таким образом, мы можем узнать, каково значение x в нашей системе уравнений, если ad-bc не равно 0.

Теперь мы повторяем точно такой же процесс, чтобы исключить x и найти y, на этот раз умножив верхнее уравнение на c, а нижнее уравнение на а.

acx + bcy = sc

acx + ади = в

Вычитание этих дает нам

(ad-bc)y=at-sc

Таким образом, мы видим, что если ad-bc не равно 0, то наша система уравнений имеет единственное решение, определяемое формулой

x = (sd-bt)/(ad-bc), y=(at-sc)/(ad-bc)

Теперь вы можете предположить, что все в порядке, мы проанализировали нашу систему, определили, что наши решения попадают в три разные категории: отсутствие решения, бесконечные решения и одно уникальное решение, но осталась еще одна вещь, которую вы, возможно, заметили. Мы показали, что единственное решение существует, когда ad-bc не равно 0, но мы не показали, что его не существует, когда ad-bc = 0. Могло бы быть каким-то другим методом решения нашей системы, о котором мы не знаем. Чтобы исследовать это, давайте сделаем шаг назад и нарисуем график для наклонной линии ax + by = s с добавленным ограничением, что оба a и b не равны 0. Наклонная линия может быть описана как линия, которая не является ни горизонтальной, ни вертикальной.

Отсюда видно, что уравнение пересекает ось Y на высоте s/b и ось X, когда x = s/a и y = 0.

Мы можем продолжить этот процесс для различных ограничений на a, b и s, чтобы создать таблицу, описывающую различные наборы очков.

Теперь мы можем думать о множестве возможных решений для данной пары линейных уравнений. Например, если у нас есть горизонтальная и вертикальная линии, будет одна общая точка. Если у нас есть плоскость и любой другой тип линейного уравнения, мы вернем этот тип обратно. Продолжая это, мы получим следующую таблицу.

Затем мы можем создать таблицу для значений ad-bc, чтобы проверить, когда оно равно нулю для данной пары линейных уравнений. Например, когда у нас есть наклонная линия, ax+by=s, мы знаем, что a и b отличны от нуля. Если взять горизонтальную линию cx + dy = t. Мы знаем, что c равно 0, но d отлично от нуля. Используя это, мы можем определить, каким будет значение ad-bc для этой пары уравнений. Мы знаем, что d должно быть равно 0, поэтому ad равно 0. Мы знаем, что b и c не равны нулю, поэтому у нас остается

нулевое значение — ненулевое значение = ненулевое значение

Повторяя эту процедуру для каждой заданной пары возможных строк, мы получаем другую таблицу.

Если вы сравните две последние таблицы, то увидите, что при ad-bc=0 наш набор решений представляет собой всего одну точку.

Таким образом, учитывая два линейных уравнения, мы можем теперь подумать о том, какова будет разница в их наклонах. Для линии ax + by = s у нас есть наклон -a/b и для cx + dy = t мы имеем наклон -c/d . Чтобы узнать, когда эти наклоны одинаковы, мы можем взять разницу, дающую нам

a/b- (-c/d)

= -a/b+c/d

= — ad/bd + bc/bd

=-(ad-bc)/bd

Если adbc = 0, то две линии в нашей системе имеют одинаковый наклон, то есть они не могут быть одним решением. В случае наклонных линий у нас могут быть две параллельные линии, которые не пересекаются, и в этом случае у нас нет решения, или у нас есть одна и та же линия, и в этом случае будет бесконечное количество решений. Если строки aIf adbc не равны 0, то наши две линии имеют разные наклоны, что приводит к одному решению, поэтому у нас был знак «?» в ячейке для наших косых линий. Теперь мы можем видеть, что для системы двух линейных уравнений

ax + by = s

cx + dy = t

Что у нас будет уникальное решение тогда и только тогда, когда adbc не равно 0.

Заключительные замечания

Спасибо, что нашли время, чтобы прочитать это! Я планирую написать больше о линейной алгебре, в частности, о формальном понятии матрицы.