Машинное обучение состоит из нескольких основных блоков, таких как:

1. Матрицы

2. Векторы

3. скаляр

4. Тензоры

5. Вероятность и статистика

6. Линейная алгебра

7. Исчисление

Матрицы:

Матрица — это представление набора чисел (или объектов), расположенных в строках.

и столбцы. Матрицы упрощают представление большего количества данных или отношений.

Приведенные выше матрицы на изображении 1 и 2 имеют размер 3x3 (3 строки x 3 столбца) и 2x3 (2 на 3, т.е. 2 строки и 3 столбца).

Это означает, что мы можем легко решать сложные задачи с помощью матриц.

Мы можем выполнять сложение, вычитание, умножение, транспонирование и другие подобные операции с матрицами.

Векторы:

Вектор — это упорядоченный набор из N элементов, также называемый n-мерным вектором. Вектор — это массив чисел. Его можно представить в виде матрицы с одним столбцом. Многомерное пространство может быть представлено через вектор, который может быть матрицей только с одним столбцом.

Скаляр:

Скаляр - это одно число.

Скалярная величина — это одномерное измерение величины, такой как температура или масса. С вектором связано более одного числа. Простой пример — скорость. У него есть величина, называемая скоростью, а также направление, такое как север или юго-запад или 10 градусов к западу от севера. С вектором может быть связано более двух чисел.

Тензоры:

Тензоры представляют собой обобщение векторов в более высоких измерениях. Тензор двух измерений является матрицей. Тензоры с более высокими размерностями представлены многомерными.

Тензоры, используемые в машинном обучении, являются синонимами многомерных массивов в программировании.

Скалярное, векторное, матричное и тензорное сравнение:

Вероятность и статистика:

Вероятность показывает, насколько вероятен конкретный результат наблюдения или измерения.

Некоторые вещи в этом мире кажутся случайными или непредсказуемыми, например. подбрасывание монеты. Многие другие явления в реальном мире имеют элемент случайности (также известные как стохастические явления), такие как значение индекса фондового рынка, температура в данный момент времени, количество людей в городе в любое время и т. д.

Например, если вы выберете карту наугад из колоды, состоящей из 52 карт, найдите вероятность того, что выпадет червовый король.

В колоде карт 4 короля (всего 52 карты)

Король червей равен 1, поэтому вероятность равна 1/52.

Другим примером может быть выбор случайного цветного шара из некоторого количества разноцветных (один цвет на шар, например, красный, зеленый, синий) шаров. Поскольку все эти исходы взаимоисключающие и один из них непременно произойдет, сумма их вероятностей равна 1.

Существует еще одно понятие, известное как распределение вероятностей. Распределение вероятностей показывает значения вероятности для каждого из возможных исходов. Однако в реальном мире распределение вероятностей может быть представлено через среднее значение, дисперсию, моду и т. д. Это статистические термины.

Например. Средний рост учащихся в конкретной школе и т.д.

Теперь есть еще одна концепция, известная как дискретная и непрерывная.

Когда числовые значения являются непрерывными, вы будете рассматривать вероятность только для диапазона значений, а не для конкретного значения.

Функция плотности вероятности (PDF) представляет собой распределение вероятностей для непрерывных переменных. PDF определяется таким образом, что вероятность во всем диапазоне значений случайной величины равна 1.

Нормальное распределение является примером такой функции распределения вероятностей.

Выборочное распределение:

Иногда нам нужно выборочное распределение. Например. полюса мнений. Из общей численности населения мы можем получить образцы. Итак, мы спрашиваем определенное количество людей об их мнении о кандидатах от политической партии. Но спросить каждого человека невозможно. Итак, делаем аппроксимации по образцам.

Линейная алгебра:

Обычно мы можем представить любые двумерные отношения с помощью графика.

Даже трехмерные отношения можно мысленно визуализировать, а также представить на графике. Однако визуализировать многомерные отношения довольно сложно. Мы можем продемонстрировать многомерные отношения через числа с таким количеством векторов измерений.

Исчисление:

Дифференциальное исчисление позволяет определить скорость изменения функции в любой момент времени.

точка по отношению к одной из входных переменных. Это означает наклон кривой (т. е. функция, изображенная как кривая) в любой заданной точке кривой.

Если мы знаем значения x в функции f(x), мы можем ее вычислить, в противном случае мы делаем аппроксимации, которые называются аппроксимацией функции.

Теперь мы хорошо вооружены основами машинного обучения, в следующей части мы будем изучать различные типы машинного обучения.