Машинное обучение — это область искусственного интеллекта, которая позволяет компьютерным системам учиться непосредственно на примерах, данных и опыте. У него много алгоритмов, и, к сожалению, мы не можем выбрать правильный алгоритм для правильной задачи. Ниже приведены факторы, которые помогают нам выбрать правильный алгоритм

Факторы, помогающие выбрать алгоритм

1-тип алгоритма

2-параметризация

3-размер памяти

4-тенденция к переоснащению

5-время обучения

6-Время предсказания

Тип алгоритма

1. Регрессия

Это метод, используемый для прогнозирования зависимой переменной в наборе независимых переменных. Алгоритмы, которые подвергаются регрессии,

1-линейная регрессия

2-Дерево решений

3-Случайный лес

4-Усиление

2. Классификация

Это метод, используемый для аппроксимации функции отображения (f) от входных переменных (X) до дискретных выходных переменных (y). Алгоритмы, которые подпадают под классификацию:

1-логистическая регрессия

2-Наивный Байес

3-СВМ

4-нейронные сети

5-Дерево решений

6-Случайный лес

6-Усиление

3. Кластеризация

Это метод разделения совокупности или точек данных на несколько групп таким образом, чтобы точки данных в одних и тех же группах были более похожи на другие точки данных в той же группе и отличались от точек данных в других группах. K-means - важный алгоритм, используемый для кластеризации

Примечание. Дерево решений, случайный лес и бустинг — это алгоритмы, которые можно использовать как для классификации, так и для регрессии.

Параметризация

Параметры являются ключевыми для алгоритмов машинного обучения. Они являются частью модели, которая изучается на основе исторических данных обучения. Параметры являются ключевыми для алгоритмов машинного обучения. Они являются частью модели, которая изучается на основе исторических данных обучения. Мы классифицируем наши параметры как

1-нет параметров

2-слабый

3-простой/интуитивный

4-Не интуитивно понятный

Объем памяти

Это пространство, необходимое нам для хранения наших данных и переменных. Исследователи борются с ограниченной пропускной способностью памяти устройств DRAM, которые должны использоваться современными системами для хранения огромного количества весов и активаций в DNN. Графические процессоры и другие машины, разработанные для матричной алгебры также используется другой множитель памяти либо для весов, либо для активаций нейронной сети. Мы классифицируем требуемый объем памяти как

1-маленький

2-большой

3-Очень большой

Тенденция к переоснащению

Когда модель пытается предсказать тенденцию в слишком зашумленных данных. Переобучение — это результат слишком сложной модели со слишком большим количеством параметров. Переоснащенная модель является неточной, поскольку тренд не отражает реальности данных. Существует множество методов, которые можно использовать для уменьшения переобучения, включая перекрестную проверку, регуляризацию, раннюю остановку, сокращение, байесовские априорные вероятности, отсев и сравнение моделей. . Мы классифицируем склонность к переоснащению как

1-Низкий

2-Средний

3-высокий

4-Очень высокий

Время учиться

Время обучения — это время, связанное с обучением набора данных. Оно зависит от размера данных и используемого нами алгоритма. Мы классифицируем время обучения как

1-слабый

2-дорого

3-Очень дорого

Время прогнозировать

Время прогнозирования — это время, связанное с тестированием набора данных. Оно зависит от размера данных и используемого нами алгоритма. Мы классифицируем время обучения как

1-слабый

2-дорого