1. Прогноз цен на жилье («пример алгоритма контролируемого обучения»)

с помощью алгоритма

  • поставить прямую линию к данным (лучше?)
  • было бы лучше подогнать квадратичную функцию или функцию второго многочлена

→ как выбрать или как решить, какая функция будет лучше предсказывать данные.

Контролируемое обучение

отражает тот факт, что мы дали алгоритму набор данных, в котором даны так называемые «правильные ответы» → по какой фактической цене продаются дома

← задача алгоритма состояла в том, чтобы просто дать больше таких правильных ответов, например, для этого нового дома, который ваш друг, возможно, пытается продать

другой пример контролируемого обучения → Прогноз рака молочной железы (злокачественный, доброкачественный)

вопрос машинного обучения в этой задаче: «Можете ли вы оценить, какова вероятность, какова вероятность того, что опухоль является злокачественной, а не доброкачественной?»

"прогнозирование цен на жилье" также называется проблемой регрессии.

1) Регрессия

с помощью проблемы регрессии мы пытаемся предсказать выпуск с непрерывным значением (= цена в этом примере)

Обычно мы думаем о цене как о реальном значении.

2) Проблема классификации

Пример «рак молочной железы» является примером проблемы классификации.

с помощью проблемы классификации мы пытаемся предсказать выход с дискретным значением (0 или 1, в этом примере злокачественный или доброкачественный)

# В задаче классификации у вас может быть более двух возможных значений для вывода. Например, может быть, есть три типа рака молочной железы. Таким образом, вы можете попытаться предсказать вывод дискретного значения; ноль, один, два или три.

0-›доброкачественная, 1-›рак 1 типа, 2-›рак 2 типа, 3-›рак 3 типа

это также проблема классификации, потому что это наборы дискретных значений вывода, соответствующие тому, что у вас нет рака, раку типа 1, 2 или 3.

# В задачах классификации есть другой способ построения этих данных. Мы можем отобразить данные по оси x, используя два разных символа; Ос и Хс.

# в других задачах машинного обучения у нас есть более одной функции или более одного атрибута

скажем, вместо того, чтобы просто знать размер опухоли, мы знаем как возраст пациентов, так и размер опухоли

(злокачественные, как обозначено крестиками, доброкачественные, как Os)

Что может сделать алгоритм обучения, так это подобрать прямую линию к данным, чтобы попытаться отделить злокачественные опухоли от доброкачественных, и поэтому алгоритм обучения может решить провести такую ​​прямую линию, чтобы разделить две причины опухолей.

в этом примере у нас было две особенности, а именно возраст пациента и размер опухоли. В других задачах машинного обучения у нас часто будет больше функций.

→ для большего вы можете использовать бесконечное количество функций и бесконечное количество атрибутов

как справиться с таким количеством функций: с помощью алгоритма под названием «Машина опорных векторов»