- Прогноз цен на жилье («пример алгоритма контролируемого обучения»)
с помощью алгоритма
- поставить прямую линию к данным (лучше?)
- было бы лучше подогнать квадратичную функцию или функцию второго многочлена
→ как выбрать или как решить, какая функция будет лучше предсказывать данные.
Контролируемое обучение
отражает тот факт, что мы дали алгоритму набор данных, в котором даны так называемые «правильные ответы» → по какой фактической цене продаются дома
← задача алгоритма состояла в том, чтобы просто дать больше таких правильных ответов, например, для этого нового дома, который ваш друг, возможно, пытается продать
другой пример контролируемого обучения → Прогноз рака молочной железы (злокачественный, доброкачественный)
вопрос машинного обучения в этой задаче: «Можете ли вы оценить, какова вероятность, какова вероятность того, что опухоль является злокачественной, а не доброкачественной?»
"прогнозирование цен на жилье" также называется проблемой регрессии.
1) Регрессия
с помощью проблемы регрессии мы пытаемся предсказать выпуск с непрерывным значением (= цена в этом примере)
Обычно мы думаем о цене как о реальном значении.
2) Проблема классификации
Пример «рак молочной железы» является примером проблемы классификации.
с помощью проблемы классификации мы пытаемся предсказать выход с дискретным значением (0 или 1, в этом примере злокачественный или доброкачественный)
# В задаче классификации у вас может быть более двух возможных значений для вывода. Например, может быть, есть три типа рака молочной железы. Таким образом, вы можете попытаться предсказать вывод дискретного значения; ноль, один, два или три.
0-›доброкачественная, 1-›рак 1 типа, 2-›рак 2 типа, 3-›рак 3 типа
это также проблема классификации, потому что это наборы дискретных значений вывода, соответствующие тому, что у вас нет рака, раку типа 1, 2 или 3.
# В задачах классификации есть другой способ построения этих данных. Мы можем отобразить данные по оси x, используя два разных символа; Ос и Хс.
# в других задачах машинного обучения у нас есть более одной функции или более одного атрибута
скажем, вместо того, чтобы просто знать размер опухоли, мы знаем как возраст пациентов, так и размер опухоли
(злокачественные, как обозначено крестиками, доброкачественные, как Os)
Что может сделать алгоритм обучения, так это подобрать прямую линию к данным, чтобы попытаться отделить злокачественные опухоли от доброкачественных, и поэтому алгоритм обучения может решить провести такую прямую линию, чтобы разделить две причины опухолей.
в этом примере у нас было две особенности, а именно возраст пациента и размер опухоли. В других задачах машинного обучения у нас часто будет больше функций.
→ для большего вы можете использовать бесконечное количество функций и бесконечное количество атрибутов
как справиться с таким количеством функций: с помощью алгоритма под названием «Машина опорных векторов»