Хорошо известно, что линейная регрессия является мощным инструментом для прогнозирования цен на жилье, особенно если характеристики линейно коррелируют с переменной отклика. Однако можно использовать и другие подходы.

В этом посте мы покажем прогноз цен на жилье с использованием георадара с ядром Матерна и его различия, а также диапазон test_sizes. На Рисунке 1 ниже показаны различия между прогнозируемыми и реальными ценами на жилье по сравнению с жилой площадью, поскольку предварительные результаты показали, что sqft_living хорошо линейно коррелирует с ценами.

Эти результаты показывают, что GPR на самом деле достаточно хорошо соответствует реальным ценам на жилье для низких значений sqft_living, поскольку в этом регионе количество точек данных больше. Более того, test_size 0.6 лучше предсказал реальные значения по сравнению с другими test_sizes. Однако следует отметить, что модель предсказывала значения, близкие к нулю.

Наконец, наш простой подход с использованием георадара в учебном пакете sci-kit может обеспечить полезный прогноз цен на жилье в дополнение к классическому подходу линейной регрессии. Тем не менее, необходимо провести более глубокий анализ, чтобы получить максимально возможную информацию.

Чтобы просмотреть скрипт Python, перейдите по ссылке ниже:

https://www.kaggle.com/erichosseinfontes/gaussian-process-regression-for-housing-prices