Обобщенная линейная модель с распределением Твиди.

Привет. сегодня мы рассмотрим необычный регрессор, названный Tweedie Regressor.

Склерн называет регрессор Твиди обобщенной линейной моделью с распределением Твиди.

Вики, в теории вероятностей и статистике распределения Твиди представляют собой семейство вероятностных распределений, которое включает чисто непрерывное нормальное, гамма- и обратное гауссовское распределения, чисто дискретное масштабированное распределение Пуассона и класс составных распределений Пуассона– гамма-распределения, которые имеют положительную массу в нуле, но в остальном непрерывны. Распределения Твиди являются частным случаем моделей экспоненциальной дисперсии и часто используются в качестве распределений для обобщенных линейных моделей.[2]

Этот твиди-оценщик можно использовать для моделирования различных GLM в зависимости от параметра power, который определяет базовое распределение.

Parameter: power float, default=0
The power determines the underlying target distribution according to the following table:
Power Distribution
0      Normal
1      Poisson
(1,2)  Compound Poisson Gamma
2      Gamma
3      Inverse Gaussian

Давайте применим Tweedie Regressor на примере

Выполнена предварительная обработка основных данных. Теперь модельная часть.

#график, чтобы проверить, следует ли tweedieregressor линейной регрессии

fig, ax = plt.subplots()
ax.scatter(y_test,y_pred,edgecolors=(0,0,0))
ax.plot([y.min(),y.max()],[y.min(),y.max()], 'k--',lw=4)
ax.set_xlabel("Measured")
ax.set_ylabel("Predicted")
plt.show()

Ну вот и все. Из параметров мощности твиди-регрессора мы можем видеть, что твиди-регрессия может использоваться для различных типов распределения, таких как пуассоновское, составное пуассоновское гамма, гамма, обратное гауссово, включая нормальное распределение, которое, в свою очередь, будет очень полезно.

Посмотрите реализацию твиди-кода на Kaggle:



Спасибо за уделенное время. Если вам понравилась эта короткая статья, в моем репозитории есть множество тем по продвинутой аналитике, науке о данных и машинному обучению. https://medium.com/@bobrupakroy

Некоторые из моих альтернативных сайтов в Интернете Facebook, Instagram, Udemy, Blogger, Issuu, Slideshare, Scribd и другие.

Также доступно на Quora @ https://www.quora.com/profile/Rupak-Bob-Roy

Дайте мне знать, если вам нужно что-нибудь. Говорите Скоро.