БАЗОВЫЙ XAI

BASIC XAI с DALEX - Часть 7: Профили Ceteris Paribus

Введение в исследование модели с примерами кода для R и Python.

Добро пожаловать в серию «BASIC XAI с DALEX».

В этом посте мы представляем профили Ceteris Paribus, независимый от модели метод, который мы можем использовать для любого типа модели.

Доступны предыдущие части этой серии:

Итак, приступим?

Во-первых, что нам поставляет Ceteris Paribus?

Ceteris Paribus - это латинское словосочетание, означающее «все остальное остается неизменным» или «все остальное неизменным». Профили Ceteris Paribus (CP) предназначены для демонстрации отклика модели вокруг одной точки в пространстве признаков. Они показывают, как реакция модели зависит от изменений одной входной переменной, при этом все остальные переменные остаются неизменными. Они работают для любой модели машинного обучения и позволяют сравнивать модели, чтобы лучше понять, как работает модель.

Второй - идея Ceteris Paribus.

Lef f обозначают прогнозную модель. Профили Ceteris Paribus для модели f, переменной j и точки x₊ определяются как

где x₊ относится к точке в пространстве функций. Кроме того, x ʲ | ⁼ ᶻ обозначает точку данных x₊ со всеми координатами, равными x₊, кроме координаты j равно значению z.

Взгляните на пример наблюдения x₊, где для года постройки принимается значение 1998, для поверхности - 88, для количества этажей - 2 и для количества комнат - 3. Переменная j - это construcion.year, поэтому она принимает только разные значения, а другие переменные имеют значения для наблюдения x₊.

На рисунке ниже показан профиль CP для одного наблюдения, описанного выше. Фиолетовая точка - это значение прогноза для x₊, j - это характеристика construction.year, а z принимает значение в диапазоне от 1920 до 2010.

В-третьих, давайте создадим модель на R и Python.

Напишем код. Мы все еще работаем над данными DALEX квартир. Для расчета профиля Ceteris Paribus мы используем функцию pred_profile (). Нам нужен объясняющий объект и наблюдение, для которого мы хотим вычислить объяснение. Затем с помощью функции plot () строим профиль CP.

На рисунке ниже представлены профили для таких переменных, как год постройки, поверхность, пол и количество комнат. Анализируя это, мы можем прочитать, что если бы наша недвижимость была построена до 1935 года или после 2000 года, ее цена могла бы быть выше. Более того, давайте посмотрим на переменную surface: если бы наша квартира имела меньшую площадь, ее цена увеличилась бы, но увеличение площади на каждый дополнительный метр ее уменьшает.

Чтобы оценить, как ведет себя прогноз для выбранных наблюдений, мы можем нарисовать несколько профилей Ceteris Paribus. См. Пример ниже. Каждый профиль соответствует одному наблюдению из подмножества (график соответствует 10 случайно выбранным наблюдениям). Чтобы получить этот график, мы должны предоставить фрейм данных, содержащий выбранное количество наблюдений в качестве значения аргумента new_observation.

Это последняя часть серии «BASIC XAI с DALEX», спасибо за время, которое вы провели со мной в этом невероятном приключении XAI.

Если вас интересуют другие сообщения об объяснимом, справедливом и ответственном машинном обучении, подпишитесь на #ResponsibleML на Medium.

Чтобы увидеть больше материалов, связанных с R, посетите https://www.r-bloggers.com