Избыточная выборка только с номинальными характеристиками, какие методы передискретизации или занижения выборки могут быть применимы в этом случае?

У меня есть данные, где все характеристики номинальные. Я применил SMOTE-NC, потом обнаружил, что он работает только с комбинацией номинальных и постоянных функций !.

В той же статье, посвященной технике SMOTE, есть метод под названием SMOTE-N (для работы только с номинальными функциями), но я не могу найти для него код или функцию в python, есть ли какое-либо приложение или что-то подобное ?. или есть ли какой-либо другой метод избыточной или недостаточной выборки, который работает только с категориальными функциями


person Hanan    schedule 06.07.2020    source источник
comment
Если у вас есть только номинальные характеристики, случайная передискретизация - гораздо более простой подход.   -  person DejaVuSansMono    schedule 06.07.2020
comment
Дубликат отвечает на ваш первый вопрос; Что касается вашего второго, обратите внимание, что запросы на рекомендации для внешних ресурсов явно не по теме - см. Какие темы я могу задать здесь?   -  person desertnaut    schedule 06.07.2020
comment
@DejaVuSansMono Я не могу найти ни одной ссылки, в которой говорилось бы, что это не противоречит наличию всех категориальных функций. не могли бы вы поделиться, если у вас есть такая информация. заранее спасибо   -  person Hanan    schedule 06.07.2020
comment
@desertnaut Я отредактировал вопрос исходя из этого. теперь я ищу любую другую технику, которая могла бы работать только с категориальными переменными.   -  person Hanan    schedule 06.07.2020
comment
Этот вопрос сейчас закрыт, к тому же, несмотря на ваше редактирование, вы все еще запрашиваете ресурс (только теперь вы дополнительно запрашиваете любую другую технику). Пожалуйста, откройте новый вопрос, убедившись, что он действительно по теме (я откатываю текущий вопрос к его предыдущей форме).   -  person desertnaut    schedule 06.07.2020
comment
@desertnaut Мне нужно подождать два дня, чтобы задать еще один вопрос. Я удалил ту часть, о которой вы упомянули, это дубликат. для меня это очень срочно! пожалуйста, дайте знать решение, чтобы опубликовать другой вопрос или разрешите этот после редактирования   -  person Hanan    schedule 06.07.2020