При демократии решение принимает не один человек (например, король), а большое количество людей, принимающих их вместе. Каковы преимущества этой установки? Почему демократия исторически так успешна? Мы могли бы возразить, что демократии более стабильны, потому что всем разрешено участвовать в процессе принятия решений, и поэтому результат будет представлять пожелания людей. Лично я в эту теорию не верю: в истории немало случаев, когда большинство в демократической стране подавляло меньшинство. Я скорее предполагаю, что в условиях демократии решения, как правило, гораздо разумнее, чем те, которые могут быть приняты одним королем или небольшой группой лидеров. Именно коллективный разум, сформированный всем голосующим населением, ставит демократию выше других систем правления.

Голосование и выборы, с точки зрения машинного обучения, являются проблемами классификации: «алгоритм» в нашем мозгу должен выбрать один из нескольких доступных вариантов как правильный. Возможные варианты: кандидаты в случае выборов или «ДА/НЕТ» в случае опросов (как при прямой демократии в Швейцарии).

Метод демократии также хорошо известен в машинном обучении под термином «методы ансамбля». Методы ансамбля объединяют несколько слабых классификаторов (например, небольшие деревья решений), чтобы вместе сформировать лучший классификатор. Например, в методе «бэгинга» каждый (простой) классификатор обучается на различном подмножестве данных. Затем результаты этих классификаторов используются для голосования по окончательному результату. Результаты часто намного лучше, чем то, что может быть достигнуто с помощью одного сложного классификатора (например, большого дерева решений) с сопоставимыми усилиями.

Предполагая, что эта аналогия между избирателями в демократии и классификаторами в ансамбле машинного обучения в некоторой степени верна, мы можем узнать несколько вещей о демократии и СМИ:

«Глупые» избиратели

Вероятно, не является большой проблемой то, что люди «глупые» (лично я так не думаю, но этот аргумент мы часто слышим в дискуссиях о том, почему демократия не работает достаточно хорошо). С помощью ансамблевых методов вы можете построить мощный классификатор из большого количества простых классификаторов. Разумеется, чем лучше работают отдельные слабые классификаторы, тем лучше будет результат ансамбля. Поэтому имеет смысл инвестировать в образование людей. Но теоретически должна быть возможность получить хорошие результаты выборов и от необразованных людей. Возможно, вам просто нужно больше избирателей, чтобы получить хороший результат.

"Люди больше не читают хорошие газеты"

В ансамблевых методах важно, чтобы отдельные классификаторы были разными, что обычно достигается путем их обучения на разных подмножествах данных. Если мы обучим все слабые классификаторы на одних и тех же данных, производительность ансамбля будет эквивалентна производительности одного слабого классификатора (который плохой). Это связано с тем, что в этом случае все классификаторы в ансамбле будут идентичными после обучения и, следовательно, всегда будут голосовать за один и тот же класс. Поэтому нежелательно, чтобы все население читало одну и ту же газету (как «Правду» в бывшем Советском Союзе). Поэтому, если вы считаете, что ситуация улучшится, если все будут читать вашу любимую качественную газету, подумайте еще раз.

"В наши дни люди получают информацию только из Facebook"

Это (само по себе) может быть преимуществом. Канал социальных сетей каждого человека отличается (в соответствии с интересами, друзьями и местоположением), и поэтому выполняется требование, согласно которому люди потребляют разные подмножества данных. Теоретически социальные сети могли бы реализовать это намного лучше, чем классические СМИ (газеты и телевидение), которые не персонализированы и передают одну и ту же информацию большому количеству людей.

Облако фильтров

Что произойдет в машинном обучении, если мы начнем обучать классификатор только на данных, из которых мы предполагаем, что классификатор будет классифицировать их определенным образом (например, соглашением)? Это происходит, когда мы позволяем алгоритмам решать в социальных сетях, какую информацию люди увидят, основываясь на том, что им нравилось раньше. Я никогда не пробовал это в эксперименте по машинному обучению, но это звучит как очень плохая идея. Классификатор, скорее всего, быстро выйдет из строя. Если мы сделаем это с классификаторами ансамбля, его производительность также ухудшится.

В машинном обучении мы случайным образом выбираем подмножество данных, которое используется для обучения одного из слабых классификаторов. Поэтому подмножество должно по-прежнему содержать информацию обо всем наборе данных.

В ансамблевых методах также можно сделать слабые классификаторы разными, подав каждому из них разное подмножество полей данных. В переводе на демократию это означает, что не проблема, если каждого избирателя волнуют только определенные темы (и не все). Это может быть даже преимуществом. Но опять же, если поля данных/темы выбираются алгоритмом, основанным на поведении классификатора/избирателя, производительность классификатора/избирателя ухудшится.

«Фейковые новости»

Что произойдет с ансамблем, если мы добавим шум к обучающим данным? Шум в смысле неправильно помеченных записей тренировок (например, для изображений классификатора изображений лошадей, помеченных как тигры). Производительность всех слабых классификаторов ухудшится. Но все же можно было бы получить хорошую производительность ансамбля (может быть, нам просто нужно больше слабых классификаторов). Если вы кормите все классификаторы одними и теми же данными (крайний классический случай СМИ «Правда»), ущерб от фейковых новостей намного выше (помните: в этом случае производительность ансамбля будет эквивалентна ухудшению производительности одного слабого классификатор). Следовательно, социальные сети могут сделать демократию более устойчивой к фейковым новостям. Но если мы позволим распространять фальшивые новости через платные посты среди большей части избирателей, у нас снова возникнет проблема.

Вирусный эффект

В социальных сетях некоторый контент может достигать значительной части населения из-за вирусного воздействия. Это снова может быть плохо, так как «обучает» членов «ансамбля» на одних и тех же данных. Поэтому «ограничения на пересылку», недавно введенные WhatsApp, могут быть полезны для всех платформ социальных сетей.

Из этой аналогии мы можем сделать вывод, что социальные сети могут быть шансом для демократии и потенциально могут предложить существенные преимущества по сравнению с классическими СМИ. Но только если мы поправимся! Если платформы социальных сетей не будут тщательно разработаны, их влияние на демократию может быть неблагоприятным.

Эта тема все еще нуждается и заслуживает дополнительных исследований, и я считаю, что машинное обучение может многому нас научить.