Часть 2 из 4: Оценка идеологии

Темы счетов:

Ключевым компонентом практически любого ценного анализа прогнозирующего характера характеристик законопроекта и политической среды является предметный состав рассматриваемого законопроекта. Хотя Библиотека Конгресса предоставляет список тем законопроектов, которые также включены в основную часть метаданных законопроектов из ProPublica, список тем может быть невероятно длинным и очень конкретным по своему характеру до такой степени, что оценка основных предметных областей законопроекта из предметы, предоставленные Библиотекой Конгресса, были бы почти невозможны. В качестве прекрасного примера субъектов законопроекта, предоставленных Библиотекой Конгресса, вот только 12 из 93 тем, предусмотренных Законом о сокращении налогов и занятости от 115-го Конгресса.

Хотя я не сомневаюсь, что «коренные жители Аляски и гавайцы» могут быть применимыми предметом какой-то части длинного законопроекта, который в конечном итоге стал законом, ни список из 93 необычно специфических предметов, ни чрезмерно общий главный предмет «Налогообложение» на самом деле не дает подходящий уровень детализации для моих целей. Чтобы получить представление о более практичных способах классификации предметных областей законопроекта, я снова обратился к миру академических кругов.

Используя работу д-ра Дастина Хиллиарда, д-ра Стивена Пурпуры и д-ра Джона Вилкерсона в их статье «Компьютерная тематическая классификация для смешанных методов социальных исследований», я смог определить очень эффективный метод распределения предметная классификация законопроектов Конгресса. Данные, которые я использовал для классификации, можно найти на сайте compareagendas.net.

Набор данных из Comparative Agendas обеспечивает классификацию более 400 000 законопроектов, представленных с 80-го Конгресса (1947 г.) до 112-го Конгресса (2012 г.). Каждый законопроект подразделяется на 1 из 21 уникальных основных предметных областей и 1 из множества второстепенных предметов, лежащих в основе основной темы (ссылка на полный список основных и второстепенных предметов будет включена в конце этого сообщения).

Поскольку резюме текста законопроекта, предоставленные Правительственным издательством и включенные в массивные файлы данных счета, являются довольно исчерпывающими, я протестировал репликацию модели машинной классификации опорных векторов, предложенной в документе Hilliard и Purpura, используя резюме счетов в качестве прокси для полного текста счета. . Мне удалось достичь точности 96,85% в классификации основных предметов векселей, используя резюме счетов вместо полного текста счета, поэтому я решил, что резюме GPO были адекватным заменителем полного текста счета, использованного в исследовании Хиллиарда-Пурпуры. Поскольку я не верил, что какая-то одна основная предметная область обычно обеспечивает достаточно надежное представление предметной композиции всего законопроекта, я вместо этого вернул три основные категории с наивысшей связанной вероятностью предсказанного класса. Возвращая три основных предметных области и их прогнозируемые вероятности классов, это могло бы позволить мне использовать прогнозируемые вероятности классов в качестве относительной меры количества содержания счета, связанного с каждым прогнозируемым классом, в будущих итерациях моего проекта. Код моей основной модели предметной классификации включен в мой репозиторий GitHub, ссылка на который находится внизу.

предметно-ориентированная оценка идеологии для законодателей:

Теперь, когда каждый из 255 449 законопроектов в моем наборе данных размечен по трем основным предметным областям, у меня есть база, необходимая для количественной оценки идеологии законодателя по каждой отдельной предметной области. Следующие методы, которые я разработал и применил для расчета идеологии законодателя, по своей природе несколько субъективны и, вероятно, будут пересмотрены и пересмотрены в будущих версиях, но я считаю их относительно интуитивно понятными и эффективными в их приложениях.

Перед первым поименным голосованием в карьере законодателя он начинает с нулевой оценки идеологии для каждой из двадцати одной отдельной предметной идеологии. Нулевой балл означает абсолютную двухпартийность, поскольку законодатель еще не проголосовал за то, чтобы какая-либо из сторон была большинством в какой-либо предметной области. Чтобы правильно оценить партию, поддерживающую большинство в отношении каждого законопроекта, методика должна быть немного более инклюзивной, чем просто определение того, какая партия проголосовала больше всего за. Потому что классификация законопроекта со 100% поддержкой обеих сторон как законопроекта, поддерживаемого республиканцами или демократами из-за того, что одна партия или другая имеет еще несколько членов в этой палате в то время, не будет точной оценкой беспартийного характера Законопроекта, законопроекты, получающие поддержку обеих партий, явно требуют своего собственного обозначения. Хотя мое определение двухпартийной поддержки несколько произвольно, я решил, что любой законопроект, получивший 95% или более поддержки от обеих сторон, будет считаться получающим двухпартийную поддержку для целей моего проекта. Поскольку сегодняшние законодатели, как правило, голосуют в рамках партийной линии чаще, чем в прошлом, может быть целесообразно определить более низкий порог двухпартийности, но более низкий порог для двухпартийной классификации также снизит оценки членской идеологии, поскольку будет признано меньшее количество голосов. как показатель индивидуальной партизанской идеологии. В будущих итерациях моей работы, вероятно, будет использоваться более всеобъемлющий и контекстно-зависимый метод классификации поддержки двух партий.

Теперь, когда я в общих чертах изложил свою методологию определения классификации партий, поддерживающих большинство в законопроекте, я могу объяснить, как подсчитываются баллы по уникальной предметной идеологии каждого члена на протяжении всей их карьеры. Если законодатель должен был отдать поименное голосование в поддержку или против законопроекта, отнесенного к трем основным темам «A», «B» и «C», добавление, отражающее поддержку или оппозицию законодателя в контексте каждого позиция большинства партии будет добавлена ​​к баллам по текущей идеологии этого законодателя по предметам «A», «B» и «C». Голосование при согласии с позицией большинства Республиканской партии приводит к добавлению «+1», голосование при согласии с позицией большинства Демократической партии приводит к добавлению «-1» и любой неспособности проголосовать голосование по двухпартийному законопроекту приводит к добавлению «0». Оценка идеологии законодателя для данного субъекта на данном этапе его законодательной карьеры рассчитывается как сумма всех сложений голосов, поданных по законопроектам этого субъекта, деленная на количество партийных законопроектов этого субъекта, по которым проголосовал законодатель. Альтернативные методологии, которые будут изучены в более поздних итерациях, вероятно, будут включать использование взвешенного по времени среднего для оценок предметной идеологии, чтобы сделать больший акцент на недавних голосующих позициях и лучше приспособиться к потенциально изменяющейся идеологии. В настоящее время источником предвзятости в выбранной мной методологии является практика, когда каждый новоизбранный законодатель начинает с нулевого балла по предметной идеологии. Хотя это может быть наиболее объективным средством оценки идеологии законодателя, еще не проголосовавшего, он, безусловно, вызывает практические опасения, поскольку даже самые идеологически крайние новоизбранные законодатели рассматриваются как двухпартийные до тех пор, пока не будет набрано достаточное количество голосов по каждому предмету. площадь. В будущих версиях моего проекта можно будет исследовать эффективность присвоения идеологии среднего партийного законодателя новоизбранным законодателям той же партии.

Следующие графики показывают развитие нескольких предметных идеологий в среднем по партиям за 46 лет данных, включенных в этот проект:

Предметная оценка идеологии для законопроектов:

После подсчета баллов по предметной идеологии для каждого законодателя на протяжении их карьеры, теперь у меня есть необходимое основание для присвоения баллов по идеологии законопроектам. Чтобы оценить идеологию содержания законопроекта, я обратился к соавторам каждого законопроекта. Я предположил, что для того, чтобы законодатель решил стать соавтором законопроекта, его содержание должно быть в достаточной степени согласовано с политическими целями и предметно-политической идеологией законодателя, решившего стать соавтором указанного законопроекта. Следуя этой логике, я определил, что предметные оценки идеологии среднего соавтора законопроекта служат эффективным показателем идеологии политических целей законопроекта. Хотя этот метод оценки идеологии законопроекта относительно интуитивно понятен, процесс запроса и усреднения идеологий каждого соавтора для каждой из трех тем законопроекта во время внесения законопроекта требовал немногим более 20 часов непрерывной работы. Одним из наиболее значительных преимуществ оценки идеологии по каждому из трех основных предметов законопроекта является то, что она позволяет представить идеологию законопроекта в виде точки в трехмерном пространстве. Представляя идеологию законопроекта в трехмерном пространстве (одно измерение для каждого основного предмета законопроекта), это позволяет мне изобразить идеологическую точку предполагаемого избирателя в законодательном органе в одном и том же трехмерном пространстве. В соответствии с пространственной моделью голосования, законодатель, скорее всего, проголосует наиболее близко к его идеологической точке зрения. Расстояние в трехмерном пространстве между идеологической точкой законопроекта и идеологической точкой законодателя представляет собой сходство или отсутствие такового между отчетами о голосовании соавторов законопроекта и рассматриваемого законодателя в отношении законопроектов, относящихся к одной и той же предметной области. Чем короче расстояние между точкой зрения законопроекта и точкой зрения законодателя, тем ближе их политические цели и, следовательно, тем выше вероятность того, что законодатель проголосует в поддержку законопроекта.

Следующий трехмерный точечный график иллюстрирует основной принцип пространственной модели голосования, показывая идеологическое положение Закона о защите пациентов и доступном медицинском обслуживании (через средние идеологии его соавторов в трех основных предметных областях) и его относительное расстояние от образца. сенаторов от обеих партий:

Как видно из диаграммы разброса, консервативные республиканцы, такие как Джон Маккейн и Митч МакКоннелл, сгруппированы в направлении пересечения высоких, положительных ценностей оси идеологии, в то время как либеральные демократы, такие как Чак Шумер и Джон Тестер, сгруппированы в сторону более отрицательных ценностей оси. Ближе к середине находятся более умеренные сенаторы, такие как Сьюзен Коллинз и Майкл Беннет.

Часть 3: https://link.medium.com/VFrpwiS5s2

Остальная часть кода:

Код для наиболее важных компонентов этого проекта можно найти в моем репозитории GitHub в области законодательной науки о данных: https://github.com/wjarvis2/Legislative-Data-Science

Цитаты:

Хиллард, Д., Пурпура, С., и Уилкерсон, Дж. Д. (2008). Компьютерная классификация тем для смешанных методов социальных исследований.