Готовя недавно статью о лингвистических паттернах в средствах массовой информации, я обнаружил, что перечитываю многие статьи, обработанные моей нейронной сетью, пытаясь понять ее выводы через призму конкретных историй. Наблюдая за сообщениями из разных источников и изучив взгляды представителей разных политических кругов, я могу из первых рук подтвердить, что просмотр новостей утомляет, и каждый момент возникает ощущение, что оно выражает постоянное чувство безотлагательности.

Начиная с данных, тональность примерно относится к тому, насколько позитивны или негативны слова в фрагменте текста. В контексте этого эссе тексты представляют собой описания статей, которые можно увидеть в RSS-потоках информационных агентств (часто это фрагменты самих статей или краткий предварительный / краткий текст, который можно увидеть на веб-сайте издателя). Значение -1, присвоенное посредством модели тональности обработки естественного языка TextBlob, означает, что оно настолько отрицательное, насколько возможно, 1 означает, что оно максимально положительно, а 0 - нейтрально. Стоит отметить, что тональность может быть контекстной (и иметь нюансы), поэтому в данном случае величина полярности может быть более важной, чем направление, и, поскольку модель настроения не зависит от СМИ, расчет не идеален. Тем не менее, как показано на визуализации выше, некоторые агентства видят разное распределение настроений в статьях, при этом некоторые, такие как Vox или Wall Street Journal, довольно узкие (более нейтральные настроения), в то время как другие, такие как Daily Mail или CNN, исследуют более полярные части языковой спектр. Это не критика какого-либо агентства или комментарий о необходимости более полярного выбора слов, но он подчеркивает, что, учитывая новости дня, не только разные агентства освещают мир более интенсивно, чем другие (с точки зрения словесности). выбор), но в случайный день можно испытать множество крайностей полярности настроений в медиа-ландшафте. Действительно, быстрый анализ случайного месяца (июнь) показывает, что в каждый день диапазон имеет тенденцию быть широким: в течение многих дней просматривается по крайней мере одна статья со средней полярностью предложения 1 или -1.

Возможно, мы действительно живем во время большого ускорения, когда всегда происходят поворотные моменты, но, с другой стороны, постоянная крайняя полярность может быть неприятной, потому что, как отмечает Джон Стюарт, [если] все усиливается, мы ничего не слышим. При этом этот анализ помещает в контекст беспокойство, вызванное полярностью в новостях: данные подтверждают, что по крайней мере часть медиа-ландшафта действительно замаривается в длительном состоянии повышенных настроений, и, поскольку он видит острый язык, он может быть Понятно, как новость вызывает опасения. Я пока не знаю, что с этим делать, хотя стоит критически изучить полярность языка, с которым вы сталкиваетесь из-за ваших привычек потребления медиа. Однако, как и в случае с моим опытом наблюдения за тенденциями, которые очерчивают этот ландшафт, я надеюсь, что вы, увидев эти данные, почувствуете перспективу и, возможно, даже успокоите.

Код и данные на https://github.com/sampottinger/news_flower. Статья отредактирована, чтобы помочь читателям лучше понять ограничения использования ранее существовавшей модели настроений.