1. Вы дезинформированы? Исследование фейковых новостей, связанных с Covid, на бенгальском языке в Facebook (arXiv)

Автор: Протик Бозе Пранто, Сайед Зами-Уль-Хак Навид, Протик Дей, Гиас Уддин, Аниндья Икбал

Аннотация .Наши мнения и взгляды на жизнь могут формироваться в зависимости от того, как мы воспринимаем мнения других людей в социальных сетях, таких как Facebook. Эта зависимость усилилась в периоды COVID-19, когда у нас меньше средств для связи с другими. Однако фейковые новости, связанные с COVID-19, стали серьезной проблемой на Facebook. Бенгальский язык является седьмым по распространенности языком в мире, однако нам неизвестно о предыдущих исследованиях, в которых изучалось распространение фальшивых новостей, связанных с COVID-19, на бенгальском языке в Facebook. В этой статье мы разрабатываем модели машинного обучения для автоматического обнаружения фейковых новостей на бенгальском языке. Лучшей моделью является BERT с оценкой F1 0,97. Мы применяем BERT ко всем сообщениям на бенгальском языке в Facebook, связанным с COVID-19. Мы находим 10 тем в бенгальских фейковых новостях о COVID-19, сгруппированных в три категории: система (например, медицинская система), вера (например, религиозные ритуалы) и социальная (например, научная осведомленность).

2. Feels Bad Man: анализ автоматического обнаружения мемов ненависти через призму FacebookChallenge(arXiv)

Автор: Кэтрин Дженнифер, Фатемех Тахмасби, Джереми Блэкберн, Джанлука Стрингини, Саввас Заннетту, Эмилиано Де Кристофаро

Аннотация: интернет-мемы стали доминирующим методом общения; в то же время, однако, они также все чаще используются для пропаганды экстремизма и поощрения уничижительных убеждений. Тем не менее, у нас нет четкого понимания того, какие аспекты восприятия мемов вызывают это явление. В этой работе мы оцениваем эффективность современных современных мультимодальных моделей машинного обучения для обнаружения ненавистнических мемов и, в частности, в отношении их универсальности на разных платформах. Мы используем два эталонных набора данных, включающих 12 140 и 10 567 изображений с доски «Политически некорректные» на 4chan (/pol/) и набор данных Facebook Hateful Memes Challenge, чтобы обучить лучшие модели машинного обучения для обнаружения наиболее заметных признаков, отличающих вирусные ненавистнические мемы. мемы из доброкачественных. Мы проводим три эксперимента, чтобы определить важность мультимодальности для эффективности классификации, влиятельную способность маргинальных веб-сообществ на основных социальных платформах и наоборот, а также переносимость обучения моделей на мемах 4chan. Наши эксперименты показывают, что характеристики изображений мемов содержат больше информации, чем их текстовое содержание. Мы также обнаруживаем, что современные системы, разработанные для онлайнового обнаружения языка ненависти в мемах, требуют дальнейшей концентрации на его визуальных элементах, чтобы улучшить их интерпретацию лежащих в основе культурных коннотаций, подразумевая, что мультимодальные модели не могут адекватно понять тонкости языка ненависти в мемах и обобщить в социальных сетях. медиа платформы.

3. Использование NLU в контексте ответов на вопросы: улучшение задач Facebook bAbI (arXiv)

Автор: Джон С. Болл

Аннотация . На следующем этапе взаимодействия человека с машиной искусственный интеллект (ИИ) должен взаимодействовать преимущественно с использованием естественного языка, потому что, если бы он работал, это был бы самый быстрый способ общения. Игрушечные задачи Facebook (bAbI) представляют собой полезный эталон для сравнения реализаций диалогового ИИ. В то время как опубликованные эксперименты до сих пор были основаны на использовании гипотезы распределения с машинным обучением, наша модель использует понимание естественного языка (NLU) с декомпозицией языка на основе грамматики ролей и ссылок (RRG) и теории Патома на основе мозга. Наша комбинаторная система для разговорного ИИ, основанная на лингвистике, имеет множество преимуществ: прохождение тестов задач bAbI без парсинга и статистики при повышении масштабируемости. Наша модель проверяет как обучающие, так и тестовые данные для поиска «мусорных» входных и выходных данных (GIGO). Он не основан на правилах и не использует части речи, а вместо этого полагается на смысл. Хотя глубокое обучение трудно отлаживать и исправлять, каждый шаг в нашей модели можно понять и изменить, как и в любой нестатистической компьютерной программе. Отсутствие объяснимых рассуждений в Deep Learning вызвало сопротивление ИИ, отчасти из-за страха перед неизвестным. Чтобы поддержать цели ИИ, мы предлагаем расширенные задачи для использования утверждений человеческого уровня с временами, аспектами и залогом, а также встроенных предложений с соединениями: и ответы должны быть генерацией естественного языка (NLG) вместо ключевых слов. В то время как машинное обучение позволяет неверным обучающим данным давать неверные ответы на тесты, наша система не может, потому что отслеживание контекста должно быть намеренно нарушено. Мы считаем, что никакие существующие системы обучения в настоящее время не могут решить эти расширенные тесты на естественном языке. Похоже, что между исследователями НЛП и лингвистами существует разрыв в знаниях, но постоянные конкурентные результаты, подобные этим, обещают сократить этот разрыв.

4.Общие чувства: понимание реакции Facebook на научные статьи (arXiv)

Автор:Коул Фриман, Мринал Канти Рой, Микеле Фатторузо, Хамед Алхури

Аннотация. Исследования на платформах социальных сетей, как правило, основываются на текстовом анализе для выполнения исследовательских задач. Хотя текстовые подходы значительно улучшили наше понимание онлайн-поведения и социальной динамики, они упускают из виду функции этих платформ, которые стали более популярными за последние несколько лет: ответы на контент на основе кликов. В этой статье мы представляем новый набор данных о реакциях Facebook на научный контент. Мы даем обзор его структуры, анализируем некоторые статистические тенденции в данных и используем его для обучения и тестирования двух алгоритмов обучения с учителем. Наши предварительные тесты предполагают наличие стратификации в количестве пользователей, просматривающих страницы, разделения, которые, кажется, соответствуют различиям в тематике этих страниц.

5. На пути к автоматическому прогнозированию личности с использованием категорий лайков Facebook (arXiv)

Автор: Раад Бин Тариф, Филипп Бергер, Патрик Хенниг, Кристоф Мейнель

Аннотация. Мы демонстрируем, что цифровые записи о поведении, такие как отметки «Нравится» в Facebook, можно легко получить и использовать для автоматического распознавания широкого спектра весьма деликатных личных качеств, включая: удовлетворенность жизнью, культурную этническую принадлежность, политические взгляды, возраст. , пол и личностные качества. Представленный анализ основан на наборе данных более 738 000 пользователей, которые поставили свои лайки в Facebook, действиях в социальных сетях, эгоцентрической сети, демографических характеристиках и результатах различных психометрических тестов для нашего расширенного анализа личности. В предлагаемой модели используется уникальный метод сопоставления между каждым объектом «Нравится» в Facebook и соответствующим объектом категории/подкатегории страницы Facebook, которые затем оцениваются как функции для набора алгоритмов машинного обучения для прогнозирования индивидуальных психодемографических профилей на основе лайков. Модель различает религиозного и нерелигиозного человека в 83% случаев, азиата и европейца в 87% случаев, а также эмоциональную стабильность и эмоциональную неустойчивость в 81% ситуаций. Мы предоставляем примеры взаимосвязей между атрибутами и лайками и представляем предложения для будущих направлений.