Публикации по теме 'linguistics'


Частоты фонем в английском языке
Быстрые ссылки Репозиторий GitHub Фонемы по частоте Фонемы по частоте пост-/ж/ Слов по количеству в BNC с произношением Резюме Оценка относительных частот английских фонем. Кроме того, оценка относительной частоты английских фонем, следующих за /w/. Методология Воспроизводя работу Дуга Блюмейера , я сопоставил Словарь произношения CMU («CMUdict )» и Нелемматизированный список частот Адама Килгарриффа для Британского национального корпуса, чтобы найти частоты фонем..

Закодированные лингвистические знания в моделях НЛП
Предпосылки, исследование и анализ «зондов» для обнаружения закодированных лингвистических знаний в моделях глубокого обучения. Авторы статьи Keyur Faldu и Dr. Амит Шет . В этой статье подробно рассматривается нишевый аспект более широкой обложки на тему Расцвет современного НЛП и необходимость интерпретируемости! В Embibe мы ищем ответы на открытые вопросы, пока мы создаем платформу НЛП. для решения множества проблем с академическим содержанием. Современные модели НЛП (BERT,..

«Как математика векторного пространства выявляет скрытый сексизм в языке»
«отношения между словами могут быть зафиксированы с помощью простой векторной алгебры. Например, «мужчина относится к королю, как женщина к королеве», или, используя общепринятую нотацию, «мужчина: король: женщина: королева». Вскоре возникли и другие отношения, такие как «сестра : женщина :: брат : мужчина» и так далее. Эти отношения известны как вложения слов. его набор данных называется Word2vec, и он очень мощный. Многие исследователи начали использовать его, чтобы лучше понять..

Shaxpir 4.5: Автоматический всплывающий тезаурус
Мы использовали ИИ. алгоритмы для анализа огромного корпуса литературы, построения уникального нового тезауруса, специально для авторов художественной литературы. Здравствуйте, шакспировцы! У меня есть для вас радостная новость… Сегодня я очень рад объявить о выпуске Shaxpir 4.5 , который включает совершенно новую лингвистическую функцию, созданную прямо в наших научно-исследовательских лабораториях: Автоматический всплывающий тезаурус . Чтобы использовать его, просто щелкните..

Об эмоциональном интеллекте машин
В фильме 2016 года Прибытие , основанном на превосходной Истории вашей жизни Теда Чанга, персонаж Эми Адамс дает краткое определение того, что в лингвистике известно как гипотеза Сепира-Ворфа: «Это теория, согласно которой язык, на котором вы говорите, определяет то, как вы думаете». Эта концепция появляется в других произведениях художественной литературы, например в романе Оруэлла 1984 , в котором авторитарное государство создает язык новояз, чтобы люди не могли критически..

Предвзятость в обработке естественного языка (НЛП): опасная, но решаемая проблема
Одна из самых больших новых проблем, с которыми сталкиваются модели обработки естественного языка (НЛП), - это неявные предубеждения, которым они учатся. Обработка естественного языка (NLP) - одна из самых больших областей исследований в области машинного обучения, и хотя современные лингвистические модели машинного обучения обеспечивают высокую числовую производительность при выполнении многих задач понимания языка, им часто не хватает оптимизации для уменьшения неявных смещений...

В поисках потерянных слов
Генерация случайного текста в программировании Пролог Идея кажется достаточно простой: как создать случайное слово? В частности, в программировании доступно так много библиотек и API, что легко предположить, что существует простое решение этой проблемы. Однако, как только нужно использовать эти случайные слова для конкретного использования, эта, казалось бы, банальная задача приобретает новую сложность с экспоненциальной скоростью. Это то, что я обнаружил при создании приложения..