Публикации по теме 'linguistics'


Как семантика позволяет создавать графы суперзнаний, часть 1
Существует ряд техник использования знаний. Подход графа знаний (KG) в настоящее время довольно популярен и широко используется, часто для поддержки ограничений методов глубокого обучения. Следующий шаг в разработке графа знаний — сделать его без потерь и независимым от языка: т. е. превратить его в супер граф знаний (SKG) для облегчения использования естественного языка…

Полиглоты разработки программного обеспечения
В последнее время я много думаю о полиглотах, с тех пор, как прочитал статью в New Yorker о людях, которые являются «гиперполиглотами» — людьми, свободно владеющими как минимум одиннадцатью языками. Отложив в сторону то, насколько смехотворно невероятно это достижение, я начал думать о параллелях в других областях. Что эквивалентно тому, чтобы быть полиглотом — не гиперполиглотом, а кем-то, кто свободно говорит на жалких пяти или около того языках — в неязыковой среде? Первое, что..

Характеристики встраивания слов
Учебник по встраиванию слов Характеристики встраивания слов И проблема антонимов Эта статья является шестой в серии Учебник по встраиванию слов: 1. Что стоит за Word2vec | 2. Слова в векторы | 3. Статистическая теория обучения | 4. Классификатор Word2vec | 5. Гиперпараметры Word2vec | 6. Характеристики встроенных слов В предыдущей статье Гиперпараметры Word2vec мы завершили изучение алгоритма Word2vec, ознакомившись с его рекомендациями по..

Окисление языка программирования
Преждевременное окисление - корень всех зол. Это может показаться наблюдением за ростом травы, но у языков программирования, как и у человеческих, есть время жизни и жизненный цикл. Основные языки просуществуют дольше, но за это придется заплатить мутацию и потерю исходной структуры. Как только язык используется более чем, скажем, 1000 человек, он начинает трансформироваться и изменяться способами, которые первоначальные носители не предвидели и, конечно, не предопределяли. Новые языки..

Начало моего пути изучения обработки естественного языка с помощью Python
Привет. Это мой первый пост в блоге. И я рад, что ты здесь. Так о чем это? Я начинаю этот блог, чтобы объяснить все, что я узнаю об обработке естественного языка. Так что заинтересованные люди могут подписаться на этот блог, чтобы начать учиться со мной. Я буду публиковать в разные дни, объясняя все, что я узнал за это время. Надеюсь, вы присоединитесь ко мне и получите удовольствие от попытки заставить машины (я имею в виду компьютеры) понимать наши неоднозначные языки. Что..

Исследования естественного языка нуждаются в теории, основанной на данных
Мария Яо в ​​социальных чат-ботах опубликовала подробный и доступный обзор наиболее популярных подходов к обработке естественного языка (НЛП), в котором освещаются теории, лежащие в основе этих подходов. Я нашел ее резюме интересным, потому что я лингвист, ориентированный на данные (социолингвистика и корпусная лингвистика), который сотрудничает с учеными-компьютерщиками и программистами для создания инструментов анализа текста. С моей точки зрения, резюме Яо указывает на три важные..

Гиперпараметры Word2vec
Учебник по встраиванию слов Гиперпараметры Word2vec Набор креативных перевесов Эта статья является пятой в серии Учебник по встраиванию слов: 1. Что стоит за Word2vec | 2. Слова в векторы | 3. Статистическая теория обучения | 4. Классификатор Word2vec | 5. Гиперпараметры Word2vec | 6. Характеристики встраивания слов В предыдущей статье Классификатор Word2vec мы узнали о концепциях и математике алгоритма Word2vec с упором на модель Skip-gram с..