Публикации по теме 'nlp'


ICML + ACL'18: структура снова в игре, перевод требует большего контекста
Несколько недель назад я посетил Международную конференцию по машинному обучению (ICML 2018) в Стокгольме и, сразу после этого, Ежегодную конференцию Ассоциации компьютерной лингвистики (ACL 2018) в противоположном конце света: Мельбурн. Интересно, что сочетание временной близости и географического расстояния между этими двумя конференциями становится традицией - в прошлом году это был ICML в Австралии и ACL в Канаде. В этом году мы представили одну статью на ICML и другую на..

Регулярное выражение в текстах Гарри Поттера
Тематическое исследование с глубоким погружением Я Грег Рафферти, специалист по обработке данных из района Залива. Вы можете посмотреть код этого проекта на моем гитхабе . Не стесняйтесь обращаться ко мне с любыми вопросами! В этой серии публикаций я рассмотрю несколько удобных техник НЛП через призму Гарри Поттера. В моем предыдущем посте из этой серии, посвященном основам НЛП, я рассматривал Тематическое моделирование со скрытым распределением Дирихле , а следующий пост будет..

Попытка изложить историю НЛП в пяти статьях: часть II
Эта статья является второй в серии из двух статей об истории НЛП, рассказанной в контексте пяти исследовательских работ. Действие происходит в середине 1970-х. Чтобы просмотреть первую статью, нажмите здесь . Разработка ресурсов корпуса Начавшаяся в конце 70-х академическая эра, ориентированная на отношения, заложила основу для грамматико-логической стадии НЛП. Поскольку исследователи искали логические представления значения и знания, этот этап привел к развитию многих..

Ускорение моделей PyTorch с несколькими графическими процессорами
Большая часть моделей машинного обучения в наши дни, особенно в НЛП, публикуется в PyTorch. В этой статье рассматриваются следующие Настройка облачной машины Google с помощью PyTorch (для приобретения облачной машины Google используйте эту ссылку ) Тестирование параллелизма на машинах с несколькими GPU на игрушечном примере Изменения кода, необходимые для того, чтобы модель использовала несколько графических процессоров как для обучения, так и для логического вывода. Настройка..

Настройка узла TPU в облаке Google — пошаговая инструкция
В настоящее время некоторые модели выпускаются с реализациями, работающими только на TPU (например, преобразователь текста в текст ). Записываю свой опыт настройки узла Google Cloud TPU для запуска моделей машинного обучения . Общая последовательность шагов такова. Создайте Облачный аккаунт Google , если у нас его нет. Создайте проект. Создайте экземпляр ВМ с одним ЦП или ГП, ОС, пространством на жестком диске, памятью ЦП и т. д. Установите инструмент (ctpu) на приобретенный..

Стоит ли того награда Vanity Awards? Эксперимент по выявлению веб-влияния.
Стоит ли того награда Vanity Awards? Эксперимент по выявлению веб-влияния. Возможно, вы сами получили электронное письмо, в котором поздравляли вашу компанию с тем, что она попала в число 30, 50 или 100 лучших, самых быстрых или самых дружелюбных компаний в отрасли A, B или C. Чтобы получить награду, все, что вам нужно сделать, это заплатить пару 1000 долларов, и целый ряд положительных отзывов ваш! Если вы выполните быстрый поиск этих наград, то найдете негативные комментарии в..

Жизнь довольно проста с SCIKIT-LEARN
В этой статье мы постараемся реализовать sklearn tf-IDF Vectorizer с нуля и провести перекрестную проверку вывода с выводом стандартной библиотеки. SCIKIT-LEARN очень упрощает вычисления, просто выполнив пару строк, чтобы получить желаемый результат. Что означает tf-IDF? Tf-IDF означает термин частота документа с обратной частотой, tf-IDF weight может быть весом, часто используемым при поиске информации и интеллектуальном анализе текста. Этот вес - вероятностная мера, используемая..