В этом кратком руководстве мы объясним вам, как начать работу с комбинированной классификацией намерений и распознаванием сущностей, называемой пониманием языка, на платформе NeuralSpace.

Это простой 10-шаговый процесс, и вы обучите свою первую модель понимания языка с помощью AutoNLP одному из 95 изначально поддерживаемых языков NeuralSpace. Лучше всего то, что мы будем использовать веб-интерфейс NeuralSpace без кода и достигнем самых современных результатов, не написав ни одной строки кода.

Платформа NeuralSpace представляет собой набор предварительно обученных моделей обработки естественного языка (NLP), которые можно точно настроить для каждого уникального варианта использования AutoNLP.

Различные модели для понимания языка, распознавания сущностей, машинного перевода, транслитерации, увеличения данных, определения языка, преобразования речи в текст, преобразования текста в речь и многие другие доступны в веб-интерфейсе без кода через API и интерфейс командной строки. Таким образом, пользователям не нужно беспокоиться о создании современных моделей глубокого обучения на основе преобразователей или поиске достаточно больших объемов данных на языках с низким уровнем ресурсов.

Фактически, в этом руководстве мы будем обучать модель понимания языка только с 20 примерами на гуджарати со смешанным кодом.

10 шагов для начала

  1. РЕГИСТРАЦИЯ

Без кредитной карты или других платежных реквизитов зарегистрируйтесь в NeuralSpace здесь, активируйте свою учетную запись с помощью подтверждающего электронного письма и войдите в систему.

2. ПОПРОБУЙТЕ ЭКСКУРСИИ

После авторизации вас ждет виртуальный тур. Мы знаем, что кнопка «Пропустить» заманчива, но просто воспользуйтесь ею, и позже вы сэкономите себе массу времени.

3. ВЫБЕРИТЕ/УСТАНОВИТЕ ПРИЛОЖЕНИЯ

Вы находитесь на странице панели инструментов, которая в настоящее время пуста и будет показывать свое значение позже, когда ваши модели будут развернуты. Перейдите к меню столбца слева и выберите одну из наших служб (Распознавание языка, Распознавание объектов и т. д.) или нажмите Установить приложения.

4. ВЫБЕРИТЕ/УСТАНОВИТЕ ПОНИМАНИЕ ЯЗЫКА

Выберите «Распознавание языка» или установите его, нажав кнопку Установить под поясняющим видео. После установки функция распознавания речи появится в разделе Ваши приложения в меню столбца слева. Нажмите здесь.

5. СОЗДАТЬ ПРОЕКТ

Первое, что вы увидите, это панель управления пониманием языка. Как и в случае с панелью мониторинга платформы, вы можете пока игнорировать ее и оценить ее ценность, как только у вас появятся модели в производстве. Вместо этого перейдите в правый верхний угол и нажмите Создать проект. Если вы хотите узнать больше о концепциях, лежащих в основе проектов, ознакомьтесь с нашей Документацией.

Дайте вашему проекту имя и выберите язык ваших данных.

Совет. Выберите Многоязычный/Смешанный код, если вы ожидаете текст на нескольких языках или на сочетании языков и алфавитов, например хинглиш, арабизи. сильный> и т. д.

Я назову свой проект Gujaratish, потому что я создам набор данных на гуджарати с использованием английского/латинского алфавита, который можно будет использовать для чат-бота для заказа еды.

После создания проекта вы получите копию предварительно обученной модели на выбранном вами языке и сможете настроить ее для своего уникального варианта использования прямо сейчас!

6. ПОДГОТОВКА НАБОРА ДАННЫХ

Пришло время настроить предварительно обученную модель. Перейдите в Студию данных (теперь она называется Студия данных), где все ваши данные загружаются, комментируются и изменяются.

7. ДОБАВИТЬ/ЗАГРУЗИТЬ/ИМПОРТИТЬ ПРИМЕРЫ

Давайте добавим, загрузим и импортируем несколько примеров предложений.

Вы можете перейти на страницу Загрузить в верхней панели, чтобы загрузить существующие наборы данных, импортировать один из наборов данных NeuralSpace или написать свои собственные примеры непосредственно в Студии данных. Как правило, мы рекомендуем для начала использовать один из наших предварительно загруженных наборов данных, доступ к которому можно получить на странице Импорт. В настоящее время доступно более 100 наборов данных, и мы постоянно добавляем новые.

Если вы хотите создать свои собственные данные в Студии данных (могут быть поверх импортированных данных), вы увидите поле под названием Введите свои примерывСтудии данных. .

Предложение, которое я здесь написал, означает «будет ли моя пицца теплой?» и мы сначала добавим к нему намерение, прежде чем пометить объект. Нажмите Добавить намерение и добавьте этот пример в свое собственное намерение, здесь order_query.

Далее мы пометим сущность в этом предложении. Слово пицца относится к продукту питания и важно, чтобы его можно было распознать в чат-боте для заказа еды. Давайте пометим его как food_item. Нажмите Создать объект, чтобы добавить обучаемый объект, который не является частью предварительно обученных объектов, поставляемых с каждой предварительно обученной моделью.

8. ПОЕЗД

Добавьте еще пару таких примеров, и вы готовы к обучению собственной модели с помощью AutoNLP. Прокрутите немного вверх Студии данных, выберите количество обучающих заданий (подробнее о том, что такое обучающие задания читайте здесь), нажмите Обучить с AutoNLP и все готово — НАЖМИТЕ, ПОЕЗД, ХОЛОД в лучшем виде.

Вы можете следить за ходом выполнения в Списке моделей в нижней части страницы Сведения о проекте.

Статус обучения изменится с В очереди на Обучение и на Завершено в течение нескольких секунд, но вам может потребоваться подождать. немного дольше для больших наборов данных. В то время как для обучения небольшого набора данных с 20 примерами требуется всего 3–5 секунд, набор данных с 5000 примеров будет обучен примерно за 15 минут.

9. РАЗВЕРНУТЬ

Ваша модель обучена, и вы можете развернуть ее сейчас, нажав кнопку Развернуть. Выберите количество реплик, которое может обеспечить ожидаемую пропускную способность с точки зрения количества запросов в секунду. Мы выбираем 1 здесь.

После развертывания вы можете оценить ее, щелкнув модель в списке моделей, а затем Проверить модель в правом меню. Введите любое предложение, на котором вы хотите протестировать свою модель, и посмотрите ее результат. Мы попробуем другой продукт питания здесь.

10. ПРОВЕРИТЬ

Нажмите «Разобрать текст» и получите вывод ниже. Секретные намерения и признанные объекты ранжируются по показателю достоверности.

Вот оно! 10 простых шагов, чтобы подготовить набор данных, обучить современную модель глубокого обучения на основе преобразователя и оценить ее на гуджаратском языке со смешанным кодом. (гуджарати + английский)

Начните прямо сейчас: Платформа NeuralSpace

Прочтите о других руководствах в наших Документах и зарегистрируйтесь в Сообществе NeuralSpace, чтобы участвовать и сотрудничать с другими пользователями.

Удачного НЛП!