Что, если бы вы могли говорить и понимать все языки мира? Это удобное понятие было полетом фантазии писателей-фантастов и поклонников на протяжении поколений. Фанаты Звездного пути признают эту технологию универсальным переводчиком (или UT для краткости), и мы видели ее в Докторе Кто Схема перевода ТАРДИС. а также в виде паразитической вавилонской рыбки в Автостопом по Галактике.

Мгновенный перевод речи — не требуется Babel Fish!

Но, к счастью для любого из нас, кто немного брезглив при мысли о том, чтобы позволить инопланетной рыбе плавать в нашем мозгу, перевод речи в реальном времени становится все более доступным с каждым усовершенствованием речевых сервисов на базе ИИ и легкости Baseet.ai. удобный интерфейс для создания приложений с искусственным интеллектом.

Перевод речи в реальном времени имеет широкий спектр полезных применений. Это может обеспечить живые разговоры между предприятиями и зарубежной аудиторией, а также позволить многонациональным участникам взаимодействовать друг с другом на конференциях. Это делает международные поездки проще и удобнее для всех нас, и это широкое разнообразие применений сделало перевод речи в реальном времени горячей темой в больших технологиях.

Google предлагает сквозной перевод речи через свое приложение Translotron, которое было выпущено в 2019 году. В то время Translotron был одной из первых моделей, которые использовали ИИ для прямого перевода речи с одного языка на другой. С тех пор для этой цели было создано несколько новых API, в частности технология, лежащая в основе Apple iTranslate Voice и Azure’s Speech Service.

Приложения для мгновенного перевода устраняют разногласия между путешественниками и местными сообществами и помогают людям общаться друг с другом со всего мира. А с Baseet добавление услуг перевода в ваши существующие приложения или создание собственного простого в использовании приложения с искусственным интеллектом — это бесплатно и просто.

Baseet.ai предоставляет предварительно созданные узлы, которые помогают разработчикам создавать приложения, использующие службу распознавания речи Azure, без написания большого количества кода. Это облачное сервисное приложение позволяет в режиме реального времени переводить входящую речь с десятков языков, на которых говорят во всем мире. С помощью Baseet разработчики могут разветвлять, настраивать и создавать API, который можно копировать и вставлять в существующий код. API позволяет разработчикам добавлять сквозной перевод речи в свои существующие приложения, расширяя охват своей аудитории и делая свои услуги доступными для глобальной аудитории. И благодаря Baseet все это может быть достигнуто с помощью простого перетаскивания кода с нашим уникальным подходом к интеграции настраиваемых готовых решений в существующие приложения. Baseet также предоставляет разработчикам приложение для визуального обучения, которое они могут использовать для обучения моделей на своих собственных наборах данных, открывая мир бесконечных возможностей!

Как добавить службу распознавания речи Azure в свои приложения

В Baseet есть предварительно созданные узлы, которые можно связать вместе с помощью нашего простого в использовании визуального интерфейса. «Узел» — это повторно используемый, настраиваемый компонент, который можно соединить с другими узлами в формате простого перетаскивания для создания все более сложных и функциональных приложений. Приложение — это набор узлов, которые можно связать вместе, чтобы создать функциональное приложение. Если вы хотите добавить службу распознавания речи Azure в свой существующий код, просто возьмите наш автоматически сгенерированный API и встройте его в свое приложение. При таком подходе разработчики могут легко создавать решения на базе существующих сервисов. Вот как:

1. API настройки

Для начала вам потребуется подписка Azure. Чтобы получить ключ для голосового сервиса на Azure, просто выполните действия, указанные в этой ссылке. Baseet предлагает эту услугу в качестве узла для создания настраиваемого приложения и создания API с полным решением, которое можно применять на вашей корпоративной платформе.

2. Получите доступ к Azure — узлу перевода речи

У вас нет подписки Azure? Начните с бесплатного пробного ключа подписки, доступного здесь.

3. Выберите входы

Этот узел помогает пользователям напрямую подключаться к службе перевода речи из Azure.

  • audioPath: источник звука, поступающий из узла аудиовхода.
  • Регион службы: выберите из меню регион, в котором ваша служба зарегистрирована в службе Azure.
  • speechKey: ключ учетных данных, полученный от Azure API для службы речи.
  • Текущий язык:выберите текущий язык текущей речи (аудио)
  • Целевые языки: выберите несколько целевых языков для перевода исходной речи

4. Создание выходных данных

Либо используйте наш редактор перетаскивания, либо введите код самостоятельно:

  • speechText:текст аудиоисточника.
  • speechTranslation: словарь целевого языка в качестве ключа, связанного с переведенным текстом.

Соедините предварительно созданные узлы Baseet со своими входными данными, запустите приложение и просмотрите свои выходные данные:

Результатом является URL-адрес PDF-файла, содержащего перевод видео-речи на выбранные вами языки:

Baseet.ai предоставляет образцы приложений для начинающих, чтобы показать, как использовать определенные узлы. Для службы перевода речи Azure следуйте Azure — приложение службы распознавания речи, чтобы показать использование для каждого узла.

Уникальный пользовательский интерфейс Baseet устранил необходимость сложного кодирования, что экономит время и значительно снижает вероятность ошибок при создании сложных функций искусственного интеллекта, таких как перевод речи в реальном времени, в существующие службы. Попробуйте сами, зарегистрировав бесплатную учетную запись на https://console.baseet.ai/signup или посетите нас в Интернете на https://baseet.ai/. Хотите быть в курсе того, что может предложить наша динамичная и удобная платформа? Следите за нами в социальных сетях @BaseetAI в Twitter, Facebook или LinkedIn.

Первоначально опубликовано на https://baseet.ai 22 мая 2020 г.