Suno’s Bark попали в Discord

Представляем Bark, генеративную модель преобразования текста в аудио для речи, невербальных звуков и музыки

Синтетическая аудиогенерация с многоязычной речью и невербальными звуками

Я действительно взволнован об этом.

После незаметного запуска Discord несколько недель назад Suno официально запускает бета-версию Bark Bot, модель преобразования текста в аудио, доступную на Discord!

Давайте подробнее рассмотрим, что делает Bark таким особенным и почему с ним так весело играть!

Что такое кора?

Bark — это модель преобразования текста в аудио, разработанная компанией Suno.ai. Модель находится под лицензией MIT License, что означает, что она доступна для коммерческого использования!

Что также отличает Bark от некоторых других моделей: это больше, чем просто традиционная модель преобразования текста в речь — Bark способна воспроизводить впечатляюще реалистичную многоязычную речь, музыку, фоновый шум, простые звуковые эффекты и даже -вербальные выражения, такие как смех или вздохи.

Как использовать кору в раздоре

Присоединение к серверу

Чтобы присоединиться к официальному серверу Suno/Bark Discord, используйте эту пригласительную ссылку. После того, как вы присоединились к серверу, вы можете использовать Bark Bot бесплатно на канале #bot-beta.

Базовый синтаксис приглашения

Пользовательский интерфейс довольно понятен, Bark Bot в настоящее время использует этот базовый синтаксис приглашения:

/bark prompt: [YOUR_PROMPT] voice: [VOICE_PRESET]

Однако есть некоторые дополнительные команды, с которыми вы, возможно, захотите поиграть. Например…

/joke topic: [YOUR_TOPIC] voice: [VOICE_PRESET]

… or:

/poem topic: [YOUR_TOPIC] voice: [VOICE_PRESET]

Вот пример приглашения и его результатов (вы также можете загрузить аудио в формате MP3 или сохранить голосовые настройки)

Подсказка