Новый генератор речи Tada: 700 секунд аудио и высокая скорость

Вышел король генераторов речи Tada: 700 секунд текста и скорость в 5 раз выше

Новая опенсорсная модель Tada генерирует до 700 секунд аудио за раз, работает в 5 раз быстрее конкурентов и обеспечивает высокую точность синтеза речи.

Алексей Морозов

Технический журналист, специализируется на искусственном интеллекте и машинном обучении. Следит за мировыми трендами ИИ с 2018 года.

Разработчики представили новую опенсорсную модель Tada, которая по своим показателям значительно превосходит существующие аналоги в области синтеза речи.

Ключевые преимущества новой нейросети:

Объём генерации: за один проход модель способна создать аудиофайл длительностью до 700 секунд при использовании 2048 токенов.
Точность: алгоритм не добавляет лишней информации или «отсебятины», выдавая максимально точный результат согласно исходному тексту.
Скорость: обработка запросов происходит в 5 раз быстрее, чем у конкурентов.
Мгновенная транскрипция: система моментально генерирует текст из аудио записей без задержек.

Модель доступна для бесплатного использования и озвучивает любой контент. Перейти к коллекции Tada на Hugging Face.

Вышел король генераторов речи Tada: 700 секунд текста и скорость в 5 раз выше

Читайте также

Источники

Комментарии

Оставить комментарий