Разработчики представили новую опенсорсную модель Tada, которая по своим показателям значительно превосходит существующие аналоги в области синтеза речи.
Ключевые преимущества новой нейросети:
- Объём генерации: за один проход модель способна создать аудиофайл длительностью до 700 секунд при использовании 2048 токенов.
- Точность: алгоритм не добавляет лишней информации или «отсебятины», выдавая максимально точный результат согласно исходному тексту.
- Скорость: обработка запросов происходит в 5 раз быстрее, чем у конкурентов.
- Мгновенная транскрипция: система моментально генерирует текст из аудио записей без задержек.
Модель доступна для бесплатного использования и озвучивает любой контент. Перейти к коллекции Tada на Hugging Face.