Фінансові новини
- |
- 20.11.24
- |
- 06:45
- |
- RSS
- |
- мапа сайту
Авторизация
Vall-E - нова модель ШІ Microsoft, яка імітує будь-який людський голос на основі всього 3-секундного оригіналу
09:56 12.01.2023 |
Компанія Microsoft представила нову модель штучного інтелекту під назвою Vall-E. Вона базується на технології EnCodec, яку Meta анонсувала в жовтні 2022 року.
Microsoft називає VALL-E "мовною моделлю нейронного кодека". Цей штучний інтелект здатний імітувати будь-який людський голос, до того ж для цього йому треба прослухати всього 3 секунди оригінального голосу. ШІ розбиває інформацію на компоненти та синтезує варіації його звучання в різних фразах, у результаті чого може точно відтворювати тембр та емоційний тон мовця.
Для навчання Vall-E компанія Microsoft використовувала записи 60 тисяч годин розмов, які записали понад 7 тисяч реальних людей. Здебільшого для цього брали аудіокниги з бібліотеки LibriVox.
Приклади імітації голосів Vall-E можна послухати на GitHub.
Microsoft каже, що Vall-E можна буде використовувати як інструмент перетворення тексту на голос, спосіб редагування мови та систему створення аудіо, поєднавши його з іншими генеративними ШІ.
|
|
ТЕГИ
ТОП-НОВИНИ
ПІДПИСКА НА НОВИНИ
Для підписки на розсилку новин введіть Вашу поштову адресу :