Новые аудио-модели от OpenAI: они снова на высоте!

Вот так поворот! OpenAI снова шагает в ногу со временем и запускает целый пакет новых аудио-моделей, которые, по утверждению разработчиков, должны взорвать мир голосовых технологий. 🌍💥

Первая и вторая модели: акцент на качество

Две из этих новинок предназначены для преобразования речи в текст. Да-да, это значит, что они могут поспорить с уже легендарным Whisper. Но, на самом деле, кто знает, насколько это правда? Всегда бывает немного слишком много пафоса в заявлениях разработчиков. Все мы помним, как раньше нам обещали, что мир технологий загладит все недостатки, а в итоге всё сводится к обычной доработке. Но тем не менее, интересно, что именно они сделали, чтобы превзойти Whisper? Ответим на этот вопрос только по факту.

TTS: теперь вы — режиссёр голоса

Теперь о третьей модели, которая просто бомба для всех, кто хоть раз мечтал о том, как управлять интонацией, тоном и тембром голоса. Этот новый TTS (Text-to-Speech) позволяет вам задавать проблемы с помощью промптов. Хотите, чтобы ваш голос звучал как Супермен или, скажем, как ваш сосед-пенсионер? Легко! 🌟 Это открывает совершенно новые горизонты для креативности. Но, давайте будем честными, слишком много возможностей — это тоже не всегда хорошо. Как насчет того, чтобы запутать пользователей с незапланированными результатами?

Агенты на подходе

К этому всему OpenAI также представили Agents SDK, который поможет в создании голосовых агентов. Это, безусловно, ещё один шаг к тому, чтобы сделать нашу жизнь более автоматизированной (или, по крайней мере, дать нам возможность поговорить с чем-то, что не является туалетом). 🤖

Так что, если хотите увидеть, как все это будет работать в действии, не пропустите стрим, который состоится через час. Обещают примеры создания голосовых агентов в реальном времени с использованием новейших аудиомоделей. Показали несколько фишек, и это может быть довольно интересно!

Где попробовать?

Если вам не терпится опробовать все эти новинки и убедиться, что всё это не просто слова, скорее переходите на OpenAI FM. Надеюсь, что вас не разочарует! В целом, таких шагов OpenAI явно не хватает, и мы на правильном пути, чтобы увидеть, как наша реальность превращается в нечто совершенно новое.

OpenAI представила 3 новейшие аудио-модели! ver 0
OpenAI представила 3 новейшие аудио-модели! ver 0
Ширина: 1280 px
Высота: 712 px
Соотношение сторон.: 160:89

Скачать


Обсуждение (0)

Войдите, чтобы оставить комментарий

Пока нет комментариев!



Вам также может понравиться

МТС запускает хакатон True Tech Hack 2025, и это реально шанс для тех, кто хочет пробиться в IT! Если у тебя есть гениальная идея, не упусти возможность показать свои навыки на реальной площадке. Участвуй, общайся с профессионалами, работай в команде и, возможно, именно твое решение станет следующим прорывом. Поспеши, пока места не... Читать далее