8 мая 2026
Компанія OpenAI оголосила про впровадження в API ряду нових можливостей голосового інтелекту, покликаних допомогти розробникам створювати додатки, здатні «говорити», розшифровувати та перекладати розмови з користувачами.
Джерело зображення: Zac Wolff/unsplash.com
Зокрема, розробникам через API Realtime тепер доступні три нові моделі голосового управління в реальному часі — GPT-Realtime-2, GPT-Realtime-Translate та GPT-Realtime-Whisper. Нові моделі підтримують більш природне голосове взаємодію, переклад в реальному часі та транскрипцію мови в текст з низькою затримкою.
Модель GPT-Realtime-2 створена для голосового взаємодії в реальному часі, маючи здатність аналізувати запити, викликати інструменти, обробляти виправлення та природно продовжувати розмову. На відміну від своєї попередниці GPT-Realtime-1.5, ця модель побудована на основі логіки класу GPT-5, розробленої для обробки більш складних запитів від користувачів.
GPT-Realtime-2 включає в себе такі нові можливості для голосових агентів:
Модель GPT-Realtime-Translate призначена для надання послуг перекладу в реальному часі, «підтримуючи темп» розмови з користувачем. Модель підтримує понад 70 мов вводу (тобто мов, які вона може розуміти) та 13 мов виводу (мов, які вона передає говорячому). Повідомляється, що модель може зберігати сенс, підлаштовуючись під говорячого, навіть коли користувачі змінюють контекст, використовують регіональну вимову або специфічну для предмета лексику.
Модель GPT-Realtime-Whisper — це потокова модель транскрипції, створена для перетворення мови в текст з низькою затримкою.
«Запущені нами моделі перекладають аудіо в реальному часі з простого діалогу в голосові інтерфейси, які дійсно можуть працювати: слухати, міркувати, перекладати, транскрибувати та вживати дії в міру розвитку розмови», — повідомила компанія.
Вартість GPT-Realtime-2 становить $32 за 1 млн вхідних аудіотокенів, $0,40 за 1 млн кешованих вхідних токенів та $64 за 1 млн вихідних аудіотокенів. Вартість GPT-Realtime-Translate становить $0,034 за хвилину, а GPT-Realtime-Whisper — $0,017 за хвилину. Розробники можуть випробувати нові моделі на онлайн-платформі OpenAI Playground.
Хочеш дізнатися більше — читай відгуки
← Вернуться на предыдущую страницу
Піца та шоколад: Samsung незвичайним способом натякнула на нові Galaxy 3 июля 2026
Піца та шоколад: Samsung незвичайним способом натякнула на нові Galaxy
Дієтолог назвав ягоду, яка ефективно спалює небезпечний жир на животі 3 июля 2026
Малина ефективно спалює вісцеральний жир. “Малина може спалювати зайвий вісцеральний жир утричі швидше, ніж перець…
Для iPhone наступний рік буде ювілейним, але це не означає, що Apple обмежиться лише оновленням лінійки своїх смартфонів. Як стверджує Bloomberg, у 2027 році буде представлена оновлена лінійка планшетів iPad Pro, а ноутбук MacBook Pro початкового рівня також буде перероблений.