5 июня 2025
На конференции Google I/O 2025 компания анонсировала новую версию своей мультимодальной модели Gemini 2.5, которая теперь поддерживает генерацию аудио и диалогов в реальном времени. Эти возможности доступны в предварительной версии для разработчиков через платформы Google AI Studio и Vertex AI.
Источник изображения: Google
Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие с ИИ, включая распознавание эмоциональной окраски речи, адаптацию интонации и акцента, а также возможность переключения между более чем 24 языками. Модель может игнорировать фоновые шумы и использовать внешние инструменты, такие как «Поиск», для получения актуальной информации во время диалога.
Дополнительно, Gemini 2.5 предлагает расширенные функции синтеза речи (TTS), позволяя управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что делает модель подходящей для создания подкастов, аудиокниг и других мультимедийных продуктов.
Для обеспечения прозрачности, все сгенерированные моделью аудио маркируются с помощью технологии SynthID, что позволяет идентифицировать контент, как сгенерированный ИИ. Разработчики могут опробовать новые функции через вкладки Stream и Generate Media в Google AI Studio.
Gemini 2.5 демонстрирует значительный шаг вперёд в области мультимодальных ИИ-систем, объединяя модальности текстов, изображений, аудио и видео в единую платформу. Новые функции открывают широкие перспективы для создания интерактивных приложений, виртуальных ассистентов и инноваций в сфере образования.
Хочешь узнать больше - читай отзывы
← Вернуться на предыдущую страницу
Oppo Find X9 Ultra отримає дві камери по 200 Мп 15 декабря 2025
Oppo Find X9 Ultra отримає дві камери по 200 Мп
Volkswagen представив автомобіль без керма та педалей 15 декабря 2025
Volkswagen представив автомобіль без керма та педалей
Заборона не спрацювала: австралійські підлітки повернули собі соцмережі за 24 години 15 декабря 2025
На минулому тижні Австралія зіткнулася з важливим прецедентом у вигляді введення заборони на доступ громадян, які не досягли віку 16 років, до десяти соціальних мереж, найбільш популярних у країні. Як стверджує CNN, більшості зацікавлених користувачів вистачило 24 години, щоб зберегти доступ до потрібних соціальних мереж, і не завжди для цього вимагалися якісь хитрощі.