5 июня 2025
На конференции Google I/O 2025 компания анонсировала новую версию своей мультимодальной модели Gemini 2.5, которая теперь поддерживает генерацию аудио и диалогов в реальном времени. Эти возможности доступны в предварительной версии для разработчиков через платформы Google AI Studio и Vertex AI.
Источник изображения: Google
Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие с ИИ, включая распознавание эмоциональной окраски речи, адаптацию интонации и акцента, а также возможность переключения между более чем 24 языками. Модель может игнорировать фоновые шумы и использовать внешние инструменты, такие как «Поиск», для получения актуальной информации во время диалога.
Дополнительно, Gemini 2.5 предлагает расширенные функции синтеза речи (TTS), позволяя управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что делает модель подходящей для создания подкастов, аудиокниг и других мультимедийных продуктов.
Для обеспечения прозрачности, все сгенерированные моделью аудио маркируются с помощью технологии SynthID, что позволяет идентифицировать контент, как сгенерированный ИИ. Разработчики могут опробовать новые функции через вкладки Stream и Generate Media в Google AI Studio.
Gemini 2.5 демонстрирует значительный шаг вперёд в области мультимодальных ИИ-систем, объединяя модальности текстов, изображений, аудио и видео в единую платформу. Новые функции открывают широкие перспективы для создания интерактивных приложений, виртуальных ассистентов и инноваций в сфере образования.
Хочешь узнать больше - читай отзывы
← Вернуться на предыдущую страницу
Реабілітологи назвали нову проблему покоління — «смартфонну шию» 28 мая 2026
Сучасні технології змінили спосіб життя людей, але разом із зручністю прийшли й нові проблеми зі…
Створення бази NASA на Місяці розпочнеться з трьох місій, які відбудуться цього року 27 мая 2026
26 травня 2026 року NASA повідомило про перші етапи реалізації проекту зі створення на Місяці бази постійного присутності людини та уклало для цього ряд контрактів. Раніше новий глава агентства, мільярдер Джаред Айзекман, розкритикував попереднє керівництво NASA за нецільове перевитрачання коштів і провал планів місії Artemis. Оновлене NASA під його керівництвом безкомпромісно націлилося на Місяць.
Штучний інтелект звинуватили в расизмі під час найму на роботу 27 мая 2026
Використовувані великими роботодавцями інструменти штучного інтелекту для найму співробітників неодноразово відсікали одних і тих же кандидатів — при цьому темношкірі та азіати страждали від цього несоразмерно частіше, показало дослідження Стенфордського університету.