10 июня 2026
Компанія Google представила нову модель Gemini 3.5 Live Translate, призначену для голосового перекладу в режимі реального часу. Нейромережа автоматично розпізнає понад 70 мов і генерує переклад, зберігаючи оригінальну інтонацію, темп і висоту голосу спікера.
Джерело зображення: Google
На відміну від систем, які чекають закінчення фрази, новий алгоритм обробляє аудіопотік синхронно. Затримка між оригінальною реплікою та перекладом складає кілька секунд і дозволяє уникнути неестетичних пауз у діалозі. Модель адаптована до роботи в шумних умовах і не вимагає ручного налаштування додаткових параметрів. З метою безпеки та боротьби з дезінформацією всі згенеровані аудіозаписи маркуються невидимим цифровим водяним знаком SynthID.
Інструмент вже доступний розробникам у форматі публічної попередньої версії через Gemini Live API та Google AI Studio, а інтеграція з такими профільними платформами, як Agora, LiveKit та Vision Agents, дозволяє створювати додатки без необхідності будувати власну складну інфраструктуру потокової передачі медіа. Наразі технологію також тестує азійський сервіс таксі та доставки Grab, який обробляє понад 10 мільйонів дзвінків на місяць, для забезпечення комунікації між водіями та клієнтами.
В корпоративному сегменті впровадження алгоритму розпочнеться в поточному місяці в рамках закритого тестування для підписників Google Workspace у сервісі відеоконференцій Google Meet. Оновлення дозволить перекладати бесіди, використовуючи понад 2000 мовних комбінацій в рамках однієї зустрічі, тоді як попередня версія системи підтримувала лише п’ять мов і вимагала обов’язкової наявності англійської. Широкий реліз для бізнесу запланований на кінець року.
Звичайні користувачі отримають доступ до функції через глобальне оновлення додатку Google Translate на платформах iOS та Android. При підключенні будь-яких навушників система буде транслювати перекладену мову безпосередньо співрозмовнику. Для власників пристроїв на базі Android також передбачений спеціальний «режим прослуховування» (listening mode), який дозволяє почути переклад прямо через динамік телефону. Як пояснює Google у своєму блозі, ця функція може бути корисною в ситуаціях, коли «потрібно швидко почути переклад, не привертаючи уваги оточуючих, і під рукою немає навушників».
Хочеш дізнатися більше — читай відгуки
← Вернуться на предыдущую страницу
Роботодавці, які звільнили працівників через впровадження штучного інтелекту, починають про це шкодувати 2 июля 2026
Сформоване у роботодавців на фоні буму штучного інтелекту уявлення про те, що штучний інтелект може «робити все», швидко змінюється, і вони знову починають наймати співробітників для просування свого бізнесу. Один із останніх прикладів — автомобілебудівник Ford, який знову наймає сотні досвідчених інженерів для вирішення проблем якості, з якими не впоралися автоматизовані системи, пише CNBC.
Google показала автомобільний Gemini, який бачить світ через камеру автомобіля 2 июля 2026
Компанія Google продемонструвала експериментальну функцію нейромережі Gemini, яка дозволяє ШІ-помічнику відповідати на запитання про те, що відбувається за вікном автомобіля. Вона реалізується завдяки наданню сервісу тимчасового доступу до фронтальної камери авто. Нову функцію продемонстрував президент підрозділу Android Самір Самат разом із головою Google AI Studio Логаном Кілпатриком.
Загроза красі: 6 найгірших продуктів для шкіри, які викликають прищі та зморшки 1 июля 2026
Запорукою здорової шкіри є не лише зовнішній догляд, а й внутрішній стан організму. Деякі продукти…