26 сентября 2023
OpenAI расширила варианты взаимодействия с ChatGPT. Новая версия чат-бота теперь принимает в качестве промтов (подсказок) не только текст, но также изображения и голосовые команды. Для коммерческих пользователей новые возможности станут доступны в ближайшие две недели, а остальным придётся какое-то время подождать.
Источник изображения: The Verge
Общение голосом с ChatGPT в чём-то похоже на разговор с любым голосовым помощником, но, по утверждению OpenAI, качество ответов значительно выше благодаря улучшенной базовой технологии. Пользователь нажимает кнопку и произносит вопрос, ChatGPT преобразует его в текст и передаёт в большую языковую модель, получает ответ, преобразует его обратно в речь и произносит ответ вслух.
Новые возможности ChatGPT опираются на большую языковую модель Whisper, которая выполняет значительную часть работы по преобразованию речи в текст и обратно. По утверждению OpenAI, новая модель может генерировать «человеческий голос из текста и образца речи длиной в несколько секунд». Пока доступно пять вариантов голоса ChatGPT, но OpenAI видит в этой модели гораздо больший потенциал.
Возможность создать синтезированный голос любого человека, опираясь всего на несколько секунд его речи, даёт широкое поле деятельности для киберпреступников, признаёт OpenAI в анонсе новых функций: «Это новые риски, такие как возможность злоумышленников выдать себя за общественных деятелей или совершить мошенничество». По утверждению компании, модель недоступна для широкого использования именно по этой причине: OpenAI планирует ограничить модель конкретными вариантами использования и партнёрскими соглашениями.
Что касается запроса в ChatGPT при помощи изображения, пользователю достаточно сфотографировать или нарисовать предмет своего интереса и отправить боту. В процессе общения можно применять текстовые или голосовые подсказки, чтобы уточнить запрос или ограничить область поиска.
Очевидно, что использование изображений в качестве подсказки для чат-бота также имеет свои потенциальные проблемы. В первую очередь это касается запроса о личности человека на фотографии, хотя OpenAI заявляет, что ограничила «способность ChatGPT анализировать и делать прямые заявления о людях» как по соображениям точности, так и по соображениям конфиденциальности.
Спустя почти год после первого запуска ChatGPT OpenAI продолжает расширять границы применения и использования своего чат-бота, пытаясь избежать связанных с ним проблем и недоработок. В частности, компания намеренно ограничивает возможности своих новых ИИ-моделей. Но такой подход не будет работать вечно. По мере того, как все больше людей используют голосовое управление и поиск изображений, а ChatGPT становится мультимодальным и полезным виртуальным помощником, удерживать ИИ в рамках будет все труднее и труднее.
Хочешь узнать больше - читай отзывы
← Вернуться на предыдущую страницу
Франція відправила в Гренландію військовий контингент 16 января 2026
Рішення було ухвалене у координації з кількома союзниками по НАТО після зустрічі у Вашингтоні напередодні.
Apple заплатить Google мільярди доларів за Gemini — OpenAI відмовилася від угоди щодо Siri 16 января 2026
За повідомленнями мережевих джерел, в рамках нового партнерського угоди Apple заплатить Google близько 1 млрд доларів на рік за використання ІІ-моделей Gemini, які стануть основою нового голосового помічника Siri. У повідомленні зазначається, що OpenAI свідомо відмовилася від угоди з Apple, в рамках якої основою Siri могла стати одна з моделей розробника ChatGPT.
Побиття та шантаж дитиною: на Київщині затримали зловмисників, які вимагали у фермерки $130 тисяч 16 января 2026
Побиття та шантаж дитиною: на Київщині затримали зловмисників, які вимагали у фермерки $130 тисяч. Фото та відео Підозрюваним загрожує до 12 років позбавлення волі