Apple представила ШІ для редагування фото з текстових команд

9 февраля 2024

Научное подразделение Apple совместно с исследователями Калифорнийского университета в Санта-Барбаре выпустило мультимодальную модель искусственного интеллекта MGIE, предназначенную для редактирования изображений. Чтобы внести изменения в снимок, пользователю достаточно естественным языком описать, что он хочет получить на выходе.

Источник изображений: Apple

Источник изображений: Apple

MGIE (Multimodal Large Language Model-Guided Image Editing) может применяться для задач различной сложности, связанных с редактированием изображений: можно добавлять различные объекты, убирать или изменять их. При получении команды модель интерпретирует слова пользователя, а затем «представляет себе», как будет выглядеть изменённая в соответствии с ними картинка.

В описывающей MGIE статье приводятся несколько примеров её работы. Когда модели дали на редактирование фото пиццы и предложили «сделать её более здоровой», та добавила овощную начинку. Далее ей предложили излишне тёмный снимок гепарда в пустыне и предложили «добавить контраста, имитируя больше света» — изображение стало ярче. MGIE доступна для бесплатного скачивания на GitHub, а опробовать её в работе можно на платформе Hugging Face Spaces. В Apple не уточнили, каковы планы компании в отношении модели вне исследовательского проекта.

Редактирование изображений поддерживается некоторыми ИИ-генераторами, включая OpenAI DALL-E 3; функции генеративного ИИ присутствуют и в Photoshop благодаря модели Adobe Firefly. Apple не позиционирует себя как крупного игрока в области ИИ в отличие от Microsoft, Meta или Google, но недавно гендиректор компании Тим Кук заявил, что в этом году производитель добавит на свои устройства новые функции ИИ. В минувшем декабре компания выпустила открытую платформу MLX для обучения ИИ-моделей на чипах Apple Silicon.

3dnews

Хочешь узнать больше - читай отзывы

← Вернуться на предыдущую страницу

Читайте также:

Наречена Роналду в діамантах та сукні-футлярі з люверсами поласувала піцою у Нью-Йорку. Фото 3 мая 2026

Наречена португальського футболіста Кріштіану Роналду, Джорджина Родрігес з діамантовим кольє та у брендовій сукні поласувала нью-йоркською піцою в авто. Деталі читайте тут.

У Перу розслідують вербування Росією найманців на війну проти України 3 мая 2026

З жовтня минулого року до Росії могли відбути близько 600 перуанців. Їм обіцяли щомісячну зарплату до 3000 доларів.

Zoom: чому найгучніший бренд не завжди означає найкращий результат 3 мая 2026

Ви, напевно, чули про Beyond. Про Amazing White. Про Opalescence. Але найгучніше ім’я на ринку відбілювання сьогодні – це Zoom. ми Zoom не використовуємо. І зараз пояснимо чому. Не тому, що погано.

 

Вас могут заинтересовать эти отзывы

10 міська лікарня 0.2
10 міська лікарня

Отзывов: 1

Каталог отзывов





×

Выберите область поиска

  • Авто
  • Одяг / аксесуари
  • Роботодавці
  • Інше