14 октября 2025
Розробники Apple та Університету штату Огайо створили нову дифузійну модель Few-Step Discrete Flow-Matching (FS-DFM), яка може писати тексти в 128 разів швидше за аналоги, повідомив ресурс 9to5mac.com з посиланням на дослідження «FS-DFM: швидка і точна генерація довгих текстів за допомогою мовних моделей дифузії з малою кількістю кроків».
Джерело зображення: Jackson Sophat/unsplash.com
Згідно з дослідженням, FS-DFM здатна записувати повні текстові фрагменти всього за вісім швидких кроків уточнення. Для отримання аналогічного результату з іншими моделями дифузії потрібно більше тисячі кроків.
Для цього дослідники використовують трьохетапний підхід: спочатку модель навчається обробляти різні види ітерацій уточнення. Потім вони використовують направляючу модель «вчителя», яка допомагає їй робити більш значні та точні оновлення на кожній ітерації, не виходячи за межі заданого тексту. І, нарешті, вони виконують корекцію роботи кожної ітерації, щоб кінцевий результат був досягнутий за меншу кількість кроків при більш стабільній роботі моделі.
В порівнянні з більшими моделями дифузії, FS-DFM показала хороші результати за двома важливими метриками: перплексією та ентропією. Показник перплексії відображає якість тексту в мовних моделях. Чим він нижчий, тим точніше і природніше звучить текст. Ентропія відображає, наскільки впевнено модель обирає кожне слово. Якщо ентропія занадто низька, текст може стати повторюваним або передбачуваним, але якщо вона занадто висока, він може виглядати беззмістовним з випадковим набором слів.
В порівнянні з моделями дифузії Dream з 7 млрд параметрів та LLaDA з 8 млрд параметрів, варіанти FS-DFM з 1,7 та 1,3, а також 0,17 млрд параметрів стабільно забезпечували меншу перплексію та більш стабільну ентропію протягом усієї кількості ітерацій.
Розробники повідомили, що «планують опублікувати код і контрольні точки моделі для полегшення відтворюваності та подальших досліджень».
Хочеш дізнатися більше — читай відгуки
← Вернуться на предыдущую страницу
Колишня дружина Дмитра Ступки Поліна Логунова заінтригувала компроматом на нього та пояснила, чому мовчатиме 22 апреля 2026
Колишня дружина Дмитра Ступки Поліна Логунова каже, що має неабиякий компромат на всю його родину, але мовчатиме заради спільної доньки
YouTube почне видаляти дипфейки за запитами знаменитостей, але не всі 22 апреля 2026
Адміністрація YouTube вдосконалила функцію моніторингу дипфейків — створені штучним інтелектом відеоролики з участю знаменитостей незабаром почнуть зникати з платформи за запитами самих знаменитостей. Але не всі.
Представлений потужний модульний ноутбук Framework Laptop 13 Pro — «MacBook Pro для користувачів Linux» 22 апреля 2026
Виробник модульних комп'ютерів Framework анонсував свого роду «MacBook Pro для користувачів Linux» — модель Framework Laptop 13 Pro готова запропонувати продуктивний процесор, економічну пам'ять, ємний акумулятор, якого вистачить на цілий день автономної роботи. І, звісно, майже повну зворотну сумісність з попередніми моделями бренду.