ИИ-стартап Stability AI объявил о выпуске сразу трёх новых версий своего генератора изображений Stable Diffusion. Как утверждают в компании, серия Stable Diffusion 3.5 предоставляет более гибкие возможности настройки и умеет создавать более разнообразные изображения по сравнению с предыдущими моделями.
В серию вошли 3 модели:
- Stable Diffusion 3.5 Large: имеет 8 млрд параметров и может генерировать картинки с разрешением до 1 мегапикселя. Является самой мощной моделью Stability на данный момент;
- Stable Diffusion 3.5 Large Turbo: ускоренная версия инструмента — создаёт картинки быстрее, чем Large, но в менее хорошем качестве;
- Stable Diffusion 3.5 Medium: генератор, оптимизированный под смартфоны и ноутбуки. Создаёт изображения с разрешением от 0,25 до 2 мегапикселей.
Large и Turbo уже выпущены, а Medium станет доступна с 29 октября.
Модели обучались на миллионах изображений, каждое из которых сопровождалось подписями и несколькими версиями ключевых слов – за счет этого инструменты научились связывать больше визуальных образов с любым заданным текстовым описанием, что повысило разнообразие и детализированность генерируемых картинок.
Предыдущий продукт стартапа, генератор Stable Diffusion 3 Medium, в своё время столкнулся с критикой из-за неполного учёта всех подсказок и ключевых слов при выдаче изображений. Стартап предупредил пользователей, что эта ошибка может ещё повторяться в новых моделях – но при этом заявил, что у новинок лучше получается создавать картинки в сложных стилях, включая 3D-изображения.
Как и старые модели Stability, инструменты серии Stable Diffusion 3.5 разрешено использовать бесплатно в «некоммерческих» целях. Также компания уточнила, что контент, созданный с помощью её моделей, является собственностью пользователей.