Stability AI выпустила три новые модели Stable Diffusion

ИИ-стартап Stability AI объявил о выпуске сразу трёх новых версий своего генератора изображений Stable Diffusion. Как утверждают в компании, серия Stable Diffusion 3.5 предоставляет более гибкие возможности настройки и умеет создавать более разнообразные изображения по сравнению с предыдущими моделями.

В серию вошли 3 модели:

  • Stable Diffusion 3.5 Large: имеет 8 млрд параметров и может генерировать картинки с разрешением до 1 мегапикселя. Является самой мощной моделью Stability на данный момент;
  • Stable Diffusion 3.5 Large Turbo: ускоренная версия инструмента — создаёт картинки быстрее, чем Large, но в менее хорошем качестве;
  • Stable Diffusion 3.5 Medium: генератор, оптимизированный под смартфоны и ноутбуки. Создаёт изображения с разрешением от 0,25 до 2 мегапикселей.

Large и Turbo уже выпущены, а Medium станет доступна с 29 октября. 

Модели обучались на миллионах изображений, каждое из которых сопровождалось подписями и несколькими версиями ключевых слов – за счет этого инструменты научились связывать больше визуальных образов с любым заданным текстовым описанием, что повысило разнообразие и детализированность генерируемых картинок.

Изображение, сгенерированное с помощью Stable Diffusion 3.5

Предыдущий продукт стартапа, генератор Stable Diffusion 3 Medium, в своё время столкнулся с критикой из-за неполного учёта всех подсказок и ключевых слов при выдаче изображений. Стартап предупредил пользователей, что эта ошибка может ещё повторяться в новых моделях – но при этом заявил, что у новинок лучше получается создавать картинки в сложных стилях, включая 3D-изображения. 

Как и старые модели Stability, инструменты серии Stable Diffusion 3.5 разрешено использовать бесплатно в «некоммерческих» целях. Также компания уточнила, что контент, созданный с помощью её моделей, является собственностью пользователей.

Изображения, сгенерированные с помощью Stable Diffusion 3.5