Генерация Изображений

Alibaba PAI починила инпейнтинг в Z-Image ControlNet и выкатила Lite-версию

Обновление Z-Image-Turbo-Fun-Controlnet-Union 2.1 устраняет протекание масок при инпейнтинге и добавляет Lite-модель на 1,9 ГБ для систем с ограниченной видеопамятью.

Игорь Исаев
Игорь ИсаевАвтор об ИИ
15 января 2026 г.2 мин чтения
Поделиться:
Сравнение до/после: улучшения инпейнтинга Z-Image ControlNet с более чёткими границами масок

Команда PAI из Alibaba на этой неделе выложила крупное обновление Z-Image-Turbo-Fun-Controlnet-Union 2.1. Главное: исправили две проблемы, которые портили жизнь пользователям предыдущей версии. Маски при инпейнтинге «протекали» в соседние области, а при высоких значениях control strength появлялись яркие артефакты.

Screenshot 2026-01-15 at 14.37.32.png

Причину обеих проблем нашли в процессе обучения. Недостаточная рандомизация масок приводила к тому, что модель запоминала их паттерны вместо того, чтобы игнорировать. Отсюда автозаполнение там, где должно было быть удаление. С артефактами ситуация другая: переобучение между этапами control и tile distillation давало те самые яркие пятна при повышении control_context_scale. Переобученные модели обе проблемы решают.

Появилась Lite-версия весом 1,9 ГБ (полная модель тяжелее). Управление применяется к 5 слоям вместо 17. Условия слабее, но разработчики утверждают, что в некоторых сценариях результат выглядит естественнее. Ещё переработали датасет: разрешение обучающих изображений теперь варьируется от 512 до 1536 пикселей, а не фиксированные 512px. Это должно улучшить работу на разных разрешениях.

Для большинства пользователей рекомендуют 8-шаговую дистиллированную версию. Она возвращает ту скорость инференса, ради которой Z-Image-Turbo изначально и создавался, но которую потеряли, когда прикрутили ControlNet.

Итог: практичные исправления под реальные рабочие процессы плюс облегчённый вариант для тех, кто сидит на потребительских видеокартах.


КРАТКО

  • Размер Lite-модели: 1,9 ГБ (5 слоёв против 17 в полной версии)
  • Диапазон разрешений при обучении: 512–1536px (раньше только 512px)
  • Рекомендуемый инференс: 8 шагов для дистиллированной модели
  • Оптимальный диапазон control_context_scale: 0,65–0,90
  • Лицензия: Apache 2.0
Игорь Исаев

Игорь Исаев

Автор об ИИ

Игорь рассказывает о самых важных новостях из мира ИИ прямо сейчас. Без хайпа, только чёткий ежедневный обзор инструментов, трендов и разработок, которые в реальном времени меняют целые отрасли. Он делает сложное понятным и привычным.

Похожие статьи

Будьте впереди в мире ИИ

Получайте последние новости, обзоры и скидки ИИ прямо на почту. Присоединяйтесь к 100 000+ энтузиастов ИИ.

Подписываясь, вы соглашаетесь с нашей Политикой конфиденциальности. Отписаться можно в любое время.