Обновить

Как убедить стол не таскать за собой чашки. Пошаговая отладка промпта в txt2img-сервисах

Время на прочтение5 мин
Охват и читатели6.7K
Всего голосов 10: ↑10 и ↓0+16
Комментарии10

Комментарии 10

НЛО прилетело и опубликовало эту надпись здесь

У меня под руками были Шедеврум 2.5 и GigaChat в MAX - достаточно стандартный набор для телефона.
Я не стал размещать в статье все варианты промптов, которые перебрал. Но их было много, пока не пошёл в сторону разбора токенов.

Моё предположение - в эти модели загружены в основном dataset-ы c полноценной сервировкой. И они перевешивают запросы на уникальные сюжеты артов (одна чашка, один бокал).

В общем следующие шаги (убрать чашку из промпта) подтверждают эту догадку. Модели упорно продолжают "досервировывать" сюжет.


В StableDiffusion этого нет - он сразу делает чёткую композицию.

И да, писать промпт сразу по-английски я не пробовал.

Попробуйте генерить игральную кость с правильными паттернами точек.

Опять же: одну игральную кость. И на сладкое: вид сверху на игральную кость с нужным количеством точек.

Гарантирую незабываемые промт-инженерные ощущения :)

Благодарю. Вот прямо сегодня и займусь.

Интересная идея.

Вернулся поблагодарить.

Вы реально классную задачу подкинули. Пока что в Шедевруме даже рядом не выходит. Без control net и с ограничением длины промпта в 500 символов уже всю бошку сломал :))))

Да, кости – это истинная жесть, а не какие-то там пальцы рук или ноги лошадей

Пока не существует нейрорисовалок, которые справляются с костями. Даже без ограничений на длину промта. Даже не в Шедевруме

Здравствуйте, Андрей!

Поздравляю с дебютной публикацией на Хабре — это важный и волнительный шаг. Отличная работа!

Очень ценно, что вы подняли тему, которая часто остается за кадром: человеческий фактор в, казалось бы, чисто техническом процессе. История с неверным форматом номера телефона — это классический пример того, как одна маленькая "мелочь" может привести к глобальным последствиям. Вы прекрасно показали всю цепочку: от требования бизнеса до реализации и последующего анализа проблемы.

Особенно понравился раздел про выводы. Конкретно, структурно и без воды. Правило "никогда не доверять данным из ненадёжных источников" — это фундаментальный принцип, который, к сожалению, многие по-настоящему осознают только после подобных инцидентов. Ваш опыт, оформленный в такие чёткие тезисы, будет крайне полезен другим разработчикам и аналитикам.

Желаю, чтобы посты были только по желанию, а в производстве всегда был только стабильный и оттестированный код!

Добрый день.

В StableDiffusion всё нормально выходит. А если ненормально – можно выправить через control net.

Речь в статье о "карманных" моделях, доступных с телефона.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
www.mts.ru
Дата регистрации
Дата основания
Численность
свыше 10 000 человек
Местоположение
Россия