Комментарии 10
У меня под руками были Шедеврум 2.5 и GigaChat в MAX - достаточно стандартный набор для телефона.
Я не стал размещать в статье все варианты промптов, которые перебрал. Но их было много, пока не пошёл в сторону разбора токенов.
Моё предположение - в эти модели загружены в основном dataset-ы c полноценной сервировкой. И они перевешивают запросы на уникальные сюжеты артов (одна чашка, один бокал).
В общем следующие шаги (убрать чашку из промпта) подтверждают эту догадку. Модели упорно продолжают "досервировывать" сюжет.
В StableDiffusion этого нет - он сразу делает чёткую композицию.
И да, писать промпт сразу по-английски я не пробовал.
Попробуйте генерить игральную кость с правильными паттернами точек.
Опять же: одну игральную кость. И на сладкое: вид сверху на игральную кость с нужным количеством точек.
Гарантирую незабываемые промт-инженерные ощущения :)
Здравствуйте, Андрей!
Поздравляю с дебютной публикацией на Хабре — это важный и волнительный шаг. Отличная работа!
Очень ценно, что вы подняли тему, которая часто остается за кадром: человеческий фактор в, казалось бы, чисто техническом процессе. История с неверным форматом номера телефона — это классический пример того, как одна маленькая "мелочь" может привести к глобальным последствиям. Вы прекрасно показали всю цепочку: от требования бизнеса до реализации и последующего анализа проблемы.
Особенно понравился раздел про выводы. Конкретно, структурно и без воды. Правило "никогда не доверять данным из ненадёжных источников" — это фундаментальный принцип, который, к сожалению, многие по-настоящему осознают только после подобных инцидентов. Ваш опыт, оформленный в такие чёткие тезисы, будет крайне полезен другим разработчикам и аналитикам.
Желаю, чтобы посты были только по желанию, а в производстве всегда был только стабильный и оттестированный код!
Попробуйте stable diffusion
Как убедить стол не таскать за собой чашки. Пошаговая отладка промпта в txt2img-сервисах