🧪 模型对比测试
Nano Banana 2
2249KB
GPT Image 2
860KB
经典版(非汤底结构)
任务目标:
基于参考图生成一套"聊天贴纸表情包合集"。整体需具备强情绪表达、传播性,以及统一但极具个性的视觉风格。最终效果应像:一个人用鼠标在电脑上胡乱画画并顺手乱写文字,低质量但非常真实、有趣、好笑。
输入结构:
图片1:角色参考(可能包含一个或多个角色)
图片2:版式参考(仅用于理解16格结构)
用户输入变量:文案内容(多行文本,可少于或多于16条)
一致性要求(核心重定义):
本任务采用"错误一致性",而非"写实一致性"。
同一角色在不同贴纸中:不需要长得一样,但必须"画得像同一个人乱画的"。
必须统一:相同的笨拙画法、相同的简化方式、相同的错误习惯
允许:五官错位、比例变化、结构错误、细节缺失
必须:保留最低识别特征
版式与结构:共16个贴纸,4x4排列
文案系统:数量处理(少于16条自动补全,多于16条自然筛选);语气优先吐槽/自言自语/情绪爆发
文字与画面融合(关键):文字必须"画出来",而不是"排版出来"。字像鼠标手写:歪、抖、大小不一
美学风格DNA:极差手绘 + MS Paint鼠标乱画 + 失败模仿
风格执行约束(极重要):
当冲突发生时:真实感 vs 风格 → 必须优先风格
禁止:精致画面、正常比例、干净线条、强设计感
判断标准:如果画面开始"好看",说明失败,必须回到粗糙、混乱状态
最终目标:
"一个人不会画画,但用鼠标乱画了16次,每次顺手写了一句不同状态下的吐槽,结果意外很好笑。"
← swipe next · swipe back →