常用的一些AI文生图的方法推荐

用过用AI做图吗?感觉怎么样?
 
想必大部分人都有过这样的经历:想要做一张图。满怀期待地告诉 AI 后,生成结果总觉得不是那么回事。
于是,失望之下,关闭了 AI 作图工具,不再使用。
 
经过一段时间探索后,我发现大部分人都存在偷懒的心理,他们期望通过一个步骤就把所有事情都做好,就像AI 能一步到位地做出完美的 PPT 一样,这显然不可能。
 
文生图也要好几个步骤,并且要认识一些基础的东西。
 
01
 
我们先弄清楚两个名词:AI绘图(AI-generated art)和文生图(Text-to-image)。为什么要了解它?
 
因为我在学习阶段时,查阅各种资料,发现大家统称的叫法不一样,有的说AI绘图、有的说文生图,把我搞的迷迷糊糊。
 
后来查阅后才知道,AI绘图是大概念,它包括了用人工智能创建图形的所有方法;比如:用文字来生成图像,或者是改变图片的风格、编辑图片、修复细节、增强图像等。
 
而文生图,指一种特定类型的绘图。这类产品、或能力,专门通过文字解析,并根据描述生成图像。
 
我记得,当年文生图刚出来时,OpenAI的DALL-E和MidJourney是最先让人知道的。这类软件,你给它一段文字,它就能帮你做成图片;但做完后你不能再改,只能调整你的描述,然后再生成一次。
 
所以,文生图是AI绘图的一个小分支。现在市面上的AI作图软件大致分为三类:
 
全功能型(例如DALL-E、MidJourney)
 
风格迁移型
 
增强与编辑型
 
这三种的主要区别是重点不同,在各自商业场景中的用途不同。
 
全能型,功能比较全,能生成多种风格的图片;风格迁移是,AI帮你把一张图片的风格搬到另一张上。
 
比如:
 
Adobe Photoshop里有个叫“神经滤镜”的工具,用了它,你可以把普通照片变成像梵高、毕加索这样的名画风格。
 
国内的即梦AI里,也有类似的功能叫“垫图”,简单讲,这类模型共性特征是,算法会分析你照片的颜色、纹理等,然后把视觉元素应用到你的图片上,让图片看起来像是那种风格的画家画的。
 
增强和编辑型,这个好理解,就是在原有的图片基础上做创新。像Camera、桌面版美图秀秀都有这种功能,但它们不支持文生图,只能编辑图片。
 
所以,我们可以说,文生图软件的竞争主要看模型的能力,也就是,软件能不能提供多种模型,让用户有更多风格的图片选择。
 
我查了查,即梦AI现在给用户提供5种模型选择,有的是人物方面的,有的是英文提示词,还有的和场景相关。
 
而可灵AI就没有给用户提供选择模型的选项,但在创意描述中,它提供很多不同的风格尝试,比如霓虹城市、仙女、新娘、海水。
 
或许,当不同风格被人使用足够多时,平台才会再把模型单独拎出来。
 
02
 
既然知道,文生图是文字做图的一种办法,那就意味着对“描述功底”有较高的要求。
 
什么是描述功底?
 
你能不能用一句话、一段话把一个需求表达明白的能力。比如:“我想要一张海边的图”。这个描述太模糊,可能导致AI生成各种风格和场景的海边图片。
 
而一个清晰的描述应该是这样的:
 
我想要一张夏日黄昏时,一对穿着休闲装的年轻情侣,在没有人的金色沙滩上散步的图片,背景是落日和平静的海面。
 
这样详细的描述,就能帮助AI更精确地理解并生成你心中想象的场景。
 
没错,一开始我也是这么学习的,后来我发现,不对。比描述更重要的是得读懂自己的需求,换言之,需求排在描述之前。
 
为什么需求很重要?
 
如果我们都不清楚自己究竟想要什么,就更难去描述它。后来,带着疑惑,我就重新学习了「如何表达自己作图的需求」。
 
我的需求既简单又复杂。一开始,我用AI作图主要想做公众号小绿书的封面;你如果注意看我的公众号,应该会发现小绿书里的配图很讲究。
 
比如:
 
前一段时间,我要把新书《自醒》当中的内容做成图文分享出来,却找不到与自醒相关的图片。
 
用海报,又明显觉得与实际场景不相关。要拍摄《自醒》图书的照片,又发现要天天去咖啡厅或各种地方找场景,这实在是太难了。
 
所以,我的需求是想要一些既能表达《自醒》主题又和文章意境匹配的图片或海报。这样的图、文搭配才略显品质。
 
需求有了,接下来该怎么办?
 
心理学中有个概念叫“否定性选择”(Negative Selection),人们面对选择时,可能不清楚自己确切想要什么,但他们能够确定自己不喜欢或不想要什么。
 
作图方面也是,我怎么可能一开始就清楚自己喜欢什么风格?更何况,我对绘画、作图本来就没什么天赋,更不用说洞察到自己的具体喜好了。
 
因此,我开始通过排除法,确定不喜欢的风格。
 
我用的是即梦AI,它上面有国风美学、海报设计、动漫游戏、未来科技、动物萌宠、绘画绘本、写真人像、产品设计、以及3D艺术和LOGO设计几种。
 
点进去大眼一看,动物萌宠、写真人像、产品设计、LOGO设计这肯定与「自醒」无关呀,于是,直接排除掉。
 
什么样的更符合呢?根据《自醒》,我提炼了几个关键词,比如顿悟、觉醒、醒悟、空间感、和意境唯美。
 
但是,我不能总停留在这些抽象的概念上,如果太抽象了,生成文生图可能会更加模糊不清。因此,我参考了一些其他人编写的具体提示词。
 
比如:
 
一张挑战视觉极限的海报,以极简主义手法展现‘披着羊皮的狼’。画面上,狼皮与羊皮巧妙地交织在一起,难以分辨,只有那双深邃的眼睛透露出真实的自我。
 
大师运用光影效果,营造出一种神秘而紧张的氛围,让观者在极简的构图中感受到强烈的视觉冲击。这幅作品不仅是对伪装与真实的探讨,也是一次视觉艺术的盛宴。
 
还有:
 
一幅极简主义风格的海报,以海与天交汇的美景为背景,两者相连成线,展现自然的辽阔与和谐。
 
沙洲上似乎还残留着未说完的话语,但画面以留白代替,留给观者无限的想象空间。
 
芦苇花以纯白色调覆盖,营造出一种静谧而深邃的氛围。爱过的容颜虽已成过往,但在极简的笔触与色彩下,那份情愫被赋予了新的生命,视觉冲击力强烈,无需文字,情感已跃然纸上,大师之作,令人回味无穷。
43 一些AI文生图的方法
 
43 一些AI文生图的方法
 
这些图片出来的效果,有我想要的感觉、又避免了那种繁琐复杂的细节,它抓住了主题的核心,又展现了我心中的想法,如果用一个词来形容的话,即:深刻简洁。
 
毕加索有一句名言叫:好的艺术家复制,伟大的艺术家窃取。在中国商业上也有类似的观点叫“先模仿,后创新”,作图亦是如此,有感觉找对了,才能融入自己的东西。
 
于是,我把别人的一些提示词拷贝下来,修改关键内容,先生成几个看看。
 
我觉得即梦AI 这一点上做得非常棒,它能把提示词公布出来,供别人学习;在经过多轮尝试之后,才找到基础感觉。
 
因此,文生图第一步,是找需求,弄清楚需求,根据平台提供的样式,知道自己不想要什么,才能缩小选择范围并聚焦重要的元素。
 
03
 
第二步是什么?我认为是:给提示词下定义。
 
中国人有一种思维方式,凡事喜欢自己干;AI时代,这种思维要发生变化;AI本身是一个生产工具,虽然它没有自主意识,但可以进行各种角色扮演。
 
我理解中的“定义”,就像是在现实生活中,我们要完成某个任务时,会找一个专家来帮忙一样;在用AI做图时,定义就意味着你可以告诉AI,你想让它成为什么样的专家。
 
以前我看别人的攻略,他们会说,你可以这样下定义,例如:“你是一个顶尖的设计大师”,但实践后发现,这种定义并不够精准。
 
我们给AI的角色定义,要像具体要求一样精确。
 
比如:
 
比如,如果我想要一种极简风格的图案,我就会定义它为:“你是一位顶尖的极简风格设计师。”这样AI就能更精确地理解我想要的是什么。
 
理解了它,就能据不同的设计需求,为AI定义更具体的角色。
 
举几个例子:
 
如果你要一张现代都市风格的图像,可以告诉AI:“你是一位专注于现代城市风格的建筑摄影师。”这样AI就会专注于捕捉城市的节奏和建筑的线条。
 
如果你想要一幅富有东方艺术风格的设计,可以定义为:你是一位擅长东方艺术的古典艺术家。
 
假设做商业海报比较多,我们可以这样表达:“你是一位商业广告设计师,专门为品牌创造引人注目的营销视觉。”这样,它生成的作品更有相关性。
 
除此之外,我在实践中发现,有时候我想要的风格和AI设计出来的风格不一致,这该怎么办?
 
比如:
 
我想要一幅具有复古感的插画,但AI却生成了一幅非常现代和抽象的作品,显然这不是我想要的。
 
第三步,要学会添加“关键词”,什么是关键词呢?就是几个特别的词,用来告诉AI你想要什么样的图。
 
如果你只告诉AI你想要一幅“复古”的画,它可能不够清楚你的具体意图;但如果你补充说需要“1920s风格”或“爵士乐元素”,AI就能更好地把握你的意思了
谈到这个,我们思考一个问题:
 
如我前面所述的“自醒”、“觉悟”、“醒悟”,算关键词吗?说算,也可以说不算。
 
算的原因是,这些词能用来指导AI创作出具有某些特定主题的作品;它们能让AI朝着一定的情感、哲学方向发展,比如:探索个人成长或精神觉醒的主题。
 
但另一方面,这些词也不算是理想关键词,因为过于抽象,这意味着它没办法描绘出主要图像。
 
这时,该怎么办?
 
我的一个技巧是,将“抽象词”用作起点,让AI根据词生成一个初步的图像,生成后基于初稿,提供更具体、更准确的指令来精细调整。
 
很多时候,你不完全确定自己想要什么,但当看到AI的初稿后,思路会逐渐清晰。然后,就可以优化你的提示词,添加新的元素或调整主题,以达到更好的效果。
 
因此,下好定义,给出铺路词,这就是迭代的过程。
 
04
 
文生图中最难把握的部分之一是氛围。所谓氛围,是过程中,能够唤起特定情感、情绪或场景氛围的词汇;这些词是感觉至上,很难描述。
 
为了更好地掌握抽象元素,我把它们分成了七类:
 
情绪、光线和色彩、时间和环境、场景空间、艺术风格、动作和状态、质感和材料
 
乍一看,这些词汇很常见,但要详细描述它们的具体影响和应用,确实不容易。
 
这些词虽然听起来很熟悉,但要详细解释它们具体的影响和用法,确实有点难。比如说“光线”和“色彩”,大家都知道这很重要,但要准确说出用什么样的光线、什么样的色彩才最合适,这可不简单。
 
如果要我用不同的方式来描述光,我可能也说不出来,这时候,怎么办呢?可以借助AI。
 
我会用Kimi Chat,会对它说:“现在做一张文生图,要一些关于光线的提示词,特别是关于明暗、冷酷的,我想不起来了,你帮我写写。
 
这样,就能解决大脑氛围词缺失的问题。
 
我还发现,如果一个提示词能把主题、环境、动作、风格、色彩、光线和氛围都描述清楚,那生成的作品基本就能达到我们的预期。
 
44 一些AI文生图的方法
 
这是我写的一个提示词例子:
 
一张由海报设计大师操刀的极简风格作品;以黑白灰为主色调,通过极简的线条与形状,勾勒出一个地球;让人感受到一种超越现实的宁静与美好;大师级的构图与色彩运用,让这幅海报成为极简主义美学的典范,插画风格:深色为主。
 
把描述直接给AI后,出来的作品非常符合想要的感觉。当然,还可以根据需要加入其他元素,比如二分法、三分法或对称构图等。
 
因此,虽然精准的提示词表达对文生图至关重要,但过程不是一蹴而就,唯有多试几次、迭代几次,才能达到想要的效果。
 
总结
 
学会分步骤,过程变简单。