常用的一些AI文生图的方法推荐

用过用AI做图吗？感觉怎么样？

想必大部分人都有过这样的经历：想要做一张图。满怀期待地告诉 AI 后，生成结果总觉得不是那么回事。

于是，失望之下，关闭了 AI 作图工具，不再使用。

经过一段时间探索后，我发现大部分人都存在偷懒的心理，他们期望通过一个步骤就把所有事情都做好，就像AI 能一步到位地做出完美的 PPT 一样，这显然不可能。

文生图也要好几个步骤，并且要认识一些基础的东西。

我们先弄清楚两个名词：AI绘图（AI-generated art）和文生图（Text-to-image）。为什么要了解它？

因为我在学习阶段时，查阅各种资料，发现大家统称的叫法不一样，有的说AI绘图、有的说文生图，把我搞的迷迷糊糊。

后来查阅后才知道，AI绘图是大概念，它包括了用人工智能创建图形的所有方法；比如：用文字来生成图像，或者是改变图片的风格、编辑图片、修复细节、增强图像等。

而文生图，指一种特定类型的绘图。这类产品、或能力，专门通过文字解析，并根据描述生成图像。

我记得，当年文生图刚出来时，OpenAI的DALL-E和MidJourney是最先让人知道的。这类软件，你给它一段文字，它就能帮你做成图片；但做完后你不能再改，只能调整你的描述，然后再生成一次。

所以，文生图是AI绘图的一个小分支。现在市面上的AI作图软件大致分为三类：

全功能型（例如DALL-E、MidJourney）

风格迁移型

增强与编辑型

这三种的主要区别是重点不同，在各自商业场景中的用途不同。

全能型，功能比较全，能生成多种风格的图片；风格迁移是，AI帮你把一张图片的风格搬到另一张上。

比如：

Adobe Photoshop里有个叫“神经滤镜”的工具，用了它，你可以把普通照片变成像梵高、毕加索这样的名画风格。

国内的即梦AI里，也有类似的功能叫“垫图”，简单讲，这类模型共性特征是，算法会分析你照片的颜色、纹理等，然后把视觉元素应用到你的图片上，让图片看起来像是那种风格的画家画的。

增强和编辑型，这个好理解，就是在原有的图片基础上做创新。像Camera、桌面版美图秀秀都有这种功能，但它们不支持文生图，只能编辑图片。

所以，我们可以说，文生图软件的竞争主要看模型的能力，也就是，软件能不能提供多种模型，让用户有更多风格的图片选择。

我查了查，即梦AI现在给用户提供5种模型选择，有的是人物方面的，有的是英文提示词，还有的和场景相关。

而可灵AI就没有给用户提供选择模型的选项，但在创意描述中，它提供很多不同的风格尝试，比如霓虹城市、仙女、新娘、海水。

或许，当不同风格被人使用足够多时，平台才会再把模型单独拎出来。

既然知道，文生图是文字做图的一种办法，那就意味着对“描述功底”有较高的要求。

什么是描述功底？

你能不能用一句话、一段话把一个需求表达明白的能力。比如：“我想要一张海边的图”。这个描述太模糊，可能导致AI生成各种风格和场景的海边图片。

而一个清晰的描述应该是这样的：

我想要一张夏日黄昏时，一对穿着休闲装的年轻情侣，在没有人的金色沙滩上散步的图片，背景是落日和平静的海面。

这样详细的描述，就能帮助AI更精确地理解并生成你心中想象的场景。

没错，一开始我也是这么学习的，后来我发现，不对。比描述更重要的是得读懂自己的需求，换言之，需求排在描述之前。

为什么需求很重要？

如果我们都不清楚自己究竟想要什么，就更难去描述它。后来，带着疑惑，我就重新学习了「如何表达自己作图的需求」。

我的需求既简单又复杂。一开始，我用AI作图主要想做公众号小绿书的封面；你如果注意看我的公众号，应该会发现小绿书里的配图很讲究。

比如：

前一段时间，我要把新书《自醒》当中的内容做成图文分享出来，却找不到与自醒相关的图片。

用海报，又明显觉得与实际场景不相关。要拍摄《自醒》图书的照片，又发现要天天去咖啡厅或各种地方找场景，这实在是太难了。

所以，我的需求是想要一些既能表达《自醒》主题又和文章意境匹配的图片或海报。这样的图、文搭配才略显品质。

需求有了，接下来该怎么办？

心理学中有个概念叫“否定性选择”（Negative Selection），人们面对选择时，可能不清楚自己确切想要什么，但他们能够确定自己不喜欢或不想要什么。

作图方面也是，我怎么可能一开始就清楚自己喜欢什么风格？更何况，我对绘画、作图本来就没什么天赋，更不用说洞察到自己的具体喜好了。

因此，我开始通过排除法，确定不喜欢的风格。

我用的是即梦AI，它上面有国风美学、海报设计、动漫游戏、未来科技、动物萌宠、绘画绘本、写真人像、产品设计、以及3D艺术和LOGO设计几种。

点进去大眼一看，动物萌宠、写真人像、产品设计、LOGO设计这肯定与「自醒」无关呀，于是，直接排除掉。

什么样的更符合呢？根据《自醒》，我提炼了几个关键词，比如顿悟、觉醒、醒悟、空间感、和意境唯美。

但是，我不能总停留在这些抽象的概念上，如果太抽象了，生成文生图可能会更加模糊不清。因此，我参考了一些其他人编写的具体提示词。

比如：

一张挑战视觉极限的海报，以极简主义手法展现‘披着羊皮的狼’。画面上，狼皮与羊皮巧妙地交织在一起，难以分辨，只有那双深邃的眼睛透露出真实的自我。

大师运用光影效果，营造出一种神秘而紧张的氛围，让观者在极简的构图中感受到强烈的视觉冲击。这幅作品不仅是对伪装与真实的探讨，也是一次视觉艺术的盛宴。

还有：

一幅极简主义风格的海报，以海与天交汇的美景为背景，两者相连成线，展现自然的辽阔与和谐。

沙洲上似乎还残留着未说完的话语，但画面以留白代替，留给观者无限的想象空间。

芦苇花以纯白色调覆盖，营造出一种静谧而深邃的氛围。爱过的容颜虽已成过往，但在极简的笔触与色彩下，那份情愫被赋予了新的生命，视觉冲击力强烈，无需文字，情感已跃然纸上，大师之作，令人回味无穷。

43 一些AI文生图的方法

这些图片出来的效果，有我想要的感觉、又避免了那种繁琐复杂的细节，它抓住了主题的核心，又展现了我心中的想法，如果用一个词来形容的话，即：深刻简洁。

毕加索有一句名言叫：好的艺术家复制，伟大的艺术家窃取。在中国商业上也有类似的观点叫“先模仿，后创新”，作图亦是如此，有感觉找对了，才能融入自己的东西。

于是，我把别人的一些提示词拷贝下来，修改关键内容，先生成几个看看。

我觉得即梦AI 这一点上做得非常棒，它能把提示词公布出来，供别人学习；在经过多轮尝试之后，才找到基础感觉。

因此，文生图第一步，是找需求，弄清楚需求，根据平台提供的样式，知道自己不想要什么，才能缩小选择范围并聚焦重要的元素。

第二步是什么？我认为是：给提示词下定义。

中国人有一种思维方式，凡事喜欢自己干；AI时代，这种思维要发生变化；AI本身是一个生产工具，虽然它没有自主意识，但可以进行各种角色扮演。

我理解中的“定义”，就像是在现实生活中，我们要完成某个任务时，会找一个专家来帮忙一样；在用AI做图时，定义就意味着你可以告诉AI，你想让它成为什么样的专家。

以前我看别人的攻略，他们会说，你可以这样下定义，例如：“你是一个顶尖的设计大师”，但实践后发现，这种定义并不够精准。

我们给AI的角色定义，要像具体要求一样精确。

比如：

比如，如果我想要一种极简风格的图案，我就会定义它为：“你是一位顶尖的极简风格设计师。”这样AI就能更精确地理解我想要的是什么。

理解了它，就能据不同的设计需求，为AI定义更具体的角色。

举几个例子：

如果你要一张现代都市风格的图像，可以告诉AI：“你是一位专注于现代城市风格的建筑摄影师。”这样AI就会专注于捕捉城市的节奏和建筑的线条。

如果你想要一幅富有东方艺术风格的设计，可以定义为：你是一位擅长东方艺术的古典艺术家。

假设做商业海报比较多，我们可以这样表达：“你是一位商业广告设计师，专门为品牌创造引人注目的营销视觉。”这样，它生成的作品更有相关性。

除此之外，我在实践中发现，有时候我想要的风格和AI设计出来的风格不一致，这该怎么办？

比如：

我想要一幅具有复古感的插画，但AI却生成了一幅非常现代和抽象的作品，显然这不是我想要的。

第三步，要学会添加“关键词”，什么是关键词呢？就是几个特别的词，用来告诉AI你想要什么样的图。

如果你只告诉AI你想要一幅“复古”的画，它可能不够清楚你的具体意图；但如果你补充说需要“1920s风格”或“爵士乐元素”，AI就能更好地把握你的意思了

。

谈到这个，我们思考一个问题：

如我前面所述的“自醒”、“觉悟”、“醒悟”，算关键词吗？说算，也可以说不算。

算的原因是，这些词能用来指导AI创作出具有某些特定主题的作品；它们能让AI朝着一定的情感、哲学方向发展，比如：探索个人成长或精神觉醒的主题。

但另一方面，这些词也不算是理想关键词，因为过于抽象，这意味着它没办法描绘出主要图像。

这时，该怎么办？

我的一个技巧是，将“抽象词”用作起点，让AI根据词生成一个初步的图像，生成后基于初稿，提供更具体、更准确的指令来精细调整。

很多时候，你不完全确定自己想要什么，但当看到AI的初稿后，思路会逐渐清晰。然后，就可以优化你的提示词，添加新的元素或调整主题，以达到更好的效果。

因此，下好定义，给出铺路词，这就是迭代的过程。

文生图中最难把握的部分之一是氛围。所谓氛围，是过程中，能够唤起特定情感、情绪或场景氛围的词汇；这些词是感觉至上，很难描述。

为了更好地掌握抽象元素，我把它们分成了七类：

情绪、光线和色彩、时间和环境、场景空间、艺术风格、动作和状态、质感和材料

乍一看，这些词汇很常见，但要详细描述它们的具体影响和应用，确实不容易。

这些词虽然听起来很熟悉，但要详细解释它们具体的影响和用法，确实有点难。比如说“光线”和“色彩”，大家都知道这很重要，但要准确说出用什么样的光线、什么样的色彩才最合适，这可不简单。

如果要我用不同的方式来描述光，我可能也说不出来，这时候，怎么办呢？可以借助AI。

我会用Kimi Chat，会对它说：“现在做一张文生图，要一些关于光线的提示词，特别是关于明暗、冷酷的，我想不起来了，你帮我写写。

这样，就能解决大脑氛围词缺失的问题。

我还发现，如果一个提示词能把主题、环境、动作、风格、色彩、光线和氛围都描述清楚，那生成的作品基本就能达到我们的预期。

44 一些AI文生图的方法

这是我写的一个提示词例子：

一张由海报设计大师操刀的极简风格作品；以黑白灰为主色调，通过极简的线条与形状，勾勒出一个地球；让人感受到一种超越现实的宁静与美好；大师级的构图与色彩运用，让这幅海报成为极简主义美学的典范，插画风格：深色为主。

把描述直接给AI后，出来的作品非常符合想要的感觉。当然，还可以根据需要加入其他元素，比如二分法、三分法或对称构图等。

因此，虽然精准的提示词表达对文生图至关重要，但过程不是一蹴而就，唯有多试几次、迭代几次，才能达到想要的效果。

总结

学会分步骤，过程变简单。