摘 要:AI绘画是基于人工智能技术进行艺术创作的一种方法,在AI绘画中,Stable Diffusion可提供稳定、连续和高质量的图像生成。Stable Diffusion是一种基于生成对抗网络的图像生成方法,它通过不断更新图像的噪声分布,逐渐生成越来越逼真的图像。在绘画艺术创作中,Stable Diffusion能够激发创作者的灵感,帮助他们探索不同的创作风格和创作方式。与此同时,创作者仍需运用自己的审美判断力对所绘制的作品进行筛选和调整。
关键词:AI绘画;Stable Diffusion;艺术创作
中图分类号:TP399;TP18 文献标识码:A 文章编号:2096-4706(2024)08-0133-05
DOI:10.19850/j.cnki.2096-4706.2024.08.029
0 引 言
AI绘画是指利用人工智能技术进行绘画和艺术创作的方法。AI绘画的技术原理主要涉及文本理解、图像生成和图像优化等方面,其中图像生成是核心环节,也是近年来研究最为活跃的领域[1]。随着深度学习和计算机视觉等技术的发展,AI绘画逐渐成为艺术创作领域的热点。艺术创作是人类创造力和想象力的产物,而AI绘画则是通过机器学习算法和大量的数据训练,使机器能够模拟艺术家的风格和创作技巧进行绘画创作。AI绘画作为一种新的艺术表现形式,正在冲击着传统的艺术领域及相关行业。AI绘画降低了艺术创作的门槛,提高了艺术相关产业的生产效率[2]。
1 Stable Diffusion的介绍
Stable Diffusion一推向市场,便成为AI图像生成领域的佼佼者。2022年5月至8月期间,其开发企业Stability AI进行了内部测试,并在项目开源化后同时公开了代码和文档[3]。在图形设计领域,Stable Diffusion可以通过文生图、图生图的方式结合关键词(Prompt)生成各种抽象和梦幻效果的图形,从而创造出更加丰富和多样化的动态图形效果[4,5]。
Stable Diffusion(稳定扩散)是一种基于生成对抗网络(GANs)的图像生成方法,用于在AI绘画中实现高质量、连续和稳定的图像生成。稳定扩散是通过将生成过程分解为多个扩散步骤实现的。在各个步骤中,生成器模型逐渐将噪声图像转变为逼真的图像,同时判别器模型评估生成图像的真实度。通过迭代调整生成器和判别器之间的对抗学习过程,产生更加真实和细腻的图像。
相比其他传统的图像生成方法,稳定扩散具有以下优势:
1)稳定扩散能够生成连续的图像序列,从低质量到高质量的渐进过程使得生成过程更加可控。
2)稳定扩散能够生成高质量的图像,图像不会模糊或失真,并且具有较好的稳定性。
3)稳定扩散还能够在保持图像细节和纹理的同时实现较快的生成速度,适用于大规模图像生成任务。
Stable Diffusion的基本原理是,在一系列的迭代步骤中通过不断地更新图像的噪声分布使其逐渐接近目标图像。这个过程类似于热扩散,通过平滑和调整图像的细节,使得生成的图像具有更好的连续性和真实感。
Stable Diffusion方法在AI绘画中的应用能够提供更稳定、连续和高质量的图像生成效果,为创作者带来更多的创作工具,使创作者涌现出更多的创作灵感。通过这种方法,创作者可以探索更多风格和创作方式,拓宽艺术创作的边界,给艺术带来更多的创新和可能。
2 Stable Diffusion绘画方法详解
为方便用户使用Stable Diffusion,开发人员会提供一键部署安装包,以简化安装和配置的过程。这样的安装包通常包含所需的软件、依赖库和配置文件,使用户可以快速地将Stable Diffusion部署到自己的计算环境中。AI绘画Stable Diffusion一键部署安装包如图1所示。
2.1 推荐电脑配置
为了达到较好的流畅度,操作系统选择Windows 10,配备64位多核处理器CPU,32 GB内存,显卡为8 GB显存的GTX 3070,硬盘可用空间达到100 GB。为了获得更好的性能和运行速度,建议选择固态硬盘作为系统盘。在这样的配置下,可以绘制最大尺寸为1 024×1 024的图像,每幅图像的绘制时间约为20秒。
2.2 Stable Diffusion常用方法及相关指令
Stable Diffusion常用方法及相关指令有很多,在生成图案中起到了尤为重要的作用,创作者可根据需要选择不同的方法,而相关指令的参数调节能够精准完成图像的风格定位、细节勾勒、动作描画等任务。随着人工智能的不断发展,Stable Diffusion常用方法及相关指令也会不断地更新和迭代。Stable Diffusion常用方法及相关指令的详细说明如下:
1)文生图。最常用生图的操作方式是利用正向提示词和反向提示词来控制想要达到的效果,提示词需要以英文输入。
2)图生图。根据以有的图像结合正向提示词和反向提示词形成新的图像。
3)后期处理。放大图片使用,因平时使用较少,放大效果并不是很好。
4)CheckPoint模型(大模型)。经过训练的图片合集被称作大模型,CKPT的全称为CheckPoint(检查点),常见格式的模型体积较大,一般真人版单个模型的大小在7 GB左右,动漫版单个模型的大小在2~5 GB之间。训练一个大模型比较困难,需要极高的显卡算力,所以绝大多数人不会训练大模型。
5)LoRA模型。通俗来讲可以理解为Stable Diffusion中的一个插件,仅需少量数据就可以进行训练的一种模型。在生成图片时,需要将LoRA模型与大模型结合起来使用,从而实现对输出图片结果的调整。
6)提示词。分为正向提示词(Positive Prompt)和反向提示词(Negative Prompt),写出一份比较好的提示词是文生图技术的关键。Stable Diffusion目前只支持英文,你可以输入单词、词组和短句来描述特征,正向提示词就是想要达到的效果,反向提示词是不想出现的效果,不同的提示词之间以英文逗号分隔。可以用()或者倍数增加权重。
7)迭代步数(Steps)。是指Stable Diffusion生成图像所需的迭代步数。每增加一步迭代,都会给AI更多的机会去比对当前结果并进行相应的调整。更高的迭代步数需要更多的计算时间,高步数并不一定意味着更好的结果。相反,如果迭代步数太少,则会降低生成图像的质量。
8)采样方法(Sampler)。是每次出图都必须选择的一个功能,在采样方法(Sampler Method)中有很多种采样器可供选择,不同的采样方法会产生不同的出图效果。
9)随机数种子(Seed)。可以理解为每个图画的唯一编码,当设置为-1时,图画随机生成,想要达到某种效果时,复制该图的种子数值并将其填入随机种子框内,后续生成的图画基本保持同种类型。
10)ControlNet。是Stable Diffusion中的一种扩展模型,通过这种扩展模型我们能够将参考图像的构图(Compositions)或者人体姿势迁移到目标图像。在生成图像的过程中,可以通过ControlNet引入更多条件来干预图像的生成过程,它可以与现有任何Stable Diffusion模型搭配使用。
3 Stable Diffusion在绘画艺术创作中的应用
在绘画艺术创作中,Stable Diffusion可以激发创作者的灵感,可供创作者设计草图和构图,完成色彩和风格的探索、故事情节构建等工作。需要注意的是,Stable Diffusion作为一个生成模型,其生成结果具有一定的随机性和创造性[6,7]。在将其应用于绘画艺术创作时,创作者仍需运用自己的审美和判断力对生成的结果进行筛选和调整,以确保最终作品符合其创作意图和要求。应用Stable Diffusion绘制一个中国传统水墨画人物,步骤如下:
1)选择Stable Diffusion大模型。选择二次元风格的CheckPoint模型2.0D-meinamix_meinaV10.safetensors,它具有独特的绘画风格和高质量的细节表现,适用于创作出二次元角色形象,如图2所示。
2)输入正向提示词和反向提示词。根据创作者的个人创作需求和想象力,正向提示词将尽可能详细地描述人物的细节、特征以及环境等方面的信息。创作者可以根据自己的审美判断和创造力对这些描述进行组合、调整,进一步拓展和演绎,从而创作出充满个性的角色形象,如图3所示。
正向提示词:
(white printed chineseupshirt),(green long skirt),upper body,shukezouma, negative space, shuimobysim , portrait of a woman standing , willow branches, (masterpiece, best quality:1.2), traditional chinese ink painting, modelshoot style, peaceful, (smile), looking at viewer, song, willow tree in background, wuchangshuo, lt;lora:旗袍裙ChinaDressV2.0:
0.7gt;lt;lora:画风LoRA:墨心MoXin_墨心MoXin1.0:0.5gt;
反向提示词:
mutated hands, (poorly drawn hands:2),(fused fingers:2), (too many fingers:2), bad hands, missing fingers, extra digit, (worst quality:2), (low quality:2), (normal quality:2),bad face,badhands,bad anatomy
3)选择合适的Lora模型。根据创作者需要的风格和最终想要达到的要求,选择合适的Lora模型,在这里选择的是lt;lora:旗袍裙ChinaDressV2.0:0.7gt;和lt;lora:画风Lora:墨心MoXin_墨心MoXin1.0:0.5gt;,分别调整它们的权重为0.7和0.5,如图4所示。
4)调整其他指令。迭代步数(Steps)选择20步,采样方法(Sampler)选择DPM++SDE Karras,随机数种子(Seed)选择-1,并设置高度600和宽度400,如图5所示。
5)最终生成图片,如图6所示。
6)细节调整。采用Stable Diffusion进行高分辨率修复,并通过ControlNet对人物姿态进行调整,以进一步完善细节,实现创作目的,如图7所示。
4 Stable Diffusion在绘画艺术中的优劣势
Stable Diffusion是一种用于AI绘画的工具,它以高质量的绘画作品呈现为特点,同时也具备出色的交互性和灵活性。其强大的功能可使用户根据需求和想象力绘制出不同风格、主题和表现力的绘画作品。此外,它注重细节和真实感,能够捕捉到物体、人物和背景的细微特征,使绘画作品更加逼真自然。与传统手绘或计算机绘图方法相比,Stable Diffusion具有更高的时间效率和资源效率[8]。
但需要注意的是,尽管Stable Diffusion在AI绘画中具有许多优势,但它仍然是基于模型的生成,可能存在一定的局限性和不足之处。现阶段AI绘画还无法完全替代人类绘画,其绘制的成品常常存在细节模糊和结构错误的地方,同时AI的识别能力相对于人的认知是有限的,学习过程中针对训练模型的平均值提取和叠加会出现一些莫名其妙的失误,需要创作者在AI绘画的基础上进行相应的修改[9,10]。创作者仍然需要根据自己的审美和艺术追求对生成的绘画结果进行进一步的调整和润饰,以创作出独特且理想的作品。
5 AI绘画在艺术创作中的发展及影响
AI绘画是指利用人工智能技术进行艺术创作和图像生成的过程。随着深度学习和计算机视觉技术的不断发展,AI绘画在艺术创作中崭露头角,并对艺术创作产生了深远影响:
1)AI绘画为艺术家提供了全新的创作方式和创作工具。传统的艺术创作依赖于艺术家的创造力和技巧,而AI绘画则是在学习和分析大量艺术品和图像数据的基础上生成新颖独特的艺术作品,为艺术家提供更多的创作灵感,为艺术创新带来更多的可能。艺术家可以将AI生成的图像作为创作的起点,进行进一步的创新改进、创意完善,从而创作出新颖别致、独具个性的作品。
2)AI绘画加速了艺术创作的过程。传统绘画需要艺术家耗费大量的时间和精力去打磨,而AI绘画可以通过自动化和智能化的方式快速生成图像。艺术家可以使用AI绘画工具快速完成构图、色彩选择和纹理添加等操作,大大缩短了创作的时间周期,提高了创作效率。这使得艺术家能够更加专注于创作的构思和表达,而不必在烦琐的技术细节上花费过多的时间。
3)AI绘画为艺术创作带来了新的可能性和挑战。AI绘画可以生成具有高度细腻和逼真感的图像,甚至可以模仿名家的特色与风格。这使得艺术家可以通过结合AI或参考AI创作出更加精美和令人惊叹的作品。然而,也有一些人担心AI绘画可能导致艺术的同质化和缺乏原创性。因此,艺术家需要积极探索和利用AI技术,将其与个人的创作理念和风格相结合,以保持艺术作品的独特性和个性化。
4)AI绘画对艺术市场和商业应用产生了深远影响。随着AI艺术作品越来越多地被认可和接受,艺术品的销售和交易方式也发生了变革。艺术家可以通过AI绘画技术创造出更多样化和定制化的艺术作品,满足不同人群的个性化需求。此外,AI绘画还可以用于广告、设计和产品开发等商业领域,为企业呈现更具创意和富有吸引力的视觉效果,可有力地推动艺术与商业的融合。
6 结 论
AI绘画为艺术家带来了新的创作方式和创作工具,加速了创作过程,提高了创作效率,同时也带来了新的可能性与挑战。它对艺术市场和商业应用产生了深远的影响,推动了艺术与科技的融合。然而,我们也要认识到AI绘画并非是取代传统艺术,而是与传统艺术共生共存的一股新兴力量。
参考文献:
[1] 孙凤华.打开“图片盲盒”:AI绘画助力新媒体演化 [J].全媒体探索,2023(7):107-108.
[2] 丁磊.生成式人工智能:AIGC的逻辑与应用 [M].北京:中信出版集团,2023.
[3] 孙文倩.人工智能技术辅助下的图像生成艺术创作研究 [D].上海:华东师范大学,2023.
[4] 张福也.AIGC技术在动态图形设计中的影响 [J].丝网印刷,2023(12):97-99.
[5] 朱光辉,王喜文.ChatGPT的运行模式、关键技术及未来图景 [J].新疆师范大学学报:哲学社会科学版,2023,44(4):113-122.
[6] 刘明亮.人工智能生成内容(AIGC)技术特征及应用场景分析 [J].信息记录材料,2023,24(10):234-236.
[7] 张兆羽.AI绘画在数字媒体设计中的应用 [J].艺术品鉴,2023(9):114-117.
[8] 中国信息通信研究院 京东探索研究院.人工智能生成内容(AIGC)白皮书 [R/OL].(2022-09-02).http://www.caict.
ac.cn/english/research/whitepapers/202211/P020221111501862950
279.pdf.
[9] 缪虹,王敬雷.AI绘画创作的运行规律及应用 [J].丝网印刷,2023(7):96-98.
[10] 汪佳雨.艺术类受众对人工智能生成绘画作品接受意愿的影响因素研究 [D].合肥:中国科学技术大学,2023.
作者简介:李深森(1988—),男,汉族,山东德州人,副教授,本科,研究方向:数字媒体技术、三维动画设计。
收稿日期:2023-08-17
基金项目:山东省一流本科专业建设项目(数字媒体技术)阶段性研究成果
Application of AI Painting in Art Creation
——Taking Stable Diffusion as an Example
LI Shensen
(School of Design and Art, Shandong Huayu University of Technology, Dezhou 253034, China)
Abstract: AI painting is a method of artistic creation based on artificial intelligence technology. In AI painting, Stable Diffusion can provide stable, continuous, and high-quality image generation. Stable Diffusion is an image generation method based on generative adversarial networks, which gradually generates increasingly realistic images by continuously updating the noise distribution of the image. In the creation of painting art, Stable Diffusion can inspire creators and help them explore different creative styles and methods. At the same time, creators still need to use their own aesthetic judgment to screen and adjust the drawn works.
Keywords: AI painting; Stable Diffusion; art creation