摘要
随着视觉技术和传播技术的进步, 人们的交流与沟通越来越倚重视觉图像,图像已成为人们把握世界的重要途径。人工智能技术的应用催生了AI(人工智能)绘画,AI绘画带来了全新的视觉体验,但同时也造成了真实与虚拟边界模糊、图像霸权不断放大内心欲望、沉溺于表层视觉享受而忽略图像背后的文化内涵等视觉认知失范,传统的视觉认知能力难以适应新环境下出现的视觉体验,可通过明晰视界政体这一图像时代的生存规则、加强顶层设计和增强视觉图像的应用能力,来建构新的视觉认知能力,从而帮助网民在图像化的世界里更好地生活。
关键词
AI绘画 视觉文化 视觉认知 图像化生存
美国社会学家、未来学家丹尼尔·贝尔(Daniel Bell)曾在其着作《资本主义文化矛盾》中写道:“我相信,当代文化正在变成一种视觉文化,而不是一种印刷文化,这是千真万确的事实。”[1]随着印刷、摄影和网络等影像复制技术的更迭发展,图像以各种形态充斥着我们的生活。当今世界已经进入了高度图像化的时代,视觉性在文化中扮演着极其重要的作用,甚至直接成为文化的主因,即我们用以解释、理解和再现世界的方式很大程度上依赖于图像化/视觉化的形式、经验和趋势[2]。视觉文化的蓬勃发展,米歇尔(W.J.T.Mitchell)将其称为继“语言转向”之后的一种新的历史阶段——“图像转向”[3],即高度图像化的时代。
从印刷媒介到视觉图像,从语言学转向到图像转向,我们的价值观、意识、行为越来越被图像所影响、规训。随着智能技术的进步,社会进入了智能传播时代,人们的交流与沟通越来越倚重视觉图像,视觉图像已成为现代人把握世界的主要途径。互联网每天都会产生数以亿计的图像,而AI绘画的出现更加让这一数字呈现指数级增长,人们需要处理的图像信息也越来越多。不同于需要实景拍摄的摄影摄像技术以及需要手部与机器共同合作的数位板绘画,AI绘画只需要输入几个关键词,即使毫无艺术细胞的人也能制作出一幅精美的画作。然而,技术的飞速更迭并没有带来人们视觉认知能力的同步上升,在虚假图像泛滥的当下,人类应该如何把握这个世界,建立理性的认知,这是我们应该思考的问题。
一、多维视角下的视觉认知
视觉是一个生理学的概念,光作用于视觉器官,所接收到的关于外部系统的信息经视觉神经系统加工处理后,视觉便产生了。视觉是人最重要的感觉,也是人类获取外部信息最主要的渠道,进入人大脑的信息有75%来自于视觉[4]。而视觉认知指的是从眼球接收到外部视觉刺激后,将这一刺激一路传导到大脑,大脑对其进行接收和辨识,从而对外部物体产生认知活动这样一个过程。视觉信息的准确获取,正确加工和解码是大脑进行高效的认知加工的基础。我们的知觉、记忆和思维,也有相当大一部分是以视觉作为组织,加工和储存的形式。由此可见,正确的视觉认知对于我们的生活极其重要。
视觉认知理论来源于认知心理学,作为人类感知、理解世界的重要途径之一,视觉认知在各个领域都有了长足的发展。在艺术学领域,当代美国艺术心理学家鲁道夫·阿恩海姆(Rudolf Arnheim)对视觉思维进行了系统的阐述,他将格式塔心理学具体地运用于艺术,把视知觉与艺术联系起来考察,为了解人的审美心理过程提供了新的契机[5]。在心理学领域,认知心理学派强调了象元(图像和视频)在信息加工和记忆过程中的重要作用。美国当代认知心理学家艾伦·佩维奥(Allan Paivio)提出了双重编码理论,他强调,在信息的贮存、加工与提取中,语言与非语言的信息加工过程是同样重要的。佩维奥同时还假定,存在两种不同的表征单元:适用于心理映象的“图象单元”和适用于语言实体的“语言单元”[6]。对于双重编码理论最重要的原则就是:可通过同时用视觉和语言的形式呈现信息来增强信息的回忆与识别[7]。神经生物学则从人的生理机能出发,阐释了视觉信息是如何通过眼睛传递到大脑,并认为视觉和认知是我们最重要的感知方式。
二、AI绘画背景下公众的视觉认知失范
将时间轴往前移,AI绘画早在上个世纪就已经出现。20世纪70年代,英国艺术家哈罗德·科恩(Harold Cohen)打造了电脑程序“AARON”,与当下的数字绘图不同之处在于,“AARON”是使用机械手臂在画布上进行绘画,是一种与人体分离的外在性的辅助装置,其本身无法进行学习与计算。2012年之后,计算机视觉迅速发展,各种网络模型问世并应用于艺术绘画领域。经过近50年的发展,AI绘画已然可以通过数据集与网络模型,进行数字化的绘画创作,将字变为画。因此,AI绘画相较于“AARON”,已经成为了人体的延伸,且具有了“学习”与“计算”能力,通过对大数据的抓取和学习,生成的高于一般画师水平的精美画作给人们带来了极致的视觉体验。在AI绘画爆火不断革新艺术领域的生产力时,也造成了人们视觉认知的失范。
(一)真实与虚拟边界的模糊
口传时代,人们通过身体符号及语言进行面对面的沟通,视觉所带来的感知是真实的、直接的。印刷时代,人们通过文字符号与图像符号等中介物认知与理解世界,符号建构了我们的认知。随着大众传媒的蓬勃发展,人们越来越多地通过视觉图像获得信息,形成对外在世界的认知。纵观历史的长河,在经历了历次宗教、社会和政治运动,以及弗迪南·德·索绪尔(Ferdinand de Saussure)、路德维希·约瑟夫·约翰·维特根斯坦(Ludwig Josef Johann Wittgenstein)、艾弗拉姆·诺姆·乔姆斯基(Avram Noam Chomsky)等语言学家和艺术史家的符号化、理论化和“体系”化之后,形象已经不再是用于认识世界的透明窗口了[8],形象变得不再透明。
进入人工智能时代,“眼见为实”被颠覆,AI的应用使得文字与图像、真实与虚拟之间呈现日益割裂的趋势。不同于画师的精雕细琢,只需要在绘画软件中输入关键词,AI绘图软件即可自动生成理想画作,并可通过后期的训练不断精进“画技”。AI所生成的图画由早期的“漫画风”进化到如今的现实主义画风,人们越来越难以分清到底哪张图是真的,虚拟与现实的边界日渐模糊。通过AI绘画软件Midjourney V5生成的《中国情侣》十分逼真,以往被诟病的“AI不会画手指”这一问题也被完美解决,不少看客最先根本不知道这是一张由AI绘制的假图。在新闻领域,AI绘画所产生的“假新闻”也已引起广泛讨论。2023年5月,一则“印度夫妻在漂浮着垃圾的恒河水中亲吻”的博文冲上微博热搜,后经证实这是一幅由AI生成的图片,不少网友表示“AI绘画这么强大,这以后谁还能分清真假”。AI绘画发展到如今,已经具备了超高的图像质量、多样化的风格、更逼真的细节纹理等等特点,甚至在一些基础应用领域比如淘宝模特,已经实现了AI替代人工。
(二)图像不断放大内心追求刺激的欲望
在以纸质文本为主的印刷文化时期,图像的作用是附属性的,目的在于阐释文字的内涵。当视觉因素逐渐成为文化的核心时,这一关系颠倒了,语言文本成为图像的附庸物,去解释或“实现”文本的并不是图像,而是文本,是把图像升华、移情或合理化了的文本[9]。图像所承载的文化、信息比以往任何时候都更丰富。居伊·德波(Guy Debord)认为,在“景象社会”中,“景象既是现存的生产方式的筹划,也是其结果。景象不是现实世界的补充或额外的装饰,它是现实社会非现实主义的核心。”[10]质言之,在高度图像化的时代,图像获得了超越于文字的“霸权”地位,一方面现代社会的商品越来越倾向于图像,另一方面,图像也影响甚至决定着商品的生产和消费。在充斥着图像的现代社会,“我们的眼球从没有像今天这样忙碌和疲劳。视觉需求和视觉欲望的不断攀升,想看的欲望从未像今天这样强烈。”[11]
AI绘画带来的极致的视觉享受一方面满足了我们对于美的追求,另一方面,经由图像所呈现出的“新奇”“光鲜”的世界也不断刺激着消费者内心的欲望,进而演变为“图像拜物教”,即对图像所具有的虚幻魔力的崇拜[12]。在消费社会中,商品的生产伴随着各种各样的图像生产,从产品的外观设计再到广告呈现,从品牌标识再到品牌形象呈现,商品的市场价值越来越倚重于商品质量之外的“视觉认可”[13],商品的竞争逐渐演变为图像的竞争,受众的消费也由为产品本身的质量买单到为产品的形象买单。这也能够说明为什么现在很多商品陷入了“包装精美、质量奇差”的花瓶陷阱。
(三)沉溺于表层视觉享受而丧失自主性思考
马歇尔·麦克卢汉(Marshall McLuhan)认为“媒介即讯息”,即重要的不是媒介,而是媒介所承载的信息。同样,在高度图像化的时代,重要的不是图像,而是图像所隐含与传达的信息。因此,视觉认知的核心就是通过读懂图像,理解图像背后所承载的文化内涵。不同于文字,视觉图像所带来的感官刺激是表面的、直接的、感性的,这是视觉感官的天然缺陷。在现代社会,万物皆可用图像阐释,多样的视觉形式,带来极致的视觉魅惑,网民所获得的视觉快感比任何时候都要强烈。这种最为“经济”的快感获得方式以及最大限度的满足使得观看的人们沉溺其中无法自拔,在凝视与被观看之间,人们满足于表层的视觉享受,并逐渐丧失了思考的自主性。
然而,正是这种表层的视觉享受背后隐藏着被“黑箱”①操控的意识形态。AI绘画软件的运行是在大量的数据抓取、模型训练以及人工进行标记的基础之上的,在进行模型训练时,由于所选取的数据样本大量的来源于国外,因此这种样本数量的不均衡以及受到标记员主观意识形态的影响,导致目前的AI模型在艺术创作时具有对特定流派、创作风格、种族、思想运动等因素的明显倾向性。目前,较为成熟的AI绘画的开发者都在国外,学习出来的AI必然会带有外国人的意识形态,甚至是种族歧视,比如在AI图像软件中输入关键词,所输出的图片会给黑人美白、把黑人融入背景里,以及一些描述高级技术工种的生成图里很少见到亚洲人的面孔等等,然而这种图像背后的深层次意义很难被普通网民察觉。
三、AI绘画背景下视觉认知能力的建构路径
在高度图像化的现代社会,每个人都处于看与被看,凝视与被凝视之中。雅克·拉康(Jacques Lacan)认为,观看是直截了当、理性、主动、有意识地看,凝视则是来自他者的目光在看你[14]。换言之,观看是人看物,凝视则是物看人。当网民沉迷于图像的浏览而不能自拔,这个时候是图像在凝视网民,它在无形之中指引着网民该如何观看,观看哪些。在无意识的被凝视之中,网民成为了没有灵魂的躯壳。因此,如何提升看的能力即视觉认知能力对于网民能否在图像化的世界中生存至关重要。视觉认知理论将视觉认知过程分为三个阶段:一是视觉信息输入阶段,二是视觉信息储存阶段,包括如何被储存以及储存的形式;三是运用阶段,即储存的信息如何使用以及影响新一轮的视觉信息输入[15]。因此,视觉认知并非是一个完全主观的过程,它包括了视觉和认知两个部分,其中视觉是客观的生理基础,而认知是主观的心理基础,主观的心理基础是可以通过后天的学习得到提升的,因此,视觉认知能力可以通过有效的途径得以建构。
(一)视界政体:图像世界的生存规则
马丁·杰(Martin Jay)提出的“视界政体”,意为“在视觉中心主义的思维下,视对象的在场与清楚呈现或者说对象的可见性为唯一可靠的参照,以类推的方式将视觉中心的等级二分延伸到认知活动以外的其他领域,从而在可见与不可见,看与被看的辩证法中确立起一个严密的有关主体与客体、自我与他者、主动与受动的二分体系,并以类推的方式将这一二分体系运用于社会和文化实践领域使其建制化。”[16]也就是说,当“看”变为了“凝视”,看的这一行为将不仅仅是一个观看的过程,而是包含了社会经济秩序和意识形态内涵,视界政体也由此产生。网民的观看行为不仅仅是一种眼睛的,更融合了社会、文化和意识形态。因此,在高度视觉化的时代,网民必须要了解观看过程中所隐含的社会、文化、经济内涵,并遵守观看的规矩,提升观看的能力。
(二)顶层设计:强化视觉认知能力培养理念
在互联网时代,读图能力成为不可或缺的一种生存方式。自互联网井喷式发展以来,媒介素养作为提升网民学习、了解世界的重要能力,许多国家都进行了广泛的研究,并取得了非常可喜的成果。与读图能力有关的视觉素养一词由来已久,在远古时代人们通过“看”手势或身体语言进行沟通的能力便被看作是最早的视觉素养。但作为一个还在发展中的新领域,视觉素养至今还未形成一个统一的定义,各个学者都因受自己专业基础所影响而有不同的见解。由于是一个跨学科的概念,因此各个学科对其下的定义也各有不同,对视觉素养的研究主要集中在艺术学、心理学、语言学以及哲学领域。因此,在传播学领域,作为视觉素养能力之一的视觉认知能力研究还需要进行持续的努力与巩固。
首先,将视觉认知能力培养纳入中小学教育之中。由于智能电子设备的普及和生活水平的提高,目前青少年触网的时间已经大大提前,甚至有不少在幼儿时期就已经开始接触电子产品,但是青少年对图像及文本的分辨能力不足,容易遭受网络不良信息的侵害。将视觉认知能力培养纳入日常的学习教育之中,让中小学学生在学习课本之余潜移默化地形成对于图像的正确认知,是提升青少年视觉认知能力的重要途径。其次,需要不断更新视觉认知能力培养理念。技术的发展日新月异,教育理念也必须及时更新。正如视觉认知不是图像时代的专属,但是随着智能技术的发展,视觉认知发展到如今已经增添了许多新的内涵。因此,必须及时更新教育培养理念,及时补充、增加新的时代内涵,不断提升青少年适应现代社会的生存能力。
(三)视觉应用:图像化生存的技术本能
随着5G、人工智能、物联网、区块链、虚拟现实等技术的进一步发展和完善,网民获取信息的途径和速度变得更加及时、便捷,技术已经渗透、融入每个人的生活。很难想象在现代社会,一个没有电子产品的人,他的生活该有多不便。我们的生活早已被湮没在图像的海洋里,每天一睁眼便要开始处理大量的图像信息,而技术是影像、知识、文化得以跨时空复制与传播的不可或缺的手段,提升现代社会网民的视觉认知能力绕不开对技术的运用,即网民必须要掌握图像处理技术。比如能使用一些图片处理软件以制作出能展现自己思想、观点的图片,能分辨出该图像是真实的还是靠技术生成的,提高自身的视觉交流能力。同时还要理解技术背后所隐含的意识形态,避免陷入技术狂欢之中而被技术所裹挟。
结语
米歇尔指出:“观看(看、凝视、扫视、观察实践、监督以及视觉快感)可能是与各种阅读形式(破译、解码、阐释等)同样深刻的一个问题,视觉经验或视觉读写可能不能完全用文本的模式来解释。”[17]在图像泛滥的时代,尤其是人工智能技术高速发展的当下,人要生存与发展,就必须要生成适应那个时代的相应素质,构建AI绘画背景下新的视觉认知能力。网民既是图像信息的接受者、观看者,同时也是制作者、传播者。作为观看与被观看的主体,网民一定要增强视觉信息把控能力,提升观看接受度,分析图像背后承载的意识形态,警惕虚拟的影像带来的视觉快感而丧失理性的思考。
在图像化生存和人工智能技术深入渗透的背景下,每个人都处在看与被看之中,图像带来的视觉快感固然充满着诱惑,但却容易让人在凝视中迷失自我,分不清真实与虚幻。因此,网民只有不断提高视觉认知能力,才能更好地在图像化的世界里认清自己,更好地生活。
注释:
①“黑箱”,原是控制论的概念,指为人所知的那些既不能打开又不能从外部直接观察其内部状态的系统。参见陶迎春《技术中的知识问题—技术黑箱》,载于《科协论坛》2008年第7期。
参考文献:
[1]丹尼尔·贝尔.资本主义文化矛盾[M].赵一凡,蒲隆,任晓晋译.北京:生活·读书·新知三联书店,1989:156.
[2]刘涛.文化意象的构造与生产:视觉修辞的心理学运作机制探析[J].现代传播(中国传媒大学学报),2011(9):20-25.
[3][17]米歇尔.图像理论[M].陈永国,胡文征译.北京:北京大学出版社,2006:7.
[4]章毓晋.计算机视觉教程[M].北京:人民邮电出版社,2017:10.
[5]王禹心.论阿恩海姆的视知觉理论在艺术作品中的体现[D].吉林:延边大学,2022(6).
[6]徐美仙,张学波.多维视角里的视觉素养:内涵、视野及意义[J].开放教育研究,2004(3):31-33.
[7]何世华.双编码理论与单词记忆[J].成才之路,2007(11):44-45.
[8]米歇尔.图像学[M].陈永国译.北京:北京大学出版社,2012:10.
[9]Roland Barthes.The Photographic Message,in Susan Sontag, ed. A Barthes Reader[M].New York:Hill and Wang,1982:204.
[10]Guy Debord, Society of the Spectacle[M].New York:Zone books,1994:3.
[11][12][13]周宪.视觉文化的转向[M].北京:北京大学出版社,2008:11,246,252.
[14]周子渊.图像与眼睛:读图时代网民的媒介素养教育研究[J].中国编辑,2019(8):21-26.
[15]李媛,刘德明.视觉认知理论的发展及其在建筑设计中的应用[J].哈尔滨工业大学学报,2011(5):49-53.
[16]吴琼.视觉性与视觉文化:视觉文化研究的谱系[J].文艺研究,2006(1):84-96.