人工智能界面:系统交互的革新
■孙玮 程陶然
【本文提要】本文以人作为有机体系统与技术机器系统的耦合为考察基点,阐释人-机系统交互界面创造的社会系统多重交互机制,以及界面演进引发的社会文化革新,由此将人-机界面拓展至文化界面、社会界面,以此揭示界面之系统交转生成的媒介性意涵,及其实施于人类文明的巨大动能。在此基础上提出以界面的系统交互性为视角,以人工智能界面为经验场域,超越人类中心主义立场,打开媒介研究的新面向。
【关键词】人工智能 数字界面 系统交互 媒介性 主体性
【中图分类号】G206
引言 系统交互的界面:媒介研究的新视角
ChatGPT破圈使得人造物的“类人性”成为全球争议焦点,人类中心主义有了一次集中爆发,或许这也是它遭遇的前所未有之打击。所谓人类中心主义的技术观,指将技术视作人类创造出来并供自身使用的工具,以技术对人类产生的工具性便利或危害,作为考察技术的出发点(陈明宽,2021:14-15)。斯蒂格勒认为,“技术中心论同样而且仍然属于人类中心论的一个变种类,因为它的实质就是要掌握并占有自然”。“技术中心主义的一个根本假设就是,技术有自身独立的目的,它是‘完全自立,自为法则,它甚至因此为万物立法。这种发展一直被人们视为无度本身,即是异化的外力,它使作为自由存在的人丧失自由’”(斯蒂格勒,2000:103)。斯蒂格勒的人与技术共生论就是对上述两种技术观的批判。对于人工智能的类人性分析框架,是人类中心主义技术观的典型体现,即,将人类主体性作为标准衡量人工智能,最终目标是遏制人工智能的类人主体性,将其锁定在人类的客体工具层面。这也与本质主义的思维方式有关,其前提是预设人类有一个稳定、先在的本质,并以此比照人工智能。在人工智能突飞猛进的当下,类人性的分析框架显得有些捉襟见肘,尽管异化论不失为一种有现实价值的观点,但因无法清楚解释人工智能(比如ChatGPT)的运作机制,以及人类智慧的生成机制,因此尚不能提出有建设性的应对方案。这提示我们,或许是时候突破人类中心主义技术论的单一框架,寻找更加多样性的理论思路来应对迅猛崛起的人工智能了。
界面理论或是一个独特的解释视角。如果说人类中心主义的基点是讨论人工智能相较于人的类本质,界面视角则放弃了这种在当前似乎很难有结论的比较,转而从“交互性”考察人工智能引发的变革,聚焦于人工智能作为新型界面如何再造了人与人、人与智能机器之间的交互状态。即,将ChatGPT为代表的新一代人工智能视为一种新型交互界面,探讨其作为媒介实施的交转、生成之影响。界面与媒介的关系久远而复杂,这种联系因为计算机的出现而受到特别关注,界面对于媒介研究的价值得以凸显。计算机刷新了人类有史以来交互界面的发展历史,交互界面开始特指数字技术展现的人与机器的接合,即“数字界面”。波斯特(2000:18)将数字界面定义为“介于人类与机器之间的一种膜(membrane),使相互排斥而又互相依存的两个世界彼此分离而又相连”。界面理论对于ChatGPT等新一代人工智能的独特解释力,体现在对于人类新型交互能力的开掘,这进一步揭示了媒介意涵的关键点是人与世界的交互,而非主体施加客体的手段。沿着这个思路,可以敞开媒介研究的一个新面向:系统交互性作为人类物种构成与社会机制运作的一种观察视角,这对于当前从媒介视角研究人工智能亦有着别样的阐发
潜能。本文所谓的系统概念,以海勒斯(2019:122)所梳理的第二、三代控制论为基础,第二代控制论以瓦雷拉的自创生理论为基础,认为系统“就是信息封闭的自创生系统加上看着这个系统的观察者”;第三代控制论则将观察者和系统定位于更复杂、网络化、有适应性、共同演进的环境之中。在这个环境下,普适技术和混合显示系统作为催化剂,信息和数据自由流动。文章亦呼应海勒斯(2019:125)所说当前展开的控制论第四次浪潮的前卫观点,即斯蒂格勒与汉森等技术创世纪的系统观。
要理解界面理论对于媒介研究的价值,须从界面的基本涵义入手。“古时候,界面(interface)这个字眼让人感到敬畏和神秘。古希腊人虔诚地谈论着prosopon,即一张面对面的脸。两张相对的脸便构成了关系。一张脸对另一张做出反应,而另一张脸则对另一张的反应做出反应。而另一张则再对那个反应做出反应,如此反复以至无穷。那么关系便作为一个第三方或存在的状态而继续生存”(海姆,2000:79)。这展现了界面的主要意涵:实时动态交互、异质元素汇聚、生成崭新状态,其关键指向交互的临界点。在人类社会的视野中,这个点就是人类接入外部世界的接口。①汉森正是在这个层面搭建了媒介与界面的关系,“媒介在人类经验上有接口,……这恰恰是媒介之所以成为媒介的首要特点”(汉森,2019:146)。界面理论对于媒介研究的独特价值正是在于捕捉这种接口的状态和运作,及其在技术迭代中的历史演进。在现象学视域中,身体是人类接入世界的最重要界面。梅洛-庞蒂认为,“身体是在世界上存在的媒介物,拥有一个身体,对一个生物来说就是介入一个确定的环境,参与某些计划和继续置身其中……我的身体确实也是世界的枢纽……我通过我的身体意识到世界”(梅洛-庞蒂,2001:116)。肉身感官是文明初始阶段人类接入世界的基础性界面。随着人类借由技术外化自身的进程,形形色色的技术辅助身体,重塑了人类接入世界的方式,技术逻辑与人类感官经验逻辑错综复杂地交织起来,在个体感知与社会系统两个方面颠覆了人类与世界的关系,史无前例地实现了超越人类感官的运作——技术无意识。数字界面充分展现了在实时交互中技术与人类感官双重逻辑的碰撞与融合,这种交汇在社会系统运作的宏观尺度上,则显示出社会文化革新的历史性影响。
界面研究大致可分为两种路径:人文社科与计算机科学。前者主要集中在人类主体如何接入外部世界,以及人与机器的交互机制;后者则指向硬件、软件之间的配置与连接。一般意义上的界面,指“独立的、通常不相关的系统可以在其上进行相互作用、相互交流的地方”。在计算机领域,或是指不同计算机系统相互协调的环境,或是将计算机的二进制数据转换成人类可理解的应用程序的环境(德·瓦尔,2018:XVI)。两种路径的隔绝局面被数字界面的突飞猛进打破了,近年来如ChatGPT、自动驾驶等人工智能界面的不断涌现,为人工智能时代的媒介研究提供了一个契机,以界面为枢纽综合了两个路径的理论,拓展了媒介理论的研究视域。
综上,本文结合控制论、系统论、复杂性科学、主体理论、软件研究等,将界面理解为各种复杂系统的交互,特别突出数字智能界面在交互方面的独特性,提出以“界面思维”作为媒介研究的一个新面向。“新控制论(NeoCybernetics,或称为二阶控制论、控制论的控制论等)”以社会系统的整体性为出发点,不再将个体对于环境感知的反馈视作单独的输入输出过程,而是将之纳入社会系统自我指涉的再生产之中(von Foerster, 1979)。这一认识论的激进更新超越了传统的线性因果与主客二元的本体论取向,转而以一种“去本体化(de-ontologizing)” 的立场,将个体与世界的互动视作“一种整合环境要素以保持稳态的模式”(Hansen, 2015:2)。控制论认为,作为有机体人类的个体性并非实体,而是可传送、改变和复制的信息形式(维纳,2010:89),信息、控制和传播三大强力要素的联合行动,将带来有机体与机械体前所未有的综合(海勒,2017:11)。交流、通信、反馈在人与机器运转中居于核心地位,接受和使用信息的过程就是我们对外界环境进行调节并在该环境中有效地生活的过程(维纳,2010::13)。通过与环境的交流,有机体与无机体获得了关于实际演绩(actual performance)的反馈,并以此为基础不断调整自己的行动。维纳等人的研究在理论上打通了有机/无机、人与机器之间的坚固壁垒,“目的(purpose)”、“反馈(feed-back/ teleological)”与“行为(behavior)”成为重新理解个体与环境的起点(Rosenblueth, Wiener & Bigelow, 1943),过往古典形而上学先验的人类主体,被作为复杂系统存在于环境之中的“观察者(observer)”所取代。这与人类中心主义的视角形成了明显的参照,打破了具有先验本质的、与物质环境和人造物对立的人类主体性。立足于此,得以不纠缠于人工智能与人类在主体性方面的比较,而是关注它作为界面展现出的新型交互状态,以及这种系统交互在社会文化层面产生的广泛影响。
既有界面视角的媒介研究,主要着眼于个体接触新媒介的人-机交互,对其所涉各种复杂系统的交互性未能给予充分的观照与阐释。本文聚焦界面创造的系统交互,以人作为有机体系统与技术机器系统的耦合状态为考察基点,在此基础上阐释人-机系统界面创造多重社会系统交互模式的动能,也就是界面引发的社会文化革新,由此将人-机技术界面拓展到马诺维奇等人提出的文化界面、社会界面等。以此揭示界面体现的交转生成的媒介性意涵,及其对于人类文明的巨大动能。
数字智能:界面演进的突破
ChatGPT是基于语言大模型深度学习的人工智能产品,其基本原理是将大量自然语言作为语料输入系统供机器学习。在语料数量到达一个临界点时,就出现了可以实现真正人-机对话的人工智能,这就是所谓“大力出奇迹”。也就是说,ChatGPT与人类的内在运作机理是不同的,它能够成为人工的“智能”,是通过与人类的交互体现出来的,也就是维纳强调的“实际演绩”②,即外显的交互行为。表面上看,它高度模仿了人类主体之间自然语言交互的特点——即时对话性,以至于每一个体验过的人无不称奇:像和真人在对话。但ChatGPT作为数字智能界面,绝不是提供了一个“类人性”对话主体,而是实现了超大语言模型系统与人类感官系统史无前例的交互,这是一个崭新的交互界面,也是一种新型主体样态,ChatGPT“类人性”形式表面所隐藏的,是超越人类的新型认知系统。
人类的自然语言是将三维世界抽象化为一维语音符号,凭借人类独有的发声器官将外部世界以及人类主体内在的思想情感外显化,以实现人类之间的交互。语言可说是人类文明初始阶段最重要的界面,但并不是唯一的。信息史研究者发现,非洲鼓语是一种与口语共生的信息传递方式,研究者将其描述为“会说话的鼓”(格雷克,2013:11-24)。这个信息发展史上的著名个案很好地展示了不同界面的交互性,也突显了语言界面的特点。口语界面是依靠人类发声传输信息,除了言语本身,声线、语调、节奏等个体声音特质也参与了信息的生成。此外,口语传播依赖身体的近距离在场,因此视觉、触觉、嗅觉等感官,都卷入整个传播实践中。非洲鼓语是利用手掌击打鼓面发声以传递信息,也属于声音的界面,但编码方式和语言不同。相较于人声,鼓声长于远距离传递信息,比如军事行动的组织、召唤远方的亲人等。鼓之界面,是人类肉身与物的交互,它拓展了肉身界面的局限性,但同时也破坏了口语传播的全息化状态。从上述分析可以看出,随着技术更迭,人类借助媒介物持续地延伸感官体验,乃至脱离肉身,但人类肉身及感官系统始终是一个出发点。人类感官系统与技术媒介系统的交互,是最为基础性的交互模式。克莱默尔认为媒介必须是在有距离的事物间搭建关系,③肉身是人类搭建各种距离的基础性一端。人类不断发明技术创造新型界面,从而将物系统、时空系统、社会各领域系统接入人类感官系统,这种过程也可视为对于人类中心的超越,人类在用技术将感官分割延伸出去以实现与其他系统的交互时,不可避免地离散、瓦解作为中心的自身。
基于系统交互视角,界面分析涉及三个方面:系统编码、解码方式及其依托的介质,系统接入人类感官系统的状态和机制,多重系统交互塑造人-机融合的新型主体样貌。以此作为分析思路,可考察语言、书写文字、印刷文字、ChatGPT的发展呈现出界面演进的特点和趋向。早期界面发展受限于技术,是不断降维的,即技术切割人类感官,将某些感官从整体感官系统中剥离出来以延展开去。文字相较于身体在场的口语界面,其编码、解码方式是单一维度的视觉抽象符号,与口语界面的感知全息化方式形成鲜明参照。人类社会在发展过程中产生了大量的信息需求,在文字出现前,只有一个储存设备就是大脑,人脑的限制大大局限了人类合作的规模和程度。“苏美尔人发明了一套系统,可以在人脑之外储存和处理信息……从此,苏美尔人的社会秩序不再受限于人脑的处理能力,而开始能走向城市、王国和帝国”,这个系统就是书写文字(赫拉利,2017:115-118)。文字作为界面实现了多重系统的交互,突破了个体生命时空之域的限制,身体不在场的群体性联系得以建立,社会规模和运行效率大大地拓展,文明能够实现跨越世代的积累,人类获得自我意识,主体性浮现。文字界面的缺陷也是非常明显的,文字接入感官的方式破坏了人类全息化认知的自然状态,掌握文字系统需要后天习得,是一个长久艰难的过程。也因此,文字符号系统也成为一种文化沟壑,它与社会文化系统的交互,是构成社会等级制和圈层文化的重要因素。在文字这种单一感官界面成为社会主要交互模式时,人类的主体性也被刷新了。现代性社会依赖印刷文字作为社会主导的信息交互界面,理性人的主体新形态也由此诞生。
感官系统切割、降维趋势的逆转得益于电子影像技术的出现,正如克拉里、基特勒所观察到的,19世纪被各类技术切割的离散化感官在当前出现了汇聚整合的趋势(克拉里,2017:32;基特勒,2017:52)。被拆散的人类感官系统因为数字技术的崛起出现了新一轮“复原”的趋向,界面越来越呈现出感官系统趋近全息化的“回归”。2023年6月苹果公司推出的Vision Pro 展现了这种感官系统整合之界面的极致状态,它与ChatGPT的区别是非常明显的。ChatGPT是通过数字界面的文字对话方式实现人-机交流;Vision Pro的界面主要包括了语音、手势、眼神三种方式,涉及了听觉、触觉、视觉等最重要的感官,在感官系统整合性方面有重大突破。此款苹果眼镜被视为第一个3D摄影机,可以拍摄3D照片和视频,并传输给其他人,实现3D沉浸式观看。更令人惊诧的设计是眼镜上的一个按钮,可由佩戴者自由调节虚拟与现实的配比,也就是说每一个人都可以即时即地决定自身所感知的虚实混合场景。由ChatGPT、Apple Vision Pro可以概括人工智能界面的特点,一方面,是模仿人类以身体为基本界面的自然交互状态,无论是ChatGPT对于语言对话的复现,还是Vision Pro的增强现实交互,界面不断地趋向于与感官系统距离更近、更全息化的接合;另一方面,是创造了人类无法达成的新型认知系统并与人类交互。ChatGPT的语料超越了任何个体终身学习所能掌握的容量,它的输出方式展现了机器系统接入人类经验的崭新状态;Vision Pro所提供的个体随心所欲配置的场景,以及眼球、手势追踪等,也是一种全新界面。总体而言,人工智能界面提供的系统交互,呈现出逼真的类人性感官体验与超越人类感知“技术无意识”的奇特融合。一方面,越来越趋向于人类经验的全息化系统模拟,界面去物质化的特征愈发显著,比如此次Vision Pro以眼神和手势替代手柄、触摸屏作为界面,业内认为是一次重大突破,媒介愈发地透明;另一方面,这种界面借助手势、眼球追踪、神经网络等前沿技术,实现了高度复杂的技术系统与人类感官系统的深度互嵌与实时交转,超越了人类的认知能力。
自动驾驶也是人工智能界面实现系统交互的典型经验。近一个世纪以来,汽车已成为当代城市中最普遍也最具代表性的交通方式,“驾车出行”是对于城市社会性模式的重组,深深地影响着城市的运行、观念与文化(Sheller & Urry, 2000)。作为一套特殊的技术形态、社会规则与文化隐喻,汽车正是人类接入现代交通系统最核心的交互界面之一。在能源转型与数字化发展的双重背景下,“智能汽车”已然成为当前交通领域最热门的发展方向。借由遍布于车身四周与道路各处的传感器与微型处理器的实时连接,智能汽车不再完全依赖于人类驾驶者对于环境的判断,而是以“非人”的计算机逻辑,自行完成行驶过程中的各项任务。
新一代的智能汽车作为当下城市交通系统的数字智能界面,与过往的机动车有着巨大的差异。通过智能汽车这一界面,人类的身体感知与计算机数据流之间的壁垒被打通,驾驶由人类与计算机共同完成。智能技术不再是麦克卢汉意义上对于人类肉身功能的延伸,而是作为非人的异质性系统,相对自主地在社会中产生行动,并通过界面的中介,与人类在“感知-反馈”循环的实际演绩中发生着融合,生成出以人-机协作为前提的新主体。
智能界面对于人-机关系的调节首先是对于人类肉身感官感知的超越,也即计算机对于环境信息的重新编码与解码。当前自动驾驶技术研发遇到的主要技术课题之一,便是如何将遍布于车身周围的摄像头、雷达等传感器所感知到的讯息,转化为计算机在进行驾驶决策时所能使用的数据图景,使汽车得以在复杂的城市交通环境中做出最优选择,换句话说,也就是如何让计算机能够“看见”交通状况。在这一领域,BEV鸟瞰图(Bird’s-eye-view Perception)解决方案是较为主流的技术路径:基于透视法原理,车载摄像头所捕捉到的二维画面中不同物体之间的位置关系被计算机测算并拼贴在一起,此后再通过特定的算法建模为一个以车为中心的三维俯视空间,以使车载计算机能够感知周围环境并据此自行完成驾驶决策(石桥,2023)。
基于BEV方案的计算机路况感知,并非对于人类驾驶员在行车过程中视觉感知方式的模仿,而是一套全新的认知模式,驾驶不再是人类视觉中有着盲区的“第一人称”,而是计算机生成的全局化“第三人称”,通过车-机界面,这一俯瞰图景被渲染为图形动画并呈现在人类驾驶员面前,肉眼捕捉的视觉信息不再是行车的唯一依据,机器感知越发被驾驶者与汽车设计者认可与倚重。如奥迪E-tron、特斯拉Cybertruck等一些较为激进的新车型甚至干脆取消了车身两侧的后视镜,转而完全以传感数据判断车身四周的交通状况。经由各类传感器与网络连接,智能技术正以“记录和分析人类感官无法触及的数据”的方式进入世界之中,计算机不再是以人的主体性范畴(以肉身感知经验为基础的意识)所能理解的方式与人发生着关系,而是以一种微观敏感性(micro-sensibility)建构独属于计算机的世界图景(Hansen, 2012)。计算机并非人的“电子枕皮质”感知器(维利里奥,2014:141),而是通过界面,与自然人在系统交互中,共同组成了行动的基本单元。
智能汽车这一数字智能界面所中介的城市交通实践,不仅仅是一种观察和操作方式的革命,更意味着人与计算机在交互中两者关系的改变。在过往的传统汽车设计理念中,蕴含着以自然人驾驶员为绝对中心的理念。驾驶员通过视觉对路况进行感知,是决策信息的唯一来源。智能汽车的出现打破了这一“以人类主体为中心”的设计思路,通过车身的传感器布局与无线网络设备,计算机以机器感知构建起一个由数据建模所搭建的,既包含路况画面等“类人”的视觉内容,又包含雷达传感、联网数据等“非人”讯息的“超人”决策系统,从而在驾驶中代替人进行感知与预见,在某些超快速的操作中替代自然人主体(维利里奥,2014:121)。
根据特斯拉提供的车主手册显示,其品牌所有型号的车辆均附带并自动开启的主动安全功能,当出现驾驶员所未能察觉到的危险时,计算机会自动介入驾驶,操纵汽车进行避让。④机器系统不再是人类感知的辅助与延伸,而是以独立的姿态与人类交互,并以其“超人”的数字逻辑替代或补救自然人处理突发情况。2016年,美国一位司机在行车途中突发心脏病,他当机立断开启了其驾驶的特斯拉的自动驾驶功能,而非停车在原地等待救护车到来,这一决定使他及时抵达20英里外的医院,保住了性命(看看财经,2016)。这一案例展示出智能界面所带来的革命性可能——通过人与计算机的协作,可能克服由于人类身体条件所导致的先天差距或突发危险,从另一个维度为社会创造更高的平等性。
在当下这个基于物而非超链接的万维网时代(许煜,2019:44),计算机并非悬浮并游离于在现实之上的虚构,而是经由界面的交转,不断与人类进行着交流与反馈,从而以一种区别于坚固的原有社会结构的相异性维度参与到实践中来(加塔利,2020:42)。经由各类数字智能界面,在过往人文主义视野中作为环境或客体的计算机系统,越发以与人类对等的、协商的主体地位,强势地参与并转变着城市的运作。
在2023年世界人工智能大会上,特斯拉展出了全新的人形机器人Tesla Bot,该机器人身高172cm,体重56.6kg,与成年人相仿。依靠其所搭载的与特斯拉汽车相同的计算单元与算法程序,Tesla Bot已经能够完成行走、上下楼梯、下蹲、拿取物品等动作,特斯拉宣称,在未来还将进一步开发其在家政、组装、园艺等方面的能力(新闻晨报,2023)。正如其CEO马斯克常常强调的那样,特斯拉并非只是一家汽车公司,更是一家人工智能企业,相较于有着“交通工具”这一外壳的智能汽车而言,具有与汽车完全相同的“非人”技术基础,却以模仿人类身体的“类人”形态现身的Tesla Bot具有冲击力地展示着数字技术对于传统人类主体独特性的颠覆。一方面,依靠其强大的跨码性,数字智能界面在编码、解码方式上越发地模拟和贴近人类的身体感官,从而在与人的交互中变得更加“透明”与“自然”;另一方面,数字界面的运作基底则是完全来源于代码软件系统的运算逻辑,这使得人类与技术的关系不再是过往的使用者与工具之间的主客关系,而是愈发转变为人类系统与计算机系统之间平等的交互与协作。
新控制论认为,异质性的个体并非独立于环境的实体,而是在与外界的交互中动态地调整着自己的边界与形态(Clarke & Hansen, 2009:9),社会中不同的复杂系统之间的互动,是社会形态涌现的前提。人工智能界面的出现,为具有极强异质性的人类系统与计算机系统创造了协商与打通的空间,从人类中心视野出发的“虚拟/现实”、“使用者/工具”等二分法不再成立。人类与计算机的交互成为理解数字现实的新起点,二者的互动催生着全新社会现实的涌现,并不断与过往的社会形态之间发生着碰撞、博弈与融合。
在今日的数字城市中,人类系统与数字智能系统的交互与耦合,正持续地引发社会文化系统的进一步嬗变。数字界面打破了城市中原本被产权、行政规划、物理距离等区隔所划定的公共管理模式,将城市运行的逻辑转化为界面规则下的平台、协议和程序(德·瓦尔,2018:XVIII)。智能汽车以及与之对应的智慧交通系统的出现,正引发城市中动态与静态交通管理系统、城市建筑与规划系统以及相关联的伦理法规系统的快速转型。“可计算化”划定了全新的数字地缘,并与传统的社会秩序就身份、边界与权力等领域的合法性不断展开博弈(Bratton, 2015:30),从而为不同的社会文化现象的涌现创造条件,构成了数字城市文明演进变化的基本范式。
从文字到ChatGPT的演变,以及最新智能技术3D眼镜、自动驾驶等,展现出人工智能界面的发展趋向。从表面看ChatGPT是“类人性”主体成功模拟了人类的主体性,但如果以界面的系统交互为视角,它实现的是人类自然语言系统与人工智能跨越个体认知极限的数字文字系统的交互,这与其说是模拟人类,不如说是创造了一个“超人”的“非人”,这种人与“超人之非人”主体对话的新型交互,在超越人类中心主义的历程中迈出了跳跃性的一大步。相较于一般意义上的界面,数字界面的突破在于,贯通了人与机器这两个异质性最强的系统,并通过计算机及相关产品实现了实际的运作。正如海勒斯总结的控制论三大贡献:将反馈闭环与信息的量化定义相连;为分析动物、人类、机器之间的控制与通讯提供了理论框架;生产出实现这些想法的产品(海勒,2019:123-124)。就界面的介质而言,数字界面可说是变化万千,二进制数字技术可以将任何存在物由计算机编码为数据,并且转化为接入人类感官经验的多种界面。鼠标、键盘、电脑图形界面、触摸屏、二维码、手柄操作杆、头盔、自动驾驶舱,语音APP软件等,都以不同方式接入了人类感官系统,每一种界面不仅是交互形式的不同,更意味着交转系统类型及交转方式的差异,以及激发的社会影响和人-机共生主体样貌的变迁。以影像为例,模拟技术时代的主要界面是电视,它的编码解码方式是二维模拟影像,接入人类的视觉、听觉系统,在与技术系统的接合中,人类作为空间位置与文化生产双重意义上的被动观看者,进入了人与视觉机器的系统性关系。这种社会主导交互界面模式构成了大众传播时代人、物、信息、社会的基本结构。数字时代的影像界面是形形色色的屏幕,或是星罗棋布地镶嵌在城市实体空间的角角落落;或是随着个体移动在具象和虚拟的多重系统中,这种数字界面的运转无时无刻不以人-机共生主体为前提。近来人工智能多种形态界面的不断涌现,极大地释放了数字界面在交转多重系统方面的巨大动能,智能化交转模式呈现出完全不同于模拟技术时代的界面力量。
结语:类人性的接入,超人类的交转
人工智能界面的最大突破是,实现了人类有机体系统与机器无机物系统的自动化交转,由此将整个世界纳入一个系统中,实质性地推进了延森所说的“世界作为一个媒介”(延森,2012:86)的进程。在社会层面,这意味着社会系统实现了有机化运作;在主体层面,则是机器全面渗透人类肉身主体,创造了人-机共生主体新样貌。
界面介入主体的生产,并非是从智能媒介开始的,这是一个界面演进史的恒久主题。从本文提出的界面系统交互视角出发,任何一个可称为界面的存在,都因其实施了系统的交互而产生了社会和主体层面的影响。加塔利在阐释他的机器性主体生产理论时,对于人类口唇生产性分析亦展示了系统交互的重要意义。“一方面有一股分化的流——多样变化的食物,它们在分解、混沌化的过程中被吃掉,被身体内部所吸收;另一方面有一股基本发音(音位学的、句法的、命题的)的流,它投注和构建了一种复杂的、分化的外部”(加塔利,2020:97)。这生动地展现了看似是一个界面的人类口唇,却因实施了不同的系统交互,生发出截然不同的意义。加塔利进一步指出,“言语,不是交流的简单媒介、信息传递的动因,而是从‘此在’中生产出宇宙的自在与主观的自为之间的言语界面”(加塔利,2020:97-98)。在此,言语作为自在宇宙和自为主观的系统交互界面,直接参与了主体的生产。加塔利认为,现代信息技术加剧了主体生产的机器化,“信息和通讯的技术机器运行于人类主体性的中心,不仅运行于人类的记忆、智能深处,而且也运行于人类的感性、感受与无意识幻想的深处。对主体化的这些机器性维度的思考促使我们在重新定义的尝试中强调那些装配主体性生产的组织部分的异质性”(加塔利,2020:4)。主体因此是复调的、异质的(加塔利,2020:6)。主体的机器性维度在界面视角中得到充分体现,界面可说是呈现这种机器性生产状态的枢纽,它凭借技术机器介质接入人类感官系统的接口,通过与形形色色系统的交互,将人类的肉身主体延展至具象和虚拟的各处。当言语随着技术媒介演变出书写文字、印刷文字、电子和数字语音,及至ChatGPT等各种界面时,主体性样貌也在持续性更迭中,每一种界面都通过系统交转,将人类肉身主体显现于形形色色的存在之域。依照加布里尔的“新实在论”,单个世界不存在,只存在无限多的世界,这些世界一些相互重叠,一些完全地相互独立(加布里尔,2022:63)。而所谓存在,是指显现在一个意义场中(加塔利,2022:64)。界面的作用在于,将某物接入人类感官系统,使其显现在某个意义场中从而获得存在,当然这种物也包括人类本身。众多不同的界面,支撑起无数个意义域;凭借着一个个界面,人类得以存在于不同的意义域中,呈现为复数的人-机共生主体。正如莫罗维茨概述计算宇宙学时指出的,“反馈闭环在人与计算机之间、仿真的自主主体与主体所运行的环境之间,当代宇宙计算机的技术与理论之间递归循环”(转引自海勒,2019:124)。人工智能界面实施的系统交互,囊括了整个世界。
界面的系统交互视角,为媒介理论提供了新思路。其基本预设有二:其一,信息只有在其关联的系统中才能获得意义,信息的连接比单个信息具有更大的价值;其二,在数字技术构筑的二进制系统中,世界万物都可视为一种信息模式,人、物、机可以实现一个递归反馈闭环系统。前者对所有界面具有普适性,后者则特指数字界面。基于这两个预设,本文将界面研究聚焦在系统交互上,一方面从媒介理论出发提供当前人工智能的独特分析视角,亦展现媒介理论与其他学科的对话性;另一方面拓展媒介性意涵,深化媒介性的阐释力,以推进媒介理论的研究。本文将界面的系统交互分解为三个方面,旨在回应当前媒介研究的相关理论和实践问题。其一,系统编码、解码方式及其依托的介质。编码、解码方式与媒介技术、物质性密切关联,如文字系统的编码解码方式是高度抽象的一维符号体系,文字的介质经历了丰富的历史变化,它与纸张、印刷等技术关联,致使它与文化系统以及造纸、印刷、运输等生产系统产生了多重交转。文字符号系统与特殊介质系统的交互,会极大地影响人类的思维方式、存在方式,甚至改变了某些生理机能。如印刷文字对于理性思维的塑造、象形文字与拼音文字对于人类思维及其社会组织模式的影响等(洛根,2012)。其二,系统接入人类感官系统的状态和机制。这重点关注技术媒介系统与人类感官系统的交互。如数字界面不但能够实现系统之间的自动化实时交互,具有“让事情发生”(Frabetti, 2015:17)的驱动力,即人类作为初始动因搭建一个数字信息系统,满足一定条件后系统就可以自行运转,并对人的行动产生影响,这种影响甚至可以不为人的感官所察觉,即所谓的“技术无意识”。其三,多重系统交互塑造人-机融合的新型主体样貌。当前,以斯蒂格勒等的技术哲学之代表性观点“技术创世纪”已获得学界广泛认同,即认为技术不是外在于人类主体的工具,而是自始至终参与了人类物种及其文明的构成。随着人工智能界面的不断涌现,人-机共生主体的样貌呈现出更加复杂的状态,如ChatGPT、自动驾驶汽车都以不同方式创造了技术机器系统与人类系统高度互嵌的人-机共生主体新样态,这种主体变革产生的巨大影响,正在深刻地改变社会系统及人本身。
在既有媒介理论中,中介化的媒介性意涵近来获得普遍的理解与认同。本文将这种中介化意涵聚焦为界面的系统交互,以突出技术及其介质、编码解码方式在中介化过程中的作用;将中介化从主体之间的交互,拓展到系统之间,旨在将中介化过程落实于系统交转涌现出的崭新状态,据此揭示媒介从技术交互延展到社会交互、文化交互的巨大动能。系统交互处的界面,并非是一个静态的位置,而是一个动态的枢纽,它发挥着将不同系统打通、促使其互动并生成新型状态的作用。在界面系统交互的视野中,媒介不能在古典形而上学范畴中被理解为世界的本体,而是在新实在论框架中作为一种显现方式,这种显现方式因界面的不同而千差万别,由此创造了千千万万个意义域。从这个视角出发,人工智能在与人类的互动中越来越像人类,并不能简单地理解为是对人类主体的模拟,更准确地说,即如汉森所言,这不过是技术机器在人类经验中找到接口,以实施人-机-物等异质系统的交转。为此,数字技术可以不断地制造新型界面,幻化成各色类人或“非人”的样态。人工智能界面并非是一种类人性主体,而是创造了人-机共生主体的新样貌,因为系统交互是人工智能主体意涵呈现的前提,人工智能的主体性是作为一种复杂技术系统在与人类作为有机体系统的交互中得以实现的。
技术或使人异化,是人类中心主义技术观的核心点。针对此,西蒙栋指出,“今天的世界中,最强有力的异化并不是由机器引起的,而是由对机器的错误理解引起的,是由未能理解机器的本性与本质而引起的,由机器从意义世界中的缺席、由文化完整概念和价值表上对机器的忽视而引起的”(转引自陈明宽,2021:193)。这启示并召唤研究者,在更加开阔多元的理论视野中,深化智能及其对于人类意义的认知,以实现人类的福祉。■
注释:
①长期以来,在中文语境中,始终存在着两种不同的对于interface一词的翻译,计算机科学依照工程与实体硬件传统,常称之为“接口”(例如时下大热的Brain Computer Interface便被译为“脑机接口”);而在社会科学视域下则往往以人类感知直观与媒体传统将之称为“界面”(例如,一般意义上应用软件的Graphical User Interface等被翻译为“用户图形界面”)。实际上,在英文语境中并不存在上述的分野,当涉及计算机时,Interface一词指向的正是一种涵盖了“软件、硬件以及一系列对于计算机数据结构的概念化隐喻”(马诺维奇,2020:123)的人机交互的接触点。
②“实际演绩(actual performance)”是维纳在《人有人的用处:控制论与社会》中所论述的控制论思想的核心概念之一。维纳在该书中进一步发展了《控制论:或关于在动物和机器中控制和通信的科学》中关于“反馈系统”的思想,并进一步延伸和探讨其人文与社会价值。在其中维纳提出,要以系统与社会环境之间的“感知-反馈”过程中的“实际演绩(actual performance)”,而非在先前设计/计划时的“预期演绩(expected performance)”,作为认识系统运作的起点。维纳通过这一概念,以一种去本体化的视角来理解有机体与无机体在社会中的存在,从而为考察控制论视角下,人与机器正在发生的耦合创造条件。
③详见KramerS.(2015).MediumMessengerTransmission: An Approach to Media Philosophy. Amsterdam: Amsterdam University Press.克莱默尔教授在该书中尝试超越过往“媒介中心论”或是“媒介工具论”的传播观念,转而将媒介视作与交流的双方处于平等的动态交互之中的“信使(messenger)”,从而搭建一种三元存在论的新媒介哲学,即“信使模型(The Messenger Model)”。在书中,克莱默尔教授从本雅明与让-吕克·南希的观点出发,提出“传播是以分离与区隔为前提的”(Kramer, 2015:79),因而“距离”乃是一切传播现象发生的首要条件,媒介正是以“在距离中搭建桥梁而不消弭距离”(同上)的方式,中介着关系的展开。
④参见特斯拉官网上的用户手册中的“防撞辅助”网页:https://www.tesla.cn/ownersmanual/modely/zh_cn/GUID-8EA7EF10-7D27-42AC-A31A-96BCE5BC0A85.html。
参考文献:
保罗·维利里奥(2014)。《视觉机器》(张新木,魏舒译)。南京:南京大学出版社。
贝尔纳·斯蒂格勒(2000)。《技术与时间:爱比米修斯的过失》(裴程译)。南京:译林出版社。
陈明宽(2021)。《技术替补与广义器官》。北京:商务印书馆。
菲利克斯·加塔利(2020)。《混沌互渗》(董树宝译)。南京:南京大学出版社。
弗里德里希·基特勒(2017)。《留声机 电影 打字机》(邢春丽译)。上海:复旦大学出版社。
凯瑟琳·海勒(N.Katherine Hayles)(2017)。《我们何以成为后人类:文学、信息科学和控制论中的虚拟身体》(刘宇清译)。北京:北京大学出版社。
看看财经(2016)。《特斯拉用户突发心脏病,靠自动驾驶技术驶往医院?》。检索于http://mt.sohu.com/20160808/n463141456.shtml。
克劳斯·布鲁恩·延森(2012)。《媒介融合:网络传播、大众传播和人际传播的三重维度》(刘君译)。上海:复旦大学出版社。
罗伯特·洛根(2012)。《字母表效应:拼音文字与西方文明》(何道宽译)。上海:复旦大学出版社。
马丁·德·瓦尔(2018)。《作为界面的城市——数字媒介如何改变城市》(毛磊译)。北京:中国建筑工业出版社。
马克·波斯特(2000)。《第二媒介时代》(范静哗译)。南京:南京大学出版社。
马克·B.N.汉森:《新媒介》。载W.J.T.米歇尔,马克·B.N.汉森主编(2019)。《媒介研究批评术语集》(肖腊梅,胡晓华译)。南京:南京大学出版社。马库斯·加布里尔(2022)。《为什么世界不存在》(王熙,张振华译)。北京:商务印书馆。
迈克尔·海姆(2000)。《从界面到网络空间》(金吾伦,刘钢译)。上海:上海科技教育出版社。
莫里斯·梅洛-庞蒂(2001)。《知觉现象学》(姜志辉译)。北京:商务印书馆。
N.凯瑟琳·海尔斯(N.Katherine Hayles):《控制论》。载W.J.T.米歇尔,马克·B.N.汉森主编(2019)。《媒介研究批评术语集》(肖腊梅,胡晓华译)。南京:南京大学出版社。
诺伯特·维纳(2010)。《人有人的用处:控制论与社会》(陈步译)。北京:北京大学出版社。
乔纳森·克拉里(2017)。《观察者的技术:论十九世纪的视觉与现代性》(蔡佩君译)。上海:华东师范大学出版社。
石桥(2023)。《Tesla技术方案小记》。检索于https://zhuanlan.zhihu.com/p/584024853。
新闻晨报(2023)。《20余款机器人亮相世界人工智能大会,特斯拉人形机器人也来了》。检索于https://baijiahao.baidu.com/s?id=1770783621784251987&wfr=spider&for=pc。
许煜(2019)。《论数码物的存在》(李婉楠译)。上海:上海人民出版社。
尤瓦尔·赫拉利(2017)。《人类简史:从动物到上帝》(林俊宏译)。北京:中信出版集团。
詹姆斯·格雷克(2013)。《信息简史》(高博译)。北京:人民邮电出版社。
Bratton, B. H. (2015). The stack on software and sovereignty. The MIT press.
ClarkeB. & Hansen, M. B. N. (2009). Emergence and Embodiment: New Essays on Second-Order Systems Theory. Duke University Press.
FrabettiF. (2015). Software theory: a cultural and philosophical study. Rowman & Littlefield International.
HansenM. B. N. (2012). Engineering Pre-individual Potentiality: Technics, Transindividuation, and 21st-Century Media. SUB-STANCE41(3)32-59.
HansenM. B. N. (2015). Feed-Forward: On the Future of Twenty-First-Century Media. University Of Chicago Press.
Rosenblueth, A. & Wiener, N. & BigelowinJ. (1943). Behavior, Purpose and Teleology. Philosophy of Science10S. 18-24.
Sheller, M. & Urry, J. (2000). The City and the Car. International Journal of Urban and Regional Research, 24737-757.
von Foerster, H. (1979). Cybernetics of Cybernetics. Communication and ControlKrippendorff. K(ed. )New York:Gordon and Breach.
孙玮系复旦大学信息与传播研究中心主任、新闻学院教授,程陶然系复旦大学新闻学院博士研究生。本文为教育部人文社科重点研究基地重大项目“数字城市共同体研究:媒介视角下的新都市文明”(项目编号:22JJD860004)成果。