走向计算主义:数据化与网络文学业态的裂变

2020-01-11 04:57廖声武谈海亮
关键词:网络文学主义文学

廖声武,谈海亮

(湖北大学 文学院, 湖北 武汉 430062)

近年来,大数据、云计算、人工智能等技术的飞速发展,正在将互联网相关的经济、社会与文化形态推向新的创新轨道。计算主义作为统摄这些技术实践的一种哲学理念和认识论,开始进入到人文学科的研究视野。计算传播学、计算新闻学、计算广告学已成为一个个方兴未艾的前沿研究领域。作为网络文化重要类型的网络文学,实际上始终依照着计算主义的逻辑框架发展,在其生产、传播、消费各环节全面应用着计算主义框架下的技术手段和技术工具。但翻检网络文学研究成果,虽然对大数据、云计算、人工智能等技术手段和技术工具投入了大量关注,却尚未从更宏观的角度以计算主义范式来进行观照。将计算主义理念引入网络文学研究领域,将为本质上揭示网络文学的生成、发展与转向的内在动因提供一种新视角,并为解决网络文学当前症结提供新思路。

那么,何谓计算主义?“计算主义是当代心灵哲学与认知科学中最具有代表性的核心观点”(1)蒙锡岗、赵泽林:《论计算主义的心智观》,《西北师大学报》(社会科学版)2008年第5期。,它源于20世纪早期形成的认知计算主义和更早期的理性主义,也可以被理解为一种世界观,它的形成经历了智能和心灵计算理论、生命计算理论和宇宙计算理论三个阶段。有论者指出:“心理状态、心理活动和心理过程是计算状态、计算活动、计算过程,换句话说,认知就是计算。”(2)程炼:《何谓计算主义?》,《科学文化评论》2007年第4期。在认知计算主义视野下,人的认知和智能的任何状态,都可以被归为一种图灵机状态,而且任何认知和智能的活动都可以通过图灵意义上的算法来计算,人类的认知和智能活动经过编码成为符号后都能通过计算机模拟。因此,“一旦从计算主义的视角来审视个体和世界,就会发现无论是人的大脑、人的行为还是人与整个物理世界、虚拟世界的交往过程,都变成了一个庞大复杂的计算系统,人与人、人与信息之间的传播过程也不例外”(3)刘庆振、钟书平、牛新权:《计算传播学:缘起、概念及其计算主义视角》,《西部学刊》2019年第8期。。

计算建立在数据的基础上,数据化是计算主义理念的实践工具。数据和数据化是在计算机和互联网时代出现的概念,本身并非严丝合缝的稳定所指,它们更多地是在实用主义的原则下被引入到与计算机和互联网相关的学科前沿议题之中。被奉为大数据圭臬的著作《大数据时代》提出:“所以我们姑且称其为‘数据化’吧——这是指一种把现象转变为可制表分析的量化形式的过程。数据化和数字化大相径庭。”(4)维克托·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,杭州:浙江人民出版社,2013年,第104页。中国学者姜浩认为:“数据化的概念经常与量化、数值化等概念相混淆,但实际上在这里,数据不是指狭义的数量值,而是指可以对应于各种信息对象的,数字比特的结构化集合。”(5)姜浩:《数据化:由内而外的智能》,北京:中国传媒大学出版社,2017年,第17页。邱泽奇认为:“数字化只是数据的一种形态,却不一定就是数据;除了数字以外,数据还有更多的形态:音频、视频、图片、文字,任何痕迹,无论是人类的还是自然的,都可以成为数据……数据化就是以数字形态记录一切事物和一切事物之间的联系。”(6)“信息社会50人论坛”编著:《未来已来:“互联网+”的重构与创新》,上海:上海远东出版社,2016年,第183-184页。厘清了这些关键概念,我们便可以在计算主义认识框架下清晰地观照网络文学数据化生存图景。

一、网络文学数据化生产模式的建立

在以计算主义为底层逻辑构建的网络世界,网络文学自生成的那一刻开始便天然地具有数据化生产特征,网络作家本质上而言是一个在网络空间里的数据化存在个体,他本身的一切行为具备可计算性。当一个网络作者开始自己的写作时,他的一切行为便会首先被进行数字化的比特转换,继而通过复杂的后台计算,以数据化形式存在和呈现。作者的写作环境是其沉浸其中的数据海洋,作者的网络写作软件建立在数据库运行的基础上,作者的写作行为本质上是一种数据输入的过程,数据化隐在地塑造着作者的写作思维,甚至,从数据库中生成的人工智能写作,创设了一种全新的作者主体。

但是,网络文学的数据化生产模式首先建立在用户数据的规模化生产的基础上,并随着计算机技术的更新迭代才逐步凸显。1994年4月,中国正式接入国际互联网,直到四年之后的1998年12月31日,也就是网络文学正式走入大众视野的元年,我国互联网用户总量才达到210万,www站点数(包括.cn、.com、.net、.org)才5300个(7)国家互联网信息办公室、北京市互联网信息办公室编著:《中国互联网20年:网络大事记篇》,北京:电子工业出版社,2014年,第48页。,相对于当时已超过12亿的中国人口基数,互联网用户规模还非常弱小。所以,1998年,当汉语网络文学以一部《第一次亲密接触》首次进入普通大众的视野时,许多读者还是通过阅读纸质版的《第一次亲密接触》才与网络文学发生第一次亲密接触。彼时,数据化特征尚未在网络文学写作中充分彰显。用户规模化的最根本和最直接的动力源于计算机技术和互联网技术的进步,在过去20多年,每一个普通互联网用户都能切身感受到“新摩尔定律”,个人电脑硬件和软件的快速迭代更新、平民化和廉价化,上网速度的不断提升,共同推动了互联网用户数量的极速增长。据CNNIC第44次报告,截至2019年6月,我国网民规模达到8.54亿,其中网络文学用户规模达4.55亿,占网民整体的53.2%;手机网络文学用户规模达4.35亿。在互联网发展历程的第一个十年与第二个十年之间,还经历了从PC门户网站到移动互联网时代的重大转型。智能手机作为移动上网设备的主要终端形式掀起了又一场数据化革命,推动用户个体数量继续增长的同时,实现了对用户个人信息的全方位、多维度挖掘。如果将前者称之为数据广度的扩展,那么后者则是对数据深度的扩展,它们合力促成了互联网的数据爆炸。

从作者和作者的写作行为而言,网络文学写作处于全面数据化的网络空间,生产行为数据化,具备可计算性,作品即数据、写作即数据生产。从数据生产的角度来说,网络作者首先是直接的、最重要的数据生产者。无论是写作字数高达数千万的“猫腻”(晓峰)、“天蚕土豆”(李虎)、“梦入神机”(王钟)、“南派三叔”(徐磊)、“辛夷坞”(蒋春玲),乃至写作字数超过1亿的“唐家三少”,还是那些籍籍无名的“太监文”写手,他们敲出的每一段网文,都构成了网络文学数据库里的比特,可以与其他数据模块建立联系并构成数据化价值。网络作者不仅以文学创作方式生产数据,网络作家的一切行为都在被数据化,作者的社交行为、情感表达、写作轨迹等等都可以被记录、转换为数据。在数据化的前阶段有一个数字化的必经阶段,一切输入和输出计算机的符号,都会转换为0和1的比特形式,从计算机语言的角度来看,万物皆比特。置身于计算机网络环境中的作者,通过键盘敲击、录入和制作的字符、图片、声音、视频等每一种表意符号,在计算机的硬盘里都被转换和储存为统一的标准化的比特模块。

置身于数据化的写作环境中,网络作者写作方式呈现出明显的数据化特征。在传统文学创作中,作家的遣词造句依靠苦思冥想和翻阅参考前人作品范例。网络文学写作则不同,网络搜索引擎成为最强大的写作辅助者,无论是写景状物,还是咏志抒情,都可以在几秒之内检索出相似的词汇、段落、经典范例。数据化的写作工具已得到广泛应用,专业写作软件还在不断进化,Office软件的自动纠错功能,各种输入法词库的自动组词功能,文字、图片、音视频的混合使用,这些都是数据化生产的表征。更为智能的网络写作软件,如“作家助手”、“吉吉写作”、“写作猫”、“码字精灵”等,可以根据相应网站的稿件计酬标准和注册作者的级别,在写作过程中根据字数实时显示当前稿费,并根据网络文学常用词汇库,补足或提示正在输出的词汇串,这些数据化写作工具的生产过程就是计算的过程。

计算主义理念下的数据化生产模式的建立,不只体现在作者对搜索引擎、写作软件等数据化工具的运用,更重要的在于作者的写作思维和作品的题材取向、叙事结构乃至语言运用都自觉遵循数据化模式。“写作者在那些‘萌元素’和‘爽元素’的数据库里,有选择地挑选若干元素,进行某种排列组合,以满足读者不同的阅读需求”(8)邵燕君主编:《网络文学经典解读》,北京:北京大学出版社,2016年,第310页。,网络文学由此逐渐形成类型化写作景观。玄幻、仙侠、修真、穿越、耽美、官场、盗墓等题材类型,以及在这些类型下的机甲流、凡人流、修仙流、种田流、退婚流、废柴流等细分类型,还有金手指、废柴逆袭、女主助势、傻瓜式相遇等等情节构造套路之所以长盛不衰,盖因它们是被阅读市场数据所证明的、屡试不爽的题材。依照传统的文学观念,同质化、类型化写作一般被视为艺术创新的大忌,而网络文学的类型化以读者市场数据为依据,类型化写作正是数据化生产的结果。

“计算”和“数据”的思维模式和实践方法弥散于网络文学写作中的世界设定、人物创设和故事情节构造等各个方面,一切曾经被认为源自于作者心灵的不可捉摸的灵感与经验同普罗普的叙事线索一样被抽丝剥茧般具象出来,都在计算主义的数据统计面前无所遁形,变得可以被量化,呈现出标准化、规则化的形式。

以“我吃西红柿”(朱洪志)的修真小说《星辰变》为例,主角所在的世界被设定为凡人界、仙魔妖界、神界,三界又各自有自己属性不同的星域。人物的修炼等级又被设定为不同的级别,以凡界为例,从低到高为后天、先天——四九小天劫;金丹前、中、后期,元婴前、中、后期——六九大天劫;洞虚前、中、后期,空冥前、中、后期,渡劫前、中、后期——九九重劫;大成前、中、后期——飞升妖魔仙界(暗星界)。同时,妖魔仙界(暗星界)和神界也各有严格的设定(9)王祥:《网络文学创作原理》,北京:中国人民大学出版社,2015年,第119页。。诸如此类的种种设定,以及包含了从动漫、网络游戏中借鉴的各种“练级”规则和角色、情节设定的N次元网络小说的“套路”,无不蕴含着数据化、模型化的创作思维。

近年来日益引起关注的人工智能写作,一种计算主义理论下的网络文学数据化生产,则从根本上对文学创造的主体提出挑战。人工智能写作也被称为机器写作、机器人写作、AI写作,它建立在庞大语料库的数据基础上,写作软件通过对语料数据的自动阅读和学习并输出作品。早期的一些自动写诗软件可以被视为人工智能写作的雏形,如2006年上线的“猎户星”自动写诗软件,用户随机输入数个关键词,软件的后台系统通过语料库补足,便可快速生成一首诗歌。但是,受限于算法技术的局限,彼时的人工智能写作本质上还停留在对诗歌文体的机械式简单模仿,通过排列组合来生搬硬套。真正意义上的人工智能写作,直到近几年才随着算法技术的发展而达到较为专业的写作水准。最新的人工智能写作软件具备深度学习能力,其学习的对象已不仅仅限于语言的使用,更重要地体现在意义与价值的自我建构,其智能水平虽然还处于人类蹒跚学步的阶段,但成长速度异常迅猛。广受关注的微软AI“小冰”,为了掌握写诗方法,经过4天约6000分钟超过10000次的深度学习,自我阅读和学习了1920年代以来519位诗人的现代诗,最终形成了具有独特行文风格的“小冰体”。它所写出的现代诗甚至连专业诗歌评论家都难辨真假,其代表作《全世界就在那里》——“河水上滑过一对对盾牌和长矛她不再相信这是人们的天堂眼看着太阳落了下去这时候不必再有爱的诗句全世界就在那里早已拉下了离别的帷幕”,有情感、有温度、有韵味,引起学术界和科技界的广泛关注。2017年5月,北京联合出版有限公司出版了“小冰”的《阳光失了玻璃窗》,成为史上首部AI作者写作的诗集。除了写诗,小冰还拥有搜索大数据、信息存储与筛选的能力,这让小冰拥有普通人无法具备的创造性能力。“小冰等已经具备类人类大脑思维,具有了一定的人格化抒情诗创作能力,有其自身‘伤感时代’风格。从现实分析,当下人工智能写作机器人已经具备独立创作高水平原创作品的能力”(10)葛许越:《写作机器人“作者”主体地位辨析》,《探索与争鸣》2019年第8期。。

相对而言,小说文体因篇幅较长和情节构造复杂而显得难度更大,但人工智能写作在小说领域也翻开了新篇章。美国人工智能工程师Ross Goodwin通过神经网络学习系统预先训练一个写作机器人,让这台创作机器人阅读了6000万字的文学作品,随后模拟凯鲁亚克的小说《在路上》,开车载着相机、GPS、麦克风和计算机的内部时钟从纽约到诺尔,一路上,机器人通过摄录到的画面、声像,旅程的时间、空间变化来自主写作。这部小说的第一句是:“早上九点十七分,房子很重……”尽管这部人工智能小说最后沦为了记录时间、空间和景物变化的流水账,但也不啻是人工智能写作的又一次里程碑(11)《AI创作了史上第一部小说,读完之后我懵了》,2018年11月8日,https:tech.sina.com.cncsj2018-11-08doc-ihmutuea8067024.shtml,2019年6月20日。。此外,由多家硅谷互联网公司联合创立的人工智能非营利组织“OpenAI”所推出的文本生成模型GPT-2,可以根据一小段文字自动“脑补”出大段连贯的文本,并模拟不同的写作风格,这一AI语言模型正由中国的研发者们进行“汉化”。可以预见,未来,人工智能写作作为一种主体、工具和对象全面数据化的网络文学新形态,将随着技术水平的发展不断向更高艺术水准进化。既然类型化、同质化的网络文学小说拥有庞大的受众群,既然“小冰”写作的诗歌能达到让非专业读者无法分辨的水平,我们有理由相信和期待人工智能能够创造出满足大众速食化阅读需求的类型化小说。在对经典作品的学习和模仿能力上,机器将会比人更快。

在数据化生产模式下,因为数据的体量过于庞大,以及云计算、云存储所需要的巨额技术成本,个人用户无力承担建构数据化生产模式的成本,文学网站成为网络文学写作、传播、阅读和互动的平台,扮演着生产空间和生产资料的角色,并记录、存储和运营网络文学活动过程中产生的所有数据,成为数据库的掌握者、文学生产模式的主导者,以计算主义为理念的数据化生产模式悄然重塑了文学的生产关系。

二、被“计算”的网络文学阅读

计算主义理念及其数据化实践模式在网络文学阅读环节清晰地体现于三种互动关系结构即“阅读-写作”、“阅读-文学网站”、“阅读-文化产业”之中,它们并非相互独立,而是以文学网站作为中心关系点,并在多种关系点上互相连接。同时,在每种关系结构中,读者都始终作为数据的生产者和消费者合一的角色存在。

在“阅读-写作”的关系结构中,读者和作者同处于实时在线的开放网络环境中,读者阅读过程中所生产的数据实时反映在网站前端,直接影响着作者的写作状态,引导着作者对写作题材的选择、故事架构的设计、叙事模式的建构和作品的价值取向。作者与读者之间实现“点对点”式的在线交流,使“读”与“写”之间产生一种彼此相通的情绪共振和体验同频。读者的点赞、吐槽、评论、分享、收藏都被数据化,共同协商生产作品的爽点、槽点和挖坑、填坑策略等,最终将文字作品开发成符合读者不同审美诉求的多形态的文化产品。

通过创建“读者粉丝社群”体系,曾经分散的读者牢牢聚拢在自己所喜爱的作品评论区、超级微信群、超级qq群、微博粉丝群和作者的微信朋友圈内,作者与读者之间不再仅限于传统的点赞、跟帖式的交互模式,而是以打赏、订阅、推荐票、月票、弹幕分享等多维方式,助推读写互动与粉丝之间的交流。网络作家使用微博、微信等社交媒体与粉丝进行交流和探讨,预告写作进度和分享写作感受,一旦作者有新品推出,只要在“读者粉丝社群”内发布了消息,数以万计的读者粉丝会在自己的微信、微博等平台转发与推介该作品。随着90后“Z世代”粉丝群体的崛起,读者的互动活跃度进一步上升。起点中文网首创的月票制度则是一种作品奖赏排行制度,读者可以通过保底月票、付费阅读和打赏等方式获得月票,再把月票投给喜爱的作者。2019年起点中文网的王牌作品《诡秘之主》,获得粉丝打赏的月票高达2500万张。最近几年的高人气作品《全职高手》、《斗破苍穹》、《大王饶命》、《完美世界》、《我有一座冒险屋》等作品,其成功营销的背后都有粉丝社群读者的助推。“在社群形式上,除了作者、官方创立的粉丝基地,大量粉丝开始自发地设立、建设虚拟集合地,在新兴的微博等社交群体上展现以同人为核心的IP文化”(12)时文宏:《从文本阅读到文化社群——粉丝经济下的网络文学生态发展简述》,《网络文学评论》2019年第2期。。可以说,读者粉丝社群所建立的互动体系,已将网络阅读推向一个全新的境界,网络读者由曾经“读”一本书转变为了现在的“粉”一本书。而所有这些互动行为,都在产生着源源不断的数据。

在“阅读-文学网站”的关系结构中,建立在阅读数据上的“计算”,正是文学网站运营的核心立足点。在计算主义的认知模式与技术路线下,具备实力的网络文学商业网站总在想尽办法“靠近”读者、“抓住”读者与“计算”读者,以实现商业资本的利润最大化。那么,如何做到“计算”读者呢?如果说依赖作品质量来吸引阅读是靠近读者的第一步,那么要牢牢“抓住”并“计算”读者,让读者甘愿为文学产品买单,就需要一套精密的计算方法和营销策略。

文学网站对网络文学阅读的数据化运营,表现在对阅读行为的记录、数据存储、计算与分析上。与网络文学生产环节一样,网络文学阅读的数据化同样经历了一个逐渐增强的历史过程。网络文学崛起的初期,由于网络读者的基数并不大,文学网站数据和算法等运营技术还处于相对低阶的水平,作者的“写”与读者的“读”基本上处于分离状态,互动模式较为单一,文学网站对读者的“计算”仅仅停留在统计点击率和评论区留言的初级阶段,网络文学阅读的数据化生存特征还并不明显。当个人电脑逐渐在普通大众用户中普及,文学网站的用户规模不断扩大,读者阅读时所生产的数据逐渐显现出越来越重要的使用价值。而伴随着智能手机的平民化和移动互联网的大普及,网络文学的读者数量猛增为数以亿计,由于读者基数的跃升和读者分享、转发等自发传播行为的增强,网络文学阅读过程中所生产的数据量呈几何数上升,一篇文学作品通过微信朋友圈或微博平台发布,往往能在几秒钟之内就传给成千上万的读者,如果读者在自己的微信朋友圈转发,会进一步扩大该作品的传播速度和传播范围,“传播内容的增加,传播频率的增强,以及传播效果的增进,都会产生大量的数据,同时人们又能借助这些数据优化传播过程”(13)刘庆振、钟书平、牛新权:《计算传播学:缘起、概念及其计算主义视角》。。同时,读者阅读行为中生产的数据体量、种类和数据维度得到极大丰富。就个体读者的数据生产方式和种类而言,当读者点击一部作品进行阅读时,不仅读者对特定作品的页面点击量、页面停留时间、评论行为等被记录、储存和计算,而且,在智能手机后台系统的多维计算下,读者在何时何地、何种场景下阅读,在具体章节段落停留痕迹、情节偏好、题材偏好,都被转化为数据;而从读者群体行为来看,性别、年龄段、受教育程度、职业、生活地域、生活规律、兴趣爱好以及反映在移动支付上的用户经济收入水平等信息,也成为文学网站掌握和计算的数据,甚至连阅读时的心理活动也能够被算法所捕捉。文学网站在计算主义框架下的数据挖掘能力和应用场景大大拓宽。

随着计算主义理念下数据化运营手段的强化,文学网站呈现于用户终端的界面,不再是如同报纸和期刊版面那样固定排列的页面栏目,而是根据用户兴趣自动刷新的个性化用户界面。同一个文学网站或客户端,在每一个读者用户界面呈现的内容可能都不相同,阅读一部作品时,页面会自动“猜你喜欢”。读者阅读的时间越长、阅读的作品越多,文学网站对于其审美水平和阅读趣味的分析与计算结果越精准,网络文学阅读由此从集中走向分化。基于个人数据的“兴趣化阅读”成为各大文学网站运营的主流模式,个体读者的阅读兴趣和审美趣味得到最大程度的尊重和满足,网络文学阅读“从无限‘广播’走向定位‘窄播’”、“由‘批量生产’过渡到‘量身打造’”(14)陈定家:《大数据时代的文学生存状况》,《长江学术》2016年第1期。——接受美学转向之后,数据化阅读将读者中心论推向一个新阶段,实现了从读者中心论的复数向单数、集体向个体、抽象向具体的再次转向。

数据化运营能力也决定了文学网站的行业生态。在二十余年来的发展历程中,文学网站从早期的百花齐放的个人化松散式运营,逐渐向起点中文网、晋江文学城、咪咕阅读、掌阅文学、纵横中文网、云起书院、潇湘书院、红袖添香网等几家重点网站集中,这些网站拥有强大数据库和数据化运营实力,能够在大浪淘沙的历史进程中生存下来并发展壮大,无不直接缘于其对阅读市场的精密计算。当然,数据运营能力最终依靠强大的资本和技术作为后盾。

“阅读-写作”、“阅读-文学网站”作为微观关系结构和次级文化场域,包含于宏观的“阅读-文化产业”关系结构和整体文化产业生产场域内。在计算主义的逻辑框架里,文学网站所记录和储存的读者阅读数据被深度开发利用,用以支撑IP全产业链的运营,作为影视、动漫、游戏等衍生文化产品改编的重要依据。相较于网络文学写作,影视剧、动漫、游戏等文化工业产品制作需要投入巨额资金。在传统时代,由于播映和上线之前缺乏与观众之间的数据参考,往往存在较大的投资风险,而立足于网络文学阅读数据的IP剧生产模式则为音像文化工业提供了可信的数据参考,并提前聚拢了大量潜在观众和用户。凭借着精准的数据计算,网络文学逐渐形成一条立体化的商业链,即“签约写手→储存原创作品→吸引点击→付费阅读→二度加工转让→下载出版→影视改编→制作电子书→开发移动阅读产品→有声读物→网游改编→动漫改编→转让海外版权”(15)宋学清、乔焕江:《大数据背景下网络文学的新生产机制与新景观》,《文艺评论》2017年第3期。。近年来炙手可热的IP剧,大部分都是基于网络文学阅读数据的计算而向影视剧产业延伸的结果,《步步惊心》、《甄嬛传》、《欢乐颂》、《盗墓笔记》、《大江东去》、《知否?知否?应是绿肥红瘦》、《三生三世十里桃花》、《微微一笑很倾城》、《庆余年》……这些耳熟能详的热播剧都来自于网络文学改编。有的用户则是因为先观看了网文改编的影视剧或动漫,再反向从网上搜索网络文学原著阅读,从此成为网络文学的忠实读者。2019年9月,改编自萧鼎作品《诛仙》的电影《诛仙Ⅰ》票房达到4亿。电影上映期间,《诛仙》在QQ阅读上的全平台总收入增长11.7倍,阅读量增长11.7倍;起点读书《诛仙》原著阅读量增长8倍,收入增长10倍以上。“影视作品与原著的‘互粉’过程,正是IP固本纳新,持续扩大影响力和焕发生命力的破圈过程”(16)《2019年度网络文学发展报告》,2020年2月20日,http:www.chinawriter.com.cnn120200220c404027-31595926.html,2020年2月21日。。

从以上的分析可以看出,网络文学阅读的数据化特征表现在读者的每一种阅读行为中,而读者阅读行为无时无刻不处于计算主义的运算逻辑中。对于网络读者而言,后台的数据化与计算结果,在用户终端的页面直观体现为作品的总体点击量、点赞数、订阅数、付费金额等数值形式,这些数值成为网络读者选择作品时的重要参考标准之一。作为数据的生产者,网络读者处于一种被动受控的角色,但是,计算的结果最终指向网络读者的文化消费需求。在数据化环境和计算主义的运行框架下,读者既生产和贡献着数据,反之又消费着自身生产的数据,且生产与消费的行为同时发生,从而形成数据化产消合一的身份角色和控制闭环。“被计算”的过程中,作为受众的网络读者的主动地位也在上升。

总之,数据化的阅读环境与数据化的文学作品正在建构新的审美方式、审美体验,也在形塑着新的审美心理。数据化的循环模式下,网络文学的写作与读者的心理经验越来越趋向一致,传统审美认知模式中的“陌生化”转向传播学认知和谐理论中的“一致性”。但需要注意的是,计算主义理念下网络文学阅读的数据化运营满足读者阅读兴趣的同时,也可能形成审美的“信息茧房”效应。这一由美国学者桑斯坦提出的概念,近年来在传播学领域受到较多关注。当前,基于个人兴趣的算法推荐机制成为网站和客户端的主流运营模式,在算法与内容平台、社交关系和个体自身的过滤机制的共同作用下,包括网络文学读者在内的用户,可能会陷入只阅读自己熟悉和感兴趣的内容,从而形成选择性接受、选择性理解和选择性记忆。要避免形成审美茧房效应,必须注意优化算法推荐和平台运营机制,促进内容供给多元化(17)彭兰:《导致信息茧房的多重因素及“破茧”路径》,《新闻界》2020年第1期。。

三、基于数据的网络文学批评

卡尔维诺认为,科学将成为文学的新生命力源泉,他指出:“今天,科学的每一个分枝都旨在表明,世界是由最为细小的实体支撑着,如脱氧核糖核酸所包含的信息,神经元的脉冲,夸克,以及自从时间开始就在空间漫游的微中子……还有计算机科学。”(18)卡尔维诺:《未来千年文学备忘录》,杨德友译,沈阳:辽宁教育出版社,1997年,第5页。文学评论界一直苦于缺乏对网络文学评价范式的根本性突破,许多研究者尝试从不同方向推进,提出应用网络土著理论、在场式研究,以及将媒介视为文学的第五要素,建立媒介诗学理论等等,这些研究方法不断拓展着网络文学批评的深度和广度,但仍然未能从根本上走出批评的困境。作为一种本质上建立在比特数据基础上的文学类型,从数据化角度建构计算主义网络文学研究范式,既有必要性,也具备可行性。

网络文学庞大的数据量为计算主义研究范式提供了坚实的数据库基础:多达1755万的网络作家群,动辄数百万字、上千万的单部作品字数,数以亿级的读者群数量,触目皆是十万、百万量级的评论数量。以一部分热门作品为例,“烟雨江南”(邱晓华)的《罪恶之城》425万字,“月关”(魏立军)的《回到明朝当王爷》370万字,“南派三叔”(徐磊)的《盗墓笔记》八部总计389万字,“猫腻”(晓峰)的《庆余年》398万字,“鱼人二代”(林晗)的《校花的贴身高手》达到1100余万字,“雷云风暴”(王世伟)的《从零开始》甚至多达2022余万字。读者评论数量方面,2018年,“会说话的肘子”(任禾)的《大王饶命》成为网络文学史上首部拥有150万条评论的作品,这一纪录在2019年便被《诡秘之主》以200万条评论的数量打破;其他如《我有一座恐怖屋》、《全球高武》等排行榜头部作品的评论数皆在30万条以上。面对超长的作品篇幅,作为个体的文学研究者即使废寝忘食、夜以继日地阅读,也只能截取其中极小的部分进行细读。作为应对策略,我们可以看到,团队式、集群式研究成为网络文学研究的重要特征,例如中南大学欧阳友权教授、北京大学邵燕君教授等为代表的学术团队,都是以多位学者和研究生团队组成一个学术小集群。即便如此,人工阅读和搜集资料的速度也远远不能与计算机程序相提并论,如果合理利用数据化技术手段,将大大丰富网络文学研究的作家作品样本,从深度和广度两方面有力推进网络文学研究。

网络文学的文本语言也更适合于采取以数据化手段进行研究。网络文学从诞生之初,其文本语言的口语化、随意性便饱受专业评论界诟病,这一方面缘于大部分网络作家相对于纯文学作家而言存在文学素养水平的局限,另一方面则是由自身写作节奏所决定的。网文大神“唐家三少”每天写作大约一万字左右,并曾创下连续130个月每天更新的吉尼斯世界记录(19)乔燕冰:《做有世界影响力的中国IP——专访中国作协主席团委员、网络作家唐家三少》,《中国艺术报》2016年12月5日,第3版。,被粉丝戏称为“人形码字机”。不独“唐家三少”如此,每日更新数千、上万字已成为网文作家晋级大神序列的基本要求。以这种写作速度输出的作品,其语言的粗糙性和口语化也就不足为奇了。因此,使用传统文学批评范式中的文本细读法来对网络作家的语言进行分析显得既不适用、也无价值。而要真正实践网络文学的在场式批评,又必须建立在对具体作家作品和文本语言分析的基础上,因此,计算主义范式下的数据化研究大有可为,利用计算机程序语言建立任务模型,设计相应的程序,可以迅速获得程序自动阅读后的任务结果。

以数据化为实践方式的计算主义研究范式,还将使网络文学更可能地接近于全量式研究,从而更为接近文学中所蕴含的社会文化心理的真实样貌。网络文学诞生之前的传统文学时代,一如其他文化领域一样,文学也是“少数代表多数”,少数精英作家、作品被视为整个时代和民族的精神风向标,能够进入到公众视野的作家和作品的数量都相对有限,研究者在十年、五年或一年周期内选取一部分有代表性的作家和作品,便能基本勾勒出相应周期内的文学写作动向和审美特征。但这种“部分选择”的研究方式是否能够代表文学的整体状况是值得怀疑的,它不可避免地存在着对整体文学现象的遗漏与遮蔽。而包括网络文学在内的网络文化以及建构在网络环境中的社会文化,是一种典型的去中心化、个人化形态。在网络文学写作领域,每一个年度的写作者和作品数量都汗牛充栋,网络文学作为一种集体文化行为和文化心理的产物,需要对足够的样本数量进行观照才能得出科学的研究结论,此时,如果只依照研究者的个人主观判断标准,选取一部分经典热门作家作品来进行考察,难免挂一漏万。而建立在全量数据库基础上的计算主义研究方式,基于全量数据库的统计和分析,可以无限接近于文学的整体样貌,因此得出的结论、观点必将更为科学、严谨。

在数据化环境中,作者、文本和读者研究都将置于计算主义的全景敞视下。“伴随信息科技革命诞生的大数据技术,其功能在于对海量的数据规模、快速的数据流转、多样的数据类型进行数据处理,通过精确的量化分析去辨识和把握对象的内容、特征、品质和价值”(20)欧阳友权:《网络文学崛起对文学研究的影响》,《湖北大学学报》(哲学社会科学版)2019年第4期。。虽然作者写作时的修改痕迹不再保留,却增加了有关于写作行为的更多质料,理论上,作者的写作时间、场景、词汇使用习惯、语序习惯、写作节奏,以及与写作无关的社交关系、地理轨迹、消费偏好、生活经历等,所有行为都能以数据形式被记录和计算。与此相似,读者研究也在数据化环境中变得更具可测性和可计算性,计算机也比读者更了解读者自己,比如一个自认为趣味高雅的读者,却可能在手机和电脑上热衷于阅读“小白文”,而这一切都被网站后台忠实记录下来。随着计算机语义分析技术的进步和语料库的无限扩展,计算主义研究范式也将走向作品的语言、情感、意蕴、结构等多维度深层分析。在AI设定的模型下,机器将自动学习和阅读作品,作品的符号、风格、叙事结构、精神内涵、社会文化语境以及与其他作品的互文性,都将可能被深度挖掘和呈现。“结合传统词源学、语义学和大数据技术,完全可以清晰地显示某个观念的诞生、潜隐、突变、流行、淡出的过程”(21)王兆鹏、郑永晓、刘京臣:《借器之势,出道之新——“数字人文”浪潮下的古典文学研究三人谈》,《文艺研究》2019年第9期。。当然,数据关系可以关联到何种限度,涉及到用户信息安全与隐私等法律问题,在实际运营中应在法律和商业伦理框架下被严格管控。

事实上,计算主义范式很早便被引入人文社会学科研究,并正在得到越来越广泛的应用。世界范围内,20世纪40年代末,耶稣会士罗伯托·布萨(Roberto Busa)与IBM公司合作,利用大型计算机制作了托马斯·阿奎那著作的索引,称为“Index Thornisticus”。60年代,《计算机与人文科学》杂志诞生,标志着人文计算的正式兴起。新世纪以来,“人文计算”一词又被称为“数字人文”,截至2019年4月20日,数字人文合作组织“数字人文中心网络”(Center Net)收录的数字人文中心已达201个。在中国学界,台湾大学于2008年成立数位人文研究中心,此后,“中研院”和政治大学都成立了数位人文中心;北京大学、武汉大学、南京师范大学、首都师范大学等多所高校也都创建了数字人文研究机构或运用数字技术进行了卓有成效的探索(22)王兆鹏、郑永晓、刘京臣:《借器之势,出道之新——“数字人文”浪潮下的古典文学研究三人谈》。。中南民族大学王兆鹏教授较早应用统计学方法进行唐宋文学研究,并逐渐扩展到更为复杂和深层的计算主义范式,其独特和前沿的研究方法受到学界瞩目。具体到网络文学领域,中南大学欧阳友权教授团队自2011年开始,并于2014年完成结题的国家社科基金重点项目“网络文学文献数据库建设”,为学界应用数据化手段推进网络文学研究做出了可供借鉴的范例,该数据库容量达到3000余万字,涵盖以汉语网络文学为主题的期刊论文、硕士博士学位论文、学术会议文章、报纸评论等各类研究成果。目前为止,这是计算主义理念下运用数据化手段进行网络文学研究最具代表性的成果之一,不过,这一项目还只是对网络文学研究史的研究,网络文学作品数据库更为广阔和深层的空间还有待探索。现阶段,较之于学界,网络文学的数据化研究在业界的应用显得更为积极和深入,每年由商业文学网站和商业研究机构所发布的各类年度网络文学报告,已成为网络文学研究的重要参考资料,中国作协、中国社科院也已经开始越来越多地与商业文学网站开展合作研究。实际上,每一家文学网站本身便是一个已经建成的作品数据库,已然为计算主义的研究方法提供了基础。以阅文集团为例,其拥有高达1170万部的作品储备,签约作者达780余万人,包含200余种内容品类,为网络文学研究提供了丰富的数据挖掘和使用空间。

在更为高级的人工智能技术领域还有着更大的想象空间,一个在各类学术资源库中自我学习和训练的学术AI,完全可以成为具有一定学术能力的“超级助手”,甚至成为一种新的学术研究主体。机器可能暂时不能完全取代人的原创角色,但与实证主义天然契合的计算主义研究范式,无疑将对思辨式的人文主义研究起到很好的辅助作用。

有研究者提出,当前文学研究领域缺乏“一种文学领域的理论物理学家”(23)夏烈:《网络文学发展大趋势》,《光明日报》2014年8月15日,第13版。。文学与科学的联姻已是大势所趋,文学研究方法空间正在科学理念和科学工具的辅助下向新的方向扩展,研究者对新的科学研究方法兴趣浓厚。如何在文学领域建构一种理论物理学家式的视野,似乎显得过于飘缈,但在数据化生存环境中,运用数据科学方法论介入网络文学的研究却完全具备可行性。诚然,建立计算主义的网络文学研究方式,如同其他社会科学面临的问题一样,“需要四个条件:新现象的涌现、新数据的易得、新方法的普及、新人才的形成”(24)祝建华、张丽华、黄显:《计算传播学与传播研究范式转移》,《青年记者》2018年第22期。。对于网络文学而言,新现象已然产生、新数据已经形成、新方法方兴未艾,目前最缺乏的当属能够打通人文科学与自然科学的隔膜并掌握计算主义方法的新人才了。

建立在计算主义底层逻辑之上、以数据化为实践路径的各种技术手段,正在深层建构一种面向未来的全新网络文学生态。在过去二十多年的发展历程中,计算主义框架下的各种技术手段更多地是以新媒介身份参与到文学的建构中,主要以传播力量促成了蔚为大观的网络文学景象。未来,计算主义技术手段将不仅成为网络文学生产、阅读和评价的智能助手,还将生成与人类并行的文学创作新主体、新文本形式、新审美体验。人类将突破文学活动等表意实践中的语言学习与运用束缚,获得前所未有的充裕文化产品,更加精确地认识和把握自身和世界的精神形态。回顾一下计算机和互联网技术对人类社会生活的颠覆性改变,许多在今天看起来无法想象之事,可能在不远的将来会变得习以为常。“我们必须向未来学习,正如从前向过去学习一样”(25)约翰·奈斯比特:《大趋势——改变我们生活的十个新方向》,梅艳译,北京:中国社会科学出版社,1984年,第17页。。

猜你喜欢
网络文学主义文学
我们需要文学
新写意主义
对待网络文学要去掉“偏见与傲慢”
网络文学竟然可以这样“玩”
网络文学趋向“一本正经”
揭秘网络文学
“太虚幻境”的文学溯源
近光灯主义
这是一部极简主义诠释片
冬日 新碰撞主义