人类学强调整体(holistic)视角,意思是人类学家在研究时必需从方方面面、各种尺度来考察自己的研究问题。这种强调从联系与交互来思考问题的整体论,也要求人类学家根据自己的需要,采取跨学科的方法与视角来做研究。
人类学提问计算社会学!
23 May 2023 - 13:15
人类学强调整体(holistic)视角,意思是人类学家在研究时必需从方方面面、各种尺度来考察自己的研究问题。这种强调从联系与交互来思考问题的整体论,也要求人类学家根据自己的需要,采取跨学科的方法与视角来做研究。
但在学科训练的现实环境中,很多社会文化人类学的同学恐怕并没有太多机会了解定量或计算的社科研究方法。本期的“人类学提问计算社会学”就是希望通过一场轻松的笔谈对话,介绍计算社会学的方法与思路,并期待可能碰撞出的火花。 人类学史上,文化人类学与数学的交织并不罕见。有列维-施特劳斯呼吁发展“关于人的数学”(1954),也有人类学如何结合数学方法的各种讨论;而作为人类认知形式,数学也一直是人类学的研究对象,突出的例子包括关于民族数学(ethnomathematics)的研究,以及对社会生活数据化(datafication)的种种反思等等。结绳志的名字也可说与之有关,作为绳结记录体系之一的印加“奇普(qhipu)”就通过计数来达成社会管理与文化传播。这次笔谈是小结学习与思考数学问题的第二篇,第一篇请见译文《算法文化与劳动分工:启蒙运动中的计算》。 本期的被访者是香港中文大学社会学系助理教授韩思齐,一位关心人文思考的计算社会学研究者。提问者叶葳是思齐的本科同学,在十年前的社会学系生活中,面对未来的方向选择,我们曾无数次聊“定性还是定量”:尽管共享对人与社会的研究兴趣,学科传统却要求我们首先选择一种方法受训,这也使得当年的谈话就充满犹豫和含糊,双方立场总是不断互换。十年之后的这次笔谈既是老友线上重聚,也再续了关于研究方法的交流对话。本文有不少跳脱、随意之处,期待大家在评论区一起充实这场讨论。
什么是计算社会学
Wei:能否介绍一下自己和最近的研究?
Siqi:我在俄亥俄州立大学时期的研究生训练主要集中于教育社会学和人口学和两个非常大、人非常多的领域。毕业之后进哥伦比亚大学做博士后,仍然在做教育相关的主题,但是使用的是文本数据和计算方法。选择这个博士后项目的过程,之前已经聊过*,但是其实根源还是在于我的两个兴趣:(1)我个人其实对于通识教育和传统的人文学科的兴趣完全不小于社会科学, (2)但是我也很感兴趣科技(大数据和计算社科)应用于回答人文领域问题(比如到底什么是好的高等教育)的可能性。一个研究人文教育的大数据计算社科项目正中我的下怀。
Wei:什么是计算社会学?它与传统的建立在社会统计学方法上的社会学定量研究有何异同?
Siqi:这个问题可以从方法和数据两个方面回答。根源的不同我觉得在于数据。由于新的适合社会学的数据出现,而它们都比较“大”,且没有“结构”,所以需要新的方法来分析。
“大”这个问题很清楚。微博数据,手机的地理定位移动数据,等等都很大。但是“结构”这个问题更加重要,区分开了传统的定量和现在的定量。传统定量里面,发一份问卷出去,就能得到各种变量——variable 1, variable 2, variable 3——这些变量放在一张Excel表里面就自然有了结构。现在要处理的则是非结构性的数据,比如说微博,每个人的每条微博,如果作为一行数据,那么这一行数据里面没有任何现成的变量存在,需要研究者自己解析(Parse)。这就进一步涉及另一个问题:这些纯文本形式的非结构的数据,不像 0= male, 1=female这种,能够轻易转化成数字编码。这也就是为什么需要新的方法。
新的方法主要分为两类,一类是社会网络分析(Social Network Analysis),另一类就是自然语言分析(Natural Language Processing, NLP),二者分别对应着微博数据(用社会网络方法分析)和其他非结构的文本数据(用自然语言分析)。当然这么说可能过于大而化之,不过据我观察,这两类方法和数据是计算社会学中最为主流的。
这两种方法和传统统计学的方法又有什么差别呢?像我已经说的,新的数据结构不再是一个人一行,一个变量一列了。在一个社会网中,很多时候结构本身产生了1+1 大于2的效果,也就是,你把每个人自己的属性考虑进去不够,这个网络结构的本身会产生一个独立于个人的效果。一个简单的例子,同样五个人,场景一是其中两个人认识彼此,场景二是其中三个人互相认识彼此,那后者这个社会网络的密度(density)与传递性 (transitivity)都高了,虽然还是一样的五个人。要了解网络结构和结构中的资源,就需要社会网络分析方法。这种方法所作用于的数据是由关系节点(nodes)与关系线(edges)组成,所以不同于调查研究的数据。
自然语言分析的数据那就更加简单明了,就是文本。在这个文本上我们能做什么?两个主流的方向:
(1)词向量。简单的例子就是,英语中King & Queen, Cat & Dog 这两对词语,我们凭借人类常识可以知道,King和Queen会比较经常一起出现,而Cat和Dog会比较经常一起出现。这是因为人脑知道这两组词语各有一个潜在的共享概念(Shared Underlying Concept):前者是皇家,后者是动物。机器学习也能知道第一对和第二对词更相似,因为它可以把每个词都向量化(Vectorize)成一列数字,每个向量(vector)都代表了一个词语周身的语义环境。既然所有词语都变成一行数字,那么就可以定量地算出它们的距离。在一起常出现的词语,它们的语义环境就会比较相似,那么我们计算的它们的距离也会比较小。所以我们会发现,king和queen的余弦相似度(Cosine Similarity) 假设是0.8, 而 king和cat的余弦相似度可能只有0.4. 这样一来谁是更靠近的词语呢,就一目了然。
(2)主题模型(Topic Model)。假定我们有一堆报纸,这个报纸是综合性的,好多各种版,体育版,娱乐版,时事版……那么如果我们一开始不知道每一篇文章是属于哪个版,是否可以通过机器学习和自然语言分析得出这篇文章最有可能的那个版(也就是Topic)呢?这是另一个非常适合社会科学的方法,比如我们有一大堆Twitter数据,这些数据自己并不能告诉你它是什么样的政治取向,那么如何找到它们背后潜在的不同政治取向呢?这时候Topic Model就可以起作用了。Topic Model有很多不同种类,LDA, Key-ATM, STM等等,不多赘述了。
Wei:非常切要的介绍!这两种数据方法非常有意思,也很适合人类学者们思考借鉴。我们先聊社会网络分析。作为十年前的社会学本科生,我第一次听说“社会网络”这个概念是因为格兰诺维特(Mark Granovetter)经典的弱关系理论(1973)——他在研究求职过程时发现,弱关系在是整合群体间关系的纽带,在信息传播等过程中作用更大;以及围绕格兰诺维特理论的一系列讨论,包括边燕杰立足中国研究提出的“强关系”分析等等。另外,当时我们思考社会网络或社会关系研究的时候,往往还会将之置于社会学老祖宗齐美尔、涂尔干等对社会互动和社会性的讨论线索中。这些对社会网络的“老”认识,是否还能用于理解当代定量社会学研究的相关前沿?这些在“社会网络”这个名词下面的不同时期的研究,究竟有没有一定的延续性(或理论相关性)?
Siqi:格兰诺维特式的对强、弱关系的研究,早期使用的是提名生成法(Name Generator)或者位置生成法(Position Generator)*,在问卷中收集;现在因为有了各种社交媒体数据,就自然有了很多新方法来测量强关系和弱关系。除了格兰诺维特,此前还有非常有名的六度分隔理论(six degrees of separation),也与社会网络研究有关,就是说全世界另一个角落的任何一个人你可以通过六步联系到,这个学名也叫小世界现象(small world phenomenon)。现在社会网络已经脱离了单纯研究人际网络,而经常运用语义网络(Rule et al. 2015)、论文引用网络(Börner et al. 2004)等方式来研究。
至于最老的祖宗,涂尔干齐美尔,其实不太多会在实证论文里提及。因为现在普遍认为社会网络“分析”方法是计算机传进我们社科的。注重的不是理念,而是方法。
提名生成法让每个被访者提供自己的社会网络成员的姓名、特征、关系等信息,来测量社会网络;位置生成法使用量表来考察被访者的社会地位。
计算社会学的想象力
Wei:理解。相较于社会学定量研究,人类学的特点之一可能就是不放开老祖宗。我在听到“社会网络分析”这样的概念的时候,会联想到的是拉德克利夫-布朗的结构功能主义,甚至是列维-斯特劳斯对神话的结构分析。而作为人类学最重要的传统,亲属关系研究似乎也有点“像”是社会网络分析的前身——人类学家在大量收集亲属制度相关信息之后,常常会以图表甚至数学化的方式来推进其分析。这是题外话了,我想借此说明的是,人类学研究一向重视讨论关系和结构,而与数学方法的结合在学科史中也不罕见,这或许是可以让人类学者或者定性研究背景的读者感到亲切的地方。
当然发展到今天,学科史上的曾经交织似乎已经显得飘渺,让我们回到受数据科学影响的这种新的社会网络“分析”方法吧,我很好奇,它在处理新的以及更大的数据的同时,会带给我们什么样的思考启发呢?能否介绍一些具体的例子来帮助我们理解这些新意和贡献?
Siqi:博士后期间我师从彼得·比尔曼(Peter Bearman), 他是古根海姆奖获得者(Guggenheim Fellow),还是美国三院院士(American Academy of Arts and Sciences, National Academy of Sciences, National Academy of Medicine),足可看出其研究的跨学科性和广度。虽然博士期间我也已经接触了社会网络,但是自从和他合作之后我对社会网络的理解有一个质变。下面我可以用比尔曼的研究为例来说明一下怎么从理念上(而非方法上)来利用社会网络思考社会科学,尤其是,有没有可能利用这个方法获得理论创新。
在比尔曼与合著者的Blocking the Future这篇论文里,他们把一个中国村庄的历史事件看作社会网络中的一个个的节点(node), 如果一个事件导致了下一个事件,则两个事件之间有了一个边(edge),即节点之间的连线。
这个做法和传统历史学家的案例研究(Casing)有什么区别,它有什么新意呢?这篇论文认为,传统上历史学家做研究往往有一个比较清晰的宏观结构,比如说我要去找经济危机、农业危机、合法性危机相关的事件。那么这些事件就选入了一个狭窄的微观层面的事件流(Narrow Stream Of Specific Microlevel Events),再由不同路径/支流汇入主流。
但是社会网络分析用于这样的历史分析中,则没有一个预设的主题,事件之间也没有预设什么强烈的联系(Sparse Data),仅仅让数据结构帮我们选择,哪个事件是历史上最重要的事件。那么哪个是历史上最重要的事件呢?就是在这个事件网络中中心性(Degree Centrality)最高,更确切地说是外向程度(Out-Degree)最高的那个节点(Node)。这是什么意思?如果一个事件(也就是一个节点node)引发了最多后续事件,它的外向程度(Out degrees)就最高,中心性(Degree Centrality)也就最高。
这想法是不是很有意思呢?放弃了传统上使用的那种很明晰的案例收集与分析,不遵循理论制造的界限(Boundary),而让事件的重要性在网络中自己浮现(emerge)出来。
Wei:有意思。我想先问一个具体问题,你提到这个社会网络分析的新意在于它没有预设历史研究的固有主题,因而能够超越惯有的解释线索。但是另一方面,这种数据结构模型显然有自己的逻辑,比如你提到的外向程度(Out-Degree)——A事件“导致”或“引发”B事件作为选择判断标准——在这个研究里,究竟什么被界定为“导致”或者“引发”呢?
Siqi:这个“导致”和“引发”应该就是研究者去看那个村庄志,然后自己手动编码(Code)出来,一个事情在前,一个事情在后,然后在村庄志中有叙述前一个事情导致了后一个事情。这个编码过程未必和历史学家的有什么大的不一样,不一样的是最后怎样让主线浮现出来,是由人来解释、选择,还是由网络方法来计算出来。
Wei:原来如此,可以看到在这个过程里不同方法其实是相互沉浸的。
这个例子让我最先想到的其实是块茎(rhizome)比喻。德勒兹和瓜塔里他们批判说现代知识模型往往是树状的(arborescent),从根到枝到果,一种线性的等级结构;他们提出“块茎”,分散的网络,其中每个节点都可以有异质性表达,因此网络连结的内在多样性不能被简化成二元的或有等级的关系。这样可以观察到的是去本质化的、流动的、异质的各种组合(assemblage),比如黄蜂与兰花——成为兰花生殖部分的黄蜂、成为黄蜂仿像的兰花——就“涌现”为一个共生单位(emergent unit)。也是类似你刚才用的这个词,emerge(如果咱们允许算英译的话)
Siqi:是的,emerging也是复杂科学的关键词,最近信睿周报出了一整期叫“21世纪为什么需要复杂科学”,也在讨论网络方法作为建模手段。
Wei:哇是的,涌现(emergence)是当代很多学科的重要概念,在不同语境里的理解和使用恐怕非常不一样;但它们可能在共同说明的,是关于系统/网络的异质性和不可还原性的认识。
回到块茎比喻,在非常大而化之的意义上说,这种思考在当代人文学科中一直有很多共鸣。以人类学为例:不仅有无数的强调去本质主义的讨论(比如Strathern强调关系而非身份),甚至还有人类学家讲要“拒绝让理论妨碍民族志”(Biehlo 2013)。这些由来已久的趋势和你提到的研究的相似之处在于,都在试图打破知识体系内固有的界限和范式。
但是,比尔曼的文章对我来说有意思和不一样之处在于,不只是研究者本人在有意识地进行打破再组合,还有一个分析工具,协助研究者看到可能自己之前难以看到的关系和线索——这种计算社会学工具,提供的似乎是意料之外的收获。这和人类学家在理论指导下的打破与反思有所不同,但是又和人类学倚靠“其他”视角和经验的核心方法,有可比处。
你前面提到与比尔曼的合作让你在对社会网络的理解有质变,第一个例子已经非常有趣,能不能再多讲一讲你说的思考方式的转变?
Siqi:刚才那篇论文的开头引用了普鲁斯特的一句话:“真正的旅行不是用同一双眼睛掠过一百片不同的土地,而是用一百双不同的眼睛去观看同一片土地。”这句非常好地说明了你讲的“可比处”,也是网络分析方法的意义,它就是在提供一双新的眼。
比尔曼本人就还有很多有意思的研究,另一个历史学研究的例子(Erikson & Bearman 2006)里, 他们把航海地图上的每一个城市当作一个节点(Node),两个城市之间的航线当然就是一条边(Edge)。这样分析航海日志之后,发现了一个社会网络,是否也很有新意呢?最后,作者还发现了当时东印度公司的船长们为了接私活,去了一些公司没让他们去的偏远的地区。这个做法看似是个人利益驱动,却无意中拓宽了世界航海地图,促成了全球化的发展。另外他还跟人合作过关于政治科学的研究(Rule et al. 2015),分析了美国历届总统的国情咨文(state of union address),把每个词作为一个节点,两个词如果出现在同一篇文档,就给它们一个边(edge),这篇是比较典型的语义网络(Semantic Network)分析。
通过上面我解释的几个例子,我觉得比尔曼的作品特别能说明社会网络分析不仅仅是一种技术,而是一种思维模式,把本来看似不是社会网络的东西想象成一个社会网络。那么航海日志、乡村的历史、总统的演说,什么都可以成为能用社会网络来分析的数据,这样做最直接的好处就是能够让这个方法为不同领域的不同话题都作出贡献,尤其是可能启发新的理论假设。
他大概是一个特别有所谓“社会学想象力”的社会学家。在现今身份政治(identity politics)盛行的社会科学里面,他是少数不是一上来就开始找性别、种族、阶层差异的人。不是说这些不重要,但是如果所有的社会学研究都只是关于族群差异(group differences in SES/outcomes),那自然就没有真正的理论创新。
这就又回到一开始讲的,新数据和老数据的不同。这些关于社会经济地位的群体差异(group differences in SES)是传统的统计分析对象:每个人是一行,每个变量(性别、种族、阶层就是每个人所拥有的人口学变量, 收入、职位等等则作为他们的因变量)是一列,并没有考虑任何人与人互动和相互影响(也就是社会网络里面的“边”)。为什么呢?因为只是看他们性别、种族、阶层这三个变量的差别,本质上还是把他们看成单独的个体,恰好他们有相同的人口学特征罢了。这么看是不是很有问题呢?这不是恰恰错过了社会学的“社会”二字了吗。
比尔曼以前在北卡罗来纳大学教堂山分校的时候,还只是助理教授,但是为了在调查数据里面实现社会网络的分析(当然,收集长期性的健康数据也是目的之一),非常冒险地提出要收集新的全国代表性数据。在助理教授阶段大家都求赶快发表,求稳妥,收集数据可能会发表得很慢,因为人家都用现成的数据,你从零开始收集。他没理会,还是去大写特写经费申请,申请收集新数据,于是就有了如今美国社会科学界最被广为利用的数据之一,全美青少年至成人健康追踪调查(Add Health)。
这个数据以健康相关的变量出名,但是另一个突出的特色就是,要求每个学生(被访者在第一阶段的时候是初高中生,在校为主)在自己学校选择若干男孩和女孩作为自己的好朋友。一旦有了这个朋友圈数据,那么就好办了,因为这些朋友个体的数据也在学校里被收集过了,那么这个网络里面有谁,他们各自的背景就都有了。这样的社会网络数据在问卷调查中极少被收集,所以虽然这个数据是健康为主的,但后来很多其他领域的人会为了其中的社会网络元素来使用它,比如犯罪学(是否青少年容易被同伴影响而犯罪), 教育学(big fish little pond,在有众多的高学业成就的同伴的班级中,个体的相对学业水平就显得低,造成许多不良后果)。也就是说,社会网络并不是非要大数据,问卷调查里面也能搞。关键是有没有这么一个数据结构存在在你的数据里。
另外,很多人觉得定量是很“科学”的,而很科学的意思是很价值中立,很客观(Objective)。其实不然。我相信结绳志很多读者了解科学史,读过布鲁诺·拉图尔 (Bruno Latour),都知道科学研究中所涉及的社会性因素,比我更了解这些。回到Blocking the future这篇,历史学家的理论会影响他们对分析案例的选择,而用社会网络方法可以打乱这种选择,用另一种逻辑使得重要的事件浮现出来。但这种逻辑本身也是一种选择。这篇文章的新颖之处在于新的网络和新的选择,而不是说这种选择就是唯一正确的“科学”。
理论与数据之辩
Wei:你提到拉图讨论的科学的建构性,确实可以帮助理解,为什么固有的知识范式有必要被不断反思和打破,尤其行动者网络理论(Actor–network theory, ANT)本身就是在要求重新织网。
但接下来,我想转而强调批判和解构的另一面:万物皆可打破,但打破了,然后呢?要是这样建构也行、那样建构也行,解释和理论究竟如何可能?一个可能与计算方法更相关的例子是我们当年的社会统计学课,陆康强老师最爱说一句话,“统计学是个聊胜于无的东西”——他当然不是说统计无用,而是在提醒我们所谓“真实”的数据可以被各种方式操纵,得出各异结论;就像他另外一句反复念叨的名言,“数据任人打扮”。
我很好奇,对这类总是萦绕在人文社科研究者脑门上的怀疑和焦虑,计算社会学会怎样回应?
Siqi:大数据因为体量大,经常你发现所有变量都是显著的。因为统计学的规律就是你增加N会增加P值显著的可能性。所以更加验证了陆老师的话哈哈哈哈。现在最热门的机器学习(machine learning)做的很多事情其实是描述、预测,但很少是解释(Interpretation), 这也是为什么我们仍然被需要,因为他们不能代替我们来解释。我们的解释还是建立在我们学科几百年来发展出的一套思维中。
Wei:等一下!N值好说,就是统计量,但以防大家不熟悉统计学的假设检验,请先解释一下什么是P值。 Siqi:啊什么是P值,本来要好几堂课解释的,现在要迅速解释其实还挺困难。我尝试一下: 假设我们要检验一个硬币是不是真的扔出去结果是随机的,还是做了手脚。如果真的是随机,那么扔到正面还是反面的概率都是0.5,这就是我们的零假设(硬币结果是随机的)。 如果我们扔了10次,有7次正面,我们就会开始怀疑是不是太多次正面了,硬币动了手脚。7次这个数字是一个比随机状况下更加“极端”的结果,8次9次10次正面则是更加极端的数字。根据正态分布,扔10次出现8次正面的概率是5%(单侧),也就是你如果扔出一个8或8以上的正面次数的概率是小于5%的极端案例。 那么当你真的随手一扔扔出了9次正面,那么你的P值就小于5%,也就是一般可以接受的显著P值,可以否定零假设,并认为这个硬币做了手脚。 Wei:好的!那我再重述一遍来对接下文:如果我们的理论假设是“硬币正反概率各半(硬币没有做手脚)”,然后我们扔出来却发现十有八九都正面朝上(即P小于0.05,P值显著),那么我们就觉得这个结果恐怕不是出于偶然(即这个差异具备统计学意义),我们需要推翻一开始的那个理论假设。 Siqi:至于怎么解释呢,怎么对待数据呢,有一篇很厉害但没什么人注意到的论文,埃里克·莱弗(Eric Leifer)的“Denying the data”。在这篇论文中,莱弗认为社会科学的问题在于,处理数据时过于被动(passive)。如果P大于0.05那么不显著,就认为是否定了理论假设,那你是否就要放弃这个假设呢? 大多数人可能回答,应该得放弃吧,因为都不显著啊。但是成熟科学(accomplished sciences)——这篇文章认为社会科学不属于成熟科学——反而会“拒绝数据”,反而更重视使用理论来选择和强调新的现象和解释。
社会学的难点在于(1)一个事,它P值不显著就代表它一定没发生,一定没有效应吗?难讲。(2)一旦你纯粹让P值说话,那就相当于把观察到的现象放在比逻辑更高的位置,很多没逻辑的东西P值也能显著,例子太多不胜枚举。而许多自然科学家,无论证据(evidence)如何,就是选择相信自己的理论,必要时甚至拒绝与自己理论不符的证据。这文章里面的例子是, 伽利略说自己没有进行实验,但是自己不需要,因为自己肯定理论是如此的,不可能有别的情况.
为什么会需要“拒绝证据”呢?因为否认某些观察有时可能意味着人们找到了一种新的方式来组织现象并产生新的效果。任何理论按道理都能被证伪,所以你发现了不符合理论的数据那并不奇怪。在无菌的实验室环境你都能经常发现不符合理论的数据,还别说在社会科学中了。然而在社会学中,大家倾向于把不管是什么观察发现都接受为自己的数据, 什么都能推翻你的理论。(所以说他这篇文章发出灵魂的拷问:为什么不考虑在一些情况下拒绝数据,尤其是噪音很大的数据?)
如果你一再用数据拒绝(deny)你的理论,而从来不反过来选择性地用理论拒绝你的数据,那么你就很难创造出和目前你所能观察到的世界有距离的理论。所以说,谨慎拒绝数据也是有必要的。(Siqi强调:注意这里说的不是故意挑选自己喜欢的、有利于自己的数据来造假!)
Wei:尽管当代文化人类学可能不再会追求成为“成熟科学”,但你说的这个数据和理论的关系,除了是关于如何建构理论,对思考现代知识论来说也非常重要。以我们刚才提到的拉图为例,他自己就谈过对所谓批判理论的误用和滥用可能导致阴谋论和虚无,我们不应该不假思索地接受所有“事实”,而应该培养从“关切”出发的现实主义。
如果来做个小结,我们这一部分说的是“拒绝数据”——不要被各种各样的数据和信息带着乱跑,而要主动地、关切地处理数据;上一部分说的却是“拒绝理论”——不要让固有的理论范式限制住自己的观察,新的方法可能带来新的发现。虽说拒绝这个拒绝那个,但可以看出来,这些社科人文的思考者们不是要我们跌进怀疑和空虚,而是要求我们重视新工具、发展新思考。
最后我再问一个关于计算社会学的学科环境问题吧,你之前提到现在这个领域的女性研究者相对较少。在研究者本身的构成与学术兴趣上,计算社会学领域有什么特点吗?
Siqi:网络分析确实是社会学中男性主导的子领域,可能与它起源于计算机科学、图论等领域有关,延续了相关领域的性别化特点。有一篇讨论科学中的交叉不平等(intersectional inequalities)的论文,是一个更成体系的分析(Kozlowski et al. 2022)。虽然它没有讲是不是女性做计算社科比较少,但提到了交叉性的不平等现象,比如社科研究中,女性更多地研究家庭和性别相关的话题,而这些主题通常不被视为该领域最负盛名的主题(引用不高)。
下面这个图,就是一个直截了当的展示。这四幅图分别对应不同种族的研究者。Y轴是研究这些图中所示的话题的女性研究者比例,所以话题越女性化,它的Y值就越高。明显可见,最高的Y值出现在性别暴力、家庭、教育这几个话题上。但同时我们也可以看见,这几个话题的数据点颜色都是偏绿色的。根据下方图示,偏绿色代表被引用次数偏少,也就是做这几个话题在学术界影响力有限。那么什么话题影响力大呢?偏红色的点。如果我们去寻找偏红色的点会发现,公司、证券这两个金融的话题最“红”, 而不难注意到,它们同时也有着最低的Y值 – 女性研究者很少。
人类学被反问
Siqi:我也有想问你的问题!其实人类学的很多田野笔记, 如果数量足够多,按道理也是可以使用自然语言处理(Natural Language Processing, NLP)方法来分析的。你作为人类学者怎么看NLP,你觉得在你们学科是否有前景?
Wei:第一个念头是:NLP来帮我写论文吧!虽然这是个玩笑话——我也相信人类学应该会是最晚被电脑取代的工种之一吧——但现在的机器学习模型的能力已经非常惊人(参见文末彩蛋),而且我们早就生活在一个被各种算法所制造的世界之中,人类学不接触它是不可能的。
具体来说的话,(美国体系)人类学大类中的生物人类学和考古等分支已经在广泛运用各种计算方法,比如我有一位同学研究坦桑尼亚塞伦盖蒂的狒狒,就用机器学习模型分析了几种叫声的音波特点。而和NLP互动最多的肯定是语言人类学家了。至于文化人类学,我注意到各类算法是很多人类学家关注的研究对象,但是作为文化人类学家自己的研究工具的,好像还不多。
作为研究对象,像按语里提到的,文化人类学的“整体”视角会特别关注技术是怎样生成于、反映、影响我们的社会与生活现实,比如会研究“编程自由”和黑客政治(Gabriella Coleman),讨论音乐推荐算法(Nick Seaver)等等。
作为研究工具,其实类似NLP这样的分析办法,当然也可以被人类学家所用,尤其是在处理比如像网络媒体上的海量数据信息,它可以很快地提供一些人力难及的视角,协助我们思考切入点。研究儿童认知的人类学者许晶,就在思考使用相关方法分析她从前辈人类学家继承的几千页田野文本。
另外,我自己也在想,所谓的“大数据”时代,究竟会不会对人类学(总是饱受争议但也从未被真正挑战的)民族志田野方法造成更深刻的影响。我自己没有答案。但在思考你这个问题的时候随手搜到一篇好玩的论文(Munk et al. 2022):作者们将计算方法与格尔兹的阐释人类学并置,设计了一场“给计算人类学的图灵测试”。他们训练出模型,让它学会分辨脸书上的各种表情的含义(比如一个“哈哈”究竟是高兴还是讽刺),并与人类被试的理解相比较;想用来对应的是格尔兹的“眨眼“阐释(是肌肉抽搐、别有暗示、还是模拟)。在被设计的场景里,机器学习模型既是在预测表情意义、也是在模拟试图理解脸书文化的人类学家(见下图)。虽然与社会文化现实相比是极端简化的语境了,但也是关于计算方法与人类学家工作的有趣探索。
Image 来自相关论文的表格(Kozlowski et al. 2022),显示出该实验在考虑如何模拟人类学家工作
Siqi:图像识别研究确实也有类似的项目,研究微笑的弧度之类,看你是真笑还是假笑。那我还有一个追问:周末下午我听了一个伊隆·马斯克 (Elon Musk)的访谈,他说,你没意识到吗,每个人现在都已经是赛博格了,因为你的手机就是你身体的延伸,只不过现在二者的连接靠的是你的手指,在屏幕上点击,这个效率很低,如同你用特别细的吸管喝水一样。未来赛博格不就是要解决这个速率问题吗,让你”大口喝水”。我当时听了觉得有点惊悚,我自己没意识到我已经是赛博格了?!现在人类学前沿对这个问题的研究大概是什么样的呢?
编注:赛博格(Cyborg= cybernetic + organism),是指机械和有机生物体混合的生命状态。
Wei:人类学家会说:别听马斯克了!我早告诉过你了!哈哈哈哈哈这不是吓唬人,唐娜·哈拉维(Donna Haraway)就是在四十年前发表《赛博格宣言 (A Cyborg Manifesto)》(1985)的。这个宣言的主旨是倡导一种反本质主义的女权主义,她认为西方科学与政治的传统始终是关于边界的战争(border war),而主动成为“赛博格”其实是一种比喻,强调的是要积极打破父权制所建立和不断加固的这些边界和对立。但是赛博格在她那里也并不只是隐喻,哈拉维讨论的基础是,所谓人与非人的各种混合早已是我们不能不承认的生命状态了。我翻出来她的宣言里专门讲人与机器的这两句——“二十世纪末的机器已经使自然和人工、思想和身体、自我发展和外部设计之间的区别彻底模糊了,还有许多其他曾经适用于生物体和机器的区别。我们的机器活泼得令人不安,而我们自己却可怕地惰性十足。” (Siqi:想到另一个科技届大佬 Kevin Kelly的《科技想要什么》一书中的类似论断。)
《赛博格宣言》本身也是建立在科学技术研究、女权批判、生物学、人类学等等多领域研究之上的。对于人类学来说,“赛博格”可能从来都不是一个新问题,因为“何以为人”本身就是人类学不断在问的核心问题,人与非人(机器、动物、生态等等)的关系与相互“成为”也是许多研究的共同关注。关于人与科技交融状态的具体探讨,我不是这方面的专家,没法做出最准确的前沿研究推荐。我一时能想到的是有两个方向特别值得关注,一个是医学人类学,有很多对具体医药技术的研究,比如人造耳蜗、义肢、百忧散、辅助生殖等等等等,这些研究都在不断拷问对身体、对人类的界定;另一方向是关于基础设施(infrastructre)的人类学研究,不管是互联网、媒体、通讯、道路、水电,这些都是人类生活之基并且已经成为我们身体存在的方式。我有一个同学研究土耳其的金融市场,交易员们的身体和他们眼前的屏幕之间的关系,就是她一个特别精彩的章节。
当然人类学里关于“新人”的讨论其实不囿于话题和领域,包括医学人类学和基础设施研究也是交织的。说到这里,我想起刚看到的一个段子,讲的就是医学基础设施造就的赛博格:因为近期核酸检测要求变高,有的地方要求每天测,不测的话就有可能因为被赋黄码而无法出门,于是有网友非常精准地感叹“没想到人的存在也有保质期了,还这么短,只有24小时”。只要体验过这种存在状态,相信一定能理解为什么说我们早已成为赛博格。
最后回到哈拉维的那句话吧,现在看来并不过时:我们早已成为赛博格,我们每天都能看到机器们生机勃勃,我们拥有的办法和技术日新月异(像我们今天聊到的),我们遇到的问题却也越来越多、越来越新(像拉图说的那样),我们不能再惰性十足啦。
消息结束/*
故事代码: 32401