正是这种想法,将佩内贝克博士——德克萨斯大学心理系教授引上了一条曲折的寻幽探秘之路。他的研究范围非常广泛,从“披头士”(Beatles)的歌词(约翰·列侬与保罗·麦卡特尼的作品相比,“消极情绪”更多)一直到恐怖分子的通讯记录。通过计算一个人说话时使用各类单词的数量,他为语言研究开辟了一片新天地,学界对语篇分析的热情卷土重来。
佩内贝克博士最近应美国联邦调查局(F.B.I.)的请求,研究了基地组织的通讯记录,包括录像带、访谈录音、信件,他按照词性——代词、冠词、形容词——对单词进行归类计数。
研究发现,多年来,本·拉登使用第一人称代词(我, 我的)的频率保持稳定。相比之下,他的副手,艾曼·扎瓦赫里则使用得越来越频繁。
“词频的显著增加显示扎瓦赫里感受到了威胁,不安全感上升,也许意味着他和拉登之间权力关系的转换。”佩内贝克博士的报告发表于《内容分析解秘》(The Content Analysis Reader)。
计数程序
克里夫兰州立大学通信系教授金伯莱·纽恩道夫(Kimberly A. Neuendorf)是内容分析学专家,她对佩内贝克博士的评估报告表示赞同。她说,扎瓦赫里“很明显对自己进行了重新定位,通过单独的平台发表个人意见,重申自己在组织发展中的重要地位。”
由于大脑的功能限制,人们很难完全统计或比较一篇讲演辞或文章中使用的所有“我”、“我的”等等,为此,佩内贝克博士开发了“语言学研究和单词计数”程序(Linguistic Inquiry and Word Count ,LIWC),该程序包括一部海量词典,每个单词均收录于一个或多个目录下。
目录分为社会类词汇(谈话,他们),生物类词汇(脸颊,手,痰),“思考类”词汇(想,知道,考虑)及其他几十个组别。LIWC将文本模板与内置字典作对照,几秒钟内即可提供每个组别的单词数量清单。
为了测试程序的实用性,作为写作疗法的倡导者——佩内贝克博士组织了一个写作练习小组,参与者都处在重病或精神创伤的康复期。词汇统计显示,在研究过程中,健康改善的人第一人称代词的使用频率降低。
但是,他们使用因果关系词汇,如“因为”、“原因”、“影响”的频率却有所增加。佩内贝克博士的解释是,简单地重复思考过往经历而不试图了解其起因,完全无益于心理成长;参试者使用因果关系词汇则表明他们“正在转换思考的方式。”
佩内贝克博士的大量研究成果显示,重要的不仅是表达的内容,还有表达的方式。传统语言学“更关注实质内容,比如语句的结构和短语的含义。”他说,“我们的方法则只是进行单词计数。”
词汇情绪
经过不懈地研究,佩内贝克博士发现,一向被文字分析学者认为是“垃圾词汇”的冠词和代词在心理学分析中占有至关重要的位置。
例如,他发现男性喜用冠词,女性则喜用代词。这种区别显示男性倾向于具体思考,女性则倾向于从不同角度看待事物。
杰佛瑞·汉考克(Jeffrey T. Hancock)是康奈尔大学通信系副教授,他正在利用单词计数法研究网络语言和骗术。
他说,骗子喜欢使用带有“消极情绪”的词汇(如“伤害”,“丑陋”、“卑鄙”等),并且很少使用第一人称单数。“尽管单词计数法出现前,研究已经进行了40年,但是骗子的伎俩几乎没有改变。”
佩内贝克博士说,这主要因为一个人的演讲模式形同于个人签名,相对固定并且独一无二。他的软件可以鉴定匿名博客和电邮的作者,提供法律证据。但是,他承认由于数据获得基于概率统计,因此不能作为确定依据。
佩内贝克博士还说,“语言世界中,一切皆为可能,但是,现有的法律体系中,每个人对概率都有不同的理解。”
潜藏态度
不过,这项技术仍吸引了多个部门的注意。美国陆军研究所(Army Research Institute)支助佩内贝克博士研究社会动力学(注:研究社会群体交互动力的社会心理学分支)语言,尤其是领导人的语言应用方式。约瑟夫·索特卡(Joseph Psotka)是该所的心理学研究者,他说,这项研究“对军事训练和领导能力培养极有帮助,但是原因和方式仍不得而知”。
LIWC程序已被翻译成多种语言,阿拉伯语版的面世也指日可待。佩内贝克博士表示,由于依赖于英语翻译,他对基地组织的分析存在一定局限性。
“不同语种中的功能词(指前置词、连词等)各不相同,但是它们却可以揭示蕴含的大量文化信息。”他说。
索特卡博士说,将一个外国人使用的单词进行计算、分类,可以帮助研究人员捕捉到“话语中潜藏的微妙态度,而不仅仅是表面意思”,例如谈判或讨论是否进展顺利。
佩内贝克博士还把他的单词计数方法应用于总统竞选分析以及一些存在长久争议的问题,例如莎士比亚的著作有没有共同作者,《联邦党人文集》(Federalist Papers)的作者是谁,依此方法他甚至可以断定一对情侣能否长相厮守。
佩内贝克博士说,“两个人使用语言的方式越相近,他们成为情侣的机率越大。”
