虚拟座谈:采用大语言模型时应该注意什么 诺贝尔文学奖消失之年,瑞典文学院发生了什么?
虚拟座谈:采用大语言模型时应该注意什么 诺贝尔文学奖消失之年,瑞典文学院发生了什么?,
虚拟座谈:采用大语言模型时应该注意什么
作者 | Anthony Alford, Meryem Arik, Numa Dhamani, Maggie Engler, Tingyi Li
译者 | 平川
策划 | Tina
本文要点
选择基于 API 的模型还是自托管模型:API 解决方案更简单,方便早期快速迭代,但长期来看,自托管模型在成本和隐私方面可能更有优势。
在对模型进行微调之前,请先尝试提示工程和检索增强生成(RAG)。
在任何情况下,比较小的开放模型其性能可能都无法与 GPT-4 等大型封闭模型相提并论,但对于许多任务来说,它们往往已经足够出色,所以值得尝试。
幻觉是一种常见的 LLM 风险,但使用依托可信来源的 RAG 可以很好地缓解这一风险。
在采用 LLM 时,组织应在员工教育和培训方面进行投资,尤其要关注模型的能力和局限性。
本文是 “生成式人工智能实践应用”系列文章的一部分,我们介绍了领先的 GenAI 从业者实际采用的解决方案和做法。
简介
大语言模型(LLM)是一种通用的人工智能解决方案,可以处理各种任务:回答问题、总结长篇文档,甚至编写代码。许多组织都希望采用这种技术,但随着创新步伐的加快,要跟上不同 LLM 的发展速度(每个选项都有自己的优势和风险)可能会很困难。
大多数人都熟悉通过 Web API 提供的大模型,如 ChatGPT。许多人也熟悉与这些模型相关的风险,如可能产生 “幻觉 ”和隐私问题。他们可能还知道,需要 “提示工程 ”才能从模型中获得最佳结果。但是,他们可能并不了解都有哪些模型可供选择或最佳实践。
在我们的虚拟座谈中,我们将讨论人们在采用 LLM 时应考虑的一些问题,以及如何针对具体的用例做出最佳选择。
虚拟座谈嘉宾
Meryem Arik:@TitanML 合伙创始人
Numa Dhamani:@KUNGFU.AI 首席机器学习工程师
Maggie Engler:@Inflection LLM 工程师兼研究员
Tingyi Li:@AWS 企业解决方案架构师
InfoQ:与 “本地 ”或自托管模型相比,在选择基于 API 的模型(如 ChatGPT)时有什么指导性原则吗?
Meryem Arik:关于应该使用自托管模型而不是基于 API 的模型,我们在最近的一篇博文中介绍了几个主要原因。首先是控制和数据隐私。对于很多企业来说,他们的 LLM 应用程序会接触到相当敏感的业务数据,因此对他们来说,控制可以看到这些数据的模型可能非常重要。
第二,可定制性。当使用自托管模型时,你可以控制模型中的所有权重。也就是说,你可以按照自己的意愿对模型进行微调或调整。即使是比较小的模型,这也能带来更好的结果。
第三,成本和可扩展性。诚然,在实验阶段,基于 API 的模型往往更便宜,因为不需要构建自托管的基础设施。但是,在大规模应用时,使用高效推理技术栈进行自托管往往成本更低,可扩展性更好。
现在,Llama 3 等开源模型已经问世,我们几乎没有理由不建设自托管能力。Llama 3 与领先的基于 API 的模型不相上下,但它有一个额外的好处,就是可以在自己的环境中进行私有部署。即使不是所有的应用程序都使用自托管模型,每个企业也都必须建设自托管能力,否则真的会错失良机。
Numa Dhamani:在决定是采用基于 API 的模型还是本地或自托管模型时,有几个关键的因素需要考虑。首先是数据隐私和安全。使用基于 API 的模型可能会将敏感信息暴露给服务提供商。如果你的数据包含专有或敏感信息,这可能会是一个问题。另一方面,本地模型部署在组织自己的基础设施上,你可以保留对数据的控制。因此,对于医疗保健和金融等受数据隐私监管的行业来说,本地模型是更好的选择。
此外,成本和资源分配也是重要的考虑因素。在开始阶段,基于 API 的模型在运营开销方面往往更划算,因为你是按使用付费,避免了与基础设施设置和维护相关的费用。此外,它们通常也更容易集成和使用。有的组织没有能力或意愿管理人工智能系统所依赖的复杂的基础设施,对于他们来说,基于 API 的模型往往是理想之选。
不过,虽然在初始设置和持续维护方面,本地模型需要更多的资源,但长期来看,它们可以节约成本,并提供更大的灵活性。对于广泛并持续使用模型的组织来说,这尤其有利。本地托管还可以减少延迟,因为数据不需要在互联网上传输,而这对于时间敏感型应用来说至关重要。最后,依赖 API 模型可能会面临与服务可用性以及条款或定价变化相关的风险,从而影响长期规划和运营稳定性。
Maggie Engler:大多数企业首先关注的是构建和维护成本。原创设两种模型的规模和功能大致相同,基于 API 的模型在配置时所需的工程资源更少,而负载管理和扩展通常由 API 提供商负责。考虑到服务基础设施的成本,按 API 调用付费可能是值得的,尤其是对于探索性项目和概念验证而言。
对于长期、大批量使用,自托管模型可能更划算,而且对性能和延迟的控制能力更强。此外,对数据隐私和安全要求较高的组织也可能会选择使用自托管模型,以避免与第三方提供商共享数据。
Tingyi Li:要在基于 API 的模型与本地或自托管模型之间做出选择,需要考虑各种因素,包括具体的用例、技术专长、资源可用性和预算。通常情况下,鉴于数据管理、隐私和透明度相关的法律法规要求,处于高度监管行业的公司将不得不采用内部托管模型。
如果你需要大量进行定制,或需要针对特定领域或用例对模型进行微调,那么自托管模型可能更适合你。它让你可以完全地控制模型架构、训练数据和参数。代价是,你需要负责维护基础设施、更新模型并解决出现的任何问题。
对于基于 API 的模型,定制选项可能仅限于提供商提供的内容,但你可以受益于自动更新、Bug 修复和功能改进,而无需为此付出额外的努力,因为这些都是由提供商完成的。
成本也是一个重要的考虑因素。基于 API 的模型通常采用订阅或按使用付费的模式,这可能更划算,特别是对于中小型应用程序而言。但是,随着使用量的增加,成本可能会大幅提高。而使用自托管模型,前期需要在基础设施和持续维护方面进行投资,但从长远来看,对于大流量应用而言,这种模型更划算。
此外,对于实时或延迟敏感的应用,本地托管模型可能可以提供更好的性能,因为这样可以消除网络开销。基于 API 的模型会因网络通信而产生额外的延迟。
InfoQ:在你们看来,什么情况下应对 LLM 进行微调,什么情况下可以使用 “开箱即用 ”的提示工程?
Arik:我建议在进行微调之前,先尝试所有可以替代微调的技术,因为它们的工作量要小得多!可以使用的替代方法包括检索增强生成(RAG)、控制生成和提示调优。
Dhamani:是对 LLM 进行微调还是采用提示工程主要取决于手头的任务。如果你有什么特殊要求,或者需要模型具有高度的特异性,那么微调可能是更好的选择。例如,如果你的企业属于一个有许多专业术语的细分行业,那么你就可以通过微调来调整模型的响应,以适应这些特定的上下文。
与此同时,提示工程更适用于一般的应用或任务,因为它们的定制化需求并不那么重要。如果你更看重的是适应各种任务的灵活性,而不是针对特定任务的深度专业化,那么这种方法尤其有用。
Engler:对于特定的应用,如果你正在考虑使用 LLM,那么你应该有非常明确的成功标准。你应该有一套可以体现用户与模型交互方式的上下文,并在其中定义好成功的响应应该包含哪些组成部分,然后用于评估模型。此外,最好能够以这种方式评估任意模型。
对于许多应用而言,提示工程可能已经足够,而不需要任何额外的微调;恰当的提示可以产生可靠的原始响应,或者,如果有什么特殊的输出限制,则可以对响应进行后处理以满足这些限制。微调能让你对模型的响应进行更精细的控制,但还是应该首先尝试更简单的方法。
Li:没有哪一种情况是必须进行微调的,但有很多情况应该避免微调。根据经验,应先从 “低垂的果实 ”开始:使用 “开箱即用 ”的模型,并及时开展提示工程和 RAG。不用半天时间,你就可以使用私有数据完成针对特定用例的快速概念验证,从而就可以对其在生产中的性能和成本进行粗略评估。
是否进行微调取决于你所追求的投资回报率,即把评估、微调模型的成本和所带来性能提升及为企业创造的商业价值进行比较。
例如,如果你有像 Perplexity.ai 这种由 GenAI 驱动的垂直化产品即服务,或者你希望将 GenAI 作为核心的差异化优势来推动业务发展,那么就可能需要在微调上进行投资。但是,随着 Llama3-8B 等开源模型的出现及其推理能力的提升,一些使用小模型的细分用例可能会变得更为可行并且简单。
InfoQ:对 LLM 的 “民主化 ”,你们有何看法?在某些情况下,开源 / 开放权重的小模型是否已经足够好?
Arik:是的!不止一些:实际上是大多数。现在,Llama 3 已经发布,它输出的结果与许多基于 API 的模型不相上下。因此,几乎没有理由不使用开源语言模型。即使只是作为 “备份”,也应该进行自托管语言模型能力建设方面的投资,否则就是不负责任的,因为那会将大量的控制权交到第三方手中。
Dhamani:毫无疑问,LLM 的民主化有可能促进人工智能领域的创新、降低准入门槛并增加竞争。在某些情况下,小型开源模型就足够了,甚至是有优势的。
对于教育、科研、实验以及计算资源有限的环境,它们尤其有价值。现在,个人和比较小的组织或研究机构也可以探索人工智能的能力,努力减少其局限性,并建立应用原型,而无需像使用大模型那样投入大量的资金。
当然,虽然对于某些任务,小模型已经非常有效,但在处理更复杂或更微妙的任务时,其性能通常无法与更先进的大模型相比。这种时候往往就需要在资源限制和任务性能要求之间做出平衡取舍。
Engler:是的!小型开源模型的功能越来越强大,对于许多用例来说,它们已经足够好了。也有一些用例就是需要小模型,比如在移动设备上运行的 LLM。
我经常与一些提示工程师交谈,他们没有意识到小模型也行,而且可以为他们节省大量的资金。最近,我遇到一位顾问,他正在使用 GPT-4 完成一项任务,而实际上,一个参数少于十亿的模型就能够轻松地完成他的任务。我建议他们使用 GPT-4 标注几千个样例,然后使用这些样例对一个小模型进行微调,以节省推理成本。
Li:无疑,开源 / 开放权重模型有很好的透明度,可以加速开源模型的开发和各种衍生产品的扩散。虽然小型开源 LLM 有其优势,但它们可能并不适合所有的用例。总体而言,我们目前还很少把开源模型与封闭模型相提并论。
不过,并不是所有用例都需要最先进或性能最好的模型。在很大程度上,开源和小型 LLM 的有效性取决于应用的具体要求、资源和限制。在许多情况下,它们可以提供一种可行且易于使用的方法来替代大型专有模型,尤其是辅以精心定制和优化的情况下。
InfoQ:使用 LLM 有哪些常见的风险?该如何避免?
Arik:人们谈论最多的风险是幻觉问题。不过,我认为这不是一个问题,而是一个需要了解的 LLM 特征。如果构建者知道,幻觉是使用 LLM 构建应用程序时不可避免的问题,那么他们就可以努力设计出能够减轻幻觉的系统。
对于减少幻觉,最常见和最流行的方法是 RAG :这主要是指模型能够 “查找 ”信息帮助其生成答案的能力。RAG 的奇妙之处在于,它不仅能让模型实时访问数据,还增加了一个可视层,让用户可以查看模型在得出答案时使用了哪些信息。要了解有关 如何构建 RAG 应用程序的指导性原则,可以看一下我们的博客。
Dhamani:LLM 有若干风险和局限性,必须谨慎使用才能有效地利用其功能。有充分的证据表明,LLM 不仅会继承而且会放大训练数据中存在的偏见。这可能会导致歧视性的做法,使历史上存在的不公正和不平等永久化,尤其是在预测性警务、招聘或信用评分等敏感应用中。减少偏见的方法包括:彻底的偏见审计、使用和记录多样化的数据集以及包容性测试和验证流程。
另一个令人担忧的问题是隐私,因为 LLM 可能会无意中记住并泄露敏感信息。在训练过程中,可以通过隐私增强技术(如差分隐私)来缓解这一问题,如果要进一步保护用户数据,则可以部署强大的数据匿名协议。
LLM 也很容易产生幻觉(即产生似是而非的信息),可以利用 RAG 等技术为它们提供额外的上下文数据,这可能有助于缓解模型的幻觉。
最后,建议使用 “人机环路(human-in-the-loop) ”解决方案,即通过人工智能来增强决策而不是取代决策,这不仅有助于减少幻觉、偏见和其他人们担忧的问题,如劳动力技能退化,还能确保核心点仍在人类经验上。
Engler:实际上,LLM 生成回复时肯定会存在误解。从本质上讲,它们是根据以往的数据预测最有可能的响应。这使得它们很容易编造出听起来很真实但实际上并不准确的信息,并强化偏见。
此外,这也意味着,非常规输入有时会产生意想不到的输出,我们已经看到过很多 LLM“越狱 ”行为,即规避了模型的某些训练,产生不安全的内容。关于缓解措施的讨论,可以写满一本书。但总的来说,这些风险有许多缓解方式,包括从可信数据源检索、针对鲁棒性进行微调以及对输入和输出进行消毒(sanitization)。
Li:LLM 有许多常见的风险,如利用误导信息进行诈骗、滥用知识产权、侵犯隐私、偏见等。也就是说,企业在考虑 AI 系统时要采用一种负责任的管理方式。
有 8 个关键的维度需要考虑,包括:公平性、可解释性、AI 系统的鲁棒性、AI 行为的可控性、数据隐私与安全、执行负责任的 AI 实践、AI 使用的透明度以及安全性(避免滥用和伤害)。为了落实这 8 个方面,就得将负责任的 AI 视为构建模型的公司和使用这些模型构建应用程序的公司之间共同的责任。
InfoQ:要成功地采用 LLM,需要进行哪些非技术性或组织性变革?
Arik:一是整合资源。LLM 很难部署,而且需要大量的资源。也就是说,整合团队之间的资源有很大的价值。与其让各团队单独进行部署,不如让他们专注于构建优秀的应用程序,并共享由中心团队提供的资源。这样既可以更好地利用资源,又可以大大加快开发周期。
另一个是培训。LLM 的行为方式与人们想象中的计算机行为方式大相径庭:它们是非确定性的,有时会犯错误。为此,我们在与它们互动时就需要考虑到这一点。我们建议向非技术人员提供像 Mindstone 这样的优质课程。这样,他们就能更好地理解什么是人工智能,以及如何在工作中利用人工智能。
Dhamani:要在组织内成功地采用 LLM,除了技术部署之外,还必须进行全面的组织变革。首先,需要领导层的支持。这不仅包括在各部门倡导使用 LLM,还包括劳动力培训、实现道德与治理框架,以及培养持续学习和发展的文化。
所有级别、所有部门的员工都应接受有关 LLM 基本知识的培训,包括大体了解 LLM 的工作方式、能力和局限性,以及与 LLM 互动的最佳做法。
实施强有力的道德与治理框架还能确保 LLM 的采用符合公平、隐私和透明度标准,防止潜在的道德和法律陷阱。
Engler:在企业内部,要成功地采用 LLM,就必须对 LLM 的功能和存在的风险(包括幻觉和数据隐私问题)进行培训。但是,LLM 带来的变化可能比人们想象的少:目前,LLM 仍然最适合作为现有工作方式的补充,而不是取而代之。它们可以快速、高质量地完成初稿,解释概念,将更多繁琐的工作自动化。
斯坦福大学和麻省理工学院最近的一项研究发现,LLM 的使用使呼叫中心员工的整体工作效率提高了约 14%,其中新员工的效率提升最为明显;专家员工则没有得到多少帮助。企业在采用 LLM 时,应采取务实的迭代方法,不断进行试验并评估投资回报。
Li:非技术性的组织变革至关重要,它可以最大限度地发挥 LLM 的优势并降低其潜在的风险。首先,组织需要培养一种拥抱 LLM 等 AI 技术的文化。这包括推动各级员工认识、理解并接受人工智能。
如果企业想要安全、负责任地开发人工智能,那么他们就应该采取以人为本的方法,优先培训领导者,推动科学发展,并力求将负责任的 AI 集成到在端到端 AI 生命周期中。他们应实施全面的培训计划,让员工掌握在工作流程中有效利用 LLM 的方法。这涉及以下内容的培训:最佳实践、道德考量以及如何解释和信任 AI 生成的内容。
应围绕 LLM 的使用制定明确的治理结构和政策,包括数据处理、模型部署、隐私保护和遵守监管要求的指导方针。最终,各组织应着眼于制定一个合乎道德的 GenAI 采用框架,以指导组织负责任地使用 LLM,这也符合组织的文化和实践。
此外,FMOps(Foundation Model Operations)需要组织在传统的 MLOps 实践中引入额外的机制,如人机环路、模型基准测试与评估。持续监测和评估对于评估 LLM 的性能、影响和投资回报率至关重要。组织应制定跟踪关键性能指标的衡量标准,征求用户的反馈意见,并随着时间的推移不断改进模型。
小结
我们在虚拟座谈中就几项一般性原则达成了共识。首先,在开始的时候,基于 API 的大型闭源 LLM 是一个很好的实验工具。不过,在许多情况下,比较小的开放模型也是一种可行的解决方案,而长期看来,自托管模型可以节省成本并解决隐私问题。
无论选择哪种模型,当试图改进模型的响应时,提示工程和检索增强生成(RAG)往往是比微调模型更好的选择。RAG 也能很好地降低 LLM 风险,如幻觉。
LLM 为公司和组织提供了一个提高员工效率的绝佳机会,尤其是当这些员工经过培训,了解了该技术的好处和局限性时。不过,企业应该有明确的成功标准,并跟踪模型使用的投资回报率。
https://www.infoq.com/articles/llm-adoption-considerations/
声明:本文为 InfoQ 翻译,未经许可禁止转载。
诺贝尔文学奖消失之年,瑞典文学院发生了什么?
【编者按】
2018年,诺贝尔文学奖并没有如期颁出,因为瑞典文学院深陷丑闻。丑闻的中心人物是让-克洛德·阿尔诺和他的诗人妻子、瑞典文学院院士卡塔琳娜·弗罗斯滕松,他们共同经营着文化沙龙“论坛”,诺贝尔文学奖得主、瑞典文学院院士、艺术界名流都是这里的常客。2017年11月,瑞典最大的日报《每日报》刊登调查报道,指控阿尔诺性侵多名女性;随后,弗罗斯滕松也被揭露涉嫌利用职务之便影响瑞典文学院奖项评选和资金发放……而揭开这一系列丑闻的,正是记者玛蒂尔达·福斯·古斯塔夫松。她的《诺贝尔文学奖消失之日》一书详细记录了这一系列丑闻曝光的过程,本文摘自该书中文版,经出版方授权发布。
瑞典文学院所在地。当地时间2018年5月3日,瑞典文学院召开每周例会,决定延期颁发该年的诺贝尔文学奖
1
当我穿过《每日报》的编辑部,准备从一台黑色的自动售货机上买咖啡时,我的手机因为《纽约时报》(New York Times)传来的讯息振动了一下。上面报道说,一名美国电影制片人被指控性骚扰和性侵。
我只读了标题。这个人的名字我不认识。这天是2017年10月5日。
在我得到这家报社的第一份临时工作之前,我和其他人一样,认为编辑部就在那座钢蓝色的高楼里,到了夜晚,灯光会亮起来,“每日报”和“快报”两组大字的霓虹灯闪烁交替。斯德哥尔摩(Stockholm)是一个以水为主的城市,站在连接各个岛屿的桥梁上,即便是几英里外,也能看到这座高楼。它能被称为“摩天大楼”也说明,在市中心的其他地方,除了黑暗的教堂塔楼外,只有几座建筑引人注目——有三顶金色皇冠的市政厅、斯德哥尔摩电视塔和沾满烟尘的绿松石穹顶的地方法院。
当我在早晨乘坐地铁穿过特兰堡大桥时,我几乎将斯德哥尔摩的所有古迹都尽收眼底,这种景象有时让我觉得这个城市很小,有时又觉得它是巨大的,让人无法进入。
但《每日报》的编辑部不再是在塔楼里,而是在隔壁的一栋平房里。要去编辑部,你必须挤过几道安全门,通过最后一道门后,一个巨大的、不规则的办公室就呈现在你面前了。屏幕上显示着正在进行的广播,在零落的沙发中,人们正在讨论从字体到独家大等各种问题。
玛蒂尔达·福斯·古斯塔夫松
2017年秋天,我担任《每日报》文化版和周末副刊的记者。
几年前,我对诗人和瑞典文学院院士克里斯蒂娜·隆做了一次高调的采访。从那时起,我主要写各种公众人物的肖像,我试图和《每日报》的一位摄影师一起走近这些人物。我们轻声和他们叨叨,去他们的夏日小屋,然后坐在后台等待,也许能得到一张意想不到的照片或一句揭示其内心的妙语。
我不断怀疑这种体裁,但我喜欢这种像是某个人的影子一般,踏入未知房间的感觉。如果不是因为“记者”这个头衔,世界是很少会暴露在你面前的。“记者”就像一道神奇的通关口令。
我从未听说过哈维·温斯坦(Harvey Weinstein)。但《纽约时报》的报道基本是无法忽视的。我手机的信息速递中,很快就涌入了各种照片,显示这位面带微笑的电影制片人几十年来是如何与他那个时代最伟大的年轻女演员一起走红地毯的。
他的手臂搂着众多才华横溢、美得不可方物的女明星的腰,她们个个以一种精准的角度把脸对着镜头,这几乎成了一组公开表现男性权力的滑稽照片。她们就像飘荡的蜉蝣,在他身边变换,围绕着这个似乎从未被自身的衰老影响过的普通人。几十年来,他只是穿着皱巴巴的衬衫直挺挺地站在那里。
这种揭露性报道甚至主导了最严肃的媒体。除了《纽约杂志》2015年令人难忘的封面——这版封面描绘了35名各年龄层的女演员,她们都作证曾被喜剧演员比尔·科斯比(Bill Cosby)下药和利用,并因“非自愿的姐妹情谊”而团结在一起——我以前从未见过这种话题大肆占据媒体。在我的记忆中,在当代被归结为“性骚扰和性侵”的经历,一直都被当作女性的事务。或者是一个工作环境艰难与否的问题,又或者作为某种属于私人领域的东西。对知名男性的指控在娱乐和八卦版上占据主要版面,短文中夹杂着自称受害者的模糊照片,照片中的她或许单手拿着酒杯,在派对上跳舞。
2017年11月22日的《每日报》文化版头版,以18名证人的肖像照为封面,刊登了古斯塔夫松的调查报道
当我开始在接下来的一周关注关于哈维·温斯坦的报道时,我发现报道铺天盖地。受害者的证词揭示了充满魅力的交际照片背后的真相。著名女演员的声音与那些试图打入这个行业的不知名女性的声音交织在一起,她们讲述了这种性侵对她们事业的阻碍,性侵破坏了一个演员必须拥有的完全掌控自己身体的权力。
通过阅读这些女性分享自己最私密经历的故事,我看到了刺眼的闪光灯后,电影界过去不为人知的一面。她们讲述经纪人在不同的酒店房间为其安排会面,助理试图平息她们的怒火,而律师则负责起草保密条款。这些故事也许让我第一次真正了解到世界上最大的娱乐行业的权力运作方式。
我也对调查的悖论越来越感兴趣。几个月来,记者们一直在努力揭开一些在电影界似乎已经是众所周知的事情。然而,好莱坞却处于震惊之中。
在2005年的一段视频中,科特妮·洛芙在红地毯上接受采访。当记者问她对业内的年轻女性是否有什么建议时,她先是嘀咕说,如果她回答的话,她会因诽谤罪被逮捕。我之前从未听过科特妮·洛芙在回答问题时会犹豫并压低声音。然后她飞快地说:“如果哈维·温斯坦邀请你参加四季酒店的私人聚会——不要去。”
我看着2013年奥斯卡颁奖典礼的主持人对最佳女配角的提名者说:“祝贺你们,不必再原创装被哈维·温斯坦吸引了。”
这个笑话很简单,但观众的反应是突然爆发出高亢的笑声——当有人掌握了一个既禁忌又公开的真相时,人们会不由自主地发出的那种笑声。这就是为什么说,终于打破了沉默的说法是不正确的。哈维·温斯坦是电影界最受关注的人物之一。关于这名有权有势的制片人滥用权力的故事已经流传了几十年,而这些耳语和谣言似乎在他本人周围形成了一种特殊的紧张气氛。现在的情况是,他的受害者以前模糊的轮廓开始有了真实的面孔和身体。但最重要的是,人们正在做出回击。不同寻常的是,这条并没有逐渐消失。
我和两位女同事正在谈论我们应该对瑞典文化界的情况做一个大的梳理报道。我们还讨论了一些之前听说过的性侵传闻中的公众人物。但我不愿意调查他们,这主要涉及一个权力问题:他们的影响力还不够大。在聊天中,我写道,像对温斯坦那样的调查,在瑞典是不可能的。这里没有大的资金,各个行业都很小,每个人都或多或少地认识对方。我无法想象,一个人可以用如此系统的方式实施性侵。瑞典文化界也没有人拥有可与好莱坞的大人物相媲美的人际网络。这里没有人可以受到那种梦幻般的、不朽的权力结构的保护。
三天后——也是让克洛德·阿尔诺突然出现在我脑海中的前一天——文化编辑部在沙发上举行了每日早会。我们还能从什么角度来看待美国的性丑闻呢?我们讨论了瑞典的公共领域,每个人都同意,这里肯定也会发生性侵。但五位男记者中没有一个听说过任何具体的案例。他们说不出一个被指控的犯罪者的具体名字。我听得越来越惊讶。我从来没有意识到,许多在理论上了解问题的人,其实在真正的知识上是匮乏的。他们并不知道这些故事。他们和我们在同一条街道、同一个办公室里活动,却有着迥异且有限的观点,原创佛我的经历和其他女同事诉说的经历与他们形成了一个平行的世界。会议最后,我和两位女同事忍不住提到了具体的人名。并不是马上。但当每个人都准备站起来离开会议桌的时候,我们说出了我们所听说的一些男性的名字和姓氏。当时#MeToo标签还没有问世,我们说这些名字更多的是作为一种对现实情况的纠正。不过,听到我们大声说出他们的名字,对我来说还是有影响的。我觉得自己很脏,很清醒。
当地时间2018年9月24日,让-克洛德·阿尔诺现身斯德哥尔摩地方法院,出席有关其性侵丑闻的最后一场听证会
2
2009年6月,我第一次听说让克洛德·阿尔诺和“论坛”。那是一个温暖的下午,在马尔默的莫乐坊广场。我在新港餐厅的阳光露台上,对面坐着拉斯穆斯(Rasmus),我和他是在为学生杂志撰稿时结识的。
他在十几岁的时候就开始阅读各种伟大的经典作品,这让我很羡慕。大约在我中断本科的B类课程学习时,他搬到了斯德哥尔摩,攻读文学硕士学位。现在他正在马尔默短期出差。
坐在新港的露天台上,光线很明亮,他向我介绍了大学的情况,还介绍了一个叫瓦尔堡的郊区,以及“论坛”的情况。
他问我是否知道“论坛”?我摇了摇头。他说,斯德哥尔摩最好的文化场所位于一个地下室里,由受人尊敬的诗人卡塔琳娜·弗罗斯滕松和她的法国丈夫让克洛德·阿尔诺经营。拉斯穆斯已经在那里工作了6个月。
他异常严肃地告诉我,他第一次来斯德哥尔摩的时候感觉很不好。他经常漫无目的地乘坐地铁,作为打发时间的一种方式。有一次他在一个叫奥登广场的车站下车,在扶梯上他突然认出了他大学里的一位男性教授。他向教授打招呼,在他们简短的交谈中,他提到自己刚来这地方。那位教授于是提出,他很愿意把拉斯穆斯介绍给自己的朋友让克洛德·阿尔诺。教授说,“论坛”对年轻人来说是一个非常好的地方。很快拉斯穆斯就开始在“论坛”打义工,他负责在演出后打扫地下室。
当我在近十年后的2018年春天再次回想起新港的时候,很多故事都记不得了。
我记得我没有戴太阳镜,在阳光下眯着眼睛。当时我刚从抑郁症中恢复过来,走出长时间呆在公寓里的状态,我开始回到现实中来,所以对自己的强烈反应感到兴奋。我仍然记得那次谈话对我情绪的影响。但拉斯穆斯那次到底告诉了我什么?他现在还记得吗?我通过Skype询问了他。我们现在仍然是朋友,尽管已经有几年没说过话了。他现在正在美国攻读文学博士学位。
拉斯穆斯
我记得,“论坛”曾是我梦想的全部。所有重要的作家和知识分子都会去那个地下室活动。每个人都是我从初中阶段就崇拜的对象。只要走下楼梯,看到一群文化名人,就是一种“伟大的经历”,这是我读过的书中的景象。世纪之交那一批的小说中,常常描写主人公搬到了首都,突然被扔进一个完全陌生的世界,然后叙述之后的故事。他们在那里就原创佛受到了持续的冲击。就像《包法利夫人》中的艾玛第一次去参加舞会时:她极其留心富人的举止和他们使用的语言。她还很留心他们的美,与年轻无关的美。这种场合使她的感官更加敏锐。在地下室里,我还记得文化部长结束与萨拉·达尼乌斯的谈话,转而与霍拉斯·恩达尔交谈的五秒钟。“论坛”是一个让你获得经验的地方,感觉上很文学。这种经历是如此重要,有一天你可能会亲笔写下这段往事。
当我完成清洁工作后,我被允许来到瓦萨霍夫,那是参与人员和圈子核心人物用来消遣夜晚的酒吧。核心人物通常是让克洛德、霍拉斯·恩达尔或瑞典文学院的其他院士,会请几个音乐家,或是一个戏剧演员,有时甚至卡塔琳娜·弗罗斯滕松自己也会来。我和让克洛德的年轻女助手们坐在聚会的边上,这些助手被称为姑娘们。我有一种感觉,他可以公开地、不被反对地触摸她们。不过我已经不记得具体的情形了。会不会我其实根本没见过这情况?我的经历是否源于让克洛德把自己塑造成一个萨德侯爵的行为,或是我自己感到不适,无法用语言来表达的感觉呢?我不知道。我是唯一一个为他工作的男性。我能进这个圈子,是因为我被看作是一个同性恋,一个基佬。他经常谈到说我很被动。他说,如果我有一天成功了,那要感谢他和这个“圈子”。他经常把“论坛”描述成一种家庭般的存在,因为人不会抛弃家。
去过瓦萨霍夫的晚上,我能记得,我有一种被困住的感觉。但是,当我之后乘坐地铁回到郊区时,我仍然会强烈地涌起一种冲动,我想给别人打电话,告诉他们,说我刚刚和卡塔琳娜·弗罗斯滕松坐在同一张桌子上喝葡萄酒。
我在“论坛”工作了一段时间后,有个年轻女孩开始常来听那儿的古典音乐会。她总是一个人来。她长得很漂亮,也像我一样害羞。这让我立刻为她担心起来。
就好像我和让克洛德待了这么久,我已经能把握准他的目光。因此,在她出现了几次后,我甚至在事情发生之前就猜到,他会在休息时间找她。他走过去,在她耳边说了些什么。她看起来很惊讶。他又低声说了几句,她就起身跟着他进了办公室。中场休息结束,下一首曲子开始演奏时,他就回来了。但我再也没有见到她。
也许我们在马尔默见面时,我告诉过你这件事情。也许我没有。也许我当时只是说,让克洛德身边围绕着很多女孩。但我已经开始感觉到一种恐惧,这种恐惧使我和你在聊“论坛”的时候会加以粉饰。同时,我也希望你能明白,我曾经也是那个圈子的一员。
卡塔琳娜·弗罗斯滕松与让-克洛德·阿尔诺
那晚,当拉斯穆斯和我在马尔默分道扬镳时,天气越来越冷。我对他的故事的某些部分感到好笑,并说这听起来像是对认为所有成功人士彼此都是朋友的那种想法的戏原创。但他描述的地下室是真实存在的,它证实了我对文化界的印象,它确实是一个遥不可及的地方:一个住在斯德哥尔摩市中心大公寓里的人的圈子,那里的楼梯间像教堂一样凉爽和宽敞。
同时,我也想起了我十几岁时想进入这个世界的原因。伴随我长大的基督教会,常常谈论一些最宏大的问题和最宏大的答案。他们相信永恒的生命,在那个时代的视角下,我可以体验到一种被选择的感觉——一种不受当下摆布的安慰和解放的感觉,可以不用被抛弃、不用被扔到当下的感觉。而当我开始对此产生怀疑时,文化作为一种可能的出路出现在我眼前。它成为唯一能衡量我所离开的环境的东西。
我发现,小说和音乐是社会的另一种例外:那是一个允许各种黑暗禁忌的思想存在的空间。我想,那些能把自己的经历转化为艺术的人,一定也会产生被保护的感觉——一种对于比自身更大的东西的归属感。但最重要的是,我对写作的人和文化世界本身有一种浪漫的看法。我想象着,一旦我被允许进入这个世界,那这里也就变成了自由地带。
在我早期发表的一篇文章中,我写到我对瑞典剧院中关于饮酒和性骚扰的辩论感到多么的失望和无聊。我无法忍受自己听到斯德哥尔摩的大演员们否认这种混乱的局面,并立下保证,说他们像其他人一样在5点下班回家,他们“都是在自行车后座架上放着一个儿童座椅的普通父母”。
在2009年的夏天,我知道焦虑往往是写作的阻碍,但拉斯穆斯的故事让我的那些早期的想象变得鲜活起来——并添加了些许不适。
当我穿过莫乐坊广场时,我突然觉得,我应该写一篇关于斯德哥尔摩的地下室的报道。
这个环境是我本来绝不会靠近的,但这项写作任务开始成为我靠近那个圈子的途径,我想着或许我可以在学生报纸上发表这篇报道,或者我可以尝试把它卖给《瑞典南方人报》(Sydsvenskan)。
我从来没有想过,我们谈论的可能是性骚扰。我也没有用这一概念。然而,这个故事包含了一种无力感,我甚至可以在身体层面上感受到,这是因为对颓废的地下室的描绘,对我产生了巨大的吸引力。
我在手机记事应用程序中写下的想法既强烈又模糊,所以当下我没有被触动。但这些想法并没有离开。
《诺贝尔文学奖消失之日》,【瑞典】玛蒂尔达·福斯·古斯塔夫松/著 沈贇璐/译,上海译文出版社,2024年8月版?