科学为何无法终结某些争论:当证据遭遇价值观的引力
核心观点
- 许多争论持续存在,是因为其根本问题无法被清晰检验。
- 证据常常能启发辩论,但无法终结它们,尤其是在复杂系统中。
- 价值观塑造了人们优先考虑的结果,即使事实已达成一致。
- 价值观的差异导致了偏见,使得专家们强调不同的研究发现。
当问题无法提供我们期待的确定性
我们倾向于认为正确的数据集应该提供一个清晰、普遍正确的答案。然而,当看到专家们各执一词时,我们常误以为是科学出了问题。真正的症结在于,人们期望某些话题能提供证据本身无法提供的清晰度。
布朗(2025)将科学主张沿两个维度进行了映射:可检验性和价值观对结论的影响程度。这解释了为何有些主张感觉坚实,而另一些则引发多年分歧。
- 高可检验性领域(如材料工程、特定药物试验):结果清晰、无争议,错误能迅速且明确地被纠正。
- 低可检验性/高价值观影响领域(如职场政策、营养学、心理健康干预):系统庞大、证据多变,且人们关心的结果各异。证据很少能产生单一、决定性的答案。它启发讨论,但不终结讨论。
两大核心挑战
1. 可检验性问题 (The Testability Problem)
主张在现实证据能否轻易证实或反驳方面存在差异。以四天工作制为例:
- 组织在行业、规模、人员配置和约束条件上差异巨大。
- “四天工作周”没有标准化定义(压缩工时 vs. 减少工时)。
- 试点项目通常是自愿的,吸引了积极性高的参与者。
- 许多影响是长期的,难以清晰衡量。
如果无法在稳定条件下进行重复的现实试验,证据就永远是暂时性的。 这不是研究者的过错,而是该领域固有的特征,导致结论总是存在争议空间。
2. 价值观引力问题 (The Values-Pull Problem)
我们不愿承认的一点是:我们希望什么是真的,会影响我们从证据中看到什么。
例如,如果你认为现代工作文化有害,人们急需更多休息,你对研究结果的解读会与优先考虑盈利能力和人员稳定性的另一方不同。双方都可以有选择性地引用数据,而技术上并未歪曲事实。在充满价值判断的领域,事实很重要,但框架决定了哪些事实具有决定性。
这并不意味着人们不理性或怀有恶意。人类(包括专家)并非以白板状态(blank slates)面对数据。我们的目标、经验和优先级会影响我们如何定义问题、解读结果。当话题涉及情感或政治立场时,向偏好结论的引力会变得更加强大。
人们常犯的错误
将有限的可检验性和强大的价值观引力结合起来,就会产生一种认知迷雾。主张变得可争议,因为它们混合了事实与判断。然而,我们却不断要求科学在这些领域提供其无法达到的确定性水平。
这种不匹配导致了三种常见错误:
- 期待科学共识,而共识本不可能达成:在可检验、可重复证据的领域(如冶金学、微生物学)容易达成共识;而在职场政策、公共卫生干预等领域则往往不能。当我们对后者抱有前者的期待时,就会将正常的意见分歧误解为无能或偏见。
- 期望p值能解决价值权衡:统计模型可以估计生产率或病假的变化,但它无法告诉你如何权衡这些发现与公平关切、招聘模式或更多休息时间的内在价值。以数学精度呈现的模型,可能隐藏了其结论中内置的价值假设。
- 混淆关于价值观的辩论与关于事实的辩论:人们各说各话,因为他们实际上在回答不同的问题。例如,一人问“这能提升幸福感吗?”,另一人问“这会威胁企业生存吗?”。双方都可以引用证据,双方都可能正确,但回答的并非同一个问题。
分歧揭示了什么
当我们在工作安排、营养、压力或公共政策等话题上看到合格的专家(legitimate experts)争论时,我们倾向于认为科学本应产生更清晰的答案。实际上,分歧往往揭示了一个有用的事实:我们正身处一个证据有限、可检验性差、价值观起主导作用的领域。在这些领域,分歧是特性,而非缺陷。 科学可以启发对话,但无法解决它。
应对策略:几个简单的启发法
对于处于简单经验真理和纯粹观点之间的主张,可以借助以下方法:
- 询问主张的哪一部分是可检验的。
- 询问是谁的价值观定义了成功。
- 对过于自信的断言保持怀疑。
- 预期分歧会持续存在。
这并不意味着我们应该抛弃科学证据,或认为所有结论都同样有效。它意味着我们需要更精确地识别我们正在处理的是哪种主张,并更诚实地面对我们的价值观在解读结果时所扮演的角色。
结语
四天工作制之争并非特例,它只是一个更广泛模式的清晰例证:许多我们最关心的问题,恰恰处于科学能提供一些洞见但无法给出决定性结论的领域。 问题始于我们假装并非如此。如果我们能认清可被清晰检验的主张与必然混合了证据与价值观的主张之间的区别,我们就能少花时间臆测他人的无知或恶意,而将更多时间用于进行我们真正想要进行的对话。