本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台★◆★。申请澎湃号请用电脑访问。
图1 (A)一个密度图,显示具有边际分布的所有主张的共识和认知情况■★■◆★,其中对角虚线表示共识和认知的校准程度。在低端,是由于人群之间的分歧而实际上以随机判断为主的主张;而在高端■★■,是完全符合常识的主张。(B)同样是一个密度图,显示所有个体的共识和认知情况。
图3 个体的常识性★◆◆◆。以个体水平的人口统计属性为横轴,纵轴为常识性◆◆◆。红色条形图示出了总体平均值的95%兼容区间。收入以美元为单位。左列显示分组的数值变量;中间列按值排序显示名义变量;右列显示顺序变量。
首先,研究者通过人们在主张上达成一致的倾向以及对彼此一致的认知◆★◆■■,来定义个体主张和人们的常识性(commonsensicality)◆★。其次■◆★◆◆■,研究者将常识的共性形式化为一个人群与主张之间的二部图★◆■,通过找到团簇来定义常识pq,即由比例为p的人共享的主张所占的比例q。在一个由2■■,046位评价者评估的4★★◆★◆,407个主张的数据集上评估本文提出的框架★■★■,该研究发现常识性与明确陈述的■■■★、类似事实的有关日常物理现实的陈述最为接近。心理测量属性,如社交感知力,影响个体的常识★◆,但令人惊讶的是年龄或性别等人口因素并不影响常识。最后,该研究发现集体常识(collective common sense)很少见:最多只有一小部分人在超过一小部分主张上达成一致。这些结果共同削弱了关于常识的普遍主义信念(universalist )★◆◆★,并对其变化性提出了相关问题,这对人类和人工智能都具有重要意义◆◆■。
图4 常识性阈值。(A)通过ECCDF图显示达到常识性阈值的主张的比例◆★■,按主张引发机制进行着色。灰色虚线曲线表示整个语料库的分布情况。(B)类似的ECCDF图显示达到该阈值的人群比例,按RME得分分为5个桶进行分组。
图5 常识。(A)一个包含3个人和3个主张的信念图,显示每个人对每个主张的信念配置,并附带一个矩阵,显示这个图的形式化表示,其中最大团以灰色标出。人物1和2具有相同的信念配置◆◆★★★,包括对主张A和B的相同信念◆◆◆★◆。(B)在整个人群中对50个主张进行样本调查后◆◆◆,对于p■◆,q所能达到的最大常识值pq。信念配置是通过一个多项式模型(F1=72★◆.7%)对未观察到的值进行预测的。
本文作者的目标是以一种超越个体偏见和不同观点的方式★■,对常识如何被定义、衡量和理解提供全新的视角■■◆,并在本文中通过提供一种解决常识固有循环性的方法,为对这一人类智能基本但难以捉摸的方面进行了广泛的实证研究开辟了道路■■。研究者预计这一工具将在未来的大规模研究中得到应用,进一步促进我们对常识及其在人类和人工智能中的作用的集体理解。
常识的概念在日常对话、政治辩论和对人工智能的评估等广泛的背景中频繁被提及,因此人们可能认为它的含义是不容置疑的。然而令人惊讶的是■★,常识知识的内在属性(什么使一个主张(claim)具有常识性)以及它在人群中的共享程度(它的“共性”)尚未经过实证研究★■■◆。最近一篇发表在PNAS上的文章通过引入一种形式化的方法★■■■■★,在个体和集体层面上实证量化常识来解决这个令人困惑的情况。论文作者之一是美国宾夕法尼亚大学社会学教授、小世界网络提出者之一 Duncan J◆■★■◆. Watts。
图2 基于主张属性的常识性★◆★◆★◆,带有关于平均值的自助法95%兼容区间◆★◆★★。(A)在具有和没有每个二元认识论属性的主张之间,自助法计算的常识性平均差异■◆◆★★。每个主张都有每个属性的值,所以这个面板中的每一行都来自语料库中的所有主张。(B)每个知识类别中主张的常识性,用虚线表示跨类别的未加权平均值★★◆■★■。每个主张属于一个知识类别■★★■,因此此面板中的所有行共同反映了语料库中的所有主张。(C)来自每个来源的主张的常识性。与B类似,整个面板反映了语料库中的所有主张。