同质性是指人类倾向于优先与在某种程度上与他们相似的人互动和联系。换句话说,这是“物以类聚”的理念。虽然传统研究侧重于从双向关系的角度衡量同质性,例如社交网络中由友谊链接编码的关系,但许多人际互动本质上是群体互动,衡量同质性的标准工具不适用于这些环境。

更深入地了解我们如何联系

德克萨斯A&M大学计算机科学与工程系助理教授NateVeldt博士与康奈尔大学的合作者AustinR.Benson博士和JonKleinberg博士开发了一个数学框架,使用超图来衡量和定义社会群体互动中的同质性。

“虽然对同质性的研究已经在帮助我们从双向互动和关系的角度理解联系和互动方面产生了很大影响,但社会充满了多方面的互动,许多早期的社会学研究都集中在理解同质性如何影响群体形成和群体互动,”Veldt说。“为量化群体设置中的同质性提供更清晰的数学测量和计算工具,使我们能够更好地解决研究同质性的原始动机。”

该团队的研究结果已发表在《科学进展》杂志上。

植根于社会科学的同质性之所以受到研究,是因为它是支配人们如何互动、行为和相互联系的基本原则。它还部分解释了我们如何建立友谊,以及我们如何以及为何彼此建立联系。这些联系基于各种因素,例如年龄、种族、性别、教育水平、宗教、志向或态度。

“如果你想到友谊,同质性并不意味着我只与一种类型的人交朋友,”Veldt说。“但是,例如,如果我不成比例地与同龄的其他人建立友谊——比你随机预期的要多——那么你会说我在友谊中表达了与年龄有关的同质性。”

以前的同质性度量使用图形模型进行人类交互。图是一种数学结构,它对一组对象(称为节点)和这些对象之间的一组成对关系(称为边)进行编码。例如,图中的边可以编码两个人是社交网络中的朋友或一个人向另一个人发送电子邮件的事实。

基于图的同质性研究在帮助研究人员理解人类联系和互动方面发挥了重要作用。然而,放眼社会,我们的许多互动都发生在群体环境中,例如参与工作中的协作、社交媒体上的对话或活动中的志愿服务。图模型不包含有关人们参与的群体的规模和构成的有价值信息。

最近人们对使用超图对不同类型的复杂系统和数据集进行建模产生了浓厚的兴趣,超图是一种可以直接编码多向关系的图的概括。超图由一组代表正在研究的内容的节点和超边组成,每个超边编码由一组(可能超过两个)节点共享的多路关系。例如,在编码烹饪食谱的数据集中,每种成分都是一个节点,而食谱是将它们组合在一起的多向关系(超边)。

“我们拥有这些庞大、丰富的现代数据集,它们正在对这些类型的多向关系进行编码,研究人员发现,超图可能是一种非常有用的方法,可以对同时涉及两个以上参与者的交互和关系集合进行建模,”Veldt说。.

使用超图,Veldt和他的合作者开发了一些方法来测量图无法捕获的组同质性概念。例如,他们的框架提供了一种衡量多数同质性的方法,即参与群体互动的倾向,其中至少大多数群体参与者共享某个属性(年龄、性别、政治派别等)。他们应用他们的框架来揭示学术合作中基于性别的群体同质性的自然模式,以及立法法案共同发起中与政治派别相关的群体同质性。

他们的研究还发现,为了正确理解和衡量群体同质性,必须考虑一些独立于人类选择和偏好的数学特性。例如,一些定义超图同质性的方法乍一看似乎很直观,直接概括了图同质性的现有定义,但在数学上是不可能满足的。

“在研究社会互动时,重要的是要意识到你观察到的模式之间的差异,因为数学需要这些模式存在,而你看到的模式是由于潜在的社会学现象,”Veldt说。“换句话说,你需要了解数学才能得出关于社会学的正确结论。”

至于未来的研究,团队可以进入的一个方向是测量互惠的社会机制,即回报利益的趋势。

“例如,如果你回复我的电子邮件,我可能更有可能回复你。或者如果有人送了某人礼物,他们将来更有可能以类似的方式回馈,”Veldt说。“互惠在群体环境中是什么样子的?你如何使用新的数学框架来衡量和研究它?”

除了帮助研究人员更好地了解社会之外,同质性原则对于计算数据分析任务的设计方法非常有用,例如根据对象的关系对一组对象进行分类或预测未来的相互作用。这些超图同质性的新度量的一个希望是,它们将导致在关系和交互本质上是多路的设置中改进这些任务和其他任务的方法。