由中国合肥的Xindong Wu 教授领导的研究团队开发了一种无监督实体对齐框架,以改进在人工智能应用的多个知识图中搜索相关信息的过程。该框架汇集了多种方法的优势,避免了依赖人工来启动对齐过程。他们在几个跨语言数据集上测试了他们的框架并测量了结果,并将它们与其他 14 种机器学习算法的结果进行了比较。他们的模型在两个不同的指标上优于大多数竞争对手,并且在将这些指标组合成总分时得分高于所有竞争对手。

新框架引导处理AI应用程序的知识图

该小组的研究于 5 月 5 日发表在科学合作期刊《智能计算》(Intelligent Computing)上。

这个名为 SE-UEA 的新框架在精度和召回率方面的得分高于 14 种竞争算法中的 12 种,其中一些是受监督的,一些是无监督的。它在所有三个数据集上的总体得分都更高。测试框架的健壮性和可扩展性的实验也取得了令人鼓舞的结果。

新框架的一个主要优点是它不需要人工费力注释的复杂数据集。它可以自动处理缺失信息的数据集,并合并具有不同内部结构的数据集。因此,定量研究结果表明,结合使用相对简单的自动处理知识图谱的方法来引导更复杂的知识图谱不仅方便而且有效。

未来的研究可以通过调整框架的两个模块中的一个或另一个来进一步提高框架的效率和准确性。

该框架的两个模块一个寻找表面相似性,另一个寻找实体之间关系的相似性。两者都使用了一对知识图谱。在这种情况下,这对由两种不同语言(英语和日语、法语或中文)的相同内容的知识图谱组成。数据集由DBpedia根据维基百科内容构建。

第一个模块寻找的不是一种而是三种不同的表面相似性:两个知识图中的相同名称、相同含义和相同位置。重要的是,该模块的输出用作第二个模块的输入,第二个模块使用一种称为图卷积网络的神经网络来自动检查两个知识图的内部结构以发现相同实体对。

在该框架分析了每对知识图并生成了一对相同的实体之后,研究人员能够根据作为 DBpedia 数据集的一部分提供的正确答案检查其工作,并根据他们选择的评估指标分配分数。

尽管知识图对于推荐系统等人工智能应用至关重要,但知识的每个结构化表示通常都是不完整的。因此,希望通过称为实体对齐的过程组合来自多个知识图谱的信息。

最直接的匹配方法是比较实体名称等表面属性。更复杂的方法可以获得更好的结果,但通常需要必须首先手动创建的详细输入数据。