负责根据搜索意图解释搜索词,而BERT负责根据搜索查询的语义主题分类解释搜索词。同时使用NLP(BERT)和向量空间分析(Rankbrain)。搜索查询是否具有实体引用的程度也至关重要。这决定了知识图谱中信息的影响力有多大。
实体正日益成为 Google 索引中的
核心组织元素。只要搜索查询与实 手机数据 体相关,Google 就可以通过知识图谱快速访问有关相关实体及其与其他实体的关系的所有存储信息。不参考知识图谱中记录的实体的搜索查询将按照经典信息检索规则照常处理。但是,只要搜索词包容相关性的含由主语、谓语和宾语(三元组)组成的初始语法结构,谷歌现在也可以使用 NLP 来识别知识图谱中没有的实体。
我认为未来经典的 Google 搜索索引和知识图谱之间将通过接口进行越来越多的交换。 知识图谱中包含的实体越多,对 SERP 的影响就越大。正如本系列其他文章中所提到的,谷歌仍然面临着协调完整性和准确性的巨大挑战。
对于 Hummingbird 的实际评分来说,文档级容相关性的别的实体并不起主要作用。相反,它们是搜索索引端形成无加权文档语料库的重要组织元素。 Hummingbird 根据经典的信息检索规则对文档进行实际评分。然而,在领域级别,我发现实体对排名的影响要高得多。关键词:吃——但在下一篇文章中会对此进行更多介绍……
最后,我想讨论一些在研究过程 英国脱欧五周年 中特别引起我注意并支持上述方法的谷歌专利。列出的所有专利仍然有效,有效期至少到 2025 年,并且均由 Google 签署。
根据实体指标对搜索结果进行排名
该项谷歌专利于2017年12月转让给谷歌,并于2019年进行了更新。我认为这是最令人兴奋的专利之一,因为它描述了如何根据知识图谱中的数据对搜索结果进行排序。它描述了知识图谱的世界与经典搜索索引之间的桥梁。
第一步,根据搜索查询确定知识图谱中最相关的两个结果。这些结果只能是实体。为这些实体确定了第一组指标。这些指标可以完全独立于搜索查询来确定。从第一个实体中选择多少个指标以及从第二个实体中选择多少个容相关性的指标取决于两个实体与搜索查询的相关程度。知识图谱中的相关性分数可以在这里发挥作用。
下一步,确定两个实体各自的实 007 厘米 体类型。这些指标容相关性的根据实体类型加权。例如,对于实体类型“人”而言,属性“职业”可能比属性“国籍”更重要。
可以使用不同指标的组合,例如
- 亲属关系度量
- 实体类型指标
- 贡献指标
- 价格指标
可以根据搜索查询中包含的实体与容相关性的网页上实体的实体类型的共现来确定相关性度量。实体类型可以是实体的定义特征和/或分类。例如,如果搜索查询包含实体“帝国大厦”,且实体类型设置为“摩天大楼”,则网站内容中“帝国大厦”和“摩天大楼”的共现可以确定相关性指标。在这个度量标准中,共现,即某些术语或实体或实体类型的同容相关性的时使用,起着特殊的作用。