Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 3|回復: 0
打印 上一主題 下一主題

Schema.org 和结构化数据构建语义网

[複製鏈接]

1

主題

0

好友

5

積分

新手上路

Rank: 1

該用戶從未簽到

跳轉到指定樓層
樓主
發表於 2023-12-20 17:22:36 |只看該作者 |倒序瀏覽
这也减少了单词翻译中的歧义,根据上下文和细微差别,单词翻译有时具有多种含义,这对于那些不掌握该语言的人(甚至搜索引擎机器)来说可能很难理解。 引用 Singal 的话,这些东西伴随着搜索引擎及其算法的发展,首先是蜂鸟的引入,然后是RankBrain,谷歌采用不同的方法来理解网页中涵盖的含义和主题,不再仅仅简单地基于关键词,而是基于对文本中所包含的概念的分析。 近年来,随着Google BERT和随后的Google MUM的推出,这一点变得更加明显,这两种基于人工智能和机器学习的技术应用于 SERP,能够更好地理解用户语言并深入分析他们的请求和需求,超越查询的字面意义(理解为一串字符或单词)来识别意图。 我们绝不能忘记结构化数据和schema.org 标记的不断增加,这些信息是我们通过页面提供的信息,以便爬虫能够更好地理解内容以及所呈现的实体和关系。 所有这些数据都有助于搜索引擎为用户提供更多主题结果,专注于真实意图,并提供可能的见解(另请参阅人们在 SERP 中询问的框的指数增长),但最重要的是减少误解并最大程度地减少错误焦点结果。

实体有什么用? 因此,在一般层面上,实体可以是一个人、一个地方、一个概念、一个具体事物或任何我们可以从语言角度表示的东西;对于谷歌来说,这是它试图训练算法自然地理解语言的方式,就像我们自动做的那样(请原谅双关语)。 我们可以将这些语义实体视为彼此相关的单词集合,它们在处理特定主题或概念的内容中非常频繁,并传递通常与关键字相关的含义:通过注意 WhatsApp 号码数据 到这些关系和相关性,机器能够消化并理解概念的含义。 因此,该算法并不是搜索和分析简单的关键词,而是广泛地搜索和分析相互关联的信息,通过这些信息对用户的请求做出详细而深入的响应。这些实体存储并分组在 Google 的知识图谱中,该知识图谱代表整个网络上的信息和数据网络,并为搜索引擎提供精确的上下文,以在其中插入页面和站点的扫描。 因此,上下文本身成为一个至关重要的概念,是在特定搜索时确定内容相关程度的关键变量,从而理解人们的意图并消除他发现的内容的歧义。



我们再次谈论语义搜索引擎优化,它能够超越查询的简单字符串来关注用户的意图,并且拦截搜索引擎所采取的方向,而如今搜索引擎不再奖励带有许多关键词或关键词的内容。指的是与关键词密度等参数相似,但能够响应人们的信息和娱乐需求的页面。 Google 的实体数据库 经过各种分析师的考虑,也基于对最新原始山景城专利的研究,我们可以假设谷歌正在构建和开发其实体数据库(不久前统计了大约 50 亿个实体) 5000 亿实体所有者)使用两种不同的方法,复制现有实体并发现新实体,正如Andrea Giudice也建议的那样。 在第一种情况下,搜索引擎识别已知的实体(例如,得益于维基百科和 Imdb 等可靠来源)并将其与现实世界保持一致:缺点是报告新实体或更新旧实体的时间取决于来源,因此谷歌依赖他们提供相关内容。 为了克服这一限制,该小组已申请了一些方法的专利,这些方法采用两种不同的策略从网络上可用的非结构化数据中发现新实体。

回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

雲端vps主機|免費論壇|Archiver|手機版|Comsenz Inc.

GMT+8, 2025-2-23 14:25 , Processed in 0.078158 second(s), 22 queries .

抗攻擊 by GameHost X2.5

© 2001-2012 Comsenz Inc.

回頂部 一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |