对数据标注工具进行问题排查

如果您在创建或发布网页集时遇到问题,请参阅此网页上的问题排查信息。

如果您在创建或发布网页集时遇到问题,请参阅此网页上的问题排查信息。

创建网页集

在我输入起始网址并点击“确定”后,看到错误讯息。

这可能是由于多种原因造成的,其中包括:

  • 如果您看到“未找到网址”错误,可能是 Google 没有将已经过验证的网页或网址编入索引。例如,以下原因都会阻止 Google 将某个网站编入索引:
    • robots.txt 文件、抓取错误或您网页上的元标记禁止 Google 将其编入索引。
    • Googlebot 无法访问您网站上的信息,因为只有填写表单后才能访问。
    • 您尝试创建的网页集中的某些材料遭到了违反数字千年版权法案 (DMCA) 的投诉。
  • 您指定的网页网址与 Search Console 中经过验证的网址不在同一网站中。例如,如果您点击的是 Search Console 首页上的 http://www.example.com 网站,那么数据标注工具就会要求网址以 http://www.example.com 开头。要突出显示开头不同的网址(例如,http://example.comhttp://reviews.example.com 或 https://www.example.com),您需要单独添加该网站。

当我尝试创建自定义网页集时,系统显示一条错误消息。

在尝试创建网页集时,网页选择器弹出式窗口中可能会显示以下任一错误消息:

此消息…在以下情况下显示…
格式不包含起始页。您指定的网址格式不包含用于创建网页集的起始页。例如,如果您将以下网址指定为起始页:
http://www.example.com/events/music/123.html 
并指定以下内容作为网址格式:
http://www.example.com/events/*
系统就会显示“格式不包含起始页”消息,因为您指定的格式排除了 /music/ 子路径。虽然指定的格式包含诸如
http://www.example.com/events/891.html 和
http://www.example.com/events/125.html 之类的网页,
但排除了诸如
http://www.example.com/events/music/123.html 之类的网页。要突出显示包含 /music/ 子路径的网址,请使用诸如
http://www.example.com/events/music/* 或
http://www.example.com/events/*/* 的格式
格式包含太多网页。您指定的网址格式包含超过 50 万个网页。请考虑创建多个网页集,且每个网页集少于 50 万个网页。例如,如果您的网站在以下网址下包含了活动相关的信息:
http://www.example.com/events/music/...

http://www.example.com/events/speaking/...则您无需指定 http://www.example.com/events/*/* 的网址格式,您可以创建两个范围较小的网页集,例如
http://www.example.com/events/music/*

http://www.example.com/events/speaking/*
格式包含您未管理的网页。您指定的网址格式包含的网页不属于在 Search Console 中经过验证的网站。例如,如果
http://www.example.com/events/music/*
已在 Search Console 中注册为经过验证的网站,则网址格式
http://www.example.com/events/*/*
还将包含
http://www.example.com/events/meetings/*
(但这尚未注册为已经过验证的网站的一部分)。指定范围较小的网址格式,例如 http://www.example.com/events/music/*
格式与所有网页均不匹配。数据标注工具未找到任何与您指定的格式匹配的网页。请检查拼写错误并确保您已输入正确的网址。如果您在检查拼写错误之后仍能看到此消息,请尝试扩大网址格式的范围。例如,将
http://www.example.com/events/music/*
更改为
http://www.example.com/events/*/*

在创建自定义网页集时,请务必执行以下操作:

  • 指定有效的网址格式。请注意,数据标注工具不支持正则表达式。而您仅可将 * 用作完整的网址组成部分的通配符。例如,此网址格式是有效的:
    http://www.example.com/*/events/*
    但是以下格式是无效的,因为该格式尝试将 * 用作网址组成部分的一部分的通配符:
    http://www.example.com/*-people-*/events/*
  • 指定至少可识别一个 Google 已抓取并编入索引的网页的网址。

数据标注工具不理解我的网站。

如果您已经过几轮标记,而数据标注工具仍不理解您的网站,请尝试重新开始并创建仅包含一个网页的网页集。如果此操作成功,请为您网站上的每个重要网页创建一个包含单个网页的网页集。如果此操作不成功,那么您需要使用 HTML 标记,而非使用数据标注工具。

发布网页集

提取的数据显示在“结构化数据”页面上,但搜索结果中仍不显示丰富网页摘要。

结构化数据信息中心会在 Google 抓取网页后显示已提取的数据,但系统可能需要花费一些时间才能将丰富网页摘要显示在搜索结果或地方信息页中。如果系统已提取数据,但未显示您网站的丰富网页摘要,请查看可能导致该情况的原因。