blog

谷歌继续尝试和扩大作者身份

<p>如果三月份SMX West的一个主题非常明确,那就是作者身份的重要性以及它如何影响谷歌未来排名的问题</p><p>在“2013年及以后的SEO成功需要什么</p><p>”小组讨论期间,我问Matt Cutts是否计划扩大作者信用(可能还有丰富的片段),而不仅仅是书面内容(如博客文章),并开始合并其他内容类型</p><p>实际上,内容创作者可以真实地创作各种类型的内容,包括摄影师的照片或摄像师的视频</p><p>仅仅因为一段内容不是书面媒体的一部分并不意味着内容没有作者</p><p>马特表示,虽然谷歌在网上看到的大部分内容都是写的,但谷歌索引并希望能够理解作者身份的内容显然还有其他类型</p><p>即使作者身份标记尚未应用于某个特定页面,Google肯定会尽力推断内容的作者身份</p><p>在过去的六个月中,有几个例子表明谷歌错误地将错误的作者归于内容,例如“纽约时报”的一篇文章将杜鲁门卡波特与新文章相提并论,尽管卡波特已经去世近30年</p><p>谷歌甚至推断了页面上其他类型的语义标记的作者身份</p><p>在我自己的网站上,我们的归档网络研讨会页面使用视频模式进行编码,之前显示的是视频丰富的片段,突然恢复为作者身份,即使页面未使用作者数据编码:在查看页面副本后,我们意识到这个视频页面包含“由珍妮特·德里斯科尔·米勒提出的”这个词</p><p>“by”这个词是否会导致Google推断该特定行是一个副行</p><p>我们重新编写了页面内容,删除了该短语,并等待Google重新编制索引</p><p>很低,谷歌然后将丰富的片段返回到视频缩略图:几周前,我们也开始看到作者和视频片段结合在一起的结果:此页面包含单词“by”,并且还使用视频模式进行编码,因此谷歌似乎正在认识到这一结果</p><p>在最近的博客文章中,Ann Smarty也认识到了类似的模式,即使在她没有被列为作者,而是编辑的情况下,也用“by”这个词</p><p>现在看来,Google还将作者身份扩展到了PDF格式的内容:这个PDF文件数据将我列为文件元数据中的作者,白皮书的封面页面包含“由Janet Driscoll Miller编写的短语”</p><p> “那么,谷歌似乎依赖于推断PDF的作者身份 - PDF元数据或PDF内容本身或两者兼而有之</p><p>我用我手头上的旧PDF来测试这个,它将我列为元数据中的作者,但也将作者列为“由搜索Mojo编写”在PDF正文中,因此没有显示单个作者</p><p>单独的元数据作者身份并没有导致Google生成作者片段:但是,使用正文副本显示带有实际作者的副行的PDF,但是PDF中的作者元数据是空白的,确实产生了一个作者片段:所以,在这一点上,谷歌继续依赖正文中的内容,包括PDF和其他网站页面,寻找列出作者的书面署名</p><p>在PDF上列出两位作者的情况下,Google似乎使用列出的第一位作者:因此,如果您正在准备PDF或HTML格式的内容,请注意Google通过识别“by”一词来推断作者身份通过作者姓名,您应该了解如何在内容中使用此组合</p><p>否则,您可能会产生作者身份而无意或Google可能会意外地推断出不正确的作者身份</p><p>本文中表达的观点是客座作者的观点,

查看所有