比较来自 Google 的每个数据集的引用域链接对,假设服从泊松分布。 运行每个数据集的性能模拟(例如:Moz vs Maj、Ahrefs vs SEMrush、Moz vs SEMrush 等) 分析结果。 结果 乍一看似乎有一些明显的赢家。在正面交锋中,Moz 略胜 Ahrefs,但总体而言,Moz 和 Ahrefs 的表现几乎相同。 Moz、Ahrefs 和 SEMrush 似乎比 Majestic Fresh 和 Majestic Historic 好得多。事实真的如此吗?为什么?
这表明指数规模和比例相关性之间存在反比关系。这看上去似乎有些矛盾,大指数不是应该更接近谷歌吗?一点也不。
这意味着什么? 每个组织都必须创建一个抓取优先级策略。当你发现数 阿尔及利亚电话数据 百万个链接时,你必须确定下一步可以抓取哪些链接。 Google 具有抓取优先级,Moz、Majestic、Ahrefs 和 SEMrush 也具有抓取优先级。您可以选择优先处理许多不同的事情……
您可能会优先考虑链接发现。 如果您想建立一个非常大的索引,您可以优先抓取历史上提供过新链接的网站上的页面. 您可能会优先考虑内容的独特性。 如果您想建立一个搜索引擎,您可能会优帉以前见过的页面不同的页面。 您可以选择抓取历史上提供唯一数据和少量重夹复复夹 您可能会优先考虑内容的新鲜度。如果您想让您的搜索引擎保持最新،您可能优先抓取经常变化的页面. 您可以优先考虑内容价值,根据指向该页面的入站链接数量首先抓取最重要. 很有可能,一个组织的抓取优先级会融合其中一些功能,但很难设计出一个与完全相同的抓取优先级。 试想一下,如果你不想爬网,而是想爬树.
|