想知道某个网站的流量信息?下面教你几招。但在进入正题之前,需要声明:
如果你是网站的所有者,那么就没有必要估计网站流量了。你可以安装(免费的)Google 分析(Google Analytics)来获得关于网站流量的准确数据。
Ahrefs 博客增长(Ahrefs’ blog growth),数据来自 Google 分析
小提示. 通过分析服务器的日志文件可以了解更多关于网站流量的信息。具体可参考这篇文章。但是既然你已经点进这篇文章了,你一定是想知道其他网站的流量。我说的没错吧?
你可能是想了解竞争对手网站的流量情况,他们是不可能与你分享 Google 分析账户的。
今天我会介绍 3 招看穿任一网站流量的方法。
第一招. 使用流量估算工具流量估算工具主要可以分成两类:
估算总体流量的工具:网站的访问者来自各处,搜索引擎、论坛、社交媒体等。这些工具可以估算所有来源流量的总和。只估算自然搜索流量的工具:许多网站从搜索引擎(如 Google 等)获得了大量自然流量,这些流量叫做“自然搜索流量”(organic search traffic)。这类工具不会考虑自然搜索流量以外的流量信息。我们来详细了解一下。
1. 找出某网站的总体流量在 Ahrefs,我们尝试了所有业界领先的总体流量估算工具,并开展了一系列小型的内部实验来确认估算的准确性,最终 SimilarWeb 获胜。
SimilarWeb 提供了大量与流量相关的数据,包括:
总访问量(Total visits);每次访问网页数(Pages per visit);平均访问时间(Average visit duration);跳出率(Bounce rate)小提示.这些内容可以帮助你了解 SimilarWeb 是如何定义及计算这些指标的。以下是 2018 年 7 月 ahrefs.com 的流量估算情况。
奇怪的是,SimilarWeb 并未给出网页浏览量(pageviews)的数据,但是可以通过反向工程——总访问量乘以每次访问网页数——得出。(对我们来说,这个数字是 563 万 * 7.5 = 4,223 万)。
SimilarWeb 免费版可以交互图表的方式展示多达 6 个月的月度流量数据。
而付费用户可以看到长达 2 年的数据。
所有的流量估值包含了移动端和桌面端的数据,如果你是付费订阅用户,则可以按设备类别对这些数据进行区分。
向下滚动网页,你可以看到更多关于流量的有用数据,如
来自各国(桌面端)的流量……
小提示.SimilarWeb 免费版只提供流量占比前 5 名国家的数据。还可以按流量来源(直接访问、引介、搜索等)进行细分……
根据指入域名进行细分(这在开展链接建设或者寻找客座博文机会时有用)……
来看看带来自然搜索流量最多的前 5 个搜索短语吧……
这些数据从何而来?为了更好地理解这些数据的可靠性,我们需要挖掘它们的来源。
以下是 SimilarWeb 关于数据来源的说明:
我们的数据主要来自以下 4 个渠道:
一组受监控的设备,其体量目前业界第一;位于不同国家(和地区)的本地互联网服务提供商(ISP);我们的爬虫可扫描所有公共站点,以创建高度精确的数字世界地图;直接与我们相连的网站和应用程序的数十万个直接测量源通俗地说,SimilarWeb 通过各种渠道,搜集与用户在线活动相关的匿名数据。
SimilarWeb 并未明示他们的覆盖面究竟有多大。但是他们并没有获得全球每一个个体的信息。因此他们的数据取自一个相对容量较小的“在线人口”样本。
这些数据准确吗?让我们来测试一下:
我们从 Flippa 选取了 116 个网站样本;使用 SimilarWeb 导出这 116 个站点的独立访客总数和网页访问总数;比较这些数据。小提示.我们只从 Flippa 选取那些至少有一年历史的网站,同时这些网站的流量情况必须已经得到验证(verified traffic)。我们的发现如下:
SimilarWeb 高估了 91.67% 网站的独立访客总数;在统计独立访客总数时,SimilarWeb 平均要高估 308.81%;SimilarWeb 高估了 70.83% 网站的网页访问总数;在统计网页访问总数时,SimilarWeb 平均要高估 210.58%。根据我们的测试,总体来看 SimilarWeb 大大高估了实际独立访客和网页访问总数。但是 SimilarWeb 并不总是高估这些数据,其低估独立访客总数的情况占比约 1/12,在低估网页访问量时,比重在 ¼ 到 ⅓ 之间。
重点来了:
对于我们选用的样本网站,SimilarWeb 只给出了其中 ⅕ 的数据。
至于另外的 ⅘,我们看到了这样的提示:
没有数据。呵呵。
如果你疑惑为什么会出现这种情况,可能与我们选取的样本容量有关。毕竟它们都是来自 Flippa 的小型网站。
前面提到 SimilarWeb 只根据全体在线人口的一小部分来进行估算。所以如果他们无法展示某一网站的流量估值,那是因为他们选取的子集(一小部分在线在人口)中没有足够的用户访问测试网站。
这就是为什么 SimilarWeb 在分析小型网站的时候,往往只能提供较少的数据,甚至无法提供数据。
为了证明这一推论,我们使用 SimilarWeb 分析了全球 Ahrefs 排名(Ahrefs Rank)前 100 的网站,结果 SimilarWeb 无一例外地提供它们的流量估值数据。
回到这些数据:
因为 SimilarWeb 只能提供差不多 ⅕ 网站的数据信息,于是我们的观察结果仅仅基于 24 个网站。不得不承认,这个样本是相当小的。
因此,你在理解这些数据的时候必须慎之又慎。
2. 找出某网站的自然搜索流量尽管市面不乏自然流量估算工具,但是我们显然倾向于使用我们自己的工具(Ahrefs),我们相信它的数据是最优质的。
我们可以提供的与流量相关的数据有:
来自 Google(全球)的月度访问量;流量价值(即:若按照每次点击付费(PPC)竞价,该网站或 URL 的自然流量价值);该网站排名进入 Google 前 100 名的关键词数据。我们来看一下 2018 年 7 月 Ahrefs 的流量估值:
每个月 ahrefs.com 的自然搜索流量为 27 万。
此为“实时”的流量估值,即它是一个“滚动着的均值”(rolling average)。每当我们更新数据库中与网站排名相关的关键词时,这个数字都会变化。正因为这样,流量估值每一天都会发生些许变化。这个数据包含了桌面端和移动端的流量。
想知道网站某一分部的流量情况?只需要将该子域名或子目录(如:blog.ahrefs.com 或者 ahrefs.com/blog)的链接粘贴进入网站分析(Site Explorer)工具。在下拉菜单中选择“前缀”(Prefix)即可。
如果输入的前缀为 ahrefs.com/blog,你就可以看到 “/blog/” 子目录下所有页面的搜索流量总和,如下图所示:
如果你想看看该子目录下每个页面的流量情况,可以使用热门页面(Top Pages)报告。该报告将根据流量(从高到低)将这些页面列出。
需要注意的是,这是全球的流量数据。点击概览(Overview)报告中的自然搜索(Organic Search)选择卡,你可以看到来自 170 个国家的流量分布。
小提示.点击显示更多(Show more),你可以看到包含 170 个国家的完整列表。我们将历史自然流量数据绘制成了图表。这里显示了从 2015 年中至今的每日自然流量估值。这张图表是可交互的。你可以通过滑动鼠标的方式查看若干年中某一特定日期的流量估值。
想只看来自某一个国家的流量?我们提供了这个选项。
你可以如下图所示只查看来自英国的流量:
等一下,还有:点击自然搜索关键词报告,你能看到所有为网站带来流量的关键词列表,从贡献流量最多的关键词开始。
你会发现,Ahrefs 可以几乎可以输出任一网站或 URL 的大量数据。这是如何做到的呢?
这些数据从何而来?Ahrefs 根据数据库中的 61 亿个关键词计算估值。
该数据库每月更新一次,其中还包括了搜索量的更新(来看看上个月比较有意思的搜索数据)。
简单来说,我们是这样估算站点流量的:
找出网站所有有排名的关键词;检查每个关键词的月度搜索量、排名位置以及点击率(涵盖超过 170 个国家和地区;估算出每个关键词为网站带来的流量;根据这些数字估算出站点的总自然搜索流量。你可以点击此处以进一步了解我们的计算方法。
这些数据准确吗?我们来验证一下。具体做法如下:
选取与之前一样的来自 Flippa 的 116 个网站作为样本(这些网站的全球自然搜索流量都经过了验证);从 Ahrefs 下载这 116 个样本站点的自然流量数据;比较。结果如下:
Ahrefs 低估了 74.14% 网站的自然搜索独立访客总数;在统计自然搜索独立访客总数时,Ahrefs 平均要低估 38.08%;Ahrefs 低估了 90.52% 网站的自然搜索页面访问总数;在统计自然搜索页面访问总数时,Ahrefs 平均要低估 52.04%。根据我们的测试,总体来看 Ahrefs 低估了自然搜索独立访客和自然搜索页面访问总数。但 Ahrefs 并不总是低估这些指标,其低估自然搜索独立访客总数的比例在 ¼ 左右,而低估自然搜索页面访问总数的比例大约为 1/10。
小提示.值得一提的是,以上结果所基于的样本量要大于此前的 SimilarWeb 测试,因为 Ahrefs 输出了所有 116 个网站的数据(而 SimilarWeb 只显示了其中的 1/5)。然而为什么 Ahrefs 倾向于低估流量数据呢?
因为我们估算的基础是 Ahrefs 数据库所包含的 61 亿个关键词的流量。这个数字听起来是不是很大?它的确够大,在市面同类工具中,Ahrefs 的数据库是最大的。
但是即使是存储有 61 亿个关键词信息的数据库仍然不足以覆盖每一个有可能被录入 Google 搜索框的关键词。那是不可能的。
例如,许多用户会使用超长尾短语进行搜索:
我们的数据库不包含这个长尾关键词,于是也就无法估算由它带来的流量。
所有的自然流量估算工具都是这样工作的,我们并不特殊。大家都倾向于低估流量。至于低估到何种程度取决于关键词数据库的体量。体量越大,估算的流量也就越准确。
这就是为什么拥有市场最大的关键词数据库对我们(Ahrefs)如此重要。
需要指出的是,没有人可以完全准确地计算搜索量,即使是Google也做不到。这是我们倾向于低估的另外一个原因。
比较多个站点,用哪个工具最好?有时,比较两个或多个站点的相对流行度,比一味追求绝对的准确度更为重要。
例如,你面前摆着一份包含了 100 个网站域名的列表,每个域名代表一个潜在的业务拓展机会,
你想从流量最大的那些网站开始,与他们建立联系。
此时,你需要做的就是比较这些站点,并将它们按流量从大到小进行排名。
你应该使用哪个工具呢?
我们将使用斯皮尔曼相关系数(Spearman correlation)对手头的数据进行分析后决定。
SimilarWeb 数据的斯皮尔曼相关系数:
实际的“独立访客” VS SimilarWeb 的估算值实际的“页面浏览数” VS SimilarWeb 的估算值0.7130.779Ahrefs 数据的斯皮尔曼相关系数:
实际的“自然搜索独立访客” VS Ahrefs 的估算值实际的“自然搜索页面访问量” VS Ahrefs 的估算值0.7670.784是不是很困惑?
以下是关于斯皮尔曼相关系数的解释:
斯皮尔曼秩相关系数是用来比较两个变量强度和方向(正或负)的一种方法。其结果总于-1到+1之间。对两个数据集进行排名。
更困惑了是不是?让我们来举例说明。
我们要考察的是两个数据集——“实际”流量(数据集#1)和估计流量(数据集#2)——的相关性。如果两个数据集以任何形式呈正相关,那么斯皮尔曼相关系数会在 0 到 1 之间;如果呈负相关,斯皮尔曼相关系数会在 ‑1 到 0 之间。
即,斯皮尔曼相关系数越接近 1,两个数据集就越正相关。
我们假设某三个网站的实际流量如下:
网站 1 — 100网站 2 — 5,000网站 3 — 40,000Ahrefs 提供的流量估值分别如下:
网站 1 — 50网站 2 — 2,000网站 3 — 10,000这时,两个数据集的相关系数正好是 1。(两个数据集对应数据的“等级”都互相完美正相关)
但如果 Ahrefs 提供的流量估值如下:
网站 1 — 10,000网站 2 — 2,000网站 3 — 50这时,两个数据集的相关系数正好是 ‑1。(两个数据集对应数据的“等级”都互相完美负相关)
因此,工具的相关性数值越高,它就越适合用来比较两个或多个网站。
比较上面的斯皮尔曼相关系数,你会发现 Ahrefs 和 SimilarWeb 输出的流量数据与“实际”流量数据都呈现了很强的相关性,但是 Ahrefs 略胜一筹。
这意味着你需要使用我们的网站批量分析(Batch Analysis Tool)工具来获取外链机会域名的流量估值,并将它们从大到小排序。
这样你就可以对这些网站的相对流行度有一个较好的判断。
所以你应该使用哪个流量估算工具?需要强调的一点是,不同的工具有不同的用途。
SimilarWeb 估算的是整体流量,而 Ahefs 估算的是自然搜索(如 Google 等)流量。
SimilarWeb 的一个独到之处是它可以展示一个网站大部分流量的来源(如:自然搜索、社交媒体等):
以 thewirecutter.com 为例,根据 SimilarWeb 的数据,你可以看到它 ⅓ 的流量来自搜索引擎。
于是我们有了一个很酷的工具流:
如果 SimilarWeb 提供的数据展示了某网站的大量流量来自搜索引擎,你就可以使用 Ahrefs 进行深挖,以更好地理解这些流量。
还是以 thewirecutter.com 这个网站为例,Ahrefs 能:
展示其过去 3 年多时间内自然搜索流量的变化……
列出它 310 万个排名关键词中的每一个……
筛选出网站上吸引了最多自然搜索流量的页面……
能做的数不胜数!
好了,不炫耀了。