分析了70多萬(wàn)已備案網(wǎng)站後我知道了這些資料
行內(nèi)人都知道,在內(nèi)地做網(wǎng)站是要備案的,備案主要分為工信部備案(ICP)和公安聯(lián)網(wǎng)備案,根據(jù)上面要求,已經(jīng)通過(guò)ICP備案的需要在30日內(nèi)辦理公安聯(lián)網(wǎng)備案,已經(jīng)通過(guò)了公安聯(lián)網(wǎng)備案的網(wǎng)站才能算得上是國(guó)內(nèi)“正規(guī)網(wǎng)站”。
原始碼窩通過(guò)資料探勘,弄到了國(guó)內(nèi)已經(jīng)通過(guò)公安聯(lián)網(wǎng)備案的70多萬(wàn)網(wǎng)站備案資料,這些資料都是可以公開(kāi)查詢的,並沒(méi)有任何隱私資料,就像下圖查詢的這些資料一樣
原始碼窩挖掘到的這些備案資料是截止2021年1月18日前備案的完整資料,總共796628個(gè),去掉部分已經(jīng)登出備案的網(wǎng)站一共是706767個(gè),下面就基於這706767個(gè)網(wǎng)站的備案資訊做一些資料統(tǒng)計(jì)分析。
1、域名字尾
域名的字尾非常多,有.com、.cn、.net等等,每個(gè)域名的受歡迎程度不不一樣,通過(guò)已備案網(wǎng)站的資料得到以下結(jié)果:
.com 432471個(gè)
.cn 210658個(gè)
.net 27176個(gè)
.top 7100個(gè)
.org 5854個(gè)
.cc 4068個(gè)
.xyz 2659個(gè)
.vip 1755個(gè)
.wang 682個(gè)
.co 564個(gè)
.info 530個(gè)
.tv 476個(gè)
.中國(guó) 423個(gè)
其它 12351個(gè)
所佔(zhàn)的比例如下圖:

域名字尾比例圖
.com域名字尾佔(zhàn)的比例非常高,都超過(guò)了60%,原始碼窩也建議建站儘量?jī)?yōu)先使用COM域名,實(shí)在不行再用CN域名。七八年前有一部分域名註冊(cè)商一直吹捧中文域名,忽悠域名投資人買(mǎi)中文域名,但如今中文域名佔(zhàn)的比例幾乎可以忽略。
2、網(wǎng)站備案主體
網(wǎng)站的備案主體也是分多種的,有企業(yè)單位、個(gè)人、事業(yè)單位、社會(huì)團(tuán)體等等,下圖把備案主體的資料也統(tǒng)計(jì)出來(lái)了

備案主體比例圖
通過(guò)上圖可以看出,大部分網(wǎng)站都是企業(yè)在運(yùn)營(yíng),不過(guò)個(gè)人網(wǎng)站也仍然佔(zhàn)了不少。根據(jù)這兩年的網(wǎng)站備案以及監(jiān)管情況來(lái)看,未來(lái)個(gè)人建站將越來(lái)越困難,手續(xù)越來(lái)越多,也越來(lái)越麻煩,這兩年這些備案手續(xù)已經(jīng)勸退了不少個(gè)人站長(zhǎng)。
3、按地區(qū)統(tǒng)計(jì)
按地區(qū)統(tǒng)計(jì)的資料會(huì)比較有意思,或許可以粗略看出那個(gè)地區(qū)的網(wǎng)際網(wǎng)路發(fā)展情況。下面是按省或直轄市的統(tǒng)計(jì)資料:

各地區(qū)備案數(shù)量分佈圖

各地區(qū)備案數(shù)量比例圖
從上圖可以看到,浙江、廣東、上海、江蘇、福建這些省市網(wǎng)站數(shù)量非常多,浙江網(wǎng)站數(shù)量排第一,不知道是不是受馬雲(yún)的影響。
以上的資料都是基於已經(jīng)通過(guò)公安聯(lián)網(wǎng)備案的網(wǎng)站,實(shí)際上沒(méi)有備案的和只通過(guò)了ICP備案的網(wǎng)站還有很多,這些資料暫時(shí)無(wú)法統(tǒng)計(jì)。