上面介紹了影響B(tài)aidu spider正常抓取的原因,下面介紹Baidu spider的一些判斷原則。在建庫環(huán)節(jié)前,Baidu spider會對頁面進行初步內(nèi)容分析和鏈接分析,通過內(nèi)容分析決定該網(wǎng)頁是否需要建索引庫,通過鏈接分析發(fā)現(xiàn)更多網(wǎng)頁,再對更多網(wǎng)頁進行抓取—一分析是否建庫&發(fā)現(xiàn)新鏈接的流程。理論上,Baidu spider會將新頁面上所有能“看到”的鏈接都抓取回來。那么,面對眾多新鏈接, Bartender根據(jù)以下兩個方面判斷哪個更重要。
(1)對用戶的價值
①內(nèi)容獨特,百度搜索引擎喜歡 unigue的內(nèi)容。
②主體突出,切不要出現(xiàn)
網(wǎng)站制作主體內(nèi)容不突出而被搜索引擎誤判為空短頁面不抓取的情況。
③內(nèi)容豐富。
④廣告適當。
(2)鏈接的重要程度
①目錄層級——淺層優(yōu)先。
②鏈接在站內(nèi)的受歡迎程度。
本文地址:http://murenxiang.com.cn//article/2518.html