
文章插圖
學(xué)習(xí)搜索引擎優(yōu)化 , 搜索引擎的工作原理是必須要了解的 , 今天我們要說的是百度搜索引擎的工作原理 , 在了解了搜索引擎的工作原理之后 , 就會涉及到收錄方面的一些問題 , 那么網(wǎng)站不收錄又與那些因素有關(guān)系呢?
我們先來了解一下什么是搜索引擎蜘蛛?搜索引擎蜘蛛是抓取信息的程序 。各大搜索引擎所對應(yīng)的蜘蛛又有所不同 。
百度蜘蛛:baiduspider
谷歌蜘蛛:Googlebot
360蜘蛛:360spider
搜狗蜘蛛:sogounewsspider
……
一、搜索引擎工作流程
1、抓?。喉樦溄优佬?nbsp;, 抓取頁面信息 。
蜘蛛順著鏈接爬行 , 然后抓取 , 又分深度和廣度抓取 。廣度抓?。鹤ナ醉?nbsp;, 欄目頁 , 欄目頁里面的分頁 , 一級一級的抓取 。深度抓取:首頁 , 欄目頁 , 欄目頁分頁 , 欄目頁)蜘蛛順著鏈接抓取 。
2、過濾:若內(nèi)容質(zhì)量不行就過濾 , 比如:采集的內(nèi)容 , 文不對題的內(nèi)容 , 不豐富的內(nèi)容 。若一些質(zhì)量好的內(nèi)容遲遲不收錄 , 是因為需要一個周期 , 過一段時間之后就會收錄的 。
3、儲存索引庫:把有質(zhì)量的信息提取和組織建立索引庫 。
4、展現(xiàn):存放臨時索引庫里面的內(nèi)容 , 經(jīng)過一些算法的排序 , 用戶在搜索某一關(guān)鍵詞的時候 , 檢索器根據(jù)用戶輸入的查詢關(guān)鍵字 , 在索引庫中快速檢測出有價值的內(nèi)容給予展現(xiàn) 。
二、網(wǎng)站出現(xiàn)不收錄的原因
1、是否允許蜘蛛抓取 。首先要看的就是是否有蜘蛛來你網(wǎng)站抓取 , 然后再分析其它原因 。Robots文件中禁止蜘蛛抓取 , 蜘蛛就不會來抓取 。
2、需要一個周期 。好的內(nèi)容放在臨時索引庫里面 , 經(jīng)過一些算法排序 。若一些質(zhì)量好的內(nèi)容遲遲不收錄 , 是因為這也是需要一個周期的 。
3、內(nèi)容質(zhì)量不行 。在過濾的時候就直接被過濾了 。
4、蜘蛛無法進行識別的東西 , 那么蜘蛛直接就過濾了 。蜘蛛無法識別的有哪些呢?
(1)Js蜘蛛識別不了 , 建議只用一兩處即可 。
(2)圖片上的內(nèi)容 , 人眼可識別 , 但蜘蛛不能識別 , 需要加alt屬性 。
(3)Flash比如說視頻 。需在視頻的上下文解釋一下這個視頻的主要內(nèi)容 。
(4)iframe框架 。層級比較多 。
(5)嵌套table 。
5、需要登錄的信息頁面 。蜘蛛無法進入這樣的頁面 。
三、注意事項
1、已收錄的內(nèi)容 , 不要改動整篇文章內(nèi)容尤其是標(biāo)題 , 不要移動 , 不要刪除 , 否則就會形成死鏈 。
2、展現(xiàn)結(jié)果需要一定的時間(2個月之內(nèi)都是正常的) 。網(wǎng)站上線一個星期了還沒收錄 , 這是需要一個周期時間的 。
3、內(nèi)容的豐富度 。文字、圖片、視頻等 。
4、吸引蜘蛛 。主動向搜索引擎提交(可重復(fù)提交) , 鏈接 。主動出擊 。
5、蜘蛛的跟蹤 , 網(wǎng)站IIS日志 。
以上關(guān)于本文的內(nèi)容,僅作參考!溫馨提示:如遇健康、疾病相關(guān)的問題,請您及時就醫(yī)或請專業(yè)人士給予相關(guān)指導(dǎo)!
「愛刨根生活網(wǎng)」www.malaban59.cn小編還為您精選了以下內(nèi)容,希望對您有所幫助:- 滴滴會員等級劃分及作用分析 滴滴會員等級有什么用
- 白蘿卜什么季節(jié)收獲
- 釣臺典藏酒價格 鉤魚臺酒價格及圖片
- 帶你認識seo優(yōu)化 seo優(yōu)化原理是什么
- 入駐條件及費用解析 京東個人店鋪入駐條件是什么
- 古代金元寶圖片 金元寶最新價格及圖片
- 面試問題及正確答案 產(chǎn)品運營一般面試問題有哪些
- 詳細介紹微博粉絲通 微博粉絲通推廣平臺及出價方式
- 廣告投放平臺優(yōu)缺點及方法 今日頭條廣告投放平臺介紹
- 銀元價格表及圖片大全_三年袁大頭價格300萬
