摘要:互聯網信息爆發式增長時代,要想做好就必須簡單了解搜索引擎基本工作原理以及自然排名機制搜索引擎工作過程是非常復雜,冬鏡在本章介紹的內容相對于真正的搜索引擎技術來說僅僅是皮毛不過對新手已經足夠用了,我盡量以最容易理解的方式來講解一搜索引擎蜘蛛搜
互聯網信息爆發式增長時代,要想做好SEO就必須簡單了解搜索引擎基本工作原理以及自然排名機制
搜索引擎工作過程是非常復雜,冬鏡SEO在本章介紹的內容相對于真正的搜索引擎技術來說僅僅是皮毛
不過對新手SEO已經足夠用了,我盡量以最容易理解的方式來講解
一、搜索引擎蜘蛛
搜索引擎工作原理
搜索引擎蜘蛛又稱網頁爬蟲。目的:抓取高質量的網頁內容。下面講幾個常見的搜索引擎蜘蛛分類:
1.1 Baiduspider(百度蜘蛛)
百度公司還有其它幾個蜘蛛:Baiduspider-news(新聞)、Baiduspider-mobile(wap)、Baiduspider-image(圖片)、Baiduspider-video(視頻),站長經常見到的是Baiduspider和Baiduspider-image
1.2 Googlebot(谷歌蜘蛛)
還發現一個Googlebot-Mobile,看名字應該是抓取wap內容的
1.3 360Spider(360蜘蛛)
它是一個很“勤奮抓爬”的蜘蛛
1.4 Sogou News Spider(搜狗蜘蛛)
還包括如下這些:Sogou web spider、Sogou inst spider、Sogou spider2、Sogou blog、Sogou News Spider、Sogou Orion spider,看最權威的百度的robots.txt http://www.baidu.com/robots.txt 就為Sogou搜狗蜘蛛費了不少字節,占了一大塊領地。
其它還有很多蜘蛛就不過多介紹,SEO優化主要針對這四個就可以,有興趣可閱讀搜索引擎蜘蛛大全這篇文章
二、搜索引擎的工作原理
搜索引擎工作原理
重慶SEO認為搜索引擎的工作原理大致上可以分成3個階段:
1.爬行和抓取
2.預處理(建立索引)
3.輸出結果
2.1 爬行和抓取
搜索引擎蜘蛛通過鏈接發現鏈接的方式去訪問網頁,從而獲得頁面HTML代碼存入數據庫
那么搜索引擎蜘蛛又是怎樣抓取網頁的呢?
答:發現某一個鏈接 → 下載這一個網頁 → 加入到臨時庫 → 提取網頁中的鏈接 → 在下載網頁 → 循環
2.2 預處理(建立索引)
蜘蛛(專業術語:索引程序)對抓取來的網頁內容要進行關鍵詞提取、生成倒排索引、頁面PageRank值及TrustRank值計算、頁面關鍵詞相關性等處理以備排名程序調用,這也是搜索引擎能在極短時間內返回搜索結果的關鍵,其中我們最關心的是PR值和相關性
2.3 輸出結果
用戶輸入關鍵詞后,排名程序調用索引庫數據,程序自動匹配關鍵詞,然后按一定規則生成搜索結果展示頁面,這是因為前面的預處理,搜索引擎才能夠在很短的時間內返回輸出結果,這里特別要提醒一下自然搜索排名和競價推廣排名是有區別的
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/126402.html
摘要:本章會對語言引擎,運行時,調用棧做一個概述。調用棧只是一個單線程的編程語言,這意味著它只有一個調用棧。查看如下代碼當引擎開始執行這段代碼的時候,調用棧會被清空。之后,產生如下步驟調用棧中的每個入口被稱為堆棧結構。 原文請查閱這里,本文采用知識共享署名 4.0 國際許可協議共享,BY Troland。 本系列持續更新中,Github 地址請查閱這里。 這是 JavaScript 工作原...
摘要:本章會對語言引擎,運行時,調用棧做一個概述。調用棧只是一個單線程的編程語言,這意味著它只有一個調用棧。查看如下代碼當引擎開始執行這段代碼的時候,調用棧會被清空。之后,產生如下步驟調用棧中的每個入口被稱為堆棧結構。 原文請查閱這里,本文采用知識共享署名 4.0 國際許可協議共享,BY Troland。 本系列持續更新中,Github 地址請查閱這里。 這是 JavaScript 工作原...
摘要:調用棧是單線程編程語言,意味著它只有單一的調用棧。調用棧是一種數據結構,基本記錄了程序運行的位置。舉個例子,先來看如下所示的代碼當引擎開始執行這段代碼時,調用棧將是空的。這正是拋出異常時棧追蹤的構造過程這基本上就是異常拋出時調用棧的狀態。 原文 How JavaScript works: an overview of the engine, the runtime, and the c...
摘要:譯者注翻譯一個對新手比較友好的工作原理解析系列文章注意以下全部是概念經驗豐富的老鳥可以離場啦正文從這里開始隨著的流行團隊們正在利用來支持多個級別的技術棧包括前端后端混合開發嵌入式設備以及更多這篇文章旨在成為深入挖掘和實際上他是怎么工作的系列 譯者注 翻譯一個對新手比較友好的 JavaScript 工作原理解析系列文章 注意: 以下全部是概念,經驗豐富的老鳥可以離場啦 正文從這里開始 隨...
摘要:這里有一份面試題相關總結,涉及高并發分布式高可用相關知識點,在此分享給大家,希望大家能拿到一份理想的知識點會陸續更新在上,覺得還算湊和的話可以關注一下噢高并發架構消息隊列為什么使用消息隊列消息隊列有什么優點和缺點都有什么優點和缺點如何保證消 這里有一份面試題相關總結,涉及高并發、分布式、高可用相關知識點,在此分享給大家,希望大家能拿到一份理想的 Offer! 知識點會陸續更新在 Git...
閱讀 3514·2023-04-25 20:09
閱讀 3720·2022-06-28 19:00
閱讀 3035·2022-06-28 19:00
閱讀 3058·2022-06-28 19:00
閱讀 3131·2022-06-28 19:00
閱讀 2859·2022-06-28 19:00
閱讀 3014·2022-06-28 19:00
閱讀 2610·2022-06-28 19:00