解析谷歌PageRank網頁排名算法原理

SEO優化 第1張" alt="解析谷歌PageRank網頁排名算法原理 SEO優化 第1張" style="box-sizing: border-box; margin-left: auto !important; max-width: 100%; height: auto !important; display: block; margin-top: 20px; margin-bottom: 20px; margin-right: auto !important;">

PageRank算法背景:搜索結果上萬條用戶只關注前20位

整個互聯網的網頁數量是巨大的,已被百度抓取并索引的中文網頁應該也是千億級別的了,但是用戶所需要的信息只有一小部分。我們在百度上搜索的幾乎每一個關鍵詞,百度都會返回成千上萬條搜索結果,不論返回結果有多少,大部分人都會在前2頁找自己所需要的信息,很少有人會瀏覽第3頁或者更靠后的搜索結果。

搜索引擎的難題:如何把用戶最想看到的結果排在前面?

對于搜索引擎來說,這成千上萬條結果該如何排序,怎樣才能把用戶最想看到的結果排在前面呢?這個問題很大程度上決定了搜索引擎的質量。總的來講,對于一個特定的查詢,搜索結果的排名取決于兩組信息:
1. 關于網頁的質量信息,
成人抖音app苹果2. 這個查詢與每個網頁的相關性信息。

雅虎(Yahoo)最先試圖給互聯網上的眾多網站排序

成人抖音app苹果最先試圖給互聯網上的眾多網站排序的并不是Google,而是雅虎公司。雅虎的創始人楊致遠和費羅最早使用目錄分類的方式讓用戶通過互聯網檢索信息。但是由于計算機存儲容量和速度的限制,雅虎和同時代的其他搜索引擎都存在一個共同的問題:收錄的網頁太少,而且只能對網頁中常見內容相關的實際用詞進行索引。

PageRank算法通過投票來決定網頁質量

真正找到計算網頁自身質量的完美的數學模型的是Google的創始人佩奇和布林。Google的"PageRank" (網頁排名) 是怎么回事呢?其實簡單地說就是民主表決。打個比方,假如我們要找李開復博士,有100個人舉手說自己是李開復。那么誰是真的呢?也許有好幾個真的,但即使如此誰又是大家真正想找的呢?如果大家都說在創新工場的那個是真的,那么他就是真的。

解析谷歌PageRank網頁排名算法原理  SEO優化 第2張

PgeRank算法對來自不同網頁的鏈接區別對待

成人抖音app苹果當然Google的PgeRank算法實際上要復雜得多。比如說,對來自不同網頁的鏈接區別對待,因為那些排名高的網頁的鏈接更可靠,于是要給這些鏈接以較大的權重。這就好比在現實世界中股東大會里的表決,要考慮每個即的股東,對最后的表決結果的影響力明顯不同。PageRank 算法考慮了這個因素,即網頁排名高的網站貢獻的鏈接權重大。

PageRank的核心思想

在互聯網上,如果同一個網頁被很多其他網頁所鏈接,說明它受到普遍的承認和信賴。那么它的排名就高。這就PageRank的核心思想。

解析谷歌PageRank網頁排名算法原理  SEO優化 第3張

Google革命性的發明是PageRank的網頁排名算法

網頁排名算法的高明之處在于它把整個互聯網當作一個整體來對待,這無意中符合了系統論的觀點。相比之下,以前的信息檢索大多把每一個網頁當作獨立的個體對待,大部分人當初只注意了網頁內容和查詢語句的相關性,忽略了網頁之間的關系。雖然在佩奇和布林同時代也有一些人在思考如何利用網頁之間的聯系來衡量網頁的質量,但只是摸到一些皮毛,找到一些拼湊的辦法,都沒有從根本上解決問題。

PR算法革命性地將準確率提高了好幾倍

成人抖音app苹果PageRank在當時對搜索結果的影響非常大。在1998年前后,所有互聯網上能找到的搜索引擎,每十條結果只有兩三條是相關的、有用的。而還在斯坦福大學實驗室里的Google當時能做到每十條結果有七八條是相關的。這是一一個質的差別,給人的感覺就如同iPhone和老式諾基亞手機的差異那么大。這使Google得以迅速打敗以前所有的搜索引擎。

用戶搜索點擊行為對搜索質量影響很大

但是今天,任何商業的搜索引擎,十條結果都有七八條是相關的了,而且決定搜索質量最有用的信息是用戶的點擊數據,相反,一項新的技術為搜索質量帶來的提升空間卻非常有限,用戶很難感覺到差別。這也是后來微軟等公司很難在搜索上有所作為的原因。

時至今日PageRank在Google所有算法中依然至關重要

成人抖音app苹果今天,Google搜索引擎比最初復雜、完善了許多。但是PageRank在Google所有算法中依然是至關重要的。在學術界,這個算法被公認為是文獻檢索中最大的貢獻之一,并且被很多大學列為信息檢索課程( Information Retrieval)的內容。佩奇也因為這個算法在30歲時當選為美國工程院院士,是繼喬布斯和蓋茨之后又一位當選院士的輟學生。由于PageRank算法受到專利保護,它帶來了兩個結果。首先,其他搜索引擎開始時都比較遵守游戲規則,不去侵犯它,這對當時還很弱小的Google是一個很好的保護,第二,它使得斯坦福大學擁有了超過1%的Google股票,收益超過10億美元。


解析谷歌PageRank網頁排名算法原理  SEO優化 第4張

感謝您的支持,我會繼續努力的!

解析谷歌PageRank網頁排名算法原理  SEO優化 第5張
掃碼打賞,你說多少就多少

打開支付寶成人抖音app苹果掃一掃,即可進行掃碼打賞哦

作者頭像
便宜技術博客創始人

樂享資源記憶點滴的博客,主要分享程序源碼!

  • 我是一個熱愛鉆研計算機技術的青少年,從小開始對計算機有極大的興趣。目前我專注網站開發領域。我還自己發起建立了一個制作游戲的團隊,希望能和大家合作,一同創造出屬于我們自己的作品!
  • 版權聲明:本站文章如無特別標注,均為本站原創文章,于2020-08-21,由便宜技術博客發表,共 2464個字。
  • 轉載請注明出處:便宜技術博客,如有疑問,請聯系我們
  • 本文地址:http://greenst.cn/?id=341
上一篇:彩虹自助下單系統QQ快捷登錄配置
下一篇:小儲云商城系統如何安裝攻略來襲!

發表評論