" />
Aim 網頁 搜尋器優化服務SEO     最新資訊     軟件工具

 > 返回

2011-07-13
PageRank是什麼?
PageRank是Google演算法的重要內容。2001年9月被授予美國專利,專利人是Google創始人之一拉裏•佩奇(Larry Page)。因此,PageRank裏的page不是指網頁,而是指佩奇,即這個等級方法是以佩奇來命名的。

Google 的PageRank根據網站的外部鏈結和內部鏈結的數量和品質倆衡量網站的價值。PageRank背後的概念是,每個到頁面的鏈結都是對該頁面的一次投 票,被鏈結的越多,就意味著被其他網站投票越多。這個就是所謂的“鏈結流行度”——衡量多少人願意將他們的網站和你的網站掛鈎。PageRank這個概念 引自學術中一篇論文的被引述的頻度——即被別人引述的次數越多,一般判斷這篇論文的權威性就越高。
Google有一套自動化方法來計算這 些投票。Google的PageRank分值從0到10;PageRank為10表示最佳,但非常少見,類似裏氏震級(Richter scale),PageRank級別也不是線性的,而是按照一種指數刻度。這是一種奇特的數學術語,意思是PageRank4不是比PageRank3好 一級——而可能會好6到7倍。因此,一個PageRank5的網頁和PageRank8的網頁之間的差距會比你可能認為的要大的多。
PageRank 較高的頁面的排名往往要比PageRank較低的頁面高,而這導致了人們對鏈結的著魔。在整個SEO社區,人們忙於爭奪、交換甚至銷售鏈結,它是過去幾年 來人們關注的焦點,以至於Google修改了他的系統,並開始放棄某些類型的鏈結。比如,被人們廣泛接受的一條規定,來自缺乏內容的“link farm”(鏈結工廠)網站的鏈結將不會提供頁面的PageRank,從PageRank較高的頁面得到鏈結但是內容不相關(比如說某個流行的漫畫書網站 鏈結到一個叉車規範頁面),也不會提供頁面的PageRank。Google選擇降低了PageRank對更新頻率,以便不鼓勵人們不斷的對其進行監測。

Google PageRank一般一年更新四次,所以剛上線的新網站不可能獲得PR值。你的網站很可能在相當長的時間裏面看不到PR值的變化,特別是一些新的網站。PR值暫時沒有,這不是什麼不好的事情,耐心等待就好了。
為您的網站獲取外部鏈結是一件好事,但是無視其他SEO領域的工作而進行急迫的鏈結建設就是浪費時間,要時刻保持一個整體思路並記住以下幾點:
  ·Google的排名演算法並不是完全基於外部鏈結的
  ·高PageRank並不能保證Google高排名
  ·PageRank值更新的比較慢,今天看到的PageRank值可能是三個月前的值
因 此我們不鼓勵刻意的去追求PageRank,因為決定排名的因素可以有上百種。儘管如此,PageRank還是一個用來瞭解Google對您的網站頁面如 何評價的相當好的指示,建議網站設計者要充分認識PageRank在Google判斷網站品質中的重要作用,從設計前的考慮到後期網站更新都要給予 PageRank足夠的分析,很好的利用。我們要將PageRank看作是一種業餘愛好而不是一種信仰。
通過對由超過 50,000 萬個變數和 20 億個辭彙組成的方程進行計算,PageRank 能夠對網頁的重要性做出客觀的評價。PageRank 並不計算直接鏈結的數量,而是將從網頁 A 指向網頁 B 的鏈結解釋為由網頁 A 對網頁 B 所投的一票。這樣,PageRank 會根據網頁 B 所收到的投票數量來評估該頁的重要性。
此外,PageRank 還會評估每個投票網頁的重要性,因為某些網頁的投票被認為具有較高的價值,這樣,它所鏈結的網頁就能獲得較高的價值。重要網頁獲得的 PageRank(網頁排名)較高,從而顯示在搜索結果的頂部。Google 技術使用網上回饋的綜合資訊來確定某個網頁的重要性。搜索結果沒有人工干預或操縱,這也是為什麼 Google 會成為一個廣受用戶信賴、不受付費排名影響且公正客觀的資訊來源。
其實簡單說就是民主表決。打個比方,假如我們要找李開複博士,有一百個人舉手說自己是李開複。那麼誰是真的呢?也許有好幾個真的,但即使如此誰又是大家真正想找的呢?:-) 如果大家都說在 Google 公司的那個是真的,那麼他就是真的。
在 互聯網上,如果一個網頁被很多其他網頁所鏈結,說明它受到普遍的承認和信賴,那麼它的排名就高。這就是 Page Rank 的核心思想。 當然 Google 的 Page Rank 演算法實際上要複雜得多。比如說,對來自不同網頁的鏈結對待不同,本身網頁排名高的鏈結更可靠,於是給這些鏈結予較大的權重。Page Rank 考慮了這個因素,可是現在問題又來了,計算搜索結果的網頁排名過程中需要用到網頁本身的排名,這不成了先有雞還是先有蛋的問題了嗎?
Google 的兩個創始人拉裏•佩奇 (Larry Page )和謝爾蓋•布林 (Sergey Brin) 把這個問題變成了一個二維矩陣相乘的問題,並且用迭代的方法解決了這個問題。他們先假定所有網頁的排名是相同的,並且根據這個初始值,算出各個網頁的第一 次迭代排名,然後再根據第一次迭代排名算出第二次的排名。他們兩人從理論上證明了不論初始值如何選取,這種演算法都保證了網頁排名的估計值能收斂到他們的真 實值。值得一提的事,這種演算法是完全沒有任何人工干預的。
理論問題解決了,又遇到實際問題。因為互聯網上網頁的數量是巨大的,上面提到的二維矩陣 從理論上講有網頁數目平方之多個元素。如果我們假定有十億個網頁,那麼這個矩陣 就有一百億億個元素。這樣大的矩陣相乘,計算量是非常大的。拉裏和謝爾蓋兩人利用稀疏矩陣計算的技巧,大大的簡化了計算量,並實現了這個網頁排名演算法。今 天 Google 的工程師把這個演算法移植到並行的電腦中,進一步縮短了計算時間,使網頁更新的週期比以前短了許多。
我來 Google 後,拉裏 (Larry) 在和我們幾個新員工座談時,講起他當年和謝爾蓋(Sergey) 是怎麼想到網頁排名演算法的。他說:"當時我們覺得整個互聯網就像一張大的圖 (Graph),每個網站就像一個節點,而每個網頁的鏈結就像一個弧。我想,互聯網可以用一個圖或者矩陣描述,我也許可以用這個發現做個博士論文。" 他和謝爾蓋就這樣發明了 Page Rank 的演算法。
網頁排名的高明之處在於它把整個互聯網當作了一個整體對待。它無意識中符合了系統論的觀點。相比之下,以前的資訊檢索大多把每一個網頁當作獨立的個體對待,很多人當初只注意了網頁內容和查詢語句的相關性,忽略了網頁之間的關係。
今 天,Google 搜索引擎比最初複雜、完善了許多。但是網頁排名在 Google 所有演算法中依然是至關重要的。在學術界, 這個演算法被公認為是文獻檢索中最大的貢獻之一,並且被很多大學引入了資訊檢索課程 (Information Retrieval) 的教程。
Whatsapp
Whatsapp