第335章 投資

第335章投資

在早期,搜尋引擎最常見的做法就是直接對網站進行整個抓取,並且剛開始的時候一般只抓取網頁的標題,這就像是將圖書館中所有書籍的名字都登記在自己的本地資料庫中,別人要想查詢相關內容,使用關鍵字在這個資料庫中進行匹配,如果發現標題中含有這個關鍵字,那麼就可以認為這本書就是使用者所需要找的內容,便將這本書所在的書架告訴使用者,讓他去訪問。

書即網站,書所在書架則就是網站的地址連結。

後來,搜尋引擎規模化,公司化之後,財大氣粗的公司擁有大量的資金,可以購置大量的伺服器和硬碟,於是便開始了將網站上的所有網頁都給抓取下來,也就是說,使用者不但可以進行標題搜尋,還可以進行全文搜尋。這無疑是一種進步,因為標題通常情況下所包含的資訊只有那麼多,不可能涵蓋所有內容。

但是,這是一個資訊大爆炸的時代,網際網路就是一個知識的海洋,網站成千上萬,一個關鍵詞搜尋出來的結果往往也有成千上萬,如果在這些結果中找到自己所需要的資訊,又成為了一個難題。

這是所有搜尋引擎都在研究的問題,歸根結底,就是將網頁進行排序,越好的網頁應該越排前列,這樣使用者就不需要huā費多少時間就能找到自己所需要的資訊。

說起來容易做起來卻是相當困難,各個搜尋引擎公司都有自己的排序演算法,這些都是商業機密,不對外公開。而使用者都是非常現實的,如果你的產品好,的確可以帶來便利,那麼他就會使用,並且還會推薦別人使用。

林鴻所發現的這個bckrup就是看到別人推薦才發現的,並且一用之下,發現它的演算法的確很強,通常情況下都能很快找到自己所要找的資訊。

他經過研究發現,這個搜尋引擎使用了一種名為pagerank的演算法。

實際上,林鴻也不知道到底是不是叫這個名稱,他之所以稱之為pagerank,是因為這個名詞多次出現在原始碼中。

每一個網站都對應著一個pagerank值,伺服器上專mén有一個資料庫,用來儲存各個網站的pagerank值。

林鴻將整個原始碼通讀了一遍,他發現pagerank分為十一個等級,從0級到10級,級別越高就代表著質量越好,那麼該網站的排名也就越高。

至於如何計算網站的pr值也非常巧妙,則是根據連結的數量而進行計算的。

簡單說來就是統計所有蜘蛛所發現的那些網站上的連結,這些網站中通常都含有指向其他網站的連結,將其看成是一種投票,誰有一個連結,就得一分,誰的連結最多,誰的分數就越高,再將這個分數進行轉換,便有了pr值,。

這個演算法的核心思想是,如果你的網站質量好,那麼別人就會喜歡給你做連結,向別人推薦。

林鴻猜測,這種演算法思想,很可能是來自科學界的文獻引用計算原則。

科學家寫文獻和論文的時候,通常需要查閱大量的資料,並且一般都會在自己的論文的末尾將查閱到的資料進行引用。一般認為,引用越多的文獻,質量便越高。

這個backrub的網站正是使用這種方式來對網頁進行評級,從而讓使用者獲得了比較好的體驗。

林鴻在這臺伺服器中,看到了一份商業計劃書,這個網站的主任larrypage似乎打算將這個網站進行商業化,正打算尋找天使投資人。

看到這裡,林鴻有些心動了。

他對這個專案非常看好,雖然目前僅僅只是一個雛形,還有很多不足,不過這並沒有關係,還可以繼續進行完善。

這個專案很符合他一直以來都在想的一個問題,那就是在資訊大爆炸時代,如何對這些資訊進行加工處理,並且從中發現商業價值。

而很顯然,這個backrub正好非常符合。

林鴻思考良久,最終決定投資這個專案。

林鴻調出位元信使,給菲麗絲髮了幾段資訊,讓她關注一下斯坦福的這個專案,如果他們尋求投資,則以他的名義進行接觸。

發完這些訊息之後,他便給菲麗絲髮了一條簡訊,讓她有時間的話就上線查收一下。

作者「瘋狂小強」的其他小說

修仙高手再戰都市