被遺忘的現代搜尋引擎之父 Jonathon Fletcher

被遺忘的現代搜尋引擎之父 Jonathon Fletcher

在科技界,真正獲得財富的常常不是發明家,而是擁有商業頭腦的人。如今,人們在提到搜尋引擎的時候,想到的是 Google 和它的創始人,很少有人去記起 Google 之前的搜尋引擎,更不會想到 Jonathon Fletcher 這個名字。但從網際網路的歷史上看,他是搜尋引擎之父。

被遺忘的現代搜尋引擎之父 Jonathon Fletcher

▲圖片來源TCD。右邊那位就是Jonathon Fletcher

Google 迎接了它的 15 歲生日,它成為了資訊檢索的代名詞。但可能許多人都沒有聽說過 Jonathon Fletcher 這個名字,如果將它輸入 Google 的搜尋框,沒有直接的結果會告訴你他在網際網路歷史中所發揮的作用,以及他作為現代搜尋引擎之父的角色。但正是在 20 年前,他在蘇格蘭斯特靈大學的一個電腦實驗室裡發明了世界上第一個採用網路爬蟲技術的搜尋引擎——該技術奠定了今天 Google、Bing、Yahoo 等搜尋工具的基礎。

1993 年,網路剛剛起步。歷史上第一款大眾瀏覽器 Mosaic 才出現不久,而網頁的總數量也僅有數千個,人們還不知道如何在網上檢索資訊。Mosaic 當時推出了一個叫做 What's New 的頁面,可以對新創建的網站進行索引。問題是,這些站長若要 Mosaic 的開發者獲知其新網站,須向 Mosaic 所在的國家超級電腦應用中心(NCSA)寫信通知。

在同一時期,Jonathon Fletcher 剛剛以優異成績從斯特靈大學畢業,並獲得了格拉斯哥大學提供的 PhD 學習機會。不幸的是,格拉斯哥大學終止了 PhD 研究經費,他頓時無事可做。「突然間我非常想去找一份工作,」他回想道:「所以我回到了母校,在那裡得到了在科技部門工作的機會。」正是這份工作讓他第一次接觸到了網際網路,以及 Mosaic。

被遺忘的現代搜尋引擎之父 Jonathon Fletcher
在建設一個網路伺服器的過程中,Jonathon 意識到 Mosaic 的 What's New 頁面是存在本質缺陷的。由於需要手動加入網站到 What's New 的清單上,網站內容的變動無法被追蹤,最終導致的後果是,許多清單上的連結很快就會過時,或者被錯誤標注。「如果你想知道發生了什麼變化,你必須親自回到網站上去查看,」他說:「我擁有電腦科學學位,認為應該有更好的解決方式,我決定編寫一個程式來幫助我進行查看。」而這一程式正是世界上首個網路爬蟲(web crawler)。

Jonathon 將他的發明取名為 JumpStation,他將一些網頁放在一起,提供給一個網路爬蟲進行搜尋,接下來它會自動對經過的所有網頁上的所有連結進行存取和索引,直到存取完所有內容。十天之後,也就是 1993 年的 12 月 21 日,JumpStation 完成了它的任務,總共索引了 25000 個頁面。Google 到目前為止頁面索引量已逾萬億。

很快 Jonathon 就為索引創建了一個易於使用的搜尋工具,並將之置於 Mosaic 的 What's New 頁面,世界上首個現代搜尋引擎誕生了。「我認為他是網路搜尋引擎之父,」研究資訊檢索歷史的 Mark Sanderson 教授說:「很長一段時間裡,都是由電腦完成搜尋工作,在網路出現前肯定也有搜尋引擎,但 Jonathon 的發明第一次具備了現代搜尋引擎的所有要素。」同 Google 一樣,其創始人謝爾蓋·布林和賴利佩吉的名字家喻戶曉,而現居香港的 Jonathon Fletcher 卻沒有為其在網際網路發展歷史所發揮的作用得到應有的認可。這可能也與他的專案被最終拋棄有關係。隨著 JumpStation 的成長,它需要越來越多的投資——而斯特靈大學當時並無此意願。「它在一台共用伺服器上運行,」Jonathon 解釋道:「當時沒有很多磁碟空間,而且那時候磁碟空間小、造價昂貴。」

被遺忘的現代搜尋引擎之父 Jonathon Fletcher這是用Mosaic's瀏覽 What's New 的頁面

到 1994 年 6 月,JumpStation 頁面索引量達到了 27.5 萬個。由於存儲空間限制,Jonathon 無法對頁面的所有內容進行索引,只能退而求其次,對標題和頁眉進行索引。即便如此,JumpStation 依然不堪重負。Jonathon 也開始覺得力不從心。「那不是我的本職工作,」他說:「我的工作是維持學生實驗室運行,做些系統管理和技術方面的零工。」來自日本的一份工作邀請也讓他難以拒絕,斯特靈大學方面對他也無意挽留。JumpStation 也沒有引起足夠的重視,「顯然我沒有成功說服他們 JumpStation 所具的潛力,」Jonathon 說:「那時候我做了我認為對的決定,但在過去 20 年裡,我也曾數次回首那段往事。」斯特靈大學電腦科學和數學主任 Leslie Smith 教授承認 JumpStation 事後被證明「領先於時代」,她說「大學的同事很高興看到 Jonathon 正在獲得他應得的認可」。

儘管 JumpStation 的最終結果讓人唏噓,但 Jonathon 的這一發明依然是隨後很多網路搜尋引擎的基礎。「1993 年時的網路社群規模還很小,」Sanderson 教授說:「當時任何與網路沾邊的人都知道 JumpStation。到 1994 年中,大家逐漸意識到網路搜尋引擎將變得非常重要,Google 直到 1998 年才出現,而 Jonathon 在 1993 年就在幹這事兒了。」

Jonathon 在數周前作為嘉賓參加了在愛爾蘭都柏林舉辦的一個會議,與他同座的是來自微軟、雅虎和 Google 的代表,他在演講中談論了未來。「以我的觀點,網路總有一天會消亡,」他說:「但搜尋資訊的難題將一直存在。從內容中搜尋和發現資訊的需求並不受媒介的限制。」

被遺忘的現代搜尋引擎之父 Jonathon Fletcher

許多搜尋引擎正是在他發明的技術基礎上發展和崛起來的,對此他沒有後悔:「我父母以我為榮,我妻子以我為榮,我的孩子們也以我為榮。這些對我來說很重要,所以我很快樂。」(bbc.co.uk)

被遺忘的現代搜尋引擎之父 Jonathon Fletcher

36Kr
作者

36氪(36Kr.com)累計發表超過10.8萬條包含圖文、音訊、影片在內的優質內容。氪原創內容體系涵蓋新創公司、大公司、投資機構、地方產業與二級市場等內容模組,設置有快訊、深度商業報導

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則