在今天看見明天
熱門: 台積電 兆豐金 勞退 特斯拉 航運股

談網路的超連結與蝴蝶結理論 p.86

談網路的超連結與蝴蝶結理論 p.86

也不知道從什麼時候開始,網路這個產業已經成為吸引人才與資金的最大黑洞。以人才來說,不僅許多即將踏入社會的年輕人把網路這一行視為選擇工作時的最愛,不少原本在非網路產業裡累積了相當資歷的中階幹部,甚至高階主管也決定離開原有的行業,轉戰網路的消息更是時有所聞。

其實由網際網路早在三十年前就已經出現,幾年前還沒沒無聞,直到最近開始出現資金與人才瘋狂投入的情形來看,網路的發展史中一定有著許多重要的里程碑,才會出現這樣的變化。而截至目前為止,我認為在這三十多年的網際網路發展歷史中,最重要的一刻就是全球資訊網( World Wide Web, WWW )的誕生。

現在許多人可能已經不需要去分辨全球資訊網以及網際網路的差別了,一切都以「網路」兩個字稱呼。 但是在包括瀏覽器在內等 WWW 相關軟體與技術剛萌芽之際,其實是有不少人在比較全球資訊網和網際網路之間存在哪些差異的。

在大約十年前 WWW 剛出現的那時候, 如果你要向已經有接觸過網際網路的人解釋全球資訊網是什麼的話,最簡單易懂的解釋會是「全球資訊網就等於網際網加上多媒體以及超連結」。也就是全球資訊網的特性包括網際網路、多媒體以及超連結三項。雖然這是當時的解釋,但是拿到今天來看可能依然適用。

就像網際網路串連了全球無數台電腦以及許多網路一樣,全球資訊網具有像網際網路一樣的互聯與分散特性毋庸置疑。而當網路上傳遞資訊的形式由原本的單一文字,擴大到包括圖形、影像與聲音等多媒體內容時,網路的介面頓時變得非常親切, 就像是個人電腦由文字模式的 DOS 環境進步到圖形介面的視窗環境一樣。

全球資訊網另外一項非常重要的特色就是超連結。在全球資訊網出現之前,網際網路上就已經存在著許多豐富的資訊,不過這些資訊全都分散在世界各地的電腦主機裡面,並且以包括文件或是資料庫等各種不同的方式存在。那時候人們想要上網找資料是很費力的一件事,因為你根本不知道從什麼地方可以找到什麼樣的資料;文件與文件或是資源與資源之間,並不存在著任何「一觸可及」的連結。

因此當 Tim Berners-Lee 在歐洲粒子物理實驗室( European Laboratory forParticle Physics,CERN )裡,想到要將其實也已經發明了幾十年的超連結觀念,加進他所設計的資訊分享系統上時,全球資訊網的雛形就誕生了。而當這種其實是與人類的思考模式更為接近的非線性或跳躍式的資訊呈現方式,加上網際網路的分散特性之後,網路成為最大的資訊寶藏,並進而因為商業的帶動而全面影響人類的生活就勢所難免了。

雖然被人尊稱為「全球資訊網之父」, 但是目前帶領全球資訊網聯盟( WorldWide Web Consortium, W3C )的 Tim Berners-Lee 這個名字,顯然並不像雅虎的楊致遠或亞馬遜的 Jeff Bezos 那麼家喻戶曉; 而 Berners-Lee 也沒有因為自己的發明與遠見,成為許多人稱羨的所謂「網路新貴」。但是人類的視界之所以能在網路上跨越時空、無限延伸,全是因為超連結這項功能。

因為有了超連結,今天我們才可能利用分類目錄,快速前進至我們有興趣的網站;因為有了超連結,我們才有可能更廣泛或更深層地知道某個主題的資訊。所以全球資訊之父才會說在網路上提供連結的人是很重要的,因為一個人努力閱讀並且持續記錄他所相信事物的結果,就會創造一個有價值的「網路」,並且讓其他更多的人知道他的種種想法與觀念。

就是因為有許多人不斷在網路上「製作」跨網站的內層超連結,因此我們才有會在網站分類目錄之外,感受到在資訊爆炸的網路世界中,依然存在著絲絲「秩序」。此外,除了人工手動的作業之外,也有一些業者是以搭配軟體技術的方式,企圖協助人們更精準地能找到想要的資訊,甚至嘗試去勾繪出網路的整體面容。

利用網路上的超連結來提高資訊搜尋精確度最好的例子就是 Google。 雖然它也是搜尋引擎,但是 Google 與其他搜尋引擎不同之處在於,它能在網路上符合查詢條件的許多篇網頁中,找出哪些網頁的關聯程度或重要性最高。而它憑藉的就是去檢視每一篇網頁的被連結次數。當某一篇網頁被別人提供的連結數目愈多時,它的重要性也就相對愈高。

至於利用網頁間的連結來勾繪出網路地圖這件事就更有趣了。根據最近公布的一項研究發現,如果我們不管每一篇網頁的內容,只考慮不同網頁彼此之間的連結關係的話,那麼整個全球資訊網看起來將不會像是一個「連結多的網頁靠裡面,連結少的網頁靠外面」的球體,而比較會像是一個手工不是很好的蝴蝶領結。

這個蝴蝶領結的中央核心部分,是屬於彼此連結非常緊密的一群網頁,人們可以在這個地方任意前進後退至任何一篇網頁,這塊區域大約占了全體網頁數量的○%。在領結的左半部,則是屬於一群你可以循著這些網頁上的連結,連到核心的一些網頁,但是卻無法由核心連回來的地方。在領結的右半部,則是另外一群你可以由核心部分連結而至,但是卻沒有太多機會可以連回核心的地方。領結左半部與右半部的網頁各占了總體網頁數量的二四%強。至於剩下還有大約二二%的網頁,則是一些和其他網頁連結比較鬆散,甚至完全沒有連結的區域;就像是蝴蝶領結的兩邊或後面掛了一些鬚鬚線頭一樣。

如果舉例的話,蝴蝶結核心部分的網頁通常也都會是一些人潮集中的地點,例如一些商業性質的網站應該都是在這塊區域。至於許多個人網頁則會是在蝴蝶結的左半部,因為個人製作的網頁通常都會擺上他所喜愛的一些網站連結,但是這些網站很可能並不會提供連結回報。至於一些較學術或冷門的資訊則會在蝴蝶結右半部的區域,因為他們很可能被一些位處核心區域的網頁所連結,但是他們並不會想要積極連回核心的部分。

上述的蝴蝶結理論是由 IBM、康柏與 AltaVista 三家公司所共同研究得來, 並且在五月中舉行的第九屆國際全球資訊網會議( 9th International WorldWide Web Conference )上發表。他們用了一台隨機記憶體高達十二 GB 的電腦,分析了兩億篇的網頁,以及其上超過十五億個連結。雖然目前全球資訊網上的網頁數量早已超過十億篇,但是這項研究卻已經是有史以來規模最大的一次。

當點選連結始終是絕大多數人在網路上最常用的瀏覽方式時,相信許多網站經營者都能從這項研究中,得到「盡量朝蝴蝶結中央靠攏」以及「和別人的連結愈多愈好」的結論。當然就算蝴蝶結理論沒有出現,相信這也是許多人都會有的認知。

不過這項研究的結果卻有點破壞了「網際網路像是資訊高速公路」的比喻。因為根據蝴蝶結理論,如果我們任意選擇兩篇網頁,那麼靠著點選連結的方式從一篇網頁,能夠成功連結到另外一篇網頁的機率只有四分之一;而就算這樣的路徑是存在的話,平均中間還得先通過十六個連結。 此外,就算從 A 網頁可以一路連結到 B 網頁,從 B 網頁也不見得就能順利連回來。

所以在許多情況下,網際網路並不像是可以四通八達的雙向資訊高速公路,反而比較像是一條條單行道,甚至有時我們可能還得面對沒有出口的死巷。

看來網路連結雖然能夠創造秩序,但是有時候也真能製造混亂呢!

(本文作者為知世網絡公司知識長,《一週網事電子雜誌》創辦人。歡迎來信討論 alex@wwwins.com )

延伸閱讀

《鐵路法》修法,為台鐵「公司化」帶來曙光!7大精華土地300億身價大盤點

2022-02-22

大船入港 ——貨櫃航運的超級財報周

2022-03-09

南山人壽買地專挑最貴的買...狂砸700億和「這集團」PK搶當「信義王」 商務城美夢快成真?

2022-03-25

新產、宏全、佳醫…都是逆勢大盤的定存成長股!殖利率5%↑、盈餘成長、K線也逆天

2022-04-11

智慧照顧領導品牌,智齡科技建構AI醫療 照護生態圈

2022-04-15