http://www.digitalwall.com/scripts/display.asp?UID=288
◎淺談搜尋引擎運作:資料抓取
由於全球網頁暴量成長,人工分類不敷所需,全文檢索式的搜尋引擎變成主流。靠著搜尋機器人(Search Bot)自動到全世界抓取網頁,抓回來的網頁上有許多連結,Bot 又自動跟隨這些連結繼續往下抓。
換言之,如果你做了一個網站,但沒有任何其他網站連結到你的網站來,你也沒有主動到搜尋引擎去登錄你的網址,這個網站是永遠無法被搜尋引擎的Bot 找到的,因此你的網站也永遠不會被網友搜尋到。
Bot 搜尋回來的資料放入資料庫中,使用者輸入關鍵字搜尋的時候,搜尋引擎就自動比對資料庫,把網頁上有出現這個字的頁面通通找出來,經過排序之後秀出來。問題是,搜尋引擎如何決定排列順序?
事實上,搜尋引擎會把Bot 找回來的網頁打分數,因此搜尋時分數高的網頁就會排在前面,而排名第10頁以後的網站大概永遠出不了頭。各家搜尋引擎幫網頁打分數的方法不盡相同,但大體方式如下:
◎淺談搜尋引擎運作:頁面排序
1)該頁面出現那個關鍵字的次數。
比如說有兩個網頁都有提到「電子商務」這四個字,其中一個提到的次數比較多,因此獲得的分數就會比較高些。運用這個方法對搜尋引擎排序的影響較小,因為搜尋引擎也怕網站經營者對網頁「灌水」。
2)網頁標題(Title Tag )是否有出現該關鍵字。
這裡所指標題並不是網頁上的文章標題,而是指HTML語法中的Title Tag 。以上面的例子來說,「電子商務」四個字就必須出現在Title Tag 中,以獲得較高分數。不過此種方式的影響也有限。
3)這個網頁被其他網頁連結的次數與品質。
這是最具決定性的方式,筆者將此種方式戲稱做「投票式的排序方法」。例如,某網頁 A上面有10個連結,其中一個連結到網頁 B,那麼就表示 A投了 B一票,或者說 B得到一分。
當然,網頁 B可能也連結到網頁 C,因此 B也幫 C打分數。由於網路的相連特性,全世界網頁彼此互相打分數,因此每個網頁都有分數。那些被別人連結最多次的網頁,得到最多票,自然就得到最高分。
此外,每個人手上的票份量並不相等。本身分數高的網頁,當它連結到別的網頁時,給對方的分數會越高。假設Google首頁有連結到貴公司網站某頁,該頁面的分數將大大提高,因為Google本身分數很高。
於是我們恍然大悟,原來要拉高自己網站在搜尋引擎的排名,只要「讓別人連到我的網頁來」以及「找知名度高的網站來連結我」就可以。問題是這該怎麼做? (文:黃彥達)
◎第一步:到搜尋引擎去登記網址
這是消費者擁有主動權的年代,也是On Demand 的年代。所以行銷模式從「主動發出廣告訊息」變成「當消費者需要某種服務,我第一個出現並提供」。消費者運用搜尋引擎找資料,正是這種精神的體現。
然而很多網站從頭到尾就沒被搜尋引擎Bot 找到過,網頁內容當然不會被收到搜尋引擎資料庫中。網友找不到,就更別談要出現在搜尋結果第一頁。以下是較知名搜尋引擎的網址登記處,請記得去登記!
1)Yahoo!:http://submit.search.yahoo.com/free/request
2)Google:http://www.google.com/intl/en/addurl.html
3)Baidu :http://www.baidu.com/search/url_submit.html
◎拉抬網頁分數的方法:增加站內互連
如前文所述,搜尋引擎幫每個網頁打分數的高低,會決定搜尋結果的排列順序,而你的網頁被別人的網頁連結的次數越多,這個分數越高。因此你能做的第一件事情:增加自己網站內頁相互連結的機會。
與其期待別的網站來連結你,不如自己先連自己。以筆者自己的網站「數位之牆」為例,本來單篇文章之間彼此沒有連結,於是筆者創造了三個方式讓網站上將近三百篇的文章互連。
第一個稱為「歷史上的今天」。由於數位之牆已經累積六年以上的文章,因此在每篇文章結尾,列出過去六年內同一個日期發表的文章標題,並連結到這些文章的網頁去。
第二種方式,在每篇文章的結尾增加了「上一篇」與「下一篇」的連結,讓讀者看完本篇文章後能直接跳到下週的文章,或者上週的文章做更進一步的閱讀。
第三種方式,增加內文關鍵字連結。比如說,在談論「無線上網」的文章,內文提到了「手機」這個字眼。於是幫這個字加上連結,連到其他有談論到「手機」的相關文章去。
這些方式讓讀者覺得方便而不覺得突兀。一方面增加舊文章被閱讀的機率,並且以服務的角度出發方便讀者閱讀。另一方面,同時間達到增加網頁互相連結,進而增加這些網頁在搜尋引擎的分數。
◎以關鍵字來進行網站分類
網站經營者必須以使用者角度想事情。「當使用者腦海裡想到什麼字眼時,會到我的網站來?」以這些關鍵字將網站上的頁面分類,並且把所有跟這些關鍵字有關的文章集合到這個分類頁面下。
請讀者到「數位之牆」網站上(http://www.digitalwall.com)的「 電子商務」這個分類頁面看一下,你很容易注意到,所有跟電子商務相關的文章,大約40篇左右通通放到這個分類頁面底下。
而這個分類頁面又往下連結到這40篇文章,由於這個「電子商務」的分類頁面本身分數高,所以被連結到的這40篇文章也同時被打了高分。就這樣,整體網站的所有網頁分數越拉越高。
在台灣Yahoo!搜尋「電子商務」,數位之牆出現在搜尋結果第一頁的,就是這個電子商務分類網頁,而非數位之牆首頁。你希望網友查詢哪些關鍵字的時候連結到你的網頁來?用這些字來做網站分類。
此外,網頁設計師記得將關鍵字設定在HTML的Title Tag 中,這會影響到該頁面的搜尋引擎分數及呈現。例如數位之牆的電子商務分類頁,Title 就是「《個人.家庭.數位化 -數位之牆》電子商務」。
早期還有網頁設計師將相關的關鍵字寫入網頁HTML中的Meta Tag中,這當然是標準作法。不過近年來由於使用假的Meta Tag來欺騙搜尋引擎的案例太多,很多搜尋引擎已經不將Meta Tag納入評分標準。
◎運用授權文章增加外站連結
數位之牆的文章除了每週在本站發表外,還授權給其他大型新聞網站與電子報網站發佈,文章網頁也存留在這些高知名度的網站上。這些網頁都有連回數位之牆的連結,等於又幫數位之牆打了高分。
「在網路上努力創造內容的人有福了」。這些文章內容透過各式的聯盟合作廣為散佈並連結回來,將使自己的網站在搜尋引擎上得到較好的排名。當這些授權文章累積到上百篇時,你能想像它的力量嗎?
經過半年操作,數位之牆網站多年來頭一次因流量過大而當機,並接獲 ISP來信提醒網站耗用頻寬過大。其實只要瞭解搜尋引擎運作原理,你可以考量自己網站特性而有不同創意,而這完全不花你一毛錢!
請注意!筆者並非鼓勵大家「玩弄」搜尋引擎。「歷史上的今天」,「上一篇」與「下一篇」,「關鍵字連結」,「依關鍵字分類網頁」,「創造內容並開創合作」,這些完全都是替讀者考量的貼心設計。
若不是因為筆者約略理解搜尋引擎的運作方式,可能還會完全想不透為什麼網站的每月新增訪客數量成長五倍?「把自己份內的事情做好,你就能得到新客戶」這句話在網路上一點都不假。
筆者希望大家在瞭解搜尋引擎的運作原理後,能夠想出更多的創意來服務網站使用者,同時提升自己的網站在搜尋引擎的曝光度。只要把客戶擺在第一位,真的不愁沒生意,而這不花你什麼錢。 (文:黃彥達)