Google的官方部落格在2008年5月刊登了伍由.曼伯(Udi Manber)的這篇文章「Introduction to Google Search Quality」,並且透露Google將定期公告關於搜尋引擎的訊息。根據伍迪.曼伯的文章,Google有超過百人以上的工程師與科學家直接在研究與改善搜尋引擎技術,另外有團隊負責品質評估、使用者界面開發、垃報技術偵測等,他表示在2007年Google就有450次的改善修正,平均每週就改善9次之多。
另外一位創立Blekko的里奇.斯克倫塔(Rich Skrenta)談論到插尋引擎說:「搜尋引擎就是把全球的頁面複製一份到你的叢集裡,然後進行七項苦工(分散式系統、HTML分析、文字與語意分析、反垃圾、人工智慧與機器學習、使用界面、彈性的系統規模),然後每天都會驚訝發現許多的色情與垃圾網站」。他的最後一句透露了兩個重點:取巧的網頁會被抓出來,以及人類在整個過程中會介入資料的判斷。
其實從2007年Google的PR調整來處罰Paid link(付費式聯結),大概就清楚人為干擾搜尋引擎演算法的例子,但由里奇.斯克倫塔的說法就更加明白,非自然的網頁行為是被嚴密監控的,也許你會認為上億頁的資料中不會被發現,那你就低估了人工智慧與機器學習的可能性。
雖然搜尋引擎的作業相當繁複,但是我們可以把它簡單劃分成幾個步驟:
- 由網路上抓取各網站的資料(Data Crawling)
- 將抓回來的資料處理與建立索引(Data Indexing)
- 以演算法建立各網頁評比分數(Data Scoring)
- 搜集使用者瀏覽網路的習慣資料(User Browsing Statistics)
- 由使用者搜尋資料搜集關鍵字及點選率(User Search Statistics)
這五個步驟詳細的內容,將在以後說明。
因此如果想要讓搜尋引擎能夠把你的網頁顯示在搜尋結果的前面幾頁(SEO),就必須深入瞭解上面五個步驟的過程,這些就牽涉到太多深奧的資訊工程學、社會學、心理學、網路行銷學、
與關鍵字排名等等知識,但是如果能夠鎖定小妹的部落格,你也可以不費吹灰之力的掌握所有關鍵字優化的核心知識。
Peace !
留言列表