2009年12月10日 星期四

最新爆衝關鍵字


當然在部觀門一開站時, 就在想如何 "萃取" 出即時關鍵字的方式, 後來想出個 "泡沫法" 之後, 覺得這是相當實用的小技巧, 簡單就是較長的關鍵字若在較少的次數下, 可以被子字串給包含, 而在經過幾次的 "疊迨" 運算後, 就是最後的結果.. anyway, 聽不懂沒關係, 就是簡化及取出真正的關鍵字的方法, 而不被 "條件", "歧異" 的問題所充斥失去資訊價值.

只是這個演算法必須要一定的量才能運作, 且有時還是會有 "誤差", 所以最後用更多的條件來去降低錯誤, 所以最後的方法是:

1. 從大家貼的部落格觀察貼紙的來源萃取出搜尋引擎的關鍵字
2. 每小時取出前兩小時區間的資料來算出前 3 名關鍵字
3. 若這個關鍵字超過一定的數, 以及至少分散在 3 至 5 個部落格以上, 就開始比對資料庫
4. 資料庫若是沒有出現過這個關鍵字, 則是 "新爆衝關鍵字", 寫入資料庫
5. 現在會發一則噗在噗浪 keyword 這個帳號

畢竟像部觀門的關鍵字是以天為單位的去計算, 是用人工的 "工人智慧" 去選出值得觀察的關鍵字, 雖然這是個有效的機制, 但有時以天為單位還是不夠, 所以才想到用小時來去萃取.