tag:blogger.com,1999:blog-6886241636793587012024-03-20T19:30:46.030+08:00來看關鍵字(部觀門)來看關鍵字的種種事情, 為部觀門與宅度計的官方個人部落格~~~黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.comBlogger91125tag:blogger.com,1999:blog-688624163679358701.post-90960565108429225542009-12-10T14:08:00.002+08:002009-12-10T14:28:02.222+08:00最新爆衝關鍵字<a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi2sJ_CAnl2B5eOFeNDlsqXUZnIHhfqemTnY47Jq1kGseDQ5G2N6vzHYGQ6TuLpmh8081B2z6m7U37hqB8tXuUu2W_h-d-LXd0uYcVR4abQ2u2u7hYeJVDDQWGiNRWBU0dBMsafj23Xtg/s1600-h/%E8%9E%A2%E5%B9%95%E5%BF%AB%E7%85%A7+2009-12-10+%E4%B8%8B%E5%8D%882.26.58.png"><img style="margin: 0pt 0pt 10px 10px; float: right; cursor: pointer; width: 301px; height: 212px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi2sJ_CAnl2B5eOFeNDlsqXUZnIHhfqemTnY47Jq1kGseDQ5G2N6vzHYGQ6TuLpmh8081B2z6m7U37hqB8tXuUu2W_h-d-LXd0uYcVR4abQ2u2u7hYeJVDDQWGiNRWBU0dBMsafj23Xtg/s200/%E8%9E%A2%E5%B9%95%E5%BF%AB%E7%85%A7+2009-12-10+%E4%B8%8B%E5%8D%882.26.58.png" alt="" id="BLOGGER_PHOTO_ID_5413490412097850434" border="0" /></a><br />當然在部觀門一開站時, 就在想如何 "萃取" 出即時關鍵字的方式, 後來想出個 "泡沫法" 之後, 覺得這是相當實用的小技巧, 簡單就是較長的關鍵字若在較少的次數下, 可以被子字串給包含, 而在經過幾次的 "疊迨" 運算後, 就是最後的結果.. anyway, 聽不懂沒關係, 就是簡化及取出真正的關鍵字的方法, 而不被 "條件", "歧異" 的問題所充斥失去資訊價值.<br /><br />只是這個演算法必須要一定的量才能運作, 且有時還是會有 "誤差", 所以最後用更多的條件來去降低錯誤, 所以最後的方法是:<br /><br />1. 從大家貼的部落格觀察貼紙的來源萃取出搜尋引擎的關鍵字<br />2. 每小時取出前兩小時區間的資料來算出前 3 名關鍵字<br />3. 若這個關鍵字超過一定的數, 以及至少分散在 3 至 5 個部落格以上, 就開始比對資料庫<br />4. 資料庫若是沒有出現過這個關鍵字, 則是 "<a href="http://door.urs.tw/newkeyword.php">新爆衝關鍵字</a>", 寫入資料庫<br />5. 現在會發一則噗在噗浪 <a href="http://www.plurk.com/keyowrd">keyword</a> 這個帳號<br /><br />畢竟像部觀門的關鍵字是以天為單位的去計算, 是用人工的 "工人智慧" 去選出值得觀察的關鍵字, 雖然這是個有效的機制, 但有時以天為單位還是不夠, 所以才想到用小時來去萃取.黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com1tag:blogger.com,1999:blog-688624163679358701.post-78198125298485269522009-03-13T02:40:00.002+08:002009-03-13T02:45:08.432+08:00昨天資料庫掛掉....昨天因為未名的原因重開機? (或之前有掛掉) 所以資料庫沒有重啟, 早成資料沒有寫入資料, 因此昨天的點閱數沒有被記錄到, ...<br /><br />影響所及的, 包含今天就沒有新增關鍵字了, 關鍵字數也很小, 昨天的關鍵字 widget 資料也容易是空著的..<br /><br />但想明天應該 OK 了....黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com2tag:blogger.com,1999:blog-688624163679358701.post-79265839920161570752009-02-22T22:09:00.003+08:002009-02-22T22:31:04.024+08:00終於計算完畢了....雖然上一篇 <a href="http://lookdoor.blogspot.com/2009/02/blog-post.html">部觀門正式回復運作</a> 說已經開始回復運作, 指的是關鍵字的關聯分析已經開始算到最初 10/15 當站時的資料了, 但後來新增的資料還沒追上進度, 那時是 02/06 我生日那時候, 而今天 02/22 我剛進去 Server 看算到那邊時, 居然已經停下來計算了, 重新跑一次還真的已經算完了, 這次又花了 16 天去追上約 1500 個關鍵字, 現在已經有 7000 個關鍵字了...<br /><br />本來想說追上這須要重算的 1500 個關鍵字可能還要好幾個月, 但經過一些調整與改變, 半個月就追上了, ...<br /><br />雖然此時部觀門點閱數已經降到:<br /><br />點閱數七日移動平均: 14578<br />點閱數28日移動平均: 17153<br /><br />但這不是重點, 至少加機器的事就可以先放在一旁, 準備做 otaku part 2 的案子了...<br /><br />前幾天把一些關鍵字的連結都改了一下, 不知大家習不習慣, 至少這是有目的 的..<br /><br />只是目前這部落格的 FeedBurner 雖然寫著 38 人訂閱, 我自己當然不會訂啦, 但這 38 人大概也不少跟我一樣是資訊狂吧... 我倒是很想知道有多少人會用這系統, 我開個 plurk 來回應好了...<br /><br /><script type="text/javascript" src="http://plurk.tw/java/jquery-1.3.1.min.js"></script><script type="text/javascript" src="http://plurk.tw/java/ph2.js"></script><script type="text/javascript" language="JavaScript" src="http://plurk.tw/java/ph2.php?url=h2apf&width=500"></script>黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-29892994909246615722009-02-07T16:56:00.004+08:002009-02-07T17:15:32.731+08:00部觀門的 ToDo 列表 (復原部份)現在已經追上計算進度了, 所以快要有多餘的資源慢慢去建立與復原系統了, 所以開始要做事了, 目前有兩個主要工作:<br /><br />關鍵字後台分析部份:<br /><br />1. 迴歸分析<br />2. 最高時期<br />3. 週期分析<br />4. 點閱數的圖<br /><br />這部份是維持關鍵字頁的正常運作, 目前還是有很多資料是不正確的.<br /><br />除外, 目前最主要還是要把每日工作給自動化:<br /><br />1. Rotate 分析資料<br />2. 計算熱門關鍵字<br />3. 傳檔 (1, 2)<br />4. 傳結果<br />=> 人工挑出須要觀察的關鍵字<br />5. 開始計算<br />6. 建立暫存資料<br />7. 寄送結果 (1, 2, 3, 4)<br /><br />每天要下視情況 11 個指令 (分散在三台機器) 才能夠正常運作, 但若我一忙往往會 Delay 或忘記下一兩個指令, 所以還是要想辦法自動化...<br /><br />接下來就是下一部更新改良的部份, 但不見得會在部觀門做, 而是在其他的地方做..黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-44355150978037534762009-02-06T04:28:00.002+08:002009-02-06T04:43:10.755+08:00部觀門正式回復運作10-16 停機<br />11-21 恢復運作<br />11-26 機器掛點<br />12-01 繼續運作<br />02-06 計算趕上每日進度<br /><br />原本只是停機約 25 + 5= 30 天, 但為了趕上這 30 天的進度花了 31+31+6+5=73 天來趕, ...<br /><br />基本上每天的工作如下:<br /><br />1. 點閱數<br />2. 延伸關鍵字<br />3. 關鍵字最佳文章<br />4. 計算資料<br /><br />然後這個動作包含計算昨日新關鍵字資料, 而最麻煩的就是點閱數與延伸關鍵字了...<br /><br />通常點閱數要花 10 ~ 12 個小時來計算, 其中大部份都是花在算新的關鍵字的點閱數, 而昨天的點閱數往往只花不到 2 小時就可以算完, 相對的, 延伸關鍵字也是要花 10~12 個小時來計算, 其中也是新關鍵字算一個至少要 15~20 分鐘....<br /><br />通常一個新關鍵字建立資料總共要花 40~50 分鐘, 也就是說只是讓資料維持運作, 一天增加的關鍵字不能超過 20 個, 不然就會算不完, 而一天算完通常也只留 1 個小時空檔, 因此這損失的 30 天, 代表損失了 680 個計算時間, 若一天追 1 小時, 完美的話須要 68 天以上才能追到, 當然這是不可能完美的, 所以花了 73 天才追上...<br /><br />因此這部落格也大約當了 2~3 個月左右, 而過完年了, 也該努力了, 剛好進度也追上來了, ok, let's go~~~黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-46850908959456022562008-12-01T04:32:00.002+08:002008-12-01T04:35:14.491+08:00部觀門暫時開始運作~~~目前狀況:<br /><br />1. 新增關鍵字停在 11 月 24 日<br />2. 目前在計算在新增到 11 月 24 日的關鍵字點閱數<br />3. 關鍵字關係與推薦文章都還沒有開始跑, 也就是說停在 10 月 15 日<br /><br />希望這次不要硬碟再掛掉, 不然就會翻臉了....<br /><br />也希望下次的文章能夠寫得有意義些..黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com1tag:blogger.com,1999:blog-688624163679358701.post-54355919870552222332008-11-25T23:33:00.001+08:002008-11-25T23:33:55.226+08:00系統掛掉~~~~現在部觀門因為機器掛掉的關係, 無法正常運作...<br />現在請 IDC 那邊重灌系統中, 等重灌後再進復元~~~黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-18034704813591407362008-11-20T00:06:00.002+08:002008-11-20T00:13:43.096+08:00部觀門大搬家~~~從 10/15 後, 部觀門處在暫停的狀態, 雖然宅度計, 好好讀看起來都很正常, 但少了一個資訊源後還是影響相當大...<br /><br />所以經過了 5 天 4 夜的重新整理與計算, 慢慢的把資料轉到另一台國外的機器上, 也慢慢的數據更上進度, 我想再過 3 ~4 天的話, 把程式改寫, 部觀門就可以重新上了...<br /><br />雖然我知道只有少數人了解部觀門是怎運作以及拿來做甚麼, 但這對網路觀察而言, 是相當重要的資料, 所以停擺了一個月, 很多資訊都有所沒有趕上, 現在就是要花一個星期左右來追上這失落的一個月了...<br /><br />現在 Domain Name 正在轉換, 所以可能要到明天才會逐漸看, 而相關的資料派送, 也要有程式修改後跟上才行, 此時 "宅度計" 與 "好好讀" 等關鍵報告才能夠更有價值..黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-14358004356405988312008-11-13T19:36:00.002+08:002008-11-13T19:45:53.488+08:00野草莓真的很熱嗎?事實上有人問我說, 野草莓事件的確在部落格界是一件大事, 不只是幾個熱情網友的支持, 且在這種互動下讓這件事的效應越來越高...<br /><br />但就好好讀的檢測來看, 野草莓事件從 8 月開始到現在, 就第一名時最高熱度只有 47 度, 就排名而言還輸給全球華文部落格大獎, 甚至要擠進前 3 名必須要超過 120 度, 目前前三名為:<br /><br />第一名: 奧運, 156 度<br />第二名: 蘇麗文, 149 度<br />第三名: 颱風, 121 度<br /><br />那前一陣子沸沸揚揚的陳雲林是以 111 引恨在第四名...<br /><br />以下是目前前 20 名的列表, 最低分是墾丁與證交稅的 31 度, 甚至大家以為很熱的海角七號還排在 15 名說, 反倒是當時的 1025 遊行還跟搬家並列第 10 名...<br /><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgDjPQAWz01Y4F431jP8bbgOGofIns3YK4ZZ_8RcDqZU3Kk8O1tR79w_1owoVGIoFcvGbOpLagwvuvn1VITcUGwdXJCicVqWE0LBeriP4tiB5uKDuuLdrmCeD75VMbyt_pEE6r_NslOfA/s1600-h/screen-capture.png"><img style="cursor: pointer; width: 223px; height: 400px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgDjPQAWz01Y4F431jP8bbgOGofIns3YK4ZZ_8RcDqZU3Kk8O1tR79w_1owoVGIoFcvGbOpLagwvuvn1VITcUGwdXJCicVqWE0LBeriP4tiB5uKDuuLdrmCeD75VMbyt_pEE6r_NslOfA/s400/screen-capture.png" alt="" id="BLOGGER_PHOTO_ID_5268106884173351538" border="0" /></a><br /><br />當然部落格熱門議題跟社會議題是完全不同的狀況, 畢竟有時跟部落格或網路切身關係的題目會較高分, 例如 Google 一直是大熱門, 搬家與部落格大獎都是, 這些是跟社會比較沒有關係的...<br /><br />但如此可以看得出來, 好像陳水扁都被壓著打, 雖然最高分時也蠻高的, 但總是有其他的話題去壓過他, 真不幸阿, 反倒是嗆馬與馬英九還排到前 20 名, 不知道是幸還是不幸阿?黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com1tag:blogger.com,1999:blog-688624163679358701.post-1214867893202045362008-11-05T04:15:00.002+08:002008-11-05T04:33:37.885+08:00部觀門維修中事實上我在想有多少人因為部觀門沒有在運作傷腦筋的, 我承認我是一個, 畢竟像我這種有 "Johnny 5 syndrome" 的人, 看到 "Information" 的確會高呼, 若沒有部觀門, 我心中總是有個大石頭吊著~~<br /><br />在 10/15 時, 部觀門就因為工作轉換的關係暫時停止營運, 但現在還在找資源恢復, 因為這系統是一個挺吃資源的東西, 雖然這個可以探知目前部落格界關心的事情與讀者關心的交集, 但由於資料過於龐大, 須要 2~3 台標準 5~7 萬的機器才能運作的順利....<br /><br />在真正復原之前, 請大家以及我忍耐一下吧, ...<br /><br />還是有誰有甚麼計劃與想法想提出的嗎?黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-8431267464380783372008-11-03T20:40:00.002+08:002008-11-03T20:42:22.348+08:00陳雲林的話題性?<span style="color: rgb(255, 0, 0); font-weight: bold;font-size:130%;" >"面對我們友好祖國的特使, 不應該讓那些少數暴力激進份子, 來破壞兩岸和平的未來, 而是更應該攜手同心去促進台灣歷史新頁"</span><br /><br />事實上我蠻意外陳雲林這次來訪的事件, 藍綠雙方有如此大的衝突, 或許在這時候大陸高層來台真的不是時候, 而馬英九又急著表現出對兩岸統一有無比的決心, 本來想說, 這也不算是壞事, 但一邊想要利用 "衝突" 來彰顯這議題, 但另一邊又用優勢 "警力" 想讓不同的聲音給壓下去, 造成這種狀況...<br /><br />最近的最熱門部落格話題大約是如下:<br /><br />10/1~10/3 (3天) <span style="color: rgb(255, 0, 0);">全球華文部落格大獎</span>: 那時公佈初選名單, 大家總要宣誓一下<br />10/4~10/5 (2天) <span style="color: rgb(255, 0, 0);">Google</span>: 那時沒甚麼話題而言, 只好讓常用的話題出線了<br />10/6~10/12 (7天) <span style="color: rgb(255, 0, 0);">海角七號</span>: 到現在還沒看的人就太超過了.. (阿, 我還沒看)<br />10/13 (1天) <span style="color: rgb(255, 0, 0);">誠品</span>: 這種以知識份子跟中產階級為消費族群為目標的話題怎能不重要阿?<br />10/14~10/15 (2天) <span style="color: rgb(255, 0, 0);">工作</span>: 說真的為甚麼那兩天大家都在討論工作我還不清楚<br />10/19~10/21 (3天) <span style="color: rgb(255, 0, 0);">搬家</span>: 大家看到馬英九要搬家, 部落格也想搬家了<br />10/22~10/23 (2天) <span style="color: rgb(255, 0, 0);">張銘清</span>: 一個人的小跌倒代表一大群人的大跌倒<br />10/24 (1天) <span style="color: rgb(255, 0, 0);">陳雲林</span>: 張銘清話題消費完就該陳雲林出線<br />10/25~10/28 (4天) <span style="color: rgb(255, 0, 0);">遊行</span>: 10/25 大遊行聽說有 60 萬人去走, 但在部落格只有 4 天效力<br />10/29~10/30 (2天) <span style="color: rgb(255, 0, 0);">陳雲林</span>: 再追加陳雲林兩天<br />10/31~11/02 (3天) <span style="color: rgb(255, 0, 0);">旅展</span>: 這個消費議題還是很重要的<br />10/3~ (?天) <span style="color: rgb(255, 0, 0);">陳雲林</span>: 陳雲林第三次踏上排行榜首位, 真不容易阿...<br /><br />接下來最近幾天的熱度為下:<br /><h2>陳雲林 歷史熱度</h2> <table border="1"> <tbody><tr> <th>時間</th> <th>熱度</th> <th>文章</th> </tr> <tr><td>2008-11-02</td><td align="right"> 62.7</td><td>江陳會/陳雲林接待規格高 台聯民調:矮化<a href="http://ma19.cc/index.php?view=2008110203334"><img src="http://door.urs.tw/graph/external.png" border="0" /></a></td></tr><tr><td>2008-11-01</td><td align="right"> 29.6</td><td>江陳會/馬若見陳雲林 呂:全民示威!<a href="http://ma19.cc/index.php?view=2008110101716"><img src="http://door.urs.tw/graph/external.png" border="0" /></a></td></tr><tr><td>2008-10-31</td><td align="right"> 33.1</td><td>拍張陳雲林與中華民國國旗合照的照片<a href="http://feeds.feedburner.com/%7Er/putkey/%7E3/438297686/404"><img src="http://door.urs.tw/graph/external.png" border="0" /></a></td></tr><tr><td>2008-10-30</td><td align="right"> 47.6</td><td>接受台媒聯訪 陳雲林為毒奶道歉<a href="http://ma19.cc/index.php?view=2008103002443"><img src="http://door.urs.tw/graph/external.png" border="0" /></a></td></tr><tr><td>2008-10-29</td><td align="right"> 39.5</td><td>台北江陳會/籲馬別怕 7大工商團體挺陳雲�<a href="http://ma19.cc/index.php?view=2008102900577"><img src="http://door.urs.tw/graph/external.png" border="0" /></a></td></tr><tr><td>2008-10-28</td><td align="right"> 19.1</td><td>總統受訪談陳雲林來台?府:可能範圍內安排<a href="http://ma19.cc/index.php?view=2008102804197"><img src="http://door.urs.tw/graph/external.png" border="0" /></a></td></tr><tr><td>2008-10-27</td><td align="right"> 19.1</td><td>民進黨:陳雲林訪台時 白天嗆聲晚上守夜<a href="http://ma19.cc/index.php?view=2008102702006"><img src="http://door.urs.tw/graph/external.png" border="0" /></a></td></tr><tr><td>2008-10-26</td><td align="right"> 31.4</td><td>11/3陳雲林來台 台灣人向前衝<a href="http://blog.roodo.com/gamy543/archives/7444277.html"><img src="http://door.urs.tw/graph/external.png" border="0" /></a></td></tr><tr><td>2008-10-25</td><td align="right"> 29.6</td><td>建議陳水扁,攔阻陳雲林的絕招,發情男女列<a href="http://blog.chinatimes.com/chao/archive/2008/10/25/338879.html"><img src="http://door.urs.tw/graph/external.png" border="0" /></a></td></tr><tr><td>2008-10-24</td><td align="right"> 18.7</td><td>台北江陳會/馬怎見陳雲林?賴:身分是總統<a href="http://ma19.cc/index.php?view=2008102400749"><img src="http://door.urs.tw/graph/external.png" border="0" /></a></td></tr><tr><td>2008-10-23</td><td align="right"> 14.5</td><td>5成同意陳雲林來台 對執政黨不滿仍高<a href="http://ma19.cc/index.php?view=2008102300525"><img src="http://door.urs.tw/graph/external.png" border="0" /></a></td></tr><tr><td>2008-10-22</td><td align="right"> 14.1</td><td>日媒競報導張銘清事件 關注陳雲林訪台動向<a href="http://ma19.cc/index.php?view=2008102200496"><img src="http://door.urs.tw/graph/external.png" border="0" /></a></td></tr><tr><td>2008-10-21</td><td align="right"> 16.3</td><td>阿宅的上街頭相談室:抗議陳雲林的13種方法!<a href="http://www.wretch.cc/blog/billypan101/14366682"><img src="http://door.urs.tw/graph/external.png" border="0" /></a></td></tr></tbody> </table><br />從這數字來看, 10月 25, 26 這兩天大概是因為遊行得關係有很高的話題性, 而從 29 號後, 已經是居高不下了, 說不定還會有新高的可能性, 而我看了一下新聞節目, 除了 TVBS 永遠的 "陳水扁案" 的討論外, 大家都在講陳雲林, 不知道是大家在追逐陳雲林的問題, 還是 TVBS 要表達台灣人民對陳水扁的深惡痛絕所造成的呢?<br /><br />來研究一下吧~~~黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-72475609383089626792008-10-06T00:37:00.005+08:002008-10-06T00:55:26.293+08:00偽不不 超進化版 格對 探知機在說自定宅度計說很久了, 一直都沒做出來, 決定開始做了, 所以在洗澡時規劃了一下流程, ...<br /><br />1. 每一個系統有自己的密碼來解密控制<br />2. 會自動化做前 300 名的部落格配對<br />3. 可以知道兩個部落格的關係度 (或以設計者來想像)<br />4. 設計者可以放自己的 Adsense<br />5. 登入者當然也可以取做 opt-in, opt-out<br />6. 貼紙就是排行榜或自己部落格在各探知機的分數囉...<br /><br />然後就是名字了, 原本名稱是打算叫 "<span style="color: rgb(51, 51, 255);">當我們宅在一起--自定宅度計產生器</span>" 這個名字, 但這個名字真的有點遜, 所以想一個較好的名字吧...<br /><br />因為這個算是 "部落<span style="color: rgb(255, 0, 0);">格</span>配<span style="color: rgb(255, 0, 0);">對</span>" 的功能之一, 所以叫 "<span style="color: rgb(255, 0, 0);">格對</span>" 吧... 那既然聽起來像 "革對" 的話, 那就應該想到 Keroro 超劇場版, 所以就名正言順就取 "Webobo 超進化版", 因此就變成 " 偽不不 超進化版 格對 探知機".... 那網址名很自然就變成 webobo.datamining.tw 囉....<br /><br />這樣的話, 看看那時候完成囉...黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-83759446866481848722008-10-01T18:34:00.002+08:002008-10-01T18:47:46.674+08:00入圍年度最佳企業組織部落格-企業形象有人要有壓力才能夠寫, 相反的我是有壓力時反而寫不下去, 打算去用這個部落格報名全球華文部落格大獎之後, 想說寫篇更不錯的文章再來報名, 但一想要寫好文章, 反而寫不出來了, 腦筋不是一片空白, 而是想太多, 多到不知如何下筆...<br /><br />後來只好隨便挑三篇:<br /><a href="http://lookdoor.blogspot.com/2008/08/blog-post_05.html" target="_blank">部落格的話題?</a><br /><a href="http://lookdoor.blogspot.com/2008/05/seo.html" target="_blank">宅度計又是一個 SEO 檢核系統?</a><br /><a href="http://lookdoor.blogspot.com/2008/08/blog-post_18.html" target="_blank">從部落格熱度來看奧運, 及部落格圈的關鍵字變化</a><br /><br />這三篇不是多好的三篇, 只是再各個類別的內容有其意涵~~~<br />甚至我還寫出報名的短文:<br /><br />來看關鍵字是部落格觀察中的部觀門, 部落格好好讀子計劃, 以及資料探勘計劃的宅度計與關鍵報告的官方個人部落格.<br />這四個計劃都是以 "關鍵字" 為出發, 因此稱為 "來看關鍵字".<br /><br /><span style="color: rgb(255, 0, 0);"></span><blockquote><span style="color: rgb(255, 0, 0);">雖說是官方部落格, 但並不是唯一代表官方說話的部落格, 而是由其參與成員之一的食夢黑貘, </span><br /><span style="color: rgb(255, 0, 0);">自己對關鍵字及其這四個計劃的個人部落格, 但因為這計劃是以 "個人參與" 為出發點, 所以工作人員有各自的部落格經營, </span><br /><span style="color: rgb(255, 0, 0);">且因為並沒有成立以計劃為單位的官方部落格, 所以每一個人都可以用官方的身份發表自己的想法.</span><br /><br /><span style="color: rgb(255, 0, 0);">部觀門是一個搜集部落格觀察使用者貼紙, 讀者對部落格所下的關鍵字記錄與整理.</span><br /><span style="color: rgb(255, 0, 0);">宅度計是一個透過關鍵字判斷部落格的分類與屬性並計錄其歷史資料的系統.</span><br /><span style="color: rgb(255, 0, 0);">部落格好好讀是算出目前 1000 大部落格的共同話題與熱度.</span><br /><span style="color: rgb(255, 0, 0);">關鍵報告是一個關鍵字統整資訊.</span><br /><br /><span style="color: rgb(255, 0, 0);">此部落格希望成為一種網站創作中, 訴諸智慧人格權個人價值的宣告.</span></blockquote><br />只是報名須要在 200 字內, 所以只好縮減一些...<br /><br />而為甚麼要報名呢? 我是這樣跟幾個也有在經營官方部落格的朋友講的:<br /><br /><span style="color: rgb(51, 51, 255);">自己的部落格或許知道不夠好沒必要報名, 也沒有必要過於自我宣傳, 但官方部落格不只是要去宣傳原本的作品, 更要爭取任何曝光機會, 畢竟不只是為了這個部落格而已, 更不是只是為了自己~~</span><br /><br />事實上我看來看去, 也是用這個部落格在這個類別說不定有脫頴而出的機會, 所以在 63 個部落格最後有 15 個部落格入圍, 比起大部份的十分之一的機會高了一些, 因為只有五分四的淘汰率, ...<br /><br />我也知道這個部落格進到初選入圍不是問題, 到要進到決選的話可能還要加把勁... 所以還是多寫一些吧...黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-13368516628215142662008-08-31T05:02:00.002+08:002008-08-31T05:14:06.821+08:00宅度計的關鍵字準備獨立事實上在好好讀在做出來時, 就有所謂的獨立關鍵字的機制, 見沒有公開的 <a href="http://good.urs.tw/newkey.php">http://good.urs.tw/newkey.php</a> , 目前有67 組外加的關鍵字, 來讓好好讀能夠有更貼近現實的呈現, 但宅度計一直沒有...<br /><br />所以一直被垢病的就是 "2008", 這種數字, 以及 "台灣" 這個過於普遍被認為是地名的關鍵字等等的一些造成失效的關鍵字, 所以宅度計也必須該有這種正面與負面列表了..<br /><br />正面列表在一開始就有規劃, 只是這個須要有對這分類的關鍵字有概念的人來設定, 例如可以規劃出一個 "日職棒球通" 這種東西, 或者是對像 "舞蹈類" 做更多關鍵字的設定, 畢竟部觀門有自己對關鍵字選擇的一套邏輯..<br /><br />1. 單日搜尋量至少要 50 次以上, 且必須要有 3 個不同部落格被搜尋到...<br />2. 但若這個關鍵字出現在較多的部落格, 要求可能可以降到 20~30 次...<br />3. 必須要能夠跟之前有可辨識差異的能力..<br />4. 若足夠量到 100 次以上, 可以為了記錄不考慮重覆性...<br /><br />事實上洋洋灑灑可以寫出 10 點以上, 但基本上還是由 "量" 來決定, 而不是為了辨識力, 這跟宅度計的目標差很遠..<br /><br />當然原本還想寫 "你的部落格是藍是綠? 是左是右?" 等等, 但最大的問題是我個性的乖張, 還是希望有足夠的實務與理論基礎, 而不是純脆的趣味化而沒有價值...<br /><br />所以慢慢的接下來真的會有幾個方向:<br /><br />1. 延伸關鍵字, 包含在既有的分類或新分類<br />2. 部落格觀察 25 分類的完成<br />3. 部份關鍵字排除在宅度計的偵測<br />4. 建立專業的分類<br /><br />然後事實上已經有 "達人" 的關鍵字投票互動系統的規劃, 甚至是自己設定關鍵字來記錄, 這個都會慢慢完成, 只是這種東西有沒有價值就見人見智了~~~黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com3tag:blogger.com,1999:blog-688624163679358701.post-32284203083240544822008-08-30T15:21:00.006+08:002008-08-30T15:42:54.752+08:00Feedburner 改版 ( Google 的企圖?)這次大概是 Google 也想推動自己有關 Feed 的 Namespace, 就像是 Google Tool Bar 一樣, 所以原本一單純的 Feed, 現在就多了三組 NameSpace, 如下表:<br /><pre id="line1"><span class="attribute-name"></span><blockquote style="color: rgb(255, 0, 0);"><span style="font-weight: bold;" class="attribute-name">xmlns:openSearch</span><span style="font-weight: bold;">=</span><span style="font-weight: bold;" class="attribute-value">"http://a9.com/-/spec/opensearch/1.1/" </span><span style="font-weight: bold;" class="attribute-name"><br />xmlns:gd</span><span style="font-weight: bold;">=</span><span style="font-weight: bold;" class="attribute-value">"http://schemas.google.com/g/2005"<br /></span><span style="font-weight: bold;" class="attribute-name">xmlns:feedburner</span><span style="font-weight: bold;">=</span><span style="font-weight: bold;" class="attribute-value">"http://rssnamespace.org/feedburner/ext/1.0"<br /></span><span style="font-weight: bold;" class="attribute-name">gd:etag</span><span style="font-weight: bold;">=</span><span style="font-weight: bold;" class="attribute-value">"W/"AkQCQn45eSp7ImA9WxdaGEU.""</span><span style="font-family:Georgia,serif;"><br /></span></blockquote></pre><br />一個是 a9 推的 open search, 一個是 google 自己推的 google schemas, 另一個是 feedburner 自己推的 feedburner 的 name space...<br /><br />比較好笑的是去看 <span class="attribute-value">http://schemas.google.com/g/2005</span> 還是錯誤網址說, 事實上指的是 Sitemap 之類的 Namespace, 而 Open Search 的網址也換了, 這個也是輔助搜尋相關的功能, 而 gd:etag 也是 google data 想要推動的 tag 功能之一...<br /><br />當然 Feedburner 這一個改版讓原本好好讀的 Parse 程式跟著失效, 所以又要改寫了, 所以最近這一陣子大家應該有看到很多 Feed 的標題都是怪怪的, 表示抓錯了, 所以剛剛把這問題修正, 所以在熱度上面的計算都多少有些問題, 但這問題過兩三天就會好了..<br /><br />事實上我並不贊成在部落格觀察的 Feed 寫 Feedburner 的來源, 畢竟這把原本可以一手抓到資料的方式變成二手, 甚至在時效性會降低, 若沒有流量的考量沒必要為了 +1 個 feed 變成用 feedburner ...:)<br /><br />只是這次 Feedburner 與所謂許多的 Google 的 Feed Proxy 等等的功能加強, 這代表的 RSS/Atom Feed 的應用在某方面因為 AJAX ( JSON ) 的 API 跟著加強, 能夠玩的東西更多了, 但面臨越來越複雜的 RSS, 已經越來越不 Really Simple 了, 讓我想到 RSS 1.1 與 RSS 2.0 的爭端, 對這有興趣的人可以自己去看~~黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-26121194906965494672008-08-24T15:57:00.002+08:002008-08-24T19:57:42.199+08:00好讀指數在之前, 我偷偷在這邊跟大家講目前 GR>=6 的部落格與最近成長不少的部落格有那些..<br /><br /><table border="1"><tbody><tr><th>目前好讀為 6 的部落格<br /></th></tr><tr><td style="vertical-align: top;"><a href="http://www.wretch.cc/blog/amarylliss">amarylliss。艾瑪[隨處走走] -</a></td></tr><tr> <td><a href="http://chinszuhan.blogspot.com/">金柏妘</a></td></tr><tr> <td><a href="http://avno1.com/">AV No.1 Blog</a></td></tr><tr> <td><a href="http://tvdeo.blogspot.com/">TVdeo - 免費線上電視機</a></td></tr><tr> <td><a href="http://www.wretch.cc/blog/bajenny">魔鬼甄與天使嘉 -</a></td></tr><tr> <td><a href="http://azo-freeware.blogspot.com/">阿榮福利味</a></td></tr><tr> <td><a href="http://www.wretch.cc/blog/cwwany">彎彎~用漫畫寫日誌 -</a></td></tr><tr> <td><a href="http://www.wretch.cc/blog/sana217">SANA的網誌 -</a></td></tr><tr> <td><a href="http://www.wretch.cc/blog/amykaku">AMYKAKU -</a></td></tr><tr> <td><a href="http://playpcesor.blogspot.com/"> 電腦玩物</a></td></tr><tr> <td><a href="http://blog.xuite.net/osaki99/blog">osaki's Blog - 娛樂,網路,影片,Kuso,不可思議...</a></td></tr><tr> <td><a href="http://www.christabelle.idv.tw/">Christabelle的藝想世界</a></td></tr></tbody></table><br />上面那個表並沒有按照分數排序~~~~<br />下面這個表是進步到 4 分以上的前 10 名~~~<br /><br /><table border="1"><tbody><tr><th>最近成長不少的部落格</th><th>原本<br /></th><th>現在<br /></th></tr><tr> <td><a href="http://blog.xuite.net/blue_sky23/rabbitget" title="15222">海綾月兔兔認養專區</a></td><td>4<br /></td><td>5</td></tr><tr> <td><a href="http://skyvee.blogspot.com/" title="26666">Fun.New.Run.High. 放形浪駭</a></td><td>3</td><td>4</td></tr><tr> <td><a href="http://www.wretch.cc/blog/kittylee0203" title="709">水瓶面面書寫幸福 -</a></td><td>3</td><td>4</td></tr><tr> <td><a href="http://blog.yam.com/eric0212" title="54037">寧靜海的銀色天空</a></td><td>4</td><td>5</td></tr><tr> <td><a href="http://blog.pixnet.net/smilejean" title="22180">~Smilejean。紫色微笑~ :: PIXNET BLO</a></td><td>3</td><td>4</td></tr><tr> <td><a href="http://blog.xuite.net/emisjerry/tech" title="716">Xuite日誌:簡睿隨筆 《科技篇�</a></td><td>3</td><td>4</td></tr><tr> <td><a href="http://blog.pixnet.net/sharon0418" title="30975">★雪倫★---Voulez-vous couchez avec </a></td><td>3</td><td>4</td></tr><tr> <td><a href="http://sofree.twbbs.org/blog" title="31094">香腸炒魷魚</a></td><td>4</td><td>5</td></tr><tr> <td><a href="http://playpcesor.blogspot.com/"> </a><a href="http://www.wretch.cc/blog/billypan101" title="14197">BillyPan 的部落格</a></td><td>4</td><td>5<br /></td></tr><tr> <td><a href="http://hanamizuki.tw/" title="63775">花。水‧木</a></td><td>3</td><td>4</td></tr></tbody></table><br />基本上看起來還要做些調整, 例如就是對於點閱數的權重要放低一些, 大家快去看自己的好讀分數吧...<br /><br />然後好讀指數是參考幾點算出一個部落格的意義:<br /><br />1. 點閱數<br />2. 最近發文頻率<br />3. 獲獎的狀況<br />4. 部落格觀察指數<br />5. 一些部落格觀察沒有參考到社群活躍度<br />6. 其他<br /><br />會採取這個數字最重要的原因是部落格觀察也太多盲點, 所以須要有一個更全面的指標來做為部落格選取的參考, ....<br /><br />只是現在這指數還在做調整, 希望做到真正有參考的價值...黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com2tag:blogger.com,1999:blog-688624163679358701.post-4782822416509806082008-08-24T05:52:00.002+08:002008-08-24T06:15:14.236+08:00坐監服刑完畢 (又重新被 Google 信任了)雖然知道, 判斷是否是 Link Farm (連結農場) 的演算法不難寫, 但說要誤判的機會是多大呢? 或者是說能夠操控的空間是多大呢?<br /><br />上一篇文章事實上是發生在 7 月底到 8 月初的 Google Dance , 就發現這個部落格被丟進觀察名單, 只是平常知道這個觀察名單一坐就要坐兩三個月才對, 甚至是以半年做計算, 所以早就有不管這件事的覺悟, 畢竟這個部落格的 RSS/Atom 訂閱已經有 42 個人了, 且這個還不包含我, 所以說, 這樣寫, 至少有 40 個人會看, 因此即使只是為自己寫, 但看到有觀眾還是不一樣的...<br /><br />但目前還有些事都還沒做:<br /><br />1. 公布每個月部觀門的熱門關鍵字, 大家可以去翻舊文就知道<br />2. 本來這個部落格會每天寫出一組重要的關鍵字觀察, 但好像很久沒寫了<br /><br />而我的確還是會持續寫下去, 只是可能頻率與心態會多少有所改變了...<br /><br />當然還是多少也高興一下不到一個月就服刑完畢, 所以自認為自己做的是白手套且肯繼續是對的, 我原本還找人去 funp 幫忙推, 說這種自諷的文章應該可以拿到一顆星才對, 只是不好意思只有 5 個人推, 半顆星都拿不到~~~<br /><br />的確這個事件直得給 SEOer 一個警惕, 但也可以證明內容夠充實, 很快就會復元了, 嗯, 下次來寫一篇有關 "好讀指數" 的文章吧, 至少要弄個 FAQ 才對,...黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-86512200679987613432008-08-22T03:26:00.002+08:002008-08-22T03:42:20.344+08:00這個部落格被 Google 給 Ban 掉了....這是一件很有趣的事, 在這次 Google Dance 之後, 這個部落格不只是 PageRank 被歸零, 甚至 "連結數" 也被歸零...<br /><br />這個部落格當時只是我發現我為了研究網路行為, 花了很多時間在 "關鍵字", 尤其是在 "部觀門" 這計劃, 就建立了這個 "來看部觀門", 但在 "宅度計" 成立後, 就變成 "來看關鍵字"...<br /><br />這個部落格也是我刻意想要推動的 "個人官方部落格", 畢竟這些計劃, 到底是歸屬於 MyZilla, 還是 "部落格觀察", 或是甚麼計劃, 我也不知道, 畢竟這大部份都是個人自己在玩, 也算是一種實驗的 Prototype (實驗原型), 即使是爾後我的工作要用這系統的核心做事, 這也都是獨力事件..<br /><br />所以這些計劃, 我刻意除了自己唯一掛的 "只是捷運日記" 的連結外, 也掛了這個部落格的連結, 只是本來也是好好的寫, 沒想到一個 "豔照門" 事件把 "部觀門" 弄得大亂, 這個部落格也停下腳步, 所以從一月18號到 4月7號的 80 天, 只寫一篇文章, 但連結數卻持續著因為系統增加而增加, 就被 Google 認為是 Link Farm, 被打入黑名單...<br /><br />事實上畢竟我寫作還是以內容為主, 不曾考慮過 SEO, 就像我都說, 我做的網站, 目前沒有 meta-data, 更沒有 sitemap, 甚至連 robots.txt 都沒寫, 就 SEO 教科書的觀點都是不及格, 但我相信只要有內容, 做得好自然在 "資訊獲取" 的概念是對的, 自然 SEO 就會起來...<br /><br />所以這個站即使是被 Google 黑掉了, 的確是給大家一個警告, 若是沒有認真的產生內容, 即使你有系統幫你增加連結, 也是不被承認的, 我那一陣子的確是低潮期, 不要說是沒做新系統, 連新內容也沒有, 因此這對我也是個不錯的警惕~~~~<br /><br />至少在某方面, 或許我該努力的不要讓這個部落格被 Google 認為是 Linking Farm, 所以在 copy and paste 一些表格時, 應該把連結拿掉, 不然真的被誤會就慘了...黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-22129148752069509712008-08-19T22:56:00.002+08:002008-08-19T23:10:05.070+08:00第二次的部落格關鍵字關聯分析上一次大約是算了 1 天多算完, 這次大約花了 3 天多, 主要是部落格數字變多了, 以及演算法稍微複雜了一些, ...<br /><br />大家可以去宅度計看自己的 "配對榜", 我相信這次的準確度比之前好多了, 這也是我敢拿出來的原因, 雖然應該還是有改善的空間, 無論是演算法還是權重~~~<br /><br /><table border="1"><tbody><tr><th>名次</th> <th>名稱</th> <th>關係度</th> <th>絕對宅度</th> </tr> <tr><td>1</td><td>MacBlog2<a href="http://macblog2.blogspot.com/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>18.14</td><td>68.49%</td></tr><tr><td>2</td><td>放屁(Fun&Peace)<a href="http://www.ccuart.org/tragicomedy/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>17.95</td><td>19.12%</td></tr><tr><td>3</td><td>工程師級的顧問 / 【食夢黑貘】<a href="http://www.ithome.com.tw/plog/index.php?blogId=410"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>15.19</td><td>67.30%</td></tr><tr><td>4</td><td>Blog E<a href="http://www.evanlin.com/blog"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>15.06</td><td>24.93%</td></tr><tr><td>5</td><td>電影‧人生‧夢 -<a href="http://www.wretch.cc/blog/fansss"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>14.93</td><td>23.52%</td></tr><tr><td>6</td><td>豬言豬語<a href="http://www.ithome.com.tw/plog/index.php?blogId=58"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>14.76</td><td>37.44%</td></tr><tr><td>7</td><td>搖櫓水向天一方<a href="http://blog.yam.com/kevin814"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>14.72</td><td>0.00%</td></tr><tr><td>8</td><td>中時部落格-李偉文部落格<a href="http://blog.chinatimes.com/sow"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>14.68</td><td>15.07%</td></tr><tr><td>9</td><td>Duncan的網路日誌 -<a href="http://www.wretch.cc/blog/deskd"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>14.31</td><td>0.00%</td></tr><tr><td>10</td><td>喲哪桑的軟體習作簿<a href="http://www.ithome.com.tw/plog/index.php?blogId=483"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>13.86</td><td>32.51%</td></tr><tr><td>11</td><td>宋東彬的部落格~蟲出江湖~爬向TVBS~我回來了!<a href="http://tw.myblog.yahoo.com/jw%21s0VJ9LSBGB7Xr168cSo6dA--"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>13.73</td><td>0.00%</td></tr><tr><td>12</td><td>[ Blog Worker ] 工頭堅部落‧ 部落格臥客<a href="http://worker.bluecircus.net/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>13.52</td><td>47.47%</td></tr><tr><td>13</td><td>CCB 2.0 (beta)<a href="http://chiao.typepad.com/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>13.51</td><td>64.32%</td></tr><tr><td>14</td><td>不取於相,如如不動 - Yam 樂多日誌<a href="http://blog.yam.com/roodo_louis"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>12.80</td><td>16.53%</td></tr><tr><td>15</td><td> 終極邊疆BLOG<a href="http://blog.serv.idv.tw/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>12.79</td><td>57.08%</td></tr><tr><td>16</td><td>玉里書<a href="http://eroach.typepad.com/yuli/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>12.66</td><td>29.94%</td></tr><tr><td>17</td><td>抬起尊臀去敲門<a href="http://mario.weblogs.us/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>12.41</td><td>20.99%</td></tr><tr><td>18</td><td>Hi! I’m clsung<a href="http://blog.dragon2.net/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>12.26</td><td>0.00%</td></tr><tr><td>19</td><td>紅色長角三倍速<a href="http://blog.woixv.com/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>12.26</td><td>34.16%</td></tr><tr><td>20</td><td>生活在臺灣<a href="http://u8930043.blogspot.com/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>12.21</td><td>90.98%</td></tr><tr><td>21</td><td>Richy's 減肥部落格<a href="http://www.richyli.com/blog/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>11.97</td><td>73.53%</td></tr><tr><td>22</td><td> 遊戲噗 <a href="http://www.gameimp.com/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>11.93</td><td>18.98%</td></tr><tr><td>23</td><td>宣和EVA的交換日記 - Yam 樂多日誌<a href="http://blog.yam.com/hsuan613"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>11.57</td><td>26.54%</td></tr><tr><td>24</td><td>美艷派可愛風惡搞系人間 - Yahoo!奇摩部落格<a href="http://tw.myblog.yahoo.com/jw%21CafrLlKbHRZRJiyzwdLRE87s"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>11.49</td><td>50.47%</td></tr><tr><td>25</td><td>Think of Joe - Yam 樂多日誌<a href="http://blog.yam.com/sunjoe"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>11.39</td><td>27.69%</td></tr><tr><td>26</td><td>張小P 過生活 - Yam 樂多日誌<a href="http://blog.yam.com/smallpigchang"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>11.20</td><td>0.00%</td></tr><tr><td>27</td><td>晚安! 203室<a href="http://r203.blogspot.com/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>10.88</td><td>21.11%</td></tr><tr><td>28</td><td>Soy Milk and Fried Bread Stick 豆漿和油條<a href="http://sweetsoymilk.blogspot.com/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>10.84</td><td>0.00%</td></tr><tr><td>29</td><td>不自量力 の Weithenn<a href="http://weithenn.blogspot.com/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>10.48</td><td>41.37%</td></tr><tr><td>30</td><td>媒觀系<a href="http://mediaobserve.blogspot.com/"><img src="http://door.urs.tw/graph/external.png" /></a></td><td>10.45</td><td>52.85%</td></tr></tbody></table><br />上表是這個部落格的前 30 名的關鍵字關聯的排行榜, 整體看起來都還算可以接受, 但或許如在 "<a href="http://geneoralspeaking.blogspot.com/2008/08/blog-post_19.html">今天, 這個部落格的關鍵字關聯分析</a>" 所說的, 那樣, 還要再更新完所有資料後, 時間性才會出來...<br /><br />目前你的部落格是跟誰有關聯呢? 大家去看看吧...黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-70458931119751576092008-08-18T15:23:00.006+08:002008-08-18T18:07:44.067+08:00從部落格熱度來看奧運, 及部落格圈的關鍵字變化這幾天一直觀察奧運的熱度, 我些列出來目前的狀況好了...<br /><br /><table style="width: 309px; height: 417px;" border="1"><tbody><tr><th>日期</th><th>奧運熱度</th><td style="vertical-align: top;">第二名話題<br /></td><td style="vertical-align: top;">熱度<br /></td></tr><tr><td>08/18<br /></td><td>41<br /></td><td style="vertical-align: top;">華原朋美<br /></td><td style="vertical-align: top;">23<br /></td></tr><tr><td style="vertical-align: top;">08/17</td><td style="vertical-align: top;">57<br /></td><td style="vertical-align: top;">華原朋美</td><td style="vertical-align: top;">23<br /></td></tr><tr><td style="vertical-align: top;">08/16</td><td style="vertical-align: top;">95<br /></td><td style="vertical-align: top;">陳水扁<br /></td><td style="vertical-align: top;">22<br /></td></tr><tr><td style="vertical-align: top;">08/15</td><td style="vertical-align: top;">128<br /></td><td style="vertical-align: top;">民進黨<br /></td><td style="vertical-align: top;">20<br /></td></tr><tr><td style="vertical-align: top;">08/14</td><td style="vertical-align: top;">156<br /></td><td style="vertical-align: top;">Microsoft<br /></td><td style="vertical-align: top;">17<br /></td></tr><tr><td style="vertical-align: top;">08/13</td><td style="vertical-align: top;">135<br /></td><td style="vertical-align: top;">福建<br /></td><td style="vertical-align: top;">21<br /></td></tr><tr><td style="vertical-align: top;">08/12</td><td style="vertical-align: top;">89<br /></td><td style="vertical-align: top;">google<br /></td><td style="vertical-align: top;">17<br /></td></tr><tr><td style="vertical-align: top;">08/11</td><td style="vertical-align: top;">81<br /></td><td style="vertical-align: top;">星光大道<br /></td><td style="vertical-align: top;">24<br /></td></tr><tr><td style="vertical-align: top;">08/10</td><td style="vertical-align: top;">123<br /></td><td style="vertical-align: top;">馬英九<br /></td><td style="vertical-align: top;">27<br /></td></tr><tr><td style="vertical-align: top;">08/09</td><td style="vertical-align: top;">148<br /></td><td style="vertical-align: top;">情人節<br /></td><td style="vertical-align: top;">50<br /></td></tr><tr><td style="vertical-align: top;">08/08</td><td style="vertical-align: top;">90<br /></td><td style="vertical-align: top;">情人節<br /></td><td style="vertical-align: top;">86<br /></td></tr><tr><td style="vertical-align: top;">08/07</td><td style="vertical-align: top;">66<br /></td><td style="vertical-align: top;">情人節<br /></td><td style="vertical-align: top;">50<br /></td></tr><tr><td style="vertical-align: top;">08/06</td><td style="vertical-align: top;">66<br /></td><td style="vertical-align: top;">減肥<br /></td><td style="vertical-align: top;">18<br /></td></tr><tr><td style="vertical-align: top;">08/05</td><td style="vertical-align: top;">58<br /></td><td style="vertical-align: top;">減肥<br /></td><td style="vertical-align: top;">44<br /></td></tr><tr><td style="vertical-align: top;">08/04<br /></td><td style="vertical-align: top;">42<br /></td><td style="vertical-align: top;">減肥<br /></td><td style="vertical-align: top;">42<br /></td></tr></tbody></table><br />從上表來看, 看得出來有兩波高鋒, 第一波就是開幕式到舉重奪得到兩個銅牌, 但隨著射箭隊失利後, 就開始冷卻了, 一直等到棒球開打到輸給中國隊, ...<br /><br />在 8/4 之前第一名的不是奧運, 這個可以看前面的文章就知道, 那時是星光大道與超級偶像的天下...<br /><br />在其中有幾個關鍵字曾經是第二高, 從這邊也可以看得出幾件有趣的事..<br /><blockquote style="color: rgb(255, 0, 0);"><span style="font-size:130%;"><br />1. 減肥這話題總是部落格的長青樹, 除非有較有趣的話題, 不然這個很容易保持一定的熱度<br /><br />2. 情人節這段期間必然是部落格熱門話題<br /><br />3. 在 8/10 時, 還迷漫著倒馬的馬英九話題, 但在 8/15 話峰一轉變成陳水扁變落水狗<br /><br />4. 因為前一陣子有一群部落客被邀請到福建參訪, 所以在 8/13 變成熱門話題, 雖然也是只有幾個人就夠了..<br /><br />5. google 與 microsoft 的一舉一動都很受到部落格圈的重視<br /><br />6. 最近大概是華原朋美的新聞不斷, 加上剛好她生日, 所以~~~</span></blockquote><br />基本上我這個人最喜歡量化, 但從這量化的確可以看到一些質化有趣的事, 尤其是時事的脈動在主流媒體與非主流媒體之間的差距, 是相當有趣的...黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-69557955986611921812008-08-14T01:29:00.002+08:002008-08-14T01:46:12.485+08:00有關好好讀的來源目前好好讀取自於 1000 個從不同來源取樣的部落格, 這包含部落格觀察名次高的部落格, 得獎的部落格之類的, 當然以後會越來越多, 但這些來源還是有些部落格比較難列入好好讀, 所以排除在外, 主要是兩個原因:<br /><br />1. 大部份都是轉貼, 網摘的部落格<br />2. 太多涉及成人的話題的內容<br /><br />以下是理論上應該有資格列進好好讀, 但最後沒有包含在好好讀的 BlogID, 向下面這些部落格說聲抱歉, ....<br /><br /><table style="width: 55px; height: 357px;" id="table_results" class="data"><tbody><tr class="odd"> <td class="nowrap" align="right">76373</td> </tr> <tr class="even"> <td class="nowrap" align="right">212</td> </tr> <tr class="odd"> <td class="nowrap" align="right">19007</td> </tr> <tr class="even"> <td class="nowrap" align="right">30407</td> </tr> <tr class="odd"> <td class="nowrap" align="right">43410</td> </tr> <tr class="even"> <td class="nowrap" align="right">30636</td> </tr> <tr class="odd"> <td class="nowrap" align="right">15466</td> </tr> <tr class="even"> <td class="nowrap" align="right">22605</td> </tr> <tr class="odd"> <td class="nowrap" align="right">29907</td> </tr> <tr class="even"> <td class="nowrap" align="right">30404</td> </tr> <tr class="odd"> <td class="nowrap" align="right">28600</td> </tr> <tr class="even"> <td class="nowrap" align="right">36385</td> </tr> <tr class="odd"> <td class="nowrap" align="right">27071</td> </tr> <tr class="even"> <td class="nowrap" align="right">35284</td> </tr> <tr class="odd"> <td class="nowrap" align="right">31724</td> </tr> <tr class="even"> <td class="nowrap" align="right">21767</td> </tr> <tr class="odd marked"> <td class="nowrap" align="right">166</td> </tr></tbody></table><br />目前的計算方式是從抓取列入清單的 1000 個部落格, 然後取三天內每個部落格最新的文章標題與內容, 然後用部觀門的關鍵字, 以及最近使用者搜尋的關鍵字, 以及特別加入的關鍵字來計算, 最後算出熱門度, 在使用者讀取時算出並進入暫存檔..<br /><br />目前是每兩時算一次, 所以快取 (Cache) 也是兩小時計算一次, 所以看到的當然是四小時內最新資料, 但因為每一個部落格的時區都不同, 所以有些部落格的時間怪怪的, 但我認為在這種誤差不會超過天, 所以是可以暫時不用去管時區的問題....<br /><br />最後, 這系統的最近會出 Widget, 但也是希望真的把算式調到一定穩定再說吧...黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com1tag:blogger.com,1999:blog-688624163679358701.post-749669513173141782008-08-11T02:18:00.002+08:002008-08-11T02:34:06.552+08:00新增模特兒分類距離上次增加新分類已經是兩個多月的事了, 這次特地邀請到對模特兒與 show girl 都很專業的 wisely 來幫忙審視這些關鍵字的這個類別...<br /><br />畢竟演員藝人不代表一定是模特兒或模特兒出身的, 自然也會排除 AV 女優出身的, 當然我是不太了解 wisely 是用甚麼標準啦, 但我是相信他的專業..<br /><br />大家有空也可以去他的部落格看看...<a href="http://wiselyview.net/blog/">Wisely's 拍拍照.寫寫字</a>, 但我猜他可能無法在這分類獨占螯頭, 畢竟他的部落格有部份美食, 部份攝影以及模特兒與 showgirl, 不像有些部落格, 如 beautypaper 等都是以這分類為主的, 但不一樣的是 Wisely 的照片都是他自己拍的, 跟那些部落格純脆收集的方向是不一樣的, 自然以原創為主的部落格在這方面會較吃虧一點...<br /><br />說真的, 在好好讀與宅度計等最大的問題就是要解決何謂原創或者是 "轉貼" 甚至是 "侵權" 等等, 這些可能都還是要靠人工吧..<br /><br />最近突然多了不少 feedburner 的訂閱, 所以再加註以前說過的話, 這個分類的排行必須要等到一星期到兩星期後才會穩定, 這段時間只能做參考...黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com1tag:blogger.com,1999:blog-688624163679358701.post-47759208701083743862008-08-09T02:32:00.002+08:002008-08-09T03:04:14.426+08:00部落格好好讀前五名的變化這些資料, 目前是放在 "<a href="http://blog-read.blogspot.com/">部落格頭版備存</a>" 上面, 大家想不開可以訂閱, ....<br /><br />若是以一天來看, 所謂的前 10 名的話題從早到晚變化不大, 但若是以幾天為單位來看, 事實上還是有變化的, 我來整理這八天的變化來看看..<br /><br />8/1: 星光3, 心理測驗, 減肥, 颱風, 瓦力<br />8/2: 星光3, 黃靖倫, 星光大道, 籃球火, 徐佳瑩<br />8/3: 超級偶像, 減肥, 煙火, 超級偶像2, Code Blue<br />8/4: 奧運, 減肥, 命中注定我愛你, 煙火, 籃球火<br />8/5: 奧運, 減肥, 命中注定我愛你, 塔羅, 夜市<br />8/6: 奧運, 北京, 減肥, 情人節, 加拿大<br />8/7: 奧運, 情人節, 七夕, 北京, 棒球<br />8/8: 奧運, 情人節, 七夕, 北京, 父親節<br /><br />首先要說明一下, 像為甚麼星光3 與星光大道跟超級偶像與超級偶像2 會同時存在呢? 因為在關鍵字的選取關係, 星光大道與超級偶像是屬於電視電影類別, 而星光3與超級偶像2在所謂的集數算是有時效性的話題所以不是在電視電影分類, 所以才會這樣子的結果...<br /><br />前三天可以說是星光與超偶的日子, 此時颱風已經逐漸退燒, 而奧運在變成主要主題時, 兩個節日的話題性也增加, 就是情人節與父親節, 果然是相當應景的..<br /><br />但這個以較意義並不大, 所以我會再加寫變化量, 不是單純的以總量來看, 這樣每日才會有變化, 不是五天才會變化一次~~黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-12293426823124198052008-08-07T15:39:00.002+08:002008-08-07T16:05:09.401+08:00宅度計的計算改變有些人發現宅度在最近一次的計算, 有 8 成的人分數大為下降, 但也有兩成的人宅度上升到新高, 這個改變最主要是針對發表文章的時間做權重的計算...<br /><br />也就是說, 若一陣子都沒有新文章, 隨著時間的推移, 原本文章的權重會逐漸降低, 雖然不至於會變成零, 但若真的超過很久沒寫的話, 這個宅度自然就會變很小到看不見, 若不到 0.5 的話, 自然看起來就是零了 (因為會進位)...<br /><br />相較的, 在部落格達人(權威部落格)的部份, 也會因為分數的不同, 讓每次計算時多了些變化, 也就是說, 原本只有當選或沒有當選, 此時還多了個 "當選次數", 畢竟要一直維持這個關鍵字的熱度不是那麼簡單, 像黑貘來說而言, 其達人代表為:<br /><br /><table border="1"><tbody><tr><th>名次</th> <th>名稱</th> <th>第一次</th> <th>最近一次</th> <th>當選次數</th> </tr> <tr><td>1</td><td><a href="http://otaku.datamining.tw/blogkeyword.php?kid=580">Web 2.0</a></td><td>2008-08-04</td><td>2008-08-04</td><td>1</td></tr><tr><td>2</td><td><a href="http://otaku.datamining.tw/blogkeyword.php?kid=533">web</a></td><td>2008-08-04</td><td>2008-08-04</td><td>1</td></tr><tr><td>3</td><td><a href="http://otaku.datamining.tw/blogkeyword.php?kid=1">部落格</a></td><td>2008-08-04</td><td>2008-08-04</td><td>1</td></tr><tr><td>4</td><td><a href="http://otaku.datamining.tw/blogkeyword.php?kid=2">部落格觀察</a></td><td>2008-06-20</td><td>2008-08-04</td><td>4</td></tr><tr><td>5</td><td><a href="http://otaku.datamining.tw/blogkeyword.php?kid=99">SEO</a></td><td>2008-06-09</td><td>2008-06-10</td><td>2</td></tr><tr><td>6</td><td><a href="http://otaku.datamining.tw/blogkeyword.php?kid=3175">宅度計</a></td><td>2008-06-04</td><td>2008-08-04</td><td>4</td></tr><tr><td>7</td><td><a href="http://otaku.datamining.tw/blogkeyword.php?kid=3079">排行榜</a></td><td>2008-06-04</td><td>2008-06-05</td><td>2</td></tr><tr><td>8</td><td><a href="http://otaku.datamining.tw/blogkeyword.php?kid=92">食夢黑貘</a></td><td>2008-06-03</td><td>2008-08-04</td><td>4</td> </tr></tbody></table> <br />這代表說, 像宅度計, 食夢黑貘, 部落格觀察這三個字是最為權威的 (這是廢話), 而 SEO, 排行榜也有 2 次, 而最近 web 2.0 等三個是剛入選, 當然以後會以次數做排序, 因為當時並沒有當選次數...<br /><br />這資訊可以在宅度計中每個部落格的 "達人" 選單看到, 也列出最近抓的一次的關鍵字數目, 只是這數目已經有經過時間的 Normalization 了, 不是真正的純數字...<br /><br />而未甚麼會有少數人增加呢? 因為雖然大部份的次數都會因為時間而有權重而降低, 但反倒是在一定時間內文章內容會因為夠新而會有微幅上升, 但這個並不多是真的...<br /><br />而想知道自己在那些關鍵字或領域是達人或權威嗎? 快去宅度計查查看吧...黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0tag:blogger.com,1999:blog-688624163679358701.post-65843239404934303902008-08-05T03:35:00.004+08:002008-08-05T04:09:50.165+08:00部落格的話題?有時我都覺得看新聞與看部觀門是相當有趣的, 此時至少有四個族群對一些事情有些不同的看法:<br /><br /><blockquote style="font-weight: bold;">1. 大眾媒體新聞從業人員<br />2. 部落格寫手<br />3. 部落格讀者<br />4. 所有讀者</blockquote><br />當然在去年初時, 開始研究搜尋關鍵字的脈動的時候, 我已經發現主流媒體對一些新聞處理的重視度跟讀者想要知道的東西有很大的落差, ....<br /><br />在做出宅度計後, 更可以看到部落格讀者與寫手的關係, 而這四個族群不只面對一個話題事件處理的態度與比重不一樣, 甚至時間上有些交互關係, 例如大部份的政論都是由上而下, 而一些消費話題都是由下而上, 都會有一個有趣的時間軸~~~<br /><br />甚至是我們可以劃分出一個有趣的事:<br /><br /><blockquote>1. <span style="color: rgb(255, 102, 102);">重度部落客</span>: 會積極參與部落圈活動, 或者是時常參與網摘的系統的人, 以及一群很有目的想要從網路賺錢的人.<br /><br />2.<span style="color: rgb(255, 102, 102);"> 一般部落客</span>: 只是純脆寫些自己的想法, 很少使用社群網摘書籤的系統, 更不會參與部落圈的活動的人. (通常也是一般部落格讀者)<br /></blockquote><br />當我把 "部落格好好讀" 給一些朋友看之後, 他認為這個正好可以表現出一般部落客對時事話題的比重, 而非經過活躍的重度部落客炒作的結果, 雖然這並不完全是我追求的目標.<br /><br />就像是 BOF 及 Punch Party 可以說是部落圈重要的大事, 去網摘看的話, 可能是一大堆相關的文章, 但從 "部落格好好讀" 來看, 又承現不同的風貌.....<br /><br />只是像 "全球華文不及格大獎", "台灣部落格大獎" 或 "[BOF]", "Punch Party" 等, 基本上是無法被列到部觀門的觀察列表, 因為太少人去搜尋了, 但在設計好好讀的時候, 本來就考慮這些部落格圈的特定議題或關鍵字的計算, 以及突發事件, 而最後算出現在部落格最夯的話題為:<br /><br /><table border="1"><tbody><tr><th>名次</th> <th>話題</th> <th>熱度</th> <th>分類</th> </tr><tr><td>1</td><td>奧運</td><td>46</td><td>時事話題</td></tr><tr><td>2</td><td>減肥</td><td>42</td><td><br /></td></tr><tr><td>3</td><td>命中注定我愛你</td><td>36</td><td>電視電影</td></tr><tr><td>4</td><td>煙火</td><td>22</td><td><br /></td></tr><tr><td>5</td><td>籃球火</td><td>20</td><td>電視電影</td></tr><tr><td>6</td><td>超級偶像2</td><td>18</td><td>時事話題</td></tr><tr><td>7</td><td>超級偶像</td><td>18</td><td>電視電影</td></tr><tr><td>8</td><td>非凡美食大探索</td><td>16</td><td>電視電影</td></tr><tr><td>9</td><td>星座運勢</td><td>14</td><td>星座命理</td></tr><tr><td>10</td><td>霹靂</td><td>14</td><td>電視電影</td></tr><tr><td>11</td><td>夜市</td><td>14</td><td>美食店家</td></tr><tr><td>12</td><td>Code Blue</td><td>12</td><td>電視電影</td></tr><tr><td>13</td><td>環島</td><td>12</td><td>旅遊地名</td></tr><tr><td>14</td><td>星光大道</td><td>10</td><td>電視電影</td></tr><tr><td>15</td><td>北京</td><td>10</td><td>旅遊地名</td></tr><tr><td>16</td><td>心理測驗</td><td>10</td><td><br /></td></tr><tr><td>17</td><td>中華隊</td><td>8</td><td>運動類</td></tr><tr><td>18</td><td>全球華文不及格大獎</td><td>8</td><td>時事話題</td></tr><tr><td>19</td><td>大稻埕</td><td>8</td><td>旅遊地名</td></tr><tr><td>20</td><td>高鐵</td><td>8</td><td><br /></td></tr><tr><td>21</td><td>MLB</td><td>8</td><td>運動類</td></tr><tr><td>22</td><td>倒馬</td><td>8</td><td>時事話題</td></tr><tr><td>23</td><td>減碳</td><td>6</td><td>時事話題</td></tr><tr><td>24</td><td>台灣部落格大獎</td><td>6</td><td>時事話題</td></tr><tr><td>25</td><td>演唱會</td><td>6</td><td>音樂類</td></tr><tr><td>26</td><td>京都</td><td>6</td><td>旅遊地名</td></tr><tr><td>27</td><td>賴銘偉</td><td>6</td><td>人名團體</td></tr><tr><td>28</td><td>煙火節</td><td>6</td><td>時事話題</td></tr><tr><td>29</td><td>達人</td><td>6</td><td><br /></td></tr><tr><td>30</td><td>康子與健兒</td><td>6</td><td>電視電影</td></tr></tbody></table><br />而 BOF 在這邊是 4 分, 沒辦法進去排行榜, 雖然最高也曾到 6 分過, 只是那時第 30 名是 8 分, ...<br /><br />但從這邊就可以看得出來, 新聞, 網摘 (funp, myshare, hemidemi), 部觀門, 跟這個好好讀的差異, 剛好表現出一般部落客(通常是讀者)與其他三種族群取向的不同, 只是這系統還未臻完善, 離真正的自動化以及全面化還有段距離, 嗯, 再看看吧....黑貘/Black Tapirhttp://www.blogger.com/profile/18277037743100778974noreply@blogger.com0