1. 程式人生 > >Blog的三大核心功能及RSS詳解

Blog的三大核心功能及RSS詳解

三大核心功能:
  • RSS
  • Permalink
Trackback Ping Permalink Trackback Ping Permalink Trackback Ping
RSS
首先談RSS,RSS其實很多朋友都已有了解。RSS是站點用來和其他站點之間共享內容的一種簡易方式(也叫聚合內容),通常被用於新聞和其他按順序排列的網站,一段專案的介紹也可以是包含新聞的全部介紹等。或者僅僅是額外的內容或者簡短的介紹。這些專案 的連結通常都能連結到全部的內容。網路使用者可以藉助RSS Reader在不開啟網站內容頁面的情況下閱讀支援RSS輸出的網站內容。網站提供RSS輸出,有利於讓使用者發現網站內容的更新。

現在很多站點都有RSS Feed,那麼為什麼是Blog的核心呢?RSS 本質上中是一種遵循W3C RDF規範的XML格式,Blog和RSS結合十分緊密,自Blog一誕生以來,標準的Blog站點都支援RSS技術規範,能夠包含網站的Logo、Link、標題、內容等等。

Permalink


中文翻譯一般叫做固定連結,其實我覺得翻譯成靜態連結更為貼切。下面切入正題:

不得不承認,將動態網頁連結rewriting成靜態連結是最保險和穩定的面向搜尋引擎優化方式。

此外隨著網際網路上的內容以驚人速度的增長也越來越突出了搜尋引擎的重要性,如果網站想更好地被搜尋引擎收錄,網站設計除了面向使用者友好(User Friendly)外,搜尋引擎友好(Search Engine Friendly)的設計也是非常重要的。進入搜尋引擎的頁面內容越多,則被使用者用不同的關鍵詞找到的機率越大。在Google的演算法調查一文中提到一個站點被Google索引頁面的數量其實對PageRank也是有一定影響的。由於Google 突出的是整個網路中相對靜態的部分(動態網頁索引量比較小),連結地址相對固定的靜態網頁比較適合被Google索引(怪不得很多大網站的郵件列表歸檔和BLOG按日期歸檔的文件很容被搜的到),因此很多關於面向搜尋引擎 URL設計優化(URI Pretty)的文章中提到了很多利用一定機制將動態網頁引數變成像靜態網頁的形式:
比如可以將:
http://d4e.org/showthread.php?t=12327
變成:
http://d4e.org/2004/09/08/01

實現方式主要有2種: 具體實現細節不是本文重點,不再細述。很多BLOG程式後臺都能開啟此功能,也要注意WEB伺服器的設定,使用虛擬主機無法設定伺服器的朋友請參考path_info的一些資料。

靜態地址還有什麼好處:
  • 隱藏後臺實現:這在後臺應用平臺的遷移時非常有用:當從asp遷移到java平臺時,對於前臺使用者來說,根本感受不到後臺應用的變化;
  • 簡化資料校驗:比如我們需要將應用從news.asp?id=234遷移成news.php?query=234時,前臺的表現可以一直保持為 news/234.html。從實現應用和前臺表現的分離:保持了URL的穩定性,而使用WEB服務中的mod_rewrite甚至可以把請求轉發到其他後臺伺服器上。
從技術層面來講,論壇如果想被搜尋引擎更多的關注的話,同樣可以實現Permalink。

Trackback

TrackBack最早是Movable上的一個小功能。可以說就是這個小功能在blog界卻掀起了一場革命。

TrackBack為將全世界無數個blog連線起來的功能。例如,當你讀了某個網站的文章,想對此寫下自己的感想。這個時候利用網站準備的討論功能進行留言是很最常見的做法。但這樣只是把自己的評論意見寫下來向別人的網站投稿,而你自己手裡卻什麼也沒留 下。

TrackBack 則與之有很大的區別。可以把評論寫到自己網站上。然後向原始文章的伺服器傳送該網頁的URL及標題、部分正文、網站名稱等資訊(注)。儘管這一過程只是稱之為“傳送TrackBackPing”,但通過這種辦法,在原始文章的地方就留下了你的評論的URL 、標題等部分資訊。當然別人也可以向原始文章傳送TrackBack Ping,所以在原始文章中就將包括你的TrackBack Ping在內的所有評論都記錄了下來。

此外,如果你在自己網站上也設定了TrackBack Ping功能的話,那麼誰都可以通過TrackBack Ping來發錶針對你的意見了。這樣,多家網站就通過相關話題而聯接起來。各種評論在因特網上就像網眼一樣聯接起來。這樣就創造出了與日記網站完全不同的文化。

注:傳送地址採用原始文章指定的URL,這一URL就稱為“TrackBack Ping URL”。TrackBack的技術標準刊登在“LowLife.jp”的blog網站上。

如果你使用的是服務商提供的Blog服務,服務商沒有提供Trackback怎麼辦?或者你的空間不足以放下太多的Trackback回覆,又怎麼辦?

到HaloScan.com去看看。


最後用一句話總結這三大功能:
  • RSS:能讓使用者更方便的訂閱
  • Permalink:能更好的讓你的文章被搜尋引擎關注
  • Trackback:能更好的與其他Blog進行交流、討論、溝通

    什麼是 RSS :rss.txt
    RSS 系列介紹(一):RSS的一些背景資料

    討論與Blog相關的技術,不可不談的就是RSS,這個縮寫在英文中可以有幾個源頭,並被不同的技術團體做不同的解釋。既可以是“Rich Site Summary”,或“RDF Site Summary”,也可以是“Really Simple Syndication”。為什麼有這麼多含義呢?這還要從RSS的一段今天也沒有理清的關係說起。

    今天肯定有人還記得IE 4剛剛推出來的時候有一個有趣的功能,那就是新聞頻道。這個新聞頻道的功能與Netscape推出的新聞頻道是很相似的(當時Netscape還是市場上領先的瀏覽器)。為此Netscape 定義了一套描述新聞頻道的語言,這就是RSS,只不過Netscape自當時起每況愈下,所以最終也沒有釋出一個正式的RSS規範(只發布了一個0.9版本)。而微軟也在當時推出了支援自己IE的CDF(Channel Definition format)資料規格,與RSS非常接近。微軟試圖用新聞頻道的功能把“推”(Push)技術變成一個應用主流,並與Netscape抗衡。不過出乎預測的是,“推”技術自始至終沒有找到合適的商業模型,而且伴隨著其他各類網路特性的出現,也日益無法顯 現自身的優勢。新聞頻道在瀏覽器中的地位最終日暮西山,最後也在IE的後續版本中消失了。

    新聞頻道的確進入了低谷,但是RSS並沒有被業界人士所拋棄。過去兩年,Blog從一個專業群體開始,逐步成為了網路上最熱門的新話題。而RSS成為了描述Blog主題和更新資訊的最基本方法。於是RSS這項技術被著名Blogger/Geek戴夫·溫那(Dave Winner)的公司UserLand所接手,繼續開發新的版本,以適應新的網路應用需要。新的網路應用就是Blog,因為戴夫·溫那的努力,RSS升級到了0.91版,然後達到了0.92版,隨後在各種Blog工具中得到了應用,並被眾多的專業新聞站點 所支援。在廣泛的應用過程中,眾多的專業人士認識到需要組織起來,把RSS發展成為一個通用的規範,並進一步標準化。一個聯合小組根據W3C新一代的語義網技術RDF對RSS進行了重新定義,釋出了RSS 1.0,並把RSS定義為“RDF Site Summary”。這項工作並沒有與戴夫·溫那進行有效的溝通,而戴夫則堅持在自己設想的方向上進一步開發RSS的後續版本,也並不承認RSS 1.0的有效性。RSS由此開始分化形成了RSS 0.9x/2.0和RSS 1.0兩個陣營,也由此引起了在專業人群中的廣泛爭論。

    因為爭論的存在,一直到今天,RSS 1.0還沒有成為標準化組織的真正標準。而戴夫·溫那卻在2002年9月獨自把RSS升級到了2.0版本,其中的定義完全是全新的模式,並沒有任何RSS 1.0的影子。這引發了網路上進一步爭議,究竟讓一個越來越普及的資料格式成為一個開放的標準,還是被一家公司所定義和控制,成為了爭議的焦點。戴夫·溫那並沒有為自己辯解,他的觀點是RSS還需要進一步發展,需要專業人士更明確的定義,不過恐怕這種輕描 淡寫不能消除人們對RSS“被一家商業公司獨佔”的擔心。

    前面的鋪墊對使用者來說也許沒有什麼太大的意義,可能更多人關心如何在自己的Blog增加RSS輸出,這樣可以讓很多新聞聚合工具(例如CNBlog剛剛推薦的NewzCrawler)很容易找到你並自動獲得你在Blog中的更新內容。

    所以我們會在後面的系列文章中逐步增加對RSS工具的介紹,以及如何在你的Blog中新增RSS輸出格式和相關的標誌連結。等不及的使用者,可以先到我的個人站點上的一個臨時連結地方嘗試起來了,我提供了一個簡單的RSS生成工具和相關的介紹(對Blogg er.com工具最佳,其他工具還沒有做測試)。

    P.S. goghs 的一個留言,供大家參考,普通使用者大可以跳過: “關於RSS兩個標準之爭前段時間確實很激烈,很多局內人士被迫翻出了陳年老帳。有些爭論甚至到了攻擊的地步。跑開情感因素不論,作為一個完全的局外人,我個人是比較偏向於0.9x/2.0 (具體就是0.91 -> 0.92 -> 0.94 -> 2.0)的。1.0將rdf的名稱空間重新加入了RSS,這有它的意義。但是從RSS使用的領域,至少是現在的使用目的而言,1.0標準顯得過重了。相比之下2.0更簡單更實用一點。 至於說一家公司控制標準的問題,其實從一開始RSS就處在這種狀況之下,如果你認為它是被控制的話,從一開始就被控制了,即使在Netscape的年代。作為一個開放標準,這種控制並未對使用者形成什麼危險。 其實1.0背後也是一家公司,知名的O'Reilly。 從既有資源而言,0.9x系列佔有壓倒優勢,我想2.0會作為當然的既得利益者,繼續佔有統治位置。

    但是對於一個開發者來說,可能這種爭論更容易被調和,因為你可以同時支援他們,甚至包括以前所有的標準。 這涉及兩個方面: 1. source: 你可以生成兩個版本,分別符合1.0和2.0規範。 或者你可以生成一個XML源,然後使用XSL/XSLT轉換成1.0/2.0格式。 2. aggregator: 對不同的格式分別使用不同的解析。

    當然,我希望最終還是能夠互相妥協,只保留一個標準。不過這也許很難,因為這在計算機領域是最不常見的一件事。不管是公司之間,還是業餘開發之間,都不容易達到一致。”

    Isaac: goghs的留言很好,算是對這場標準的爭論的一個補充吧。大家可能會奇怪,這種爭論會不會對Blog的發展產生不利的影響。照我說,不一定,很可能是促進作用更多一些。不像最近國內的某些爭吵,吵來吵去其實傷害了發展和進步。另外,從技術開發上來說,我 也非常支援0.92系列的簡易性,把新浪新聞變成RSS 0.92並匯入NewzCrawler 就是一個10分鐘的工作,而RDF相對麻煩一點,當然也不過是處理一些額外的名稱空間而已。但是從整體來說,Sementic Web(語義網)也需要大家的通力支援才能夠有更好的未來,而作為承載語義網的一個重要部分,RDF應當被有責任感的人們所推動。不過我還是要承認RDF應用到RSS中還為時過早。


    RSS 系列介紹(二)


    --------------------------------------------------------------------------------
    RSS與新聞聚合前面介紹了RSS的一些歷史淵源,今天我再與大家聊聊RSS在新聞聚合,而下一次我還會介紹RSS在網站聯合中的應用。

    其實,RSS就是一段規範的XML資料,用一些大家約定的標記描述一個Blog或者一個新聞源的最近更新的內容。RSS是Blog走向社群化和快速普及的一個技術推動力,Blog也因此技術而走向了專業化領域。連同本來網路上的各種專業媒體提供的新聞源, 人們可以透過RSS在桌面上輕鬆訪問大量與自己的興趣相關的主題,而忽略掉訪問網站帶來的複雜過程,還有那些討厭的花花綠綠的廣告。新聞聚合(News Aggregation)和網站聯合(Syndication)兩個概念由此出現並廣泛被Blogger們所採用。我們今天先談談新聞聚合。


    所謂新聞聚合,就是通過軟體工具或程式設計的方法從多個新聞源或Blog站點蒐集新聞並在一個介面中提供給讀者進行閱讀。新聞聚合的基礎條件就是這些新聞源都提供通用的資料格式,目前最流行的格式也就是RSS。也不知道是有了RSS,才有了新聞聚合的概念,還 是有了新聞聚合的想法,才出現了RSS的技術,總之技術最終應當是為人們的需要服務。目前網路上有一些流行的新聞聚合工具,他們都支援多種目前處於版本的RSS格式。我們在這裡介紹幾種比較流行的工具:


    Aggie 是一個很小的新聞聚集工具,連同原始碼下載也不過84K。唯一的限制是它建立在Microsoft .Net 框架上,所以執行起來還要這個平臺的支援(.Net 框架的基本執行版本也要20M左右)。Aggie把使用者登記的各種Blog或專業媒體新聞網站的資訊都蒐集在一起,並直接輸出為一個本地網頁,自動啟動IE提供給使用者進行瀏覽。

    NetNewsWire 則是一個運行於Apple公司電腦上的新聞蒐集和閱讀工具。它提供的三個板塊的版面格式與電子郵件應用非常類似,它可以直接在應用程式的介面中瀏覽新聞。

    Straw 也是一個高效率的桌面新聞聚合工具,不過執行在GNOME環境中,在Linux和支援GNOME的UNIX環境中都能夠執行。


    CNBlog 心得集近期曾經推薦過NewzCrawler這個新出現的新聞聚合工具,這是我在PC桌面上看到的最好的新聞聚合工具了。無論從功能還是易用性方面來看,這個工具都比前面介紹的幾個工具要更優秀。唯一的問題是,正式版本的NewzCrawler不是免費的 。現在我能夠利用這個工具每天輕鬆地察看來自一些新聞站點(例如新浪和CNET等)的最新訊息和一批我關心的Blog的更新內容,還能夠便捷地用工具中內嵌的Blog輸入工具把感興趣的內容摘錄到自己的Blog中,效率大增,真是令人產生了全球資訊盡在指 尖的感受。當我們深入去想的時候,會發現這大概正是網路走向個性化和對傳統媒體的一種挑戰所在吧。

    在新聞聚合的觀念下,我相信Blog會與RSS共同發展,越來越成為人們最喜愛的資訊來源。

  • Permalink:能更好的讓你的文章被搜尋引擎關注
  • Trackback:能更好的與其他Blog進行交流、討論、溝通

    什麼是 RSS :rss.txt
    RSS 系列介紹(一):RSS的一些背景資料

    討論與Blog相關的技術,不可不談的就是RSS,這個縮寫在英文中可以有幾個源頭,並被不同的技術團體做不同的解釋。既可以是“Rich Site Summary”,或“RDF Site Summary”,也可以是“Really Simple Syndication”。為什麼有這麼多含義呢?這還要從RSS的一段今天也沒有理清的關係說起。

    今天肯定有人還記得IE 4剛剛推出來的時候有一個有趣的功能,那就是新聞頻道。這個新聞頻道的功能與Netscape推出的新聞頻道是很相似的(當時Netscape還是市場上領先的瀏覽器)。為此Netscape 定義了一套描述新聞頻道的語言,這就是RSS,只不過Netscape自當時起每況愈下,所以最終也沒有釋出一個正式的RSS規範(只發布了一個0.9版本)。而微軟也在當時推出了支援自己IE的CDF(Channel Definition format)資料規格,與RSS非常接近。微軟試圖用新聞頻道的功能把“推”(Push)技術變成一個應用主流,並與Netscape抗衡。不過出乎預測的是,“推”技術自始至終沒有找到合適的商業模型,而且伴隨著其他各類網路特性的出現,也日益無法顯 現自身的優勢。新聞頻道在瀏覽器中的地位最終日暮西山,最後也在IE的後續版本中消失了。

    新聞頻道的確進入了低谷,但是RSS並沒有被業界人士所拋棄。過去兩年,Blog從一個專業群體開始,逐步成為了網路上最熱門的新話題。而RSS成為了描述Blog主題和更新資訊的最基本方法。於是RSS這項技術被著名Blogger/Geek戴夫·溫那(Dave Winner)的公司UserLand所接手,繼續開發新的版本,以適應新的網路應用需要。新的網路應用就是Blog,因為戴夫·溫那的努力,RSS升級到了0.91版,然後達到了0.92版,隨後在各種Blog工具中得到了應用,並被眾多的專業新聞站點 所支援。在廣泛的應用過程中,眾多的專業人士認識到需要組織起來,把RSS發展成為一個通用的規範,並進一步標準化。一個聯合小組根據W3C新一代的語義網技術RDF對RSS進行了重新定義,釋出了RSS 1.0,並把RSS定義為“RDF Site Summary”。這項工作並沒有與戴夫·溫那進行有效的溝通,而戴夫則堅持在自己設想的方向上進一步開發RSS的後續版本,也並不承認RSS 1.0的有效性。RSS由此開始分化形成了RSS 0.9x/2.0和RSS 1.0兩個陣營,也由此引起了在專業人群中的廣泛爭論。

    因為爭論的存在,一直到今天,RSS 1.0還沒有成為標準化組織的真正標準。而戴夫·溫那卻在2002年9月獨自把RSS升級到了2.0版本,其中的定義完全是全新的模式,並沒有任何RSS 1.0的影子。這引發了網路上進一步爭議,究竟讓一個越來越普及的資料格式成為一個開放的標準,還是被一家公司所定義和控制,成為了爭議的焦點。戴夫·溫那並沒有為自己辯解,他的觀點是RSS還需要進一步發展,需要專業人士更明確的定義,不過恐怕這種輕描 淡寫不能消除人們對RSS“被一家商業公司獨佔”的擔心。

    前面的鋪墊對使用者來說也許沒有什麼太大的意義,可能更多人關心如何在自己的Blog增加RSS輸出,這樣可以讓很多新聞聚合工具(例如CNBlog剛剛推薦的NewzCrawler)很容易找到你並自動獲得你在Blog中的更新內容。

    所以我們會在後面的系列文章中逐步增加對RSS工具的介紹,以及如何在你的Blog中新增RSS輸出格式和相關的標誌連結。等不及的使用者,可以先到我的個人站點上的一個臨時連結地方嘗試起來了,我提供了一個簡單的RSS生成工具和相關的介紹(對Blogg er.com工具最佳,其他工具還沒有做測試)。

    P.S. goghs 的一個留言,供大家參考,普通使用者大可以跳過: “關於RSS兩個標準之爭前段時間確實很激烈,很多局內人士被迫翻出了陳年老帳。有些爭論甚至到了攻擊的地步。跑開情感因素不論,作為一個完全的局外人,我個人是比較偏向於0.9x/2.0 (具體就是0.91 -> 0.92 -> 0.94 -> 2.0)的。1.0將rdf的名稱空間重新加入了RSS,這有它的意義。但是從RSS使用的領域,至少是現在的使用目的而言,1.0標準顯得過重了。相比之下2.0更簡單更實用一點。 至於說一家公司控制標準的問題,其實從一開始RSS就處在這種狀況之下,如果你認為它是被控制的話,從一開始就被控制了,即使在Netscape的年代。作為一個開放標準,這種控制並未對使用者形成什麼危險。 其實1.0背後也是一家公司,知名的O'Reilly。 從既有資源而言,0.9x系列佔有壓倒優勢,我想2.0會作為當然的既得利益者,繼續佔有統治位置。

    但是對於一個開發者來說,可能這種爭論更容易被調和,因為你可以同時支援他們,甚至包括以前所有的標準。 這涉及兩個方面: 1. source: 你可以生成兩個版本,分別符合1.0和2.0規範。 或者你可以生成一個XML源,然後使用XSL/XSLT轉換成1.0/2.0格式。 2. aggregator: 對不同的格式分別使用不同的解析。

    當然,我希望最終還是能夠互相妥協,只保留一個標準。不過這也許很難,因為這在計算機領域是最不常見的一件事。不管是公司之間,還是業餘開發之間,都不容易達到一致。”

    Isaac: goghs的留言很好,算是對這場標準的爭論的一個補充吧。大家可能會奇怪,這種爭論會不會對Blog的發展產生不利的影響。照我說,不一定,很可能是促進作用更多一些。不像最近國內的某些爭吵,吵來吵去其實傷害了發展和進步。另外,從技術開發上來說,我 也非常支援0.92系列的簡易性,把新浪新聞變成RSS 0.92並匯入NewzCrawler 就是一個10分鐘的工作,而RDF相對麻煩一點,當然也不過是處理一些額外的名稱空間而已。但是從整體來說,Sementic Web(語義網)也需要大家的通力支援才能夠有更好的未來,而作為承載語義網的一個重要部分,RDF應當被有責任感的人們所推動。不過我還是要承認RDF應用到RSS中還為時過早。


    RSS 系列介紹(二)


    --------------------------------------------------------------------------------
    RSS與新聞聚合前面介紹了RSS的一些歷史淵源,今天我再與大家聊聊RSS在新聞聚合,而下一次我還會介紹RSS在網站聯合中的應用。

    其實,RSS就是一段規範的XML資料,用一些大家約定的標記描述一個Blog或者一個新聞源的最近更新的內容。RSS是Blog走向社群化和快速普及的一個技術推動力,Blog也因此技術而走向了專業化領域。連同本來網路上的各種專業媒體提供的新聞源, 人們可以透過RSS在桌面上輕鬆訪問大量與自己的興趣相關的主題,而忽略掉訪問網站帶來的複雜過程,還有那些討厭的花花綠綠的廣告。新聞聚合(News Aggregation)和網站聯合(Syndication)兩個概念由此出現並廣泛被Blogger們所採用。我們今天先談談新聞聚合。


    所謂新聞聚合,就是通過軟體工具或程式設計的方法從多個新聞源或Blog站點蒐集新聞並在一個介面中提供給讀者進行閱讀。新聞聚合的基礎條件就是這些新聞源都提供通用的資料格式,目前最流行的格式也就是RSS。也不知道是有了RSS,才有了新聞聚合的概念,還 是有了新聞聚合的想法,才出現了RSS的技術,總之技術最終應當是為人們的需要服務。目前網路上有一些流行的新聞聚合工具,他們都支援多種目前處於版本的RSS格式。我們在這裡介紹幾種比較流行的工具:


    Aggie 是一個很小的新聞聚集工具,連同原始碼下載也不過84K。唯一的限制是它建立在Microsoft .Net 框架上,所以執行起來還要這個平臺的支援(.Net 框架的基本執行版本也要20M左右)。Aggie把使用者登記的各種Blog或專業媒體新聞網站的資訊都蒐集在一起,並直接輸出為一個本地網頁,自動啟動IE提供給使用者進行瀏覽。

    NetNewsWire 則是一個運行於Apple公司電腦上的新聞蒐集和閱讀工具。它提供的三個板塊的版面格式與電子郵件應用非常類似,它可以直接在應用程式的介面中瀏覽新聞。

    Straw 也是一個高效率的桌面新聞聚合工具,不過執行在GNOME環境中,在Linux和支援GNOME的UNIX環境中都能夠執行。


    CNBlog 心得集近期曾經推薦過NewzCrawler這個新出現的新聞聚合工具,這是我在PC桌面上看到的最好的新聞聚合工具了。無論從功能還是易用性方面來看,這個工具都比前面介紹的幾個工具要更優秀。唯一的問題是,正式版本的NewzCrawler不是免費的 。現在我能夠利用這個工具每天輕鬆地察看來自一些新聞站點(例如新浪和CNET等)的最新訊息和一批我關心的Blog的更新內容,還能夠便捷地用工具中內嵌的Blog輸入工具把感興趣的內容摘錄到自己的Blog中,效率大增,真是令人產生了全球資訊盡在指 尖的感受。當我們深入去想的時候,會發現這大概正是網路走向個性化和對傳統媒體的一種挑戰所在吧。

    在新聞聚合的觀念下,我相信Blog會與RSS共同發展,越來越成為人們最喜愛的資訊來源。

  • Permalink:能更好的讓你的文章被搜尋引擎關注
  • Trackback:能更好的與其他Blog進行交流、討論、溝通

什麼是 RSS :rss.txt
RSS 系列介紹(一):RSS的一些背景資料

討論與Blog相關的技術,不可不談的就是RSS,這個縮寫在英文中可以有幾個源頭,並被不同的技術團體做不同的解釋。既可以是“Rich Site Summary”,或“RDF Site Summary”,也可以是“Really Simple Syndication”。為什麼有這麼多含義呢?這還要從RSS的一段今天也沒有理清的關係說起。

今天肯定有人還記得IE 4剛剛推出來的時候有一個有趣的功能,那就是新聞頻道。這個新聞頻道的功能與Netscape推出的新聞頻道是很相似的(當時Netscape還是市場上領先的瀏覽器)。為此Netscape 定義了一套描述新聞頻道的語言,這就是RSS,只不過Netscape自當時起每況愈下,所以最終也沒有釋出一個正式的RSS規範(只發布了一個0.9版本)。而微軟也在當時推出了支援自己IE的CDF(Channel Definition format)資料規格,與RSS非常接近。微軟試圖用新聞頻道的功能把“推”(Push)技術變成一個應用主流,並與Netscape抗衡。不過出乎預測的是,“推”技術自始至終沒有找到合適的商業模型,而且伴隨著其他各類網路特性的出現,也日益無法顯 現自身的優勢。新聞頻道在瀏覽器中的地位最終日暮西山,最後也在IE的後續版本中消失了。

新聞頻道的確進入了低谷,但是RSS並沒有被業界人士所拋棄。過去兩年,Blog從一個專業群體開始,逐步成為了網路上最熱門的新話題。而RSS成為了描述Blog主題和更新資訊的最基本方法。於是RSS這項技術被著名Blogger/Geek戴夫·溫那(Dave Winner)的公司UserLand所接手,繼續開發新的版本,以適應新的網路應用需要。新的網路應用就是Blog,因為戴夫·溫那的努力,RSS升級到了0.91版,然後達到了0.92版,隨後在各種Blog工具中得到了應用,並被眾多的專業新聞站點 所支援。在廣泛的應用過程中,眾多的專業人士認識到需要組織起來,把RSS發展成為一個通用的規範,並進一步標準化。一個聯合小組根據W3C新一代的語義網技術RDF對RSS進行了重新定義,釋出了RSS 1.0,並把RSS定義為“RDF Site Summary”。這項工作並沒有與戴夫·溫那進行有效的溝通,而戴夫則堅持在自己設想的方向上進一步開發RSS的後續版本,也並不承認RSS 1.0的有效性。RSS由此開始分化形成了RSS 0.9x/2.0和RSS 1.0兩個陣營,也由此引起了在專業人群中的廣泛爭論。

因為爭論的存在,一直到今天,RSS 1.0還沒有成為標準化組織的真正標準。而戴夫·溫那卻在2002年9月獨自把RSS升級到了2.0版本,其中的定義完全是全新的模式,並沒有任何RSS 1.0的影子。這引發了網路上進一步爭議,究竟讓一個越來越普及的資料格式成為一個開放的標準,還是被一家公司所定義和控制,成為了爭議的焦點。戴夫·溫那並沒有為自己辯解,他的觀點是RSS還需要進一步發展,需要專業人士更明確的定義,不過恐怕這種輕描 淡寫不能消除人們對RSS“被一家商業公司獨佔”的擔心。

前面的鋪墊對使用者來說也許沒有什麼太大的意義,可能更多人關心如何在自己的Blog增加RSS輸出,這樣可以讓很多新聞聚合工具(例如CNBlog剛剛推薦的NewzCrawler)很容易找到你並自動獲得你在Blog中的更新內容。

所以我們會在後面的系列文章中逐步增加對RSS工具的介紹,以及如何在你的Blog中新增RSS輸出格式和相關的標誌連結。等不及的使用者,可以先到我的個人站點上的一個臨時連結地方嘗試起來了,我提供了一個簡單的RSS生成工具和相關的介紹(對Blogg er.com工具最佳,其他工具還沒有做測試)。

P.S. goghs 的一個留言,供大家參考,普通使用者大可以跳過: “關於RSS兩個標準之爭前段時間確實很激烈,很多局內人士被迫翻出了陳年老帳。有些爭論甚至到了攻擊的地步。跑開情感因素不論,作為一個完全的局外人,我個人是比較偏向於0.9x/2.0 (具體就是0.91 -> 0.92 -> 0.94 -> 2.0)的。1.0將rdf的名稱空間重新加入了RSS,這有它的意義。但是從RSS使用的領域,至少是現在的使用目的而言,1.0標準顯得過重了。相比之下2.0更簡單更實用一點。 至於說一家公司控制標準的問題,其實從一開始RSS就處在這種狀況之下,如果你認為它是被控制的話,從一開始就被控制了,即使在Netscape的年代。作為一個開放標準,這種控制並未對使用者形成什麼危險。 其實1.0背後也是一家公司,知名的O'Reilly。 從既有資源而言,0.9x系列佔有壓倒優勢,我想2.0會作為當然的既得利益者,繼續佔有統治位置。

但是對於一個開發者來說,可能這種爭論更容易被調和,因為你可以同時支援他們,甚至包括以前所有的標準。 這涉及兩個方面: 1. source: 你可以生成兩個版本,分別符合1.0和2.0規範。 或者你可以生成一個XML源,然後使用XSL/XSLT轉換成1.0/2.0格式。 2. aggregator: 對不同的格式分別使用不同的解析。

當然,我希望最終還是能夠互相妥協,只保留一個標準。不過這也許很難,因為這在計算機領域是最不常見的一件事。不管是公司之間,還是業餘開發之間,都不容易達到一致。”

Isaac: goghs的留言很好,算是對這場標準的爭論的一個補充吧。大家可能會奇怪,這種爭論會不會對Blog的發展產生不利的影響。照我說,不一定,很可能是促進作用更多一些。不像最近國內的某些爭吵,吵來吵去其實傷害了發展和進步。另外,從技術開發上來說,我 也非常支援0.92系列的簡易性,把新浪新聞變成RSS 0.92並匯入NewzCrawler 就是一個10分鐘的工作,而RDF相對麻煩一點,當然也不過是處理一些額外的名稱空間而已。但是從整體來說,Sementic Web(語義網)也需要大家的通力支援才能夠有更好的未來,而作為承載語義網的一個重要部分,RDF應當被有責任感的人們所推動。不過我還是要承認RDF應用到RSS中還為時過早。


RSS 系列介紹(二)


--------------------------------------------------------------------------------
RSS與新聞聚合前面介紹了RSS的一些歷史淵源,今天我再與大家聊聊RSS在新聞聚合,而下一次我還會介紹RSS在網站聯合中的應用。

其實,RSS就是一段規範的XML資料,用一些大家約定的標記描述一個Blog或者一個新聞源的最近更新的內容。RSS是Blog走向社群化和快速普及的一個技術推動力,Blog也因此技術而走向了專業化領域。連同本來網路上的各種專業媒體提供的新聞源, 人們可以透過RSS在桌面上輕鬆訪問大量與自己的興趣相關的主題,而忽略掉訪問網站帶來的複雜過程,還有那些討厭的花花綠綠的廣告。新聞聚合(News Aggregation)和網站聯合(Syndication)兩個概念由此出現並廣泛被Blogger們所採用。我們今天先談談新聞聚合。


所謂新聞聚合,就是通過軟體工具或程式設計的方法從多個新聞源或Blog站點蒐集新聞並在一個介面中提供給讀者進行閱讀。新聞聚合的基礎條件就是這些新聞源都提供通用的資料格式,目前最流行的格式也就是RSS。也不知道是有了RSS,才有了新聞聚合的概念,還 是有了新聞聚合的想法,才出現了RSS的技術,總之技術最終應當是為人們的需要服務。目前網路上有一些流行的新聞聚合工具,他們都支援多種目前處於版本的RSS格式。我們在這裡介紹幾種比較流行的工具:


Aggie 是一個很小的新聞聚集工具,連同原始碼下載也不過84K。唯一的限制是它建立在Microsoft .Net 框架上,所以執行起來還要這個平臺的支援(.Net 框架的基本執行版本也要20M左右)。Aggie把使用者登記的各種Blog或專業媒體新聞網站的資訊都蒐集在一起,並直接輸出為一個本地網頁,自動啟動IE提供給使用者進行瀏覽。

NetNewsWire 則是一個運行於Apple公司電腦上的新聞蒐集和閱讀工具。它提供的三個板塊的版面格式與電子郵件應用非常類似,它可以直接在應用程式的介面中瀏覽新聞。

Straw 也是一個高效率的桌面新聞聚合工具,不過執行在GNOME環境中,在Linux和支援GNOME的UNIX環境中都能夠執行。


CNBlog 心得集近期曾經推薦過NewzCrawler這個新出現的新聞聚合工具,這是我在PC桌面上看到的最好的新聞聚合工具了。無論從功能還是易用性方面來看,這個工具都比前面介紹的幾個工具要更優秀。唯一的問題是,正式版本的NewzCrawler不是免費的 。現在我能夠利用這個工具每天輕鬆地察看來自一些新聞站點(例如新浪和CNET等)的最新訊息和一批我關心的Blog的更新內容,還能夠便捷地用工具中內嵌的Blog輸入工具把感興趣的內容摘錄到自己的Blog中,效率大增,真是令人產生了全球資訊盡在指 尖的感受。當我們深入去想的時候,會發現這大概正是網路走向個性化和對傳統媒體的一種挑戰所在吧。

在新聞聚合的觀念下,我相信Blog會與RSS共同發展,越來越成為人們最喜愛的資訊來源。