1. 程式人生 > >簡述 URL 並分別說明各部分的含義

簡述 URL 並分別說明各部分的含義

統一資源定位符(URL)是用於完整地描述Internet上網頁和其他資源的地址的一種標識方法。
  Internet上的每一個網頁都具有一個唯一的名稱標識,通常稱之為URL地址,這種地址可以是本地磁碟,也可以是區域網上的某一臺計算機,更多的是Internet上的站點。簡單地說,URL就是Web地址,俗稱“網址”。
  URI 方案集,包含如何訪問 Internet 上的資源的明確指令。
  URL 是統一的,因為它們採用相同的基本語法,無論定址哪種特定型別的資源(網頁、新聞組)或描述通過哪種機制獲取該資源。 
  對於 Internet 伺服器或全球資訊網伺服器上的目標檔案,可以使用“統一資源定位符 (URL)”地址(該地址以“ http://”開始)。Web 伺服器使用“超文字傳輸協議 (HTTP)”,一種“幕後的”Internet 資訊傳輸協議。例如, 
http://www.microsoft.com/ 為 Microsoft 網站的全球資訊網 URL 地址。
  URL的一般格式為(帶方括號[]的為可選項):
  protocol :// hostname[:port] / path / [;parameters][?query]#fragment [編輯本段]格式說明:   URL的組成
  URL由三部分組成:協議型別主機名路徑及檔名。通過URL可以指定的主要有以下幾種:http、ftp、gopher、telnet、file等。
  1、protocol(協議):指定使用的傳輸協議,下表列出 protocol 屬性的有效方案名稱。 最常用的是HTTP協議,它也是目前WWW中應用最廣的協議。 

  file 資源是本地計算機上的檔案。格式file:// 
  ftp 通過 FTP訪問資源。格式 FTP://
  gopher 通過 Gopher 協議訪問該資源。 
  http 通過 HTTP 訪問該資源。 格式 HTTP:// 
  https 通過安全的 HTTPS 訪問該資源。 格式 HTTPS://
  mailto 資源為電子郵件地址,通過 SMTP 訪問。 格式 mailto:
  MMS 通過 支援MMS(流媒體)協議的播放該資源。(代表軟體:Windows Media Player)格式 MMS://
  ed2k 通過 支援ed2k(專用下載連結)協議的P2P軟體訪問該資源。(代表軟體:電驢) 格式 ed2k://

  Flashget 通過 支援Flashget:(專用下載連結)協議的P2P軟體訪問該資源。(代表軟體:快車) 格式 Flashget://
  thunder 通過 支援thunder(專用下載連結)協議的P2P軟體訪問該資源。(代表軟體:迅雷) 格式 thunder://
  news 通過 NNTP 訪問該資源。
  tencent 通過支援tencent(專用聊天連線) 協議和使用者對話。(代表軟體:QQ、TM)格式 tencent://message/?uin=號碼&Site=&Menu=yes
  msnim 通過支援msnim(專用聊天連線) 協議和使用者對話。(代表軟體:MSN、WLM) 格式 msnim:chat?contact=郵箱地址
  2、hostname(主機名):是指存放資源的伺服器的域名系統 (DNS) 主機名或 IP 地址。有時,在主機名前也可以包含連線到伺服器所需的使用者名稱和密碼(格式:username:password)。
  3、port(埠號):整數,可選,省略時使用方案的預設埠,各種傳輸協議都有預設的埠號,如http的預設埠為80。如果輸入時省略,則使用預設埠號。有時候出於安全或其他考慮,可以在伺服器上對埠進行重定義,即採用非標準埠號,此時,URL中就不能省略埠號這一項。
  4、path(路徑):由零或多個“/”符號隔開的字串,一般用來表示主機上的一個目錄或檔案地址。
  5、;parameters(引數):這是用於指定特殊引數的可選項。
  6、?query(查詢):可選,用於給動態網頁(如使用CGI、ISAPI、PHP/JSP/ASP/ASP.NET等技術製作的網頁)傳遞引數,可有多個引數,用“&”符號隔開,每個引數的名和值用“=”符號隔開。
  7、fragment,資訊片斷,字串,用於指定網路資源中的片斷。例如一個網頁中有多個名詞解釋,可使用fragment直接定位到某一名詞解釋。
  注意,Windows 主機不區分 URL 大小寫,但是,Unix/Linux 主機區分大小寫。 [編輯本段]URL定位標識說明  下面列表是常見的URL中定位和標識的服務或檔案:
  http:檔案在WEB伺服器上.
  file:檔案在您自己的區域性系統或匿名伺服器上
  ftp:檔案在FTP伺服器上
  gopher:檔案在gopher伺服器上
  wais:檔案在wais伺服器上
  news:檔案在Usenet伺服器上
  telnet:連線到一個支援Telnet遠端登入的伺服器上
  URL轉發 
  所謂URL轉發,是通過伺服器的特殊設定,將訪問您當前域名的使用者引導到您指定的另一個網路地址。例如,URL轉發可以讓使用者在訪問 http://www.abc.com時,自動轉向訪問到一個您自己指定的網址“ http://www.123.com”,URL轉發功能是萬網提供的域名註冊後的增值服務。
  URL發展背景 
  URL也被稱為網頁地址,是因特網上標準的資源的地址(Address)。它最初是由蒂姆·伯納斯-李發明用來作為全球資訊網的地址的。現在它已經被全球資訊網聯盟編制為因特網標準RFC1738了。在因特網的歷史上,統一資源定位符的發明是一個非常基礎的步驟。統一資源定位符的語法是一般的,可擴充套件的,它使用ASCII程式碼的一部分來表示因特網的地址。統一資源定位符的開始,一般會標誌著一個計算機網路所使用的網路協議。
  相關資料 
  URI方案集
  包含如何訪問Internet上的資源的明確指令。
  URL是統一的,因為它們採用相同的基本語法,無論定址哪種特定型別的資源(網頁、新聞組)或描述通過哪種機制獲取該資源。對於Internet伺服器或全球資訊網伺服器上的目標檔案,可以使用“統一資源定位符(URL)”地址(該地址以“ http://”開始)。Web伺服器使用“超文字傳輸協議(HTTP)”,一種“幕後的”Internet資訊傳輸協議。例如, http://www.microsoft.com/為Microsoft網站的全球資訊網URL地址。
  統一資源定位符與統一資源標誌符
  統一資源定位符是統一資源標誌符的一個變種。統一資源標誌符確定一個資源,而統一資源定位符不但確定一個資源,而且還表示出它在哪裡。比如下面的統一資源標誌符確定因特網工程工作組RFC1738,但並沒有說出在哪裡才找得到這份資料:urn:ietf:rfc:1738。而下面這些統一資源定位符則確定每個RFC1738文獻,而且還確定這些文獻在哪裡找得到:
  * http://www.ietf.org/rfc/rfc1738.txt
  * http://www.w3.org/Addressing/rfc1738.txt
  * http://rfc.sunsite.dk/rfc/rfc1738.html
  歷史上幾乎所有的統一資源標誌符都是統一資源定位符,因此這篇文章中所介紹的許多內容對兩者來說都是一樣的。
  統一資源定位符體制:每個統一資源定位符的開始都是該統一資源定位符的體制,其後是按體制不同的部分。
  統一資源定位符的日常使用
  超文字傳輸協議統一資源定位符將從因特網獲取資訊的四個基本元素包括在一個簡單的地址中:
  1. 傳送協議;
  2. 伺服器;
  3. 埠號;
  4. 路徑。
  典型的統一資源定位符看上去是這樣的:
http://zh.wikipedia.org:80/wiki/Special:Search?search=鐵路&go=Go
  其中:
  1. http,是協議;
  2. zh.wikipedia.org,是伺服器;
  3. 80,是伺服器上的網路埠號;
  4. /wiki/Special:Search,是路徑;
  5. ?search=鐵路&go=Go,是詢問。
  大多數網頁瀏覽器不要求使用者輸入網頁中「http://」的部分,因為絕大多數網頁內容是超文字傳輸協議檔案。同樣,「80」是超文字傳輸協議檔案的常用埠號,因此一般也不必寫明。一般來說使用者只要鍵入統一資源定位符的一部分(zh.wikipedia.org/wiki/鐵路)就可以了。由於超文字傳輸協議允許伺服器將瀏覽器重定向到另一個網頁地址,因此許多伺服器允許使用者省略網頁地址中的部分,比如 www。從技術上來說這樣省略後的網頁地址實際上是一個不同的網頁地址,瀏覽器本身無法決定這個新地址是否通,伺服器必須完成重定向的任務。 [編輯本段]URL結構說明  關於URL結構一般分為兩個部分,一個是物理結構,一個是邏輯結構。在物理結構包括扁平結構和樹型結構。扁平結構就是網站中所有的頁面都是在根目錄這一級別,形成一個扁平的物理結構。這比較適合於小型的網站,因為如果太多檔案都放在根目錄下的話,製作和維護起來比較麻煩。而樹型結構的意義是在一級目錄下分為多個頻道或者稱支為目錄,然後目錄下面再放上屬於這個頻道的頁面,首頁、頻道首頁、頻道下的內容就好比樹幹、樹枝、樹葉的關係。邏輯結構就是由網頁內部連結所形成的邏輯的或連結的網路圖。比較好的情況是邏輯結構與前面的樹型物理結構相吻合。

  如左圖所示
  主頁連結向所有的頻道主頁;主頁一般不直接連結向內容頁,除非是你非常想推的幾個特殊的頁;所有頻道主頁都連向其他頻道主頁;頻道主頁都連回網站主頁;頻道主頁也連向屬於自己本身頻道的內容頁;頻道主頁一般不連向屬於其他頻道的內容頁;所有內容頁都連向網站主頁;所有內容頁都連向自己的上一級頻道主頁;內容頁可以連向同一個頻道的其他內容頁;內容頁一般不連向其他頻道的內容頁;內容頁在某些情況下,可以用適當的關鍵詞連向其他頻道的內容頁。
   URL處理方式
  首先,需要注意URL的長度,在URL裡最好不要超過3-5個關鍵詞,如果超過5個關鍵詞,該url的權重就會被相應的降低。
  其次,在URL中儘量不要出現重複。
  最後,切忌在命名的時候用.exe之類的字尾作為URL的結尾。 [編輯本段]統一資源定位器URL的作用  統一資源定位器(URL)是為了能夠使客戶端程式查詢不同的資訊資源時有統一訪問方法而定義的一種地址標識方法。在Internet上所有資源都有一個獨一無二的URL地址。