網頁META標籤的標準寫法
最近,Danny Sullivan談到了如何處理的搜尋引擎meta標籤的問題,以下是一些關於在Google中如何處理這些問題的答案。
多內容數值
我們建議你把所有的Meta標籤內容放在一個meta中。這將使得meta標籤更易於讀取並降低發生錯誤的概率。例如:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
如果一行包含對個meta標籤,我們將會累加標籤的內容,例如,我們會將
<META NAME="ROBOTS" CONTENT="NOINDEX">
<META NAME="ROBOTS" CONTENT="NOFOLLOW">
理解為:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
如果內容的數值有衝突,我們將使用最嚴格的那個。所以,如果有個頁面包含下面的meta標籤:
<META NAME="ROBOTS" CONTENT="NOINDEX">
<META NAME="ROBOTS" CONTENT="INDEX">
我們將只遵守noindex的數值。
單詞拼寫規範
Googlebot可以理解任何大小寫的組合,所有大小寫都是同樣的效果。如果包含多內容的數值,數值之間需要使用逗號分隔。
同時使用robots.txt和robots meta標籤
如果你同時使用了robots.txt檔案和robots meta標籤,如果robots.txt和meta標籤有衝突,googlebot將使用限制更嚴的。具體來說:
如果你在robots.txt裡禁止了某一頁,Googlebot永遠也不會去索引那一頁,也不會讀取那一頁的任何標識。
如果你在robot.txt中允許,但是在頁面中使用 meta 標籤對其進行限制,那麼Googlebots會訪問那一頁,讀取裡面的標籤,但不會對其進行索引。
有效的meta標籤數值
Googlebot可以對下面的標籤進行如下的解讀:
NOINDEX - 阻止頁面被列入索引。
NOFOLLOW - 阻止對於頁面中任何超級連結進行索引。(注,這不同於超級連結上的nofollow屬性,那個屬性只是組織索引單獨的連結)
NOARCHIVE - 不儲存該頁面的網頁快照。
NOSNIPPET - 不在搜尋結果中顯示該頁面的摘要資訊,同時不儲存該頁面的網頁快照。
NOODP - 在搜尋結果中不使用Open Directory Project中的描述資訊作為其摘要資訊。
NONE - 相當於“NOINDEX, NOFOLLOW”。
數值NONE的含義
據robotstxt.org的定義,下面的標記等價於 NOINDEX, NOFOLLOW 。
<META NAME="ROBOTS" CONTENT="NONE">
不過,有些網站站長使用這個標籤來限制和組織所有搜尋引擎來的內容索引。
<META http-equiv=Content-Type content="text/html; charset=gb2312">
//設定頁面語言為簡體中文
<META content="關鍵字" name="keywords">
//設定關鍵字
<META content="內容描述" name="description">
//設定描述
<META http-equiv="Refresh" Content="30">
//設定該頁面30秒自動重新整理
<META name="robots" content="index, follow" />
//設定允許搜尋引擎可以檢索,頁面上鍊接可以查詢
<META name="googlebot" content="index, follow" />
//針對google的搜尋機器人設定允許搜尋引擎可以檢索,頁面上鍊接可以查詢
<META name="Author" Content="酷站程式碼 www.5icool.org">
//頁面作者
<META name="Copyright" Content="All Rights Reserved icediary">
//頁面版權
<META name="revisit-after" CONTENT="1 days" >
//設定回訪為1天
META標籤分兩大部分:HTTP標題資訊(HTTP-EQUIV)和頁面描述資訊(NAME)。
一、HTTP-EQUIV
HTTP-EQUIV類似於HTTP的頭部協議,它迴應給瀏覽器一些有用的資訊,以幫助正確和精確地顯示網頁內容。常用的HTTP-EQUIV型別有:
1、Content-Type和Content-Language (顯示字符集的設定)
用法:<Meta http-equiv="Content-Type" Content="text/html; Charset=gb2312">或<Meta http-equiv="Content-Language" Content="zh-CN">
設定頁面使用的字符集,用以說明主頁製作所使用的文字或語言,瀏覽器會根據此來呼叫相應的字符集顯示頁面內容。簡體中文一般為GB2132,繁體中文為BIG5,日文的字符集是iso-2022-jp,韓文的是ks_c_5601等。
2、Refresh (重新整理)
用法:<Meta http-equiv="Refresh" Content="30">或<Meta http-equiv="Refresh" Content="5; Url=http://www.5icool.org">
讓網頁多少秒重新整理自己,或在多少秒後讓網頁自動連結到其它網頁。
3、Expires (期限)
用法:<Meta http-equiv="Expires" Content="0">或<Meta http-equiv="Expires" Content="Wed, 26 Feb 1997 08:21:57 GMT">
指定網頁在快取中的過期時間,一旦網頁過期,必須到伺服器上重新調閱。注意:必須使用GMT的時間格式。
4、Pragma (cach模式)
用法:<Meta http-equiv="Pragma" Content="No-cach">
網頁不儲存在快取中,每次訪問都重新整理頁面。這樣設定,訪問者將無法離線瀏覽。
5、Set-Cookie (cookie設定)
<Meta http-equiv="Set-Cookie" Content="cookievalue=xxx; expires=Wednesday,21-Oct-98 16:14:21 GMT; path=/">
瀏覽器訪問某個頁面時會將它存在快取中,下次再次訪問時就可從快取中讀取,以提高速度。當你希望訪問者每次都重新整理你廣告的圖示,或每次都重新整理你的計數器,就要禁用快取了。通常HTML檔案沒有必要禁用快取,對於ASP等頁面,就可以使用禁用快取,因為每次看到的頁面都是在伺服器動態生成的,快取就失去意義。如果網頁過期,那麼存檔的cookie將被刪除。必須使用GMT的時間格式。
6、Window-target (顯示視窗的設定)
用法:<Meta http-equiv="Widow-target" Content="_top">
強制頁面在當前視窗以獨立頁面顯示。這個屬性是用來防止別人在框架裡呼叫你的頁面。Content選項:_blank、_top、_self、_parent。
7、Pics-label (網頁RSAC等級評定)
用法:<META http-equiv="Pics-label" Contect="(PICS-1.1'http://www.bazhan.net' I gen comment 'RSACi North America Sever' by
'[email protected]' for 'http://www.microsoft.com' on '1997.06.30T14:21-0500' r(n0 s0 v0 l0))">
在IE的Internet選項中有一項內容設定,可以防止瀏覽一些受限制的網站,而網站的限制級別就是通過該引數來設定的。
8、Page-Enter、Page-Exit (進入與退出)
用法:<Meta http-equiv="Page-Enter" Content="blendTrans(Duration=0.5)"> <Meta http-equiv="Page-Exit" Content="blendTrans(Duration=0.5)">
或者:<Meta http-equiv="Page-Enter" Content="revealTrans(duration=x, transition=y)"> <Meta http-equiv="Page-Exit" Content="revealTrans(duration=x, transition=y)">
這個是頁面被載入和調出時的一些特效。注意:blendTrans是動態濾鏡的一種,產生漸隱效果。另一種動態濾鏡RevealTrans也可以用於頁面進入與退出效果: Duration 表示濾鏡特效的持續時間(單位:秒);Transition 濾鏡型別。表示使用哪種特效,取值為0-23。
9、IE6 (頁面生成器)
用法:<Meta http-equiv="IE6" Content="Generator">
頁面生成器generator,是ie6。
10、Content-Script-Type (指令碼相關)
用法:<Meta http-equiv="Content-Script-Type" Content="text/javascript">
注意:這是近來W3C的規範,指明頁面中指令碼的型別。
二、NAME變數
name是描述網頁的,對應於Content(網頁內容),以便於搜尋引擎機器人查詢、分類(目前幾乎所有的搜尋引擎都使用網上機器人自動查詢meta值來給網頁分類)。
11、Keywords (關鍵字)
用法:<Meta name="Keywords" Content="關鍵詞1,關鍵詞2,關鍵詞3,關鍵詞4">
為搜尋引擎提供的關鍵字列表。注意:各關鍵詞間用英文半形逗號“,”隔開。關鍵詞數量最好保持在5個以內,關鍵詞要和頁面內容相關。
12、Description (簡介)
用法:<Meta name="Description" Content="你網頁的簡述,如酷站程式碼 www.5icool.org">
Description用來告訴搜尋引擎你的網站或該頁面的主要內容,描述內容要和頁面內容相關,字數在150個字以內。
13、Robots (機器人嚮導)
用法:<Meta name="Robots" Content="All|None|Index|Noindex|Follow|Nofollow">
說明:Robots用來告訴搜尋機器人哪些頁面需要索引,哪些頁面不需要索引。Content的引數有all、none、index、noindex、follow、nofollow。預設是all。
all:檔案將被檢索,且頁面上的連結可以被查詢;none:檔案將不被檢索,且頁面上的連結不可以被查詢;(和 "noindex, no follow" 起相同作用);index:檔案將被檢索;(讓robot/spider登入);follow:頁面上的連結可以被查詢;noindex:檔案將不被檢索,但頁面上的連結可以被查詢;(不讓robot/spider登入);nofollow:檔案將不被檢索,頁面上的連結可以被查詢。(不讓robot/spider順著此頁的連線往下探找)。
14、Author (作者)
用法:<Meta name="Author" Content="酷站程式碼,www.5icool.org">
標註網頁的作者或製作組。Content可以是:你或你的製作組的名字或Email。
15、Copyright (版權)
用法:<Meta name="Copyright" Content="本頁版權歸酷站程式碼所有。All Rights Reserved icediary">
標註版權。
16、Generator (編輯器)
用法:<Meta name="Generator" Content="PCDATA|FrontPage|">
編輯器的說明。
17、revisit-after (重訪)
用法:<META name="revisit-after" CONTENT="7 days" >
一般用做引導搜尋引擎重新訪問你的站點的時間間隔,一般使用days。