日期的正則表達式
本文是copy某位網友的,原文:http://www.jb51.net/article/28034.htm
要考慮的問題:合法的日期是多少;每個月的天數不一樣;閏年的問題。。。。
1、合法的日期:MSDN上規定--在公元(基督紀元)0001 年 1 月 1 日午夜 12:00:00 到公元 (C.E.) 9999 年 12 月 31 日晚上 11:59:59 之間的日期和時間
查看http://msdn.microsoft.com/zh-cn/library/system.datetime(VS.80).aspx
2、閏年的概念:百度百科說明--四年一閏,百年不閏,四百年再閏
查看http://baike.baidu.com/view/29649.htm
3、整合表達式
平年:
年份可統一寫作:(?!0000)[0-9]{4}
包括平年在內的所有年份的月份都包含1-28日:(0[1-9]|1[0-2])-(0[1-9]|1[0-9]|2[0-8])
包括平年在內的所有年份除2月外都包含29和30日:(0[13-9]|1[0-2])-(29|30)
包括平年在內的所有年份1、3、5、7、8、10、12月都包含31日:(0[13578]|1[02])-31)
合起來就是除閏年的2月29日外的其它所有日期:(?!0000)[0-9]{4}-((0[1-9]|1[0-2])-(0[1-9]|1[0-9]|2[0-8])|(0[13-9]|1[0-2])-(29|30)|(0[13578]|1[02])-31)
潤年
能被4整除但不能被100整除的年份:([0-9]{2}(0[48]|[2468][048]|[13579][26])
能被400整除的年份。能被400整除的數肯定能被100整除,因此後兩位肯定是00:(0[48]|[2468][048]|[13579][26])00
合起來就是所有閏年的2月29日:([0-9]{2}(0[48]|[2468][048]|[13579][26])|(0[48]|[2468][048]|[13579][26])00)-02-29)
四條規則都已實現,且互相間沒有影響,合起來就是所有符合DateTime範圍的日期的正則
^((?!0000)[0-9]{4}-((0[1-9]|1[0-2])-(0[1-9]|1[0-9]|2[0-8])|(0[13-9]|1[0-2])-(29|30)|(0[13578]|1[02])-31)|([0-9]{2}(0[48]|[2468][048]|[13579][26])|(0[48]|[2468][048]|[13579][26])00)-02-29)$
考慮到這個正則表達式僅僅是用作驗證,所以捕獲組沒有意義,只會占用資源,影響匹配效率,所以可以使用非捕獲組來進行優化。
^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$
有關正則表達式的捕獲/非捕獲 參看: http://www.jb51.net/article/28035.htm
日期的正則表達式