時間戳計算
Linux原始碼中的mktime演算法解析
我們知道,從CMOS中讀出來的系統時間並不是time_t型別,而是類似於struct tm那樣,年月日時分秒是分開儲存的。
那麼,要把它轉化為系統便於處理的time_t型別,就需要演算法進行轉換。
我們都知道我們的公曆還是比較複雜的,有大月小月,有閏年非閏年,處理起來會很麻煩。
但是Linux的原始碼僅僅用了短短的幾行就完成了這個複雜的轉換(Gauss演算法),實在令人驚奇。話不多說,先看原始碼:
include/linux/time.h
staticinline unsigned longmktime (unsignedunsigned int day, unsigned int hour,
unsigned int min, unsigned int sec)
{
if (0>= (int) (mon -=2)) { /* 1..12 -> 11,12,1..10 */ mon +=12; /* Puts Feb last since it has leap day */ year -=1;
}
return (((
(unsigned long) (year/4- year/100+ year
先不看前面的,直接看return那句,該式整體上具有這樣的結構:
T = ((X * 24 + hour) * 60 + min) * 60 + sec
這說明該演算法是先算出從1970年1月1日開始的天數X,再進而求出具體的時間值T的。
因此我們重點看如何求天數X。也就是X = year/4 - year/100 + year/400 + 367*mon/12 + day + year*365 - 719499這一部分。
首先可以將上式拆成:
Y = year / 4 - year / 100 + year / 400
Z = 367 * mon / 12
W = year * 365 + day
X = Y + Z + W - 719499
Y很簡單,它計算了從公元元年到所求年份為止所有的閏年數。從W式看出,該演算法先假設所有年都是正常年(365天),再加上閏年額外的天數(式Y)。
到現在為止都算簡單,關鍵是Z式和X式中的那個常數719499是怎麼回事,似乎莫名其妙。還有就是它們和return語句前面的那個if判斷有什麼關係呢?
首先要澄清一點,常數719499並不是像很多人說的那樣,是0001年1月1日到1970年1月1日所經歷的天數。
不信你可以隨手寫個指令碼,將得到正確的數字:719162天。
顯然719162和719499是有關係的。我們把注意力放在那個if語句上:
mon -=2;if (mon <=0) {
mon +=12;
year--;
}
很明顯,它是想把1月和2月當作上一年年底的最後兩個月,讓3月作為一年的第一個月。這樣一來,我們可以儘量少的被閏年所影響。
按照這個假設,讓我們先不管Z式是怎麼來的,看看0001年1月1日時,Y + Z + W等於什麼:
mon = 1月變成上一年(公元前0001年)的11月;
year減一後變成了0,因此Y = 0;
Z = 367 * 11 / 12 = 336;
W = 1 + 0 * 365 = 1;
Y + Z + W = 337。
337這個數正好等於719499 - 719162!換句話說,它是對上述假設所做的補正!於是這些式子就變成了:
Y = year / 4 - year / 100 + year / 400
Z = 367 * mon / 12
V = Z - 337
W = year * 365 + day
X = Y + W + V - 719162
再來看式Z,這個式子表面看不出任何名堂,367這個數字顯然很是奇怪。那讓我們窮舉一下mon,看看這個式子算出的都是些什麼值吧:
mon Z
1 30
2 61
3 91
4 122
5 152
6 183
7 214
8 244
9 275
10 305
11 336
12 367
似乎看出了什麼?再讓我們把相鄰的兩個mon的Z做一下減法看看:
mon dZ
1 30
2 31
3 30
4 31
5 30
6 31
7 31
8 30
9 31
10 30
11 31
12 31
聞出點味道了吧,很象大小月的規則。讓我們回想起那個if語句作了什麼,它把1月2月變成了11月和12月,3月變成了1月!還原一下看看:
mon org-mon dZ
1 3 30
2 4 31
3 5 30
4 6 31
5 7 30
6 8 31
7 9 31
8 10 30
9 11 31
10 12 30
11 1 31
12 2 31
怎麼本來應該是大月的3月成了30天?
那好我們想想這個原理,假設今天是1月1日,那你能說你今年已經過了31天了麼?顯然不是,1月還沒過,我們不能把它算進去。
這裡同然,我們從4月看起,如果今天是愚人節,那麼距離3月1日我們經過了31天。
就像前面說的,我們假設一年是從3月開始,到次年的2月結束。按照這個規則,整個式子裡有問題的只有3月,理論上這裡應該是0!
但是這沒關係,我們把它減去就行了,於是變成:
Z = 367 * mon / 12 - 30
V = Z - 307
回頭看看W式,year * 365,但是按照上面的理論,沒過完的這一年不應該加進去,所以這裡把它減去,再和V式合併:
V = Z + 58
W = (year - 1) * 365 + day
我們記得這個演算法的一年是從3月開始的,因此少算了公元元年的1月和2月的天數:31 + 28 = 59天:(公元元年是正常年)
V = Z + 59 - 1
那麼最後的這個減1是什麼?還是上面那個原理,今天還沒過,就不應該把它算進去!
綜上,整個演算法就明朗了,主要難於理解的是那個3月開始的假設以及367 * mon / 12會產生類似大小月的序列。
最後把這些式子整理並羅列一下,做為本文的結束:
Y = (year - 1) * 365 + year / 4 - year / 100 + year / 400M = 367 * mon / 12 - 30 + 59D = day - 1X = Y + M + D - 719162T = ((X * 24 + hour) * 60 + min) * 60 + sec