1. 程式人生 > >MySQL(二) 資料庫資料型別詳解

MySQL(二) 資料庫資料型別詳解

一、資料型別

        MySQL的資料型別有大概可以分為5種,分別是 整數型別、浮點數型別和定點數型別、日期和時間型別、字串型別、二進位制型別。現在可以來看看你對這5種類型的熟悉程度,哪個看起來懵逼了,那就說明自己哪個不熟悉,不理解。  
 

        注意:整數型別和浮點數型別可以統稱為數值資料型別,這不難理解。

        數值資料型別

          整數型別:TINYINT、SMALLINT、MEDIUMINT、INT、BIGINT

          浮點數型別:FLOAT、DOUBLE

          定點小數:DECIMAL

        日期/時間型別

          YEAR、TIME、DATE、DATETIME、TIMESTAMP

        字串型別

          CHAR、VARCHAR、TEXT、ENUM、SET等   

        二進位制型別

          BIT、BINARY、VARBINARY、BLOB

 

      1、整數型別

                

          不管你學什麼語言,在基礎方面,都應該知道  1個位元組= 8位二進位制數。 每個型別的取值範圍也就能夠知道,比如 TINYINT佔用1個位元組,也就是8位,2的8次方減1等於255,也就是說如果代表沒符號的整數,該取值範圍為0~255,如果是有符號的,最高位為符號號位,也就是2的7次方減1,也就是127,取值範圍為-128~127, 為什麼需要減1,這個問題就需要考慮臨界值的問題了。而考慮臨界值問題又有需要討論原碼補碼反碼的知識,這些度不是我們討論的重點,所以在這就自行百度。給出一張範圍表,給大家做參考。

 

                不同整數型別的取值範圍

          

      根據自己所需去選取不同的型別名稱,

      例如:

         CREATE TABLE aaa(

            id INT(10) PRIMARY KEY,

            age INT(6)

         );

      這個例子中INT(10)、INT(6) 括號中的數字表示的是該資料型別指定的顯示寬度,指定能夠顯示的數值中數字的個數。這裡要注意:顯示寬度和資料型別的取值範圍是無關的,顯示寬度只是指明MySQL最大可能顯示的數字個數,注意是可能。通俗點講就是,比如這個age欄位,顯示寬度為6,但是如果你插入的資料大於6,達到了8,6666 6666,那也沒關係,只要插入的數值的位數不超過該型別整數的取值範圍,就行,如果插入的數值長度是4,或者3,數值的位數小於指定的寬度,後面的位數就會由空格填空,5555插入age欄位,存的就是"5555  "後面用空格補齊。還有一點,這個顯示寬度沒限制,你寫100度沒問題,但是插入資料時,實際起控制作用的還是資料型別的取值範圍。如果不寫顯示寬度,就會用系統預設的,比如,INT的預設顯示寬度是11,看上面表,最高也就能表示10位大小的數值,但是要注意,有符號的,也就是負數時,符號位也佔一位。

 

      2、浮點數型別和定點數型別

            

       2.1解釋M,D的意思:

              M:數值的總位數。 通俗點講,就是看有多少個數字,比如,5.6789,M就是5

              D:小數點後面能保留幾位。 比如上面的5.6789 ,D就是4。 這只是舉一個例子,來說明M,D是什麼,實際是先有M,D的,然後在來控制數值,而不是更具數值來確定M,D。

          不單單就MECIMAL有M,D這兩個引數,FLOAT 和 DOUBLE 度有,看下面例子

         比如:

           CREATE TABLE tmp(

              x FLOAT(3,1),

              y DOUBLE(5,3),

              z DECIMAL(5,4)

           );

           假設x插入的值為:5.69,56.78,5.438,349.2 (注意:實驗給x這個欄位插入的值,可能實驗了三次,不要錯看成x的值為5.69,y為56.78等等了)

           實際上在資料庫中存的值為:5.7,56.9,5.3,349.2這個報錯

           分析:x的M為3,D為1,那麼小數點上必須是佔了一位數字,就算沒有值,也會用0來填充,所以說,整數位上最多就只能是2位,這裡要切記要先根據D的值,來算整數位能最多有多少位。

           通過分析x,y和z也就簡單了,

            y欄位上的值,整數部分最多是2位,小數點後的位數最多是3位,也就是說小數點後超過了3位,就會四捨五入。

            z欄位上的值,整數部分最多隻能是一位,小數點後的位數最多是4位,如果不足4位,也會用0補充。比如插入1.56,在資料庫中存的就是1.5600, 比如插入25.46,這個就會報錯,因為整數部分只能是一位,小數點後的位數已經佔了4位了。這裡要搞清楚。

 

         2.2、FLOAT、DOUBLE、DECIMAL三者的區別。

            都是用來表示我們所說的小數的也就是浮點數,但是三種的精度不一樣,也就是後面顯示的位數不一樣,

              區別一:

                FLOAT顯示後面的小數點位大概在40多位,

                DOUBLE能顯示的就是300多位了,不是一個層次上的,

                DECIMAL這個小數點後面能顯示的位數跟DOUBLE差不多,

              區別二:

                 FLOAT和DOUBLE在不指定精度時,也就是不用(M,D),預設會按照實際的精度,也就是你寫多少就是多少,而DECIMAL如不指定精度預設為(10,0),也就是如果不指定精度,插入數值56.89,在資料庫中儲存的就是57。所以一般使用DECIMAL時就會指定精度,而使用FLOAT和DOUBLE就不用。

              區別三:

                 浮點數相對與定點數(DECIMAL)的優點就是在長度一定的情況下,浮點數能夠表示更大的資料範圍,但是缺點是會引起精度問題。

 

         2.3、什麼時候使用FLOAT、DOUBLE、DECIMAL

            對精度要求比較高的時候,比如貨幣、科學資料等,使用DECIMAL的型別比較好。其他的時候,看你要存放的資料的大小而定了,一般使用DOUBLE。並且在使用浮點數時需要注意,儘量避免做浮點數的比較,比如加、減,誰大誰小,這樣的操作,會引起精度缺失。相信在一些程式語言中,遇到過float精度丟失的問題。

    

 

    3、日期與時間型別

            

         現在有些東西看不懂沒關係,大概有個瞭解先,接下來一一進行講解。

       3.1、YEAR 

           3.1.1、重點看他的儲存範圍,1901~2155. 在插入該數值時,有兩種方式,一種是用字串來代表插入的YEAR值,另一種是用數字代表YEAR值,其中字串插入的可以用單引號和雙引號,沒區別,跟一些程式設計語言不一樣,單個字元就必須用單引號,多字元就要用雙引號,在MySQL中,單雙引號度表示字元。

             例子:

              CREATE TABLE tmp(

                y YEAR

              );     

             向表中插入資料:INSERT INTO tmp VALUES(2010),('2010'),("2010");

             查詢表中資料:SELECT * FROM tmp;

             能檢視三條記錄度插入到資料庫tmp表中了。注意:這裡插入資料和查詢資料操作還沒學過,如果不知道,可以暫時跳過,直接看結論。

                        

 

             如果向表中插入超出範圍的值,2166則會報錯

                       

          3.1.2、在插入完整年份時,用字串和用數字代表YEAR值的效果是一樣的,但是當省略YEAR值時,用這兩種方式就不一樣了。

              例子一:就拿上面那張tmp表來說。向表中插入用字串代表的YEAR值,'’0' 、'00'、 '77'、 '10'

                刪除表中資料:DELETE FROM tmp;

                向表中插入資料:INSERT INTO tmp VALUES('0'),('00'),('77'),('10');

                       

               結果:

                  插入的字元'0'、'00'變成了2000

                  插入的字元'77'變成了1977

                  插入的字元'10'變成了2010

 

             例子二:向tmp表中y欄位插入2位數字表示YEAR值,0,00,78,11

                刪除表中資料:DELETE FROM tmp;

                向表中插入資料:INSERT INTO tmp VALUES(0),(00),(77),(11);

                       

                結果:

                   插入的數字0、00變成了0000

                   插入的數字77變成了1977

                   插入的數字11變成了2011

        

            結論:在省略寫年份時,

               1、用字元表示和用數字表示的區別就在於0。如果是字元0或字元00,則在資料庫中會生成2000,如果是數字0或00,則會生成0000. 

               2、在不超過70,也就是小於70,度會生成2000年以上,也就是如果是69,則生成2069.如果是70以上包含70,就會變成1970以上。比如70,就會變為1970。也就是00-69範圍的年值轉換為2000~2069. 70-99範圍的年值轉換為1970~1999

               3、一般我們如果要使用,也就用全稱,這樣不容易混淆,但是得知道有這些特性

 

 

       3.2、TIME       

          格式:HH:MM:SS   HH表示小時 、MM表示分鐘、SS表示秒

          取值範圍:-838:59:59 ~ 838:59:59

          解釋:這裡的時間不僅僅可以用來表示一天的時間(也就是24小時),還可能是某件事情過去的時間或兩個事件之間的時間間隔,通俗點講,我們平常每天的時間就是從凌晨0點就重新開始計時,計滿24個小時,然後又重新開始,也就相當於當前我們看到的時間是凌晨0點過去的時間,也就是距凌晨0點過去了多少個小時。 早上7點,也就是距離凌晨0點這件事7個小時,以此類推,直到距離了24個小時,然後重新開始計算。 在MySQL中,這個TIME就不侷限於每天距離凌晨0點多長時間了,可以是過去某個時間距離現在多長時間了,比如昨天早上7點,距離現在上午9.00多長時間了,就超過了24小時,所以。這個TIME的取值範圍就比我們所理解的24小時更大。

          3.2.1、表示TIME有很多種格式,上面的HH:MM:SS只是標準的一種,

            1、D HH:MM:SS :D表示日、天數。在資料庫中儲存時,D會被轉換為小時儲存,D*24+HH

            2、HH:MM 、D:HH、 SS  :這些格式度是可以的,注意最後一個,如果是單獨就是2個數字,那麼就代表的是秒,比如"20"那就代表的是00:00:20 

            3、HHMMSS: 這是沒有間隔符的字串或者數值,比如101112會被理解為10:11:12,但是109712就是不合法的,因為分鐘位上超過了59。儲存時會報錯。這個沒有冒號時需要注意一點,數值的最右邊兩位表示秒,以此類推,比如 5523 表示的是00:55:23而不是55:23:00。 所以說上面SS格式時代表的是秒就是這樣來的,從最右邊看起。如果有冒號,則從左邊小時開始看起,比如 55:23 就是代表的55:23:00 

          例如:

            CREATE TABLE tmp(

              t TIME

            );

            插入值"10:05:05"、"23:23"、"2 10:10"、"3 02"、"10"、"101112"、"109712"

            INSERT INTO tmp VALUES("10:05:05"),("23:23"),("2 10:10"),("3 02"),("10"),("101112");

            SELECT * FROM tmp;  

                      

            可以看出:都是如我們預期的那樣顯示資料。  

          3.2.2、使用系統的函式,插入當前的時間。

            DELETE FROM tmp;

            INSERT INTO tmp VALUES(CURRENT_TIME),(NOW());

            SELECT * FROM tmp;

                     

            

        3.3、DATE

            格式:YYYY-MM-DD  YYYY表示年份  MM表示月份  DD表示日

            取值範圍:1000-01-01~9999-12-3

              使用字元或者數值的資料度可以插入

            注意:這個除了標準格式之外,跟TIME一樣YEAR一樣,在年份這裡也有其省略格式,其規則和YEAR中一樣。00-69範圍的年值轉換為2000~2069. 70-99範圍的年值轉換為1970~1999。  例如:12-12-31 表示2012-12-31  981231表示1998-12-31

            也可以使用CURRENT_DATE或者NOW()插入當前的系統日期。

            例子:(注意,每次建立表之前,會把之前的老表給刪除掉,這裡省略掉了,使用DROP TABLE 表名; )

               CREATE TABLE tmp(

                 d DATE

               );

               INSERT INTO tmp VALUES("1998-08-08"),(19980808),(100511),(CURRENT_DATE),(NOW());

               SELECT * FROM tmp;

                      

 

            注意:MySQL允許“不嚴格”語法,也就是任何標點符號度可以當用日期部分之間的間隔符,比如"98.11.23"、"98/11/31"、"[email protected]@31"都可以,自己可以去嘗試嘗試,但是一般使用標準格式比較好,讓人看起來舒服。

 

        3.4、DATETIME  

            格式:YYYY-MM-DD HH:MM:SS 

            取值範圍:1000-01-01 00:00:00~9999-12-3 23:59:59

                  這個不用做多解釋,因為這個就是DATE和TIME的結合體。其各種特點在這裡也能夠適合。但是注意HH:MM:SS 只能表示一天的時間,也就最多到23:59:59.

            例子:

               CREATE TABLE tmp(

                 dt DATETIME

               );        

               INSERT INTO tmp VALUES("1998-08-08 08-08-08"),(980808080808),(CURRENT_DATE()),(NOW());

               SELECT * FROM tmp;

                      

 

             CURRENT_DATE()返回的是當前系統的日期 格式 YYYY-MM-DD 所以在前面列印YEAR和DATE度可以用到該函式,因為包含了其資料型別所要的資訊

             NOE()返回當前系統的日期和時間值,格式為YYYY-MM-DD HH:MM:SS,所以在這裡能夠使用其輸出DATETIME型別的值。

 

        3.5、TIMESTAMP

             格式:YYYY-MM-DD HH:MM:SS

             取值範圍:1970-01-01 00:00:01 UTC ~ 2038-01-19 03:14:17 UTC

             解釋:顯示寬度固定在 19個字元。也就是這個輸出標準格式,UTC表示世界標準時間,這個跟DATETIME基本上一樣,但是有一個最大的區別,我們需要知道。

             區別:儲存位元組和支援的範圍不一樣,最重要的區別在DATETIME在儲存日期資料時,按實際輸入的格式儲存,即輸入什麼就儲存什麼,也就輸出什麼,與時區無關,而TIMESTAMP值的儲存是以UTC格式儲存,儲存時會對當前時區進行轉換,檢索時再轉換回當前時區,也就是查詢時,會根據當前時區的不同,顯示的時間值不同。 時區的意思就是,你在美國和你在中國兩邊的時間顯示不一樣,你在美國有在美國的時間,比中國快多長時間,比如在中國才早上8點,在美國可能就是晚上8.9點了(這個只是打個比方,準備轉換時間我沒去看。)

             例如:

              CREATE TABLE tmp(

                ts TIMESTAMP

              );

              INSERT INTO tmp VALUES(NOW());

              SELECT * FROM tmp;

                      

              轉換時區

                      

              可以看到,如我們所想,輸出時間變了,增加了兩個小時,這個是關於什麼東10區,東8區等,我也不懂這些時差,總之能夠得出結論就行了。

              也就是說,TIMESTAMP和DATETIME其實差不多,就是一個時區的差別。TIMESTAMP也叫時間戳。以後遇到它我們就應該知道是什麼東西了

 

    4、字串型別

         有CHAR、CARCHAR、TINYTEXT、TEXT、MEDIUMTEXT、LONGTEXT、ENUM、SET

                    

         4.1、CHAR和VARCHAR

            CHAR(M):為固定長度字串,固定長度的意思就是M的值為多少,那麼該M的值就是其實際儲存空間的值,就算插入的資料少於M位,其儲存空間還是那麼大,多餘的用空格補齊。在輸出時,空格將被刪除不輸出。M最大為255,比如char(4),如果插入abc,則儲存的值為'abc '後面多了一個空格,輸出還是‘abc’, 儲存空間還是佔4個位元組。M最大為255

            VARCHAR(M):長度可變的字串,跟CHAR相反,會根據實際的大小值來確定儲存空間的大小,比如 VARCHAR(4),插入'ab',則儲存空間為3位元組,看上面圖就知道VARCHAR會多一個位元組用來儲存長度,M最大為65535.

            注意:字串跟數值型別不一樣,M為多大,就最多能插入多少字元,超過了M,就會報錯

            例子:

              CREATE TABLE tmp(

                ch CHAR(4),

                vch VARCHAR(4);

              );          

              INSERT INTO tmp VALUES('asdf','asdfg');

              結果報錯:

                      

              INSERT INTO tmp VALUES('ab  ','ab  ');

              SELECT concat( '(', ch ,')' ),concat( '(',vch,')' ) FROM tmp;//這句話的意思就用(將結果包起來,用來觀察輸出的字元長度)

                        

              說明,CHAR不能夠儲存空格字元,而VARCHAR可以。        

      

          4.2、TEXT

              text分四種:TINYTEXT、TEXT、MEDIUMTEXT和LONGTEXT

                TINYTEXT:255字元

                TEXT:65535字元

                MEDIUNTEXT:16777215字元

                LONGTEXT:4294967295,大概4GB的字元

              也就是說,比如我們要存一本小說,那麼就需要使用上面四種中的一種來儲存,選取MEDIUNTEXT或者LONGTEXT差不多。

 

          4.3、ENUM

              列舉,格式:欄位名 ENUM('值1','值2','值3'...,'值n');  n最多為65535

              例如:

                CREATE TABLE tmp(

                  enm ENUM('first','second','third');

                );      

                解釋:enm欄位的資料型別為ENUM,列舉型別,那麼在插入該欄位中的值只能為列舉中的這幾個值,不能插入別得值,否則報錯

                INSERT INTO tmp VALUES('first'),('FIRST');

                SELECT * FROM tmp;

                        

                  MySQL不區分大小寫。

                  INSERT INTO tmp VALUES('four');

                  報錯:

                        

                例子二:

                  CREATE TABLE tmp(

                    soc INT,

                    level ENUM('excellent','good','bad')

                  );

                  INSERT INTO tmp VALUES(70,2),(90,1),(55,3);

                  SELECT * FROM tmp;

                        

                  使用索引值,也可以選擇列舉中得值,從1開始,不是0,注意這點

 

                總結:使用ENUM型別就是為了限制欄位上的值的取值範圍,只能取我們所規定的值。

 

            4.4、SET

                格式:欄位名 SET('值1','值2','值3','值4'...,'值n')  n最大為64

                通過例子來講解這個SET的特點

                  CREATE TABLE tmp(

                    s SET('a','b','c','d');

                  );

                  INSERT INTO tmp VALUES('a'),('a,b,a'),('c,a,d');

                  SELECT * FROM tmp;

                        

                   a 變成 a

                   a,b,a 變成 a,b

                   c,a,d 變成 a,c,d

                   結論:

                      1、插入SET欄位中的值如果有重複,則會自動刪除重複的值

                      2、插入SET欄位中的值會按順序排列,排列規則就是按照SET中的值的排列優先順序

                   INSERT INTO tmp VALUES('a,x,b');

                   報錯:

                        

                   結論:

                      3、如果插入了不屬於SET中的值,就會報錯

                   SET的特性就上面所說的三點   

 

      5、二進位制型別  

           用來存放二進位制數,也就是01010這種。有BIT、BINARY、VARBINARY、TINYBLOB、BLOB、MEDIUNBLOB和LONGBLOB

                       

           5.1、BIT型別 

                位欄位型別,M表示插入值的位數,最大為64位,預設值為1,如果插入值小於M位,值的左邊用0填充,

                例子:

                   CREATE TABLE tmp(

                      b BIT(4)

                   );   

                   解釋:4位的二進位制,也就是能夠儲存0到15之間的值。

                   INSERT INTO tmp VALUES(2),(10),(15);       

                   SELECT BIN(b+0) FROM tmp;

                         

                   解釋:我們將2,10,15這三個10進位制存入資料表中,其欄位為BIT型別,所以在表中存放的是二進位制數,但是將其顯示出來,要先將二進位制數轉換為對應的數字的值,也就是通過b+0, 然後在通過BIN()函式將數字轉換為二進位制。我們可以嘗試不用BIN()函式,只用b+0,看輸出什麼

                   SELECT b+0 FROM tmp;

                          

 

            5.2、BINARY和VARBINARY型別

                  格式:欄位 BINARY(M)或者VARBINARY(M)

                  這兩個跟CHAR和VARCHAR類似,

                    BINARY:長度是固定的,指定長度後,不足最大程度的,將在它們右邊填充"\0"來達到指定長度,

                    VARBINARY:長度是可變的,制定好長度後,其長度可以在0到最大值之間,例如,指定欄位資料型別為VARBINARY(20),如果插入的值的長度只有10,則實際儲存空間為10加1,即實際佔用的空間為字串的實際長度加1.

                  說了這麼多,但是還是不明白這兩個有什麼用處,現在來告訴你,我們說MySQL中對大小寫不敏感,但是這兩個資料型別卻對大小寫敏感,原因是他們是用二進位制來儲存資料的,比如A和a,兩個的二進位制就不一樣。所以在很多時候我們需要區分大小寫的時候,就會用到該型別。

                  注意:這兩個型別的長度計算的是位元組長度,一個字元等於2個位元組,比如BINARY(4)這個表示能夠存放4個位元組的長度,也就是隻能存放2個漢字。可以存4個字母。不要把這個長度當成二進位制位的長度了,說是二進位制字串的意思是,用二進位制來進行儲存,但是其長度約束是位元組長度。

                  例子:

                    CREATE TABLE tmp(

                      b BINARY(10)

                    );

                    INSERT INTO tmp VALUES('a');

                    select * from tmp WHERE b='A';

                          

                    解釋:在tmp表中存放了一個小寫a,然後通過大寫A查詢表中,看是否能找到a,結果找不到,就驗證了我們上面的說法,具有區分大小寫的功能。

 

                總結:BINARY和VARBINARY的主要作用就是用來區分大小寫的,其他沒什麼作用,但是使用時要注意限制其大小的是位元組數,而不是二進位制位,它儲存的格式是用二進位制來儲存的。這兩個不要搞混淆了。

 

 

          5.3、BLOB型別

                是一個二進位制大物件,TINYBLOB(32kb)、BLOB(64kb)、MEDIUMBLOB(16M)和LONGBLOB(4GB)。一般儲存的是一些影象,音訊檔案。

 

 

 

二、如何選擇資料型別             

        1、整數和浮點數

          如果不需要小數部分,則使用整數來儲存資料,並且根據整數的大小,來選擇合適的整數型別,如果需要小數部分,則使用浮點數型別,浮點數型別中,有float和double,如果需要精度高一點,則選擇double。根據自己的需求來決定選什麼。

        2、浮點數和定點數

          浮點數FLOAT、DOUBLE相對應定點數DECIMAL的優勢在於:在長度一定的情況下,浮點數能表示更大的資料範圍,但是浮點數容易產生誤差,因此在精度比較高時,建議使用DECIMAL,比如貨幣這一類東西,就用DECIMAL比較合理,注意浮點數在進行加減運算時也容易出現問題。如果進行數值比較,也建議用DECIMAL

        3、日期與時間型別

          可以看上面詳解時的圖,根據各種格式,選擇自己所需要的資料型別,注意TIMESTAMP和DATETIME的區別,一個是跟時區有關,一個無關,其他沒什麼大的區別。

        4、CHAR與VARCHAR之間的特點與選擇

          區別:

            CHAR是固定長度字元、VARCHAR是可變長度字元。CHAR會自動刪除插入資料的尾部空格,VARCHAR不會。 

            CHAR是固定長度,處理速度比VARCHAR更快,缺點很明顯,浪費儲存空間,所以對儲存不大,但在速度上有要求的可以使用CHAR型別,反之用VARCHAR。

        5、ENUM和SET

           ENUM只能取單值,也就是從列舉型別中選取其中一個值,但是SET可以取多值,

           ENUM最多能存放65535個成員,SET只能65個

           空字串也能在SET中儲存,

           要儲存一個人的喜愛時,最好使用SET型別,其實最重要的是看具體的情況在選取最為合適的把

        6、BLOB和TEXT

           BLOB是二進位制字串,TEXT是非二進位制字串,兩者均可存放大容量的資訊,BLOB主要儲存圖片、音訊資訊,而TEXT只能儲存純文字檔案。分清楚兩者的用途

 

        7、BINARY和VARBINARY

           這兩個的區別和CHAR與VARCHAR的區別差不多,BINARY是固定長度、VARBINARY是可變程度,這兩個的作用就是為了區分大小寫的,注意這兩個是位元組字串。