PHP開發基礎教程之類型、字元...LOGIN

PHP開發基礎教程之類型、字元集、引擎和索引

資料型別

#MySQL中存的是資料。只要是數據,我們就會規定數據的類型。在表格的欄位中規定了使用的是某個資料類型。那麼,在插入的資料中就要使用對應的資料類型。並且,遵守資料類型的長度要求。

在MySQL裡面我們將資料型別分成了以下一些類型:

  • #數值型別(整數、浮點)

  • 字串型別

  • 日期時間型別

  • #複合型別

##整數

88.png


整數的長度不同,在實際使用過程也就PHP學院。

MySQL 以一個可選的顯示寬度指示器的形式對 SQL 標準進行擴展,這樣當從資料庫檢索一個值時,可以把這個值加長到指定的長度。例如,指定一個欄位的類型為 INT(6),

就可以保證所包含數字少於 6 個的值從資料庫中檢索出來時能夠自動地用空格填充。需要注意的是,使用一個寬度指示器不會影響欄位的大小和它可以儲存的值的範圍。

    注意:
  • 在建立表格欄位時,性別我們可以使用無符號的微小整數(tinyint)來表示。用0表示女、用1表示男。用2表示未知。
  • 同樣人類年齡也是,在建立表格欄位時可用無符號的整數。因為人類的年齡還沒有負數
  • 在實際使用過程中。我們業務中最大需要儲存多大的數值。我們建立表格時,就選擇什麼樣的類型來儲存這樣的值。

浮點型別

89.png


90.png
##注意:


浮點是非精確值,會存在不太準確的情況

###而decimal叫做定點數。在MySQL內部,本質上是用字串儲存的。實際使用過程中如果存在金額、錢精度要求比較高的浮點數存儲,建議使用decimal(定點數)這個類型。 #########字元類型#################################

*CHAR * 類型用於設定長字串,並且必須在圓括號內用一個大小修飾符來定義。這個大小修飾符的範圍從 0-255。比指定長度大的值將被截短,而比指定長度小的值將會用空格作填補。
*VARCHAR * 把這個大小當成數值的大小,不長度不足的情況下就用空格補足。而 VARCHAR 類型把它視為最大值並且只使用儲存字串實際需要的長度
類型不會被空格填補,但長於指示器的值仍然會被截斷。
因為 VARCHAR 類型可以根據實際內容動態改變儲存值的長度,所以在無法確定欄位需要多少字元時使用 VARCHAR 類型可以大幅節省磁碟空間、提高儲存效率。

text類型與blob類型 對於欄位長度要求超過 255 個的情況下,MySQL 提供了 TEXT 和 BLOB 兩種類型。根據儲存資料的大小,它們都有不同的子類型。這些大型的資料用於儲存文字區塊或圖像、
聲音檔案等二進位資料類型。
TEXT 和 BLOB 類型在分類和比較上有差異。 BLOB 類型區分大小寫,而 TEXT 不區分大小寫。大小修飾符不用於各種 BLOB 和 TEXT 子類型。

時間類型

91.png


#注意:

時間類型在web系統中用的比較少,很多時候很多人喜歡使用int來儲存時間。插入時插入的是unix時間戳,因為這種方式比較方便計算。在前端業務中用date類型的函數,再將unix時間戳轉成人們可辨識的時間。

上面的類型你可以根據實際情況實際進行選擇

有些人為了在資料庫管理中方便查看,也有人使用datetime類型來儲存時間。

複合型別

92.png


#一個ENUM 類型只允許從一個集合中取得一個值;而SET 類型允許從一個集合中取得任意多個值。

1.ENUM 類型

ENUM 類型因為只允許在集合中取得一個值,有點類似單一選項。在處理相互排拆的資料時容易讓人理解,例如人類的性別。 ENUM 類型欄位可以從集合中取得一個值或使用null值,除此之外的輸入將會使 MySQL 在這個欄位中插入一個空字串。另外如果插入值的大小寫與集合中值的大小寫不匹配,MySQL會自動使用插入值的大小寫轉換成與集合中大小寫一致的值。

ENUM 型別在系統內部可以儲存為數字,並且從1開始用數字做索引。一個 ENUM 類型最多可以包含 65536 個元素,其中一個元素被 MySQL 保留,用來儲存錯誤訊息,這個錯誤值用索引 0 或一個空字串表示。

MySQL 認為 ENUM 類型集合中出現的值是合法輸入,除此之外其它任何輸入都會失敗。這說明透過搜尋包含空字串或對應數字索引為 0 的行就可以輕鬆找到錯誤記錄的位置。

2.SET 類型 SET 類型與 ENUM 類型相似但不同。 SET類型可以從預先定義的集合中取得任意數量的值。並且與 ENUM 類型相同的是任何試圖在 SET 類型欄位中插入非預先定義的值都會使MySQL插入一個空字串。如果插入一個即有合法的元素又有非法的元素的記錄,MySQL 將會保留合法的元素,除去非法的元素。

一個 SET 類型最多可以包含 64 項元素。在 SET 元素中值被儲存為一個分離的「位元」序列,這些「位元」表示與它相對應的元素。 「位」是創建有序元素集合的一種簡單而有效的方式。
而且它也去掉了重複的元素,所以SET類型中不可能包含兩個相同的元素。
希望從 SET 類型欄位中找出非法的記錄只需尋找包含空字串或二進位值為 0 的行。

類型使用


我們學習了這麼多類型,在建立表格的語句的時候使用對應的類型即可。

舉例如下:

CREATE TABLE IF NOT EXISTS demo (
id int(11) NOT NULL,
username varchar(50) NOT NULL,
password char(#password char(50) NOT NULL,
password char( 32) NOT NULL,
content longtext NOT NULL,
createtime datetime NOT ##字段其他屬性設定


UNSIGNED(無符號) 主要用於整數和浮點類型,使用無符號。即,沒有前面面的-(負號)。

儲存位數更長。 tinyint整數型的取值區間為,-128~127。而使用無符號後可儲存0-255個長度。

  • 建立時在整數或浮點欄位語句後面接著上:

  • unsigned

ZEROFILL(0填) 0(不是空格)可以用來真補輸出的值。使用這個修飾符可以阻止 MySQL 資料庫儲存負值。

  • 建立時在整數或浮點欄位語句後面接著:

  • zerofill

default default屬性確保在沒有任何值可用的情況下,賦予某個常數值,這個值必須是常數,因為MySQL不允許插入函數或表達式值。此外,此屬性無法用於BLOB或TEXT列。如果已經為此列指定了NULL屬性,沒有指定預設值時預設值將為NULL,否則預設值將依賴於欄位的資料類型。

  • 建立時在整數或浮點欄位語句後接上:

  • #default '值'
  • not null 如果將一個欄位定義為not null,將不允許向該欄位插入null值。建議在重要情況下始終使用not null屬性,因為它提供了一個基本驗證,確保已經向查詢傳遞了所有必要的值。

建立時在整數或浮點欄位語句後面接著上:

  • not null

null 為列指定null屬性時,該列可以保持為空,而不論行中其它列是否已經被填入。記住,null精確的說法是“無”,而不是空字串或0。

建立時在整數或浮點欄位語句後不要宣告not null即可。


字元集

#字元集是什麼


為了更好的辨識中文、日文、英文、希臘文。對於常用的符號進行了編碼,這個編碼就是一個字元集。

字元集確定了文字的儲存方式。

字元集相當於電腦中人類的語言。

舉例:

我說的是英文,所以我儲存的時候要用英文文字來儲存。
如果我說的是中文,用英文字元來儲存的話。那麼人們就看不懂也看不明白,就是我們所說的亂碼。

因為字元集太多了,足夠有幾十種上百種之多。所以我們不需要了解太多的字符集的知識,甚至不需要了解字符集到底是如何編成人類可見字符的。

字元集的重點知識


#我們只需要了解:

  • 常用字元集

  • 資料庫中我們用什麼字元集

#英文字元集:

93.png


ASCII

ASCII 碼使用指定的7 位元或8 位元二進位數組合來表示128 或256 種可能的字元。標準ASCII 碼也叫基礎ASCII碼,使用7 位元二進位數來表示所有的大寫和小寫字母,數字0 到9、標點符號, 以及在美式英語中使用的特殊控製字元。
其中:
0~31及127(共33個)是控製字元或通訊專用字元(其餘為可顯示字元),如控制符:LF(換行)、CR(Enter)、FF(換頁)、DEL(刪除)、BS( 、10 和13 分別轉換為退格、製表、換行和回車字元。它們並沒有特定的圖形顯示,但會依不同的應用程序,而對文字顯示有不同的影響。
32~126(共95個)是字元(32是空格),其中48~57為0到9十個阿拉伯數字。
65~90為26個大寫英文字母,97~122號為26個小寫英文字母,其餘為一些標點符號、運算符號等。

GBK

GBK 向下與 GB 2312 編碼相容。是中華人民共和國定義的漢字計算機編碼規範。早期版本為GB2312。

Unicode

Unicode(統一碼、萬國碼、單碼)Unicode是國際組織制定的可以容納世界上所有文字和符號的字元編碼方案。以滿足跨語言、跨平台進行文字轉換、處理的要求。

UTF-8

是針對Unicode的可變長度字元編碼,也是萬國碼。因為UNICODE比ASCII佔用大一倍的空間,而對ASCII來說高位元組的0對他毫無用處。為了解決這個問題,就出現了一些中間格式的字元集,他們被稱為通用轉換格式,即UTF(Universal Transformation Format)

實際工作中要使用的編碼

在中文常用的字元集分為utf-8和GBK。

實際使用的如下:

94.png

#

觀察(圖一)的特性你會發現,MySQL字元集由三個部份組成:
1.字元集 
2.語言
3.型別

最後的bin是指二進位字元集,後面的ci是指儲存排序時不區分字元的大小寫。

注意:
mysql在寫utf-8的時候寫的是utf8。不加中間的中橫線。

95.png


引擎

MySQL的強大之處在於它的插件式儲存引擎,我們可以基於表的特點使用不同的儲存引擎,從而達到最好的效能。

如果你夠熟悉,並且有一定工作經驗後。你也可以使用阿里巴巴和網易開源出來的MySQL引擎在自己的伺服器中使用。

大家在後面的一節《資料庫結構定義語句》中可以學到建立表格的語句。 mysql在建立表格的時候,可以指定對應的引擎。

在mysql指令中使用:

show engines;

可以檢視到目前伺服器支援的所有引擎。

我們介紹幾種常用的引擎和了解幾個不常用的引擎。避免未來在實際工作中看到一些引擎不知道概念。

96.png

MyISAM

不支援事務,表鎖(表級鎖,加鎖會鎖住整個表),支援全文索引,操作速度快。常用於讀取多的業務。

  • myisam儲存引擎表由myd和myi組成。 .myd用來存放資料文件,.myi用來存放索引文件。

  • 對於myisam儲存引擎表,mysql資料庫只快取其索引文件,資料文件的快取由作業系統本身來完成。

InnoDB

  • 支援事務,主要針對線上事務處理(OLTP)的應用。

  • 行鎖定設計,支援外鍵,即預設讀取操作不加鎖。

InnoDB是為處理巨大資料量時的最大效能設計。

註:
行鎖:寫入、更新操作的時候將這一行鎖起來,不讓其他人再操作了。
表鎖:寫入、更新操作時,將表格給鎖起來不讓其他人再操作了。
事務:同時操作多個數據,若其中的一個數據操作失敗。可回滾到操作之前。常用於銀行、電商、金融等系統。



索引

#索引看著挺高大上的名字,說穿了就是我們書最新面的目錄。

假如你用新華字典來查找「張」這個漢字,不使用目錄的話,你可能要從新華字典的第一頁找到最後一頁,可能要花二個小時。字典越厚呢,你花的時間就越多。現在你使用目錄來找出「張」這個漢字,張的首字母是z,z開頭的漢字從900多頁開始,有了這條線索,你查找一個漢字可能只要一分鐘,由此可見索引的重要性。

索引用於快速找出在某個欄位中有一特定值的行。

不使用索引,MySQL必須從第1筆記錄開始然後讀取完整表直到找出相關的行。表越大,花費的時間越多。如果表中查詢的欄位有索引,MySQL能快速到達一個位置去搜尋到資料檔案的中間,沒有必要看所有資料。

當然索引也不易過多,索引越多寫入,修改的速度越慢。因為,寫入修改資料時,也要修改索引。

MySQL的索引類型

97.png

#下一節
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>php.cn</title> </head> <body> <?php echo "Hello World!!!"; ?> </body> </html>
章節課件