串行化大概就是把一些变量转化成为字符串的字节流的形式,这样比较容易传输、存储。当然,关是传输存储没有什么,关键是变成串的形式以后还能够转化回来,而且能够保持原来数据的结构。
在PHP中有多串行化处理的函数:serialize(),该函数把任何变量值(除了资源变量)转化为字符串的形式,可以把字符串保存到文件里,或者注册为Session,乃至于使用curl来模拟GET/POST来传输变量,达到RPC的效果。
如果要将串行化的变量转化成PHP原始的变量值,那么可以使用unserialize()函数。
一、变量串行化
我们举简单的例子来说明串行化,以及它的存储格式。
整型:
$var = 23;
echo serialize($var);
输出:
i:23;
浮点型:
$var = 1.23;
echo serialize($var);
输出:
d:1.229999999999999982236431605997495353221893310546875;
字符串:
$var = "This is a string";
echo serialize($var);
$var = "我是变量";
echo serialize($var);
输出:
s:16:"This is a string";
s:8:"我是变量";
布尔型:
$var = true;
echo serialize($var);
$var = false;
echo serialize($var);
输出:
b:1;
b:0;
上面这些基本类型串行化之后的情况很清楚,串行化之后的存储格式是:
变量类型:[变量长度:]变量值;
就是第一位字符代表变量类型,第二个:代表分割,变量长度是可选的,就是在字符串类型里有,其他类型没有,最后一个就是变量值,每个串行化的值以";"作为结束。
比如我们整型数字23串行化之后就是:i:23,那么它没有长度,只有类型和变量值,i代表integer,通过冒号分割,后面保存的是整型值23,包括浮点型(双字节型)也是一样。布尔型的话,类型是b(boolean),如果是true的话,那么串行化的值是1,如果是false那么值就是0。字
符串值话中间会多一个保存的值得,保存字符串的长度值,比如字符串"This is a string",那么生成的串行化的值是 s:16:"This is a string"; s是string,代表类型,中间的16就是该字符串的长度,如果是中文的话,那么每个中文是两个字符来保存的,比如字符串 "我是变量",生成的串行化值是:s:8:"我是变量"; 就是8个字符的长度。
下面我们重点来讲一下数组变量串行化。
数组变量:
$var = array("abc", "def", "xyz", "123");
echo serialize($var);
输出:
a:4:{i:0;s:3:"abc";i:1;s:3:"def";i:2;s:3:"xyz";i:3;s:3:"123";}
就是把我的数组 $var 串行化得到的字符串值,我们的$var数组包括4个字符串元素,分别是"abc", "def", "xyz", "123",我们来分析一下串行化后的数据,为了简便起见,我们把串行化的数据列成数组的样式:
a:4:
{
i:0;s:3:"abc";
i:1;s:3:"def";
i:2;s:3:"xyz";
i:3;s:3:"123";
}
这样排列就比较清晰了,看开始的字符串:a:4:{...} 首先第一个字符a保存的是变量类型是array(数组)类型,第二个 4 保存的是数组元素的个数,一共有4个,然后在{}之间数组元素的内容。比如第一个数组元素:i:0;s:3:"abc"; i代表是当前数组元素的索引值类型是整型,并且值是 0,元素值的类型是s(字符串的),个数是 3 个,具体值是"abc",分号结束,下面的数组元素依次类推。
我们再看看使用字符串做为元素索引会如何:
$var = array("index1"=>"abc", "index2"=>"def", "index3"=>"xyz", "index4"=>"123");
echo serialize($var);
输出:
a:4:{s:6:"index1";s:3:"abc";s:6:"index2";s:3:"def";s:6:"index3";s:3:"xyz";s:6:"index4";s:3:"123";}
变成数组样式后:
a:4:
{
s:6:"index1";s:3:"abc";
s:6:"index2";s:3:"def";
s:6:"index3";s:3:"xyz";
s:6:"index4";s:3:"123";
}
其实跟上面没有太大区别,不过是开始的索引变成了保存字符串的形式,比如第一个元素:s:6:"index1";s:3:"abc";第一项就是索引值:s:6:"index1"; s是类型,6是索引字符串的长度,"index1"就是索引的值。后面的s:3:"abc"; 就是元素值,这个好理解,就不讲了。
从上面来看,我们大致了解了基本数据类型的串行化,其实我们完全可以构造自己的串行化功能,或者从这个角度去扩展,开发自己的串行化程序,便于我们的变量交换。
當然,其實我們也可以利用這個功能,把數組或任意其他變數串列化成字串,然後透過curl功能來模擬GET/POST功能,達到能夠無用使用者執行動作就從遠端伺服器取得資料的功能。
二、物件序列化
物件的序列化也是一個比較普遍的功能,能夠把一個物件進行串列化以後變成一個字串,能夠保存或傳輸。
我們先來看一個例子:
class TestClass
{
var $a;
var $b;
$this->a = "This is a";
$this->b = "This is b";
$this->b = "This is b";
function getA()
{
}
function getB()
{
}
}
$obj = new TestClass;
$str = serialize($obj);
輸出結果:
我們來分析一個物件串列化之後的字串。
O:9:"TestClass":2:
{
s:1:"a";s:9:"This is a"; s:1:"b";s :9:"This is b";
}
先看對於物件本身的內容:O:9:"TestClass":2:O是說明這是一個物件類型(object),然後9是代表物件的名字查過濃度,2是代表該物件有幾個屬性。在看兩個屬性的內容:
先說一種物件序列化的應用,下面的內容是PHP手冊上,沒有更改原文。
serialize() 傳回一個字串,包含著可以儲存於 PHP 的任何值的位元組流表示。 unserialize() 可以用此字串來重建原始的變數值。用序列化來保存物件可以保存物件中的所有變數。物件中的函數不會被保存,只有類別的名稱。
要能夠 unserialize() 一個對象,需要定義該對象的類別。也就是,如果序列化了 page1.php 中類別 A 的物件 $a,將會得到一個指向類別 A 的字串並包含有所有 $a 中變數的值。如果要在 page2.php 中將其解序列化,重建類別 A 的物件 $a,則 page2.php 中必須出現類別 A 的定義。這可以例如這樣實現,將類別 A 的定義放在包含檔案中,並在 page1.php 和 page2.php 都包含此檔案。
<?php
// classa.inc:
class A{
var $one = 1;
function show_one()
{
}
}
// page1.php:
include("classa.inc");
$a = new A;
$s = serialize($a);
$fp = fopen("store" , "w");
fputs($fp, $s);
fclose($fp);
// page2.php:
// 為了正常解序列化需要這一行
$s = implode("", @file("store"));
$a = unserialize($s);
// 現在可以用 $a 物件的 show_one() 函數了
$a->show_one();
如果在用會話並使用了 session_register() 來註冊對象,這些對象會在每個 PHP 頁面結束時被自動序列化,並在接下來的每個頁面中自動解序列化。基本上是說這些物件一旦成為會話的一部分,就能在任何頁面中出現。
因此如果在以上的例子中 $a 透過運行 session_register("a") 成為了會話的一部分,應該在所有的頁面中包含 classa.inc 文件,而不只是page1.php 和 page2.php。
當然,其實序列化物件其實完全可以應用在很多地方。當然,在PHP 5中對序列化的處理不一樣了,我們看一下手冊中的說法:
serialize() 檢查類別中是否有魔術名稱 __sleep 的函數。如果這樣,函數將在任何序列化之前運行。它可以清除物件並應該傳回一個包含有該物件中應被序列化的所有變數名的陣列。
使用 __sleep 的目的是關閉物件可能具有的任何資料庫連接,提交等待中的資料或進行類似的清除任務。此外,如果有非常大的物件而並不需要完全儲存下來時此函數也很有用。
相反地,unserialize() 檢查具有魔術名稱 __wakeup 的函數的存在。如果存在,此函數可以重建物件可能具有的任何資源。
使用 __wakeup 的目的是重建在序列化中可能丟失的任何資料庫連接以及處理其它重新初始化的任務。