在PHP中,flock似乎工作的不是那麼好!在多並發情況下,似乎是經常獨佔資源,不即時釋放,或者是根本不釋放,造成死鎖,從而使伺服器的cpu佔用很高,甚至有時會讓伺服器徹底死掉。好像在很多linux/unix系統中,都會有這樣的情況發生。所以使用flock之前,一定要慎重考慮。
如果flock()我們使用得當,完全可能解決死鎖的問題。當然如果不考慮使用flock()函數,也同樣會有很好的解法來解決我們的問題。大致歸納了解決方案有以下幾種。
方案一:對檔案進行加鎖時,設定一個逾時時間。大致實現如下:
if($fp=fopen($fileName,'a')){ $startTime=microtime(); do{ $canWrite=flock($fp,LOCK_EX); if(!$canWrite){ usleep(round(rand(0,100)*1000)); } }while((!$canWrite)&&((microtime()-$startTime)<1000)); if($canWrite){ fwrite($fp,$dataToSave); } fclose($fp); }
超時設定為1ms,如果這裡時間內沒有獲得鎖,就反覆獲得,直接獲得到對檔案操作權為止,當然。如果超時限制已到,就必需馬上退出,讓出鎖讓它進程來進行操作。
方案二:不使用flock函數,借用暫存檔案來解決讀寫衝突的問題。大致原理如下:
(1)將需要更新的文件考慮一份到我們的臨時文件目錄,將文件最後修改時間保存到一個變量,並為這個臨時文件取一個隨機的,不容易重複的檔名。
(2)當這個暫存檔案更新後,再偵測原始檔案的最後更新時間和先前所儲存的時間是否一致。
(3)如果最後一次修改時間一致,就將所修改的臨時文件重新命名到原始文件,為了確保文件狀態同步更新,所以需要清除一下文件狀態。
(4)但是,如果最後一次修改時間和先前所保存的一致,這說明在這期間,原文件已經被修改過,這時,需要把臨時文件刪除,然後返回false,說明文件這時有其它進程在進行操作。
實作程式碼如下:
$dir_fileopen='tmp'; function randomid(){ return time().substr(md5(microtime()),0,rand(5,12)); } function cfopen($filename,$mode){ global $dir_fileopen; clearstatcache (); do{ $id=md5(randomid(rand(),TRUE)); $tempfilename=$dir_fileopen.'/'.$id.md5($filename); } while( file_exists ($tempfilename)); if(file_exists($filename)){ $newfile=false; copy($filename,$tempfilename); }else{ $newfile=true; } $fp=fopen($tempfilename,$mode); return $fp?array($fp,$filename,$id,@ filemtime ($filename)):false; } function cfwrite($fp,$string){ return fwrite($fp[0],$string); } function cfclose($fp,$debug='off'){ global $dir_fileopen; $success=fclose($fp[0]); clearstatcache(); $tempfilename=$dir_fileopen.'/'.$fp[2].md5($fp[1]); if((@filemtime($fp[1])==$fp[3])||($fp[4]==true&&!file_exists($fp[1]))||$fp[5]==true){ rename($tempfilename,$fp[1]); }else{ unlink($tempfilename); //说明有其它进程 在操作目标文件,当前进程被拒绝 $success=false; } return $success; } $fp=cfopen('lock.txt','a+'); cfwrite($fp,"welcome to beijing.\n"); fclose($fp,'on');
對於上面的程式碼所使用的函數,需要說明一下:
(1)rename();重新命名一個檔案或一個目錄,該函數其實更像linux裡的mv。更新檔案或目錄的路徑或名字很方便。但當我在window測試上面程式碼時,如果新檔案名稱已經存在,會給出一個notice,說當前檔案已經存在。但在linux下工作的很好。
(2)clearstatcache();清除檔案的狀態.php將快取所有檔案屬性訊息,以提供更高的效能,但有時,多進程在對檔案進行刪除或更新操作時,php來不及更新快取裡的檔案屬性,容易導致存取到最後更新時間不是真實的資料。所以這裡需要使用該函數對已儲存的快取進行清除。
方案三:對操作的檔案進行隨機讀寫,以降低並發的可能性。
在對使用者存取日誌進行記錄時,這種方案似乎被採用的比較多。先前需要定義一個隨機空間,空間越大,並發的可能性就越小,這裡假設隨機讀寫空間為[1-500],那麼我們的日誌檔案的分佈就為log1~到log500不等。每一次用戶訪問,都將資料隨機寫到log1~log500之間的任一文件。在同一時刻,有2個進程進行記錄日誌,A進程可能是更新的log32文件,而B進程呢?則此時更新的可能就為log399.要知道,如果要讓B進程也操作log32,機率基本上為1/500,差不多約等於零。在需要對訪問日誌進行分析時,這裡我們只需要先將這些日誌合併,然後再進行分析即可。使用這種方案來記錄日誌的一個好處時,進程操作排隊的可能性比較小,可以使進程很迅速的完成每一次操作。
方案四:將所有要操作的程序放入一個佇列中。 然後專門放一個服務完成檔案操作。佇列中的每一個排除的進程相當於第一個具體的操作,所以第一次我們的服務只需要從佇列中取得相當於具體操作事項就可以了,如果這裡還有大量的檔案操作進程,沒關係,排到我們的隊列後面即可,只要願意排,隊列的多長都沒關係。
對於以前幾種方案,各有各的好處!大致可能歸納為兩類:
(1)需要排隊(影響慢)例如方案一、二、四
(2)不需要排隊。 (影響快)方案三
在設計快取系統時,一般我們不會採用方案三。因為方案三的分析程序和寫入程序是不同步的,在寫的時間,完全不考慮到時候分析的難度,只管寫的行了。試想一下,如我們在更新一個快取時,如果也採用隨機檔案讀寫法,那麼在讀取快取時似乎會增加很多流程。但採取方案一、二就完全不一樣,雖然寫的時間需要等待(當獲取鎖不成功時,會反覆取得),但讀文件是很方便的。增加快取的目的就是要減少資料讀取瓶頸,進而提高系統效能。
以上是php讀寫檔案衝突出現高並發解決方案匯總的詳細內容。更多資訊請關注PHP中文網其他相關文章!