前言:
不要試圖用強制方法殺死一個python線程,這從服務設計就存在不合理性。 多線程本用來任務的協作並發,如果你使用強製手段幹掉線程,那麼很大幾率出現意想不到的bug。 請記住一點,鎖定資源不會因為執行緒退出而釋放鎖定資源 !
我們可以舉出兩個常見的例子:
1. 有個A線程拿到了鎖,因為他是被強制幹掉的,沒能及時的release()釋放鎖資源,那麼導致所有的執行緒獲取資源是都被阻塞下去,這就是典型的死鎖場景。
2.在常見的生產消費者的場景下,消費者從任務隊列獲取任務,但是被幹掉後沒有把正在做的任務丟回隊列中,那麼這就造成了數據丟失。
下面是java和python終止執行緒的方法:
java有三種方法可以讓終止執行緒:
1. 使用退出標誌,使執行緒正常退出,也就是當run方法完成後執行緒終止。
2. 使用stop方法強行終止執行緒(不建議使用,因為stop和suspend、resume一樣,也可能發生不可預料的結果)。
3. 使用interrupt方法中斷執行緒。
python可以有兩種方法:
1. 退出標記
2. 使用ctypes強行殺掉執行緒
ps -mp 31449 -o THREAD,tid USER %CPU PRI SCNT WCHAN USER SYSTEM TID root 0.0 - - - - - - root 0.0 19 - poll_s - - 31449 root 0.0 19 - poll_s - - 31450取得到了流程所有的執行緒後,透過strace得知31450 是需要我們kill的執行緒id,當我們kill的時候,會出現整個行程都崩潰的情況。 在多執行緒環境下,產生的訊號是傳遞給整個行程的,一般而言,所有執行緒都有機會收到這個訊號,行程在收到訊號的的執行緒上下文執行訊號處理函數,具體是哪個執行緒執行的難以獲知。也就是說,訊號會隨機發個該行程的一個執行緒。
strace -p <span style="font-size:14px;line-height:21px;">31450</span> Process <span style="font-size:14px;line-height:21px;">31450</span> attached - interrupt to quit select(0, NULL, NULL, NULL, {0, 320326}) = 0 (Timeout) select(0, NULL, NULL, NULL, {1, 0}) = 0 (Timeout) select(0, NULL, NULL, NULL, {1, 0}) = 0 (Timeout) select(0, NULL, NULL, NULL, {1, 0}) = ? ERESTARTNOHAND (To be restarted) --- SIGTERM (Terminated) @ 0 (0) --- Process <span style="font-size:14px;line-height:21px;">31450</span> detached上面出現的問題其實跟pthread的說明是一致的。當我們在python程式碼裡加入signal 訊號處理函數後,回呼函數可以防止整個行程的退出,那麼問題來了,透過訊號函數不能辨識你要幹掉哪一個線程,也就是說,不能精準的幹掉某個線程。你雖然把訊號發給31450線程id,但是訊號受理人是所屬進程的任何一個,另外傳給訊號處理函數的參數只有訊號數和訊號stack而已,可有可無的。 加上了訊號處理後,不會退出進程
select(0, NULL, NULL, NULL, {1, 0}) = 0 (Timeout) select(0, NULL, NULL, NULL, {1, 0}) = ? ERESTARTNOHAND (To be restarted) --- SIGTERM (Terminated) @ 0 (0) --- rt_sigreturn(0xffffffff) = -1 EINTR (Interrupted system call) select(0, NULL, NULL, NULL, {1, 0}) = 0 (Timeout) select(0, NULL, NULL, NULL, {1, 0}) = 0 (Timeout)如果想從外部通知殺掉某個線程,那麼可以建構使用rpc服務,或是別的方式通信,signal訊號不可以,因為無法無法傳遞更多的訊息。 python的線程不是模擬的,是真實的內核線程,內核呼叫pthread方法,但Python上層沒有提供關閉線程的方法,這就需要我們自己把握了。強烈建議使用 event 或 自訂標誌位元的方法, 如果非要強制殺掉線程,那麼可以用python ctypes PyThreadState SetAsyncExc 方法強制退出,這樣對於運行的python服務沒有什麼影響。
import ctypes def terminate_thread(thread): if not thread.isAlive(): return exc = ctypes.py_object(SystemExit) res = ctypes.pythonapi.PyThreadState_SetAsyncExc( ctypes.c_long(thread.ident), exc) if res == 0: raise ValueError("nonexistent thread id") elif res > 1: ctypes.pythonapi.PyThreadState_SetAsyncExc(thread.ident, None) raise SystemError("PyThreadState_SetAsyncExc failed")##咱們簡單look一下PyThreadState原始碼,總而言之觸發線程的異常模式。 有興趣的人可以閱讀 python pystate.c 的設計,配合著youtube的一些影片分享。
int PyThreadState_SetAsyncExc(long id, PyObject *exc) { PyInterpreterState *interp = GET_INTERP_STATE(); ... HEAD_LOCK(); for (p = interp->tstate_head; p != NULL; p = p->next) { if (p->thread_id == id) { 从链表里找到线程的id,避免死锁,我们需要释放head_mutex。 PyObject *old_exc = p->async_exc; Py_XINCREF(exc); #增加该对象的引用数 p->async_exc = exc; # 更为exc模式 HEAD_UNLOCK(); Py_XDECREF(old_exc); # 因为要取消,当然也就递减引用 ... return 1; #销毁线程成功 } } HEAD_UNLOCK(); return 0; }原生posix pthread 可以使用 ptread_cancel(tid) 在主執行緒中結束子執行緒。但是 Python 的線程庫不支援這樣做,理由是我們不應該強制地結束一個線程,這樣會帶來很多隱患,應該讓該線程自己結束自己。所以在 Python 中,建議的方法是在子線程中循環判斷一個標誌位,在主線程中改變該標誌位,子線程讀到標誌位改變,就結束自己。 類似這個邏輯:
def consumer_threading(): t1_stop= threading.Event() t1 = threading.Thread(target=thread1, args=(1, t1_stop)) t2_stop = threading.Event() t2 = threading.Thread(target=thread2, args=(2, t2_stop)) time.sleep(duration) #stop the thread2 t2_stop.set() def thread1(arg1, stop_event): while(not stop_event.is_set()): #similar to time.sleep() stop_event.wait(time) pass def thread2(arg1, stop_event): while(not stop_event.is_set()): stop_event.wait(time) pass
簡單的總結,雖然我們可以用ctypes裡的pystats來控制線程,但這種粗暴中斷線程的方法是不合理的。 請選用 自殺模式 !如果你的線程正在發生io阻塞,而不能判斷事件怎麼辦? 你的程式需要做優化了,最少在網路io層需要主動的timeout,避免一直的阻塞下去。
更多不要用強制方法殺掉python線程相關文章請關注PHP中文網!