Socket 在英文中的意思為“(連接兩個物品的)凹槽”,像the eye socket,意為“眼窩”,此外還有“插座”的意思。在電腦科學中,socket 通常是指一個連接的兩個端點,這裡的連接可以是同一台機器上的,像unix domain socket,也可以是不同機器上的,像network socket。
本文著重介紹現在用的最多的 network socket,包括其在網絡模型中的位置、API 的編程範式、常見錯誤等方面,最後用 Python 語言中的 socket API 實現幾個實際的例子。 Socket 中文一般翻譯為“套接字”,不得不說這是個讓人摸不著頭腦的翻譯,我也沒想到啥“信達雅”的翻譯,所以本文直接用其英文表述。本文中所有程式碼均可在 socket.py 倉庫中找到。
概述
Socket 作為一種通用的技術規範,首次是由 Berkeley 大學在 1983 為 4.2BSD Unix 提供的,後來逐漸演化為 POSIX 標準。 Socket API 是由作業系統提供的一個程式設計接口,讓應用程式可以控制使用 socket 技術。 Unix 哲學中有一條一切皆為文件,所以 socket 和file 的 API 使用很類似:可以進行read、write、open、close等操作。
現在的網路系統是分層的,理論上有OSI模型,工業界有TCP/IP協定簇。其對比如下:
每層上都有其相應的協議,socket API 不屬於TCP/IP協議簇,只是操作系統提供的一個用於網絡編程的接口,工作在應用層與傳輸層之間:
時所建立的電子郵件時使用我們所使用的我們來完成郵件程式的 API.
一個 socket,包含兩個必要組成部分:
位址,由 ip 與 連接埠組成,像192.168.0.1:80。
協議,socket 所是用的傳輸協議,目前有三種:TCP、UDP、raw IP。
位址與協定可以確定一個socket;一台機器上,只允許存在一個同樣的socket。 TCP 連接埠 53 的 socket 與 UDP 連接埠 53 的 socket 是兩個不同的 socket。
根據 socket 傳輸資料方式的不同(使用協定不同),可以分為以下三種:
Stream sockets,也稱為「面向連線」的 socket,使用 TCP 協定。實際通訊前需要連接,傳輸的資料沒有特定的結構,所以高層協定需要自己去界定資料的分隔符,但其優點是資料是可靠的。
Datagram sockets,也稱為「無連接」的 socket,使用 UDP 協定。實際通訊前不需要連接,一個優勢時 UDP 的資料包本身是可分割的(self-delimiting),也就是說每個資料包就標示了資料的開始與結束,其劣勢是資料不可靠。
Raw sockets,通常用在路由器或其他網路設備中,這種socket 不經過TCP/IP協定簇中的傳輸層(transport layer),直接由網路層(Internet layer)通往應用層(Application layer) ,所以這時的封包就不會包含tcp 或udp 頭資訊。
Python socket API
Python 裡面用(ip, port)的元組來表示 socket 的位址屬性,用AF_*來表示協定類型。
資料通訊有兩組動詞可供選擇:send/recv 或 read/write。 read/write 方式也是Java 採用的方式,這裡不會對這種方式進行過多的解釋,但是需要注意的是:
read/write 操作的具有buffer 的“文件”,所以在進行讀寫後需要呼叫flush方法去真正傳送或讀取數據,否則數據會停留在緩衝區內。
TCP socket
TCP socket 由於在通往前需要建立連接,所以其模式較 UDP socket 負責些。具體如下:
每個API 的具體含義這裡不在贅述,可以查看手冊,這裡給出 Python 語言的實現的 echo server。
# echo_server.py # coding=utf8 import socket sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 设置 SO_REUSEADDR 后,可以立即使用 TIME_WAIT 状态的 socket sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1) sock.bind(('', 5500)) sock.listen(5)
def handler(client_sock, addr): print('new client from %s:%s' % addr) msg = client_sock.recv(1024) client_sock.send(msg) client_sock.close() print('client[%s:%s] socket closed' % addr) if __name__ == '__main__': while 1: client_sock, addr = sock.accept() handler(client_sock, addr)
# echo_client.py # coding=utf8 import socket sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) sock.connect(('', 5500)) sock.send('hello socket world') print sock.recv(1024)
上面簡單的echo server 程式碼中有一點要注意的是:server 端的socket 設定了SO_REUSEADDR為1,目的是可以立即使用處於TIME_WAIT狀態的socket,那麼TIME_WAIT又是什麼意思呢後面在講解tcp?變更圖時再做詳細介紹。
UDP socket
UDP socket server 端代码在进行bind后,无需调用listen方法。
# udp_echo_server.py # coding=utf8 import socket sock = socket.socket(socket.AF_INET, socket.SOCK_DGRAM) # 设置 SO_REUSEADDR 后,可以立即使用 TIME_WAIT 状态的 socket sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1) sock.bind(('', 5500)) # 没有调用 listen if __name__ == '__main__': while 1: data, addr = sock.recvfrom(1024) print('new client from %s:%s' % addr) sock.sendto(data, addr) # udp_echo_client.py # coding=utf8 import socket udp_server_addr = ('', 5500) if __name__ == '__main__': sock = socket.socket(socket.AF_INET, socket.SOCK_DGRAM) data_to_sent = 'hello udp socket' try: sent = sock.sendto(data_to_sent, udp_server_addr) data, server = sock.recvfrom(1024) print('receive data:[%s] from %s:%s' % ((data,) + server)) finally: sock.close()
常见陷阱
忽略返回值
本文中的 echo server 示例因为篇幅限制,也忽略了返回值。网络通信是个非常复杂的问题,通常无法保障通信双方的网络状态,很有可能在发送/接收数据时失败或部分失败。所以有必要对发送/接收函数的返回值进行检查。本文中的 tcp echo client 发送数据时,正确写法应该如下:
total_send = 0 content_length = len(data_to_sent) while total_send < content_length: sent = sock.send(data_to_sent[total_send:]) if sent == 0: raise RuntimeError("socket connection broken") total_send += total_send + sent
send/recv操作的是网络缓冲区的数据,它们不必处理传入的所有数据。
一般来说,当网络缓冲区填满时,send函数就返回了;当网络缓冲区被清空时,recv 函数就返回。
当 recv 函数返回0时,意味着对端已经关闭。
可以通过下面的方式设置缓冲区大小。
s.setsockopt(socket.SOL_SOCKET, socket.SO_SNDBUF, buffer_size)
认为 TCP 具有 framing
TCP 不提供 framing,这使得其很适合于传输数据流。这是其与 UDP 的重要区别之一。UDP 是一个面向消息的协议,能保持一条消息在发送者与接受者之间的完备性。
代码示例参考:framing_assumptions
TCP 的状态机
在前面echo server 的示例中,提到了TIME_WAIT状态,为了正式介绍其概念,需要了解下 TCP 从生成到结束的状态机器。(图片来源)
这个状图转移图非常非常关键,也比较复杂,我自己为了方便记忆,对这个图进行了拆解,仔细分析这个图,可以得出这样一个结论,连接的打开与关闭都有被动(passive)与主动(active)两种,主动关闭时,涉及到的状态转移最多,包括FIN_WAIT_1、FIN_WAIT_2、CLOSING、TIME_WAIT。
此外,由于 TCP 是可靠的传输协议,所以每次发送一个数据包后,都需要得到对方的确认(ACK),有了上面这两个知识后,再来看下面的图:
在主动关闭连接的 socket 调用 close方法的同时,会向被动关闭端发送一个 FIN
对端收到FIN后,会向主动关闭端发送ACK进行确认,这时被动关闭端处于 CLOSE_WAIT 状态
当被动关闭端调用close方法进行关闭的同时向主动关闭端发送 FIN 信号,接收到 FIN 的主动关闭端这时就处于 TIME_WAIT 状态
这时主动关闭端不会立刻转为 CLOSED 状态,而是需要等待 2MSL(max segment life,一个数据包在网络传输中最大的生命周期),以确保被动关闭端能够收到最后发出的 ACK。如果被动关闭端没有收到最后的 ACK,那么被动关闭端就会重新发送 FIN,所以处于TIME_WAIT的主动关闭端会再次发送一个 ACK 信号,这么一来(FIN来)一回(ACK),正好是两个 MSL 的时间。如果等待的时间小于 2MSL,那么新的socket就可以收到之前连接的数据。
前面 echo server 的示例也说明了,处于 TIME_WAIT 并不是说一定不能使用,可以通过设置 socket 的 SO_REUSEADDR 属性以达到不用等待 2MSL 的时间就可以复用socket 的目的,当然,这仅仅适用于测试环境,正常情况下不要修改这个属性。
实战
HTTP UA
http 协议是如今万维网的基石,可以通过 socket API 来简单模拟一个浏览器(UA)是如何解析 HTTP 协议数据的。
#coding=utf8 import socket sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) baidu_ip = socket.gethostbyname('baidu.com') sock.connect((baidu_ip, 80)) print('connected to %s' % baidu_ip) req_msg = [ 'GET / HTTP/1.1', 'User-Agent: curl/7.37.1', 'Host: baidu.com', 'Accept: */*', ] delimiter = '\r\n' sock.send(delimiter.join(req_msg)) sock.send(delimiter) sock.send(delimiter) print('%sreceived%s' % ('-'*20, '-'*20)) http_response = sock.recv(4096) print(http_response)
运行上面的代码可以得到下面的输出
--------------------received-------------------- HTTP/1.1 200 OK Date: Tue, 01 Nov 2016 12:16:53 GMT Server: Apache Last-Modified: Tue, 12 Jan 2010 13:48:00 GMT ETag: "51-47cf7e6ee8400" Accept-Ranges: bytes Content-Length: 81 Cache-Control: max-age=86400 Expires: Wed, 02 Nov 2016 12:16:53 GMT Connection: Keep-Alive Content-Type: text/html <html> <meta http-equiv="refresh" content="0;url=http://www.baidu.com/"> </html>
http_response是通过直接调用recv(4096)得到的,万一真正的返回大于这个值怎么办?我们前面知道了 TCP 协议是面向流的,它本身并不关心消息的内容,需要应用程序自己去界定消息的边界,对于应用层的 HTTP 协议来说,有几种情况,最简单的一种时通过解析返回值头部的Content-Length属性,这样就知道body的大小了,对于 HTTP 1.1版本,支持Transfer-Encoding: chunked传输,对于这种格式,这里不在展开讲解,大家只需要知道, TCP 协议本身无法区分消息体就可以了。对这块感兴趣的可以查看 CPython 核心模块 http.client
Unix_domain_socket
UDS 用于同一机器上不同进程通信的一种机制,其API适用与 network socket 很类似。只是其连接地址为本地文件而已。
代码示例参考:uds_server.py、uds_client.py
ping
ping 命令作为检测网络联通性最常用的工具,其适用的传输协议既不是TCP,也不是 UDP,而是 ICMP,利用 raw sockets,我们可以适用纯 Python 代码来实现其功能。
代码示例参考:ping.py
netstat vs ss
netstat 与 ss 是类 Unix 系统上查看 Socket 信息的命令。netstat 是比较老牌的命令,我常用的选择有
-t,只显示 tcp 连接
-u,只显示 udp 连接
-n,不用解析hostname,用 IP 显示主机,可以加快执行速度
-p,查看连接的进程信息
-l,只显示监听的连接
ss 是新兴的命令,其选项和 netstat 差不多,主要区别是能够进行过滤(通过state与exclude关键字)。
$ ss -o state time-wait -n | head Recv-Q Send-Q Local Address:Port Peer Address:Port 0 0 10.200.181.220:2222 10.200.180.28:12865 timer:(timewait,33sec,0) 0 0 127.0.0.1:45977 127.0.0.1:3306 timer:(timewait,46sec,0) 0 0 127.0.0.1:45945 127.0.0.1:3306 timer:(timewait,6.621ms,0) 0 0 10.200.181.220:2222 10.200.180.28:12280 timer:(timewait,12sec,0) 0 0 10.200.181.220:2222 10.200.180.28:35045 timer:(timewait,43sec,0) 0 0 10.200.181.220:2222 10.200.180.28:42675 timer:(timewait,46sec,0) 0 0 127.0.0.1:45949 127.0.0.1:3306 timer:(timewait,11sec,0) 0 0 127.0.0.1:45954 127.0.0.1:3306 timer:(timewait,21sec,0) 0 0 ::ffff:127.0.0.1:3306 ::ffff:127.0.0.1:45964 timer:(timewait,31sec,0)
这两个命令更多用法可以参考:
SS Utility: Quick Intro
10 basic examples of linux netstat command
总结
我们的生活已经离不开网络,平时的开发也充斥着各种复杂的网络应用,从最基本的数据库,到各种分布式系统,不论其应用层怎么复杂,其底层传输数据的的协议簇是一致的。Socket 这一概念我们很少直接与其打交道,但是当我们的系统出现问题时,往往是对底层的协议认识不足造成的,希望这篇文章能对大家编程网络方面的程序有所帮助。