最近在有python的scapy模块分析TCP报文,一直有一个关于转义字符的问题困惑着我,查找的很多资料后仍然百思不得其解,请大神指教。
请看代码:
from scapy.all import *
def findTCPdata(pkt):
raw = pkt.sprintf("%Raw.load%")
print raw
print 'length of TCP data: '+ str(len(raw))
def main():
pkts = rdpcap('XXX.pcap')
for pkt in pkts:
findTCPdata(pkt)
if __name__ == '__main__':
main()
结果为:
打印出的字符串中‘\x11’、'\x04'等等应该相当于一个字符,但是解释器把它们当成了4个字符。所以四条报文中的tcp数据长度不是17而成了为53,52,46,52。
查阅scapy源码发现sprintf("%Raw.load%")函数实现提取tcp数据段,并将其转化为字符串,但是转化后的结果类似于raw_string,字符串中的‘\x’失效了,被当做了2个字符。
请问该怎么转化,使得转义字符‘\x’生效,使得类似‘\x11’、'\x04'等等的字符被看做一个字符而不是4个?
天蓬老师2017-04-18 10:23:04
After consulting the information, I found that I need to use a function to convert raw string to string.
raw = raw.replace('\'','')
string = raw.decode('string_escape')
The output result is correct