Background
로그를 분석한 결과 로그의 일부 매개변수에 다음과 같은 다른 URL이 포함되어 있음을 발견했습니다.
# 🎜🎜 #https://blog.csdn.net/breaksoftware/article/details/7009209. 관심이 있다면 다음 사실을 확인해보세요. 주인님이 자세를 정말 좋아지시네요.
원본 텍스트는 C++ 버전입니다. 여기서는 참고용으로 비슷한 내용을 Python으로 작성했습니다. 일반적인 URL 분류 #🎜 🎜# 도메인 이름 추출:
www.baidu.com
IP 형식 추출: 예: 192.168.1.1.
while (i < len(z) and z[i].isdigit()): i = i + 1 ip_v1 = True reti = i if i < len(z) and z[i] == '.': i = i + 1 reti = i else: tokenType = TK_OTHER reti = 1while (i < len(z) and z[i].isdigit()): i = i + 1 ip_v2 = True if i < len(z) and z[i] == '.': i = i + 1 else: if tokenType != TK_DOMAIN: tokenType = TK_OTHER reti = 1while (i < len(z) and z[i].isdigit()): i = i + 1 ip_v3 = True if i < len(z) and z[i] == '.': i = i + 1 else: if tokenType != TK_DOMAIN: tokenType = TK_OTHER reti = 1while (i < len(z) and z[i].isdigit()): i = i + 1 ip_v4 = True if i < len(z) and z[i] == ':': i = i + 1 while (i < len(z) and z[i].isdigit()): i = i + 1 if ip_v1 and ip_v2 and ip_v3 and ip_v4: self.urls.append(z[0:i]) return reti, tokenType else: if tokenType != TK_DOMAIN: tokenType = TK_OTHER reti = 1
결과 테스트
테스트 데이터:
# 🎜🎜#
실행 결과: #🎜 🎜#
결론
예전에는 머리 숙인 채 코드 작성에만 집중하고 이후의 생각과 요약은 무시했습니다. 이제는 바꾸려고 노력하고 있고, 작업하면서 다듬고 요약하고 있는데, 기분 좋은 일이 생기면 그걸 도구로 써서 모두와 공유하려고 해요.
코드 포털:
https://github.com/skskevin/UrlDetect/blob/master/tool/domainExtract/domainExtract.py#🎜🎜 # 추천 관련 기사 및 튜토리얼: webserversecurity
위 내용은 어휘 분석을 사용하여 도메인 이름 및 IP 추출의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!