두 번째 부분이 나왔습니다! 오늘은 기본적인 지식을 배워봅시다. 탄탄한 기초만이 깊이 있는 학습을 할 수 있는 유일한 방법입니다! ! !
기본 지식 학습
1. OSI 모델
OSI 모델은 네트워크 통신 작업을 7개의 계층으로 나눕니다. 아래에서 위로는 물리적 계층, 데이터 링크 계층, 네트워크 계층, 전송 계층, 세션 계층, 프레젠테이션 계층 및 애플리케이션 계층입니다. OSI는 개념과 이론으로만 존재하는 모델일 뿐입니다. 단점은 레이어가 너무 많아 네트워크 작업의 복잡성이 증가하므로 대규모로 적용되지 않았습니다. 나중에 사람들은 OSI를 단순화하고 일부 레이어를 병합했는데, 결국 아래에서 위로 4개의 레이어만 남았습니다. 이는 인터페이스 레이어, 네트워크 레이어, 전송 레이어 및 애플리케이션 레이어입니다. 모델 .
이 네트워크 모델의 역할은 정확히 무엇인가요? 간단히 말해서 데이터 캡슐화입니다.
데이터 캡슐화 원리: 일반적으로 우리가 사용하는 프로그램(소프트웨어)은 애플리케이션 계층을 통해 네트워크에 액세스합니다. 프로그램에서 생성된 데이터는 최종 네트워크 인터페이스 계층까지 계층별로 전송됩니다. 네트워크 케이블을 통해 인터넷으로 전송됩니다. 데이터가 한 계층 아래로 내려갈 때마다 이 계층의 프로토콜에 따라 패키징됩니다. 인터넷으로 전송될 때쯤에는 원래 데이터보다 4개의 패키징 계층이 더 많아집니다. 전체 데이터 캡슐화 과정은 러시아 마트료시카 인형과 같습니다. 다른 컴퓨터가 데이터 패킷을 수신하면 네트워크 인터페이스 계층에서 계층별로 전송됩니다. 전송의 각 계층은 최종 응용 프로그램 계층까지 압축이 풀리며 이는 프로그램에서 얻을 수 있는 데이터입니다. 사용할 것입니다. 데이터를 패키징하는 과정은 실제로 데이터 헤드에 플래그(데이터 블록)를 추가하는 것으로, 데이터가 이 레이어를 통과했고 내가 처리했음을 나타냅니다. 데이터의 압축을 푸는 과정은 정반대입니다. 즉, 데이터 헤더의 표시를 제거하고 점차 원래의 모양을 드러내도록 하는 것입니다. (OSI 7계층 네트워크 모델과 TCP/IP 4계층 네트워크 모델 비교)
두 대의 컴퓨터가 통신할 때 다음 원칙을 준수해야 합니다. (1) 반드시 at the same level 통신의 경우, 예를 들어 컴퓨터 A의 애플리케이션 계층과 컴퓨터 B의 전송 계층은 동일한 수준에 있지 않기 때문에 통신할 수 없으며 데이터 언패킹에 문제가 발생합니다. (2) 각 레이어의 기능은 동일해야 합니다. 즉, 정확히 동일한 네트워크 모델 을 가져야 합니다. 네트워크 모델이 모두 다르면 엉망이 되어 누구도 알 수 없게 됩니다. 데이터는 레이어 호핑이 아닌 레이어 단위로만 전송될 수 있습니다. (3) 각 레이어는 하위 레이어가 제공하는 서비스를 사용할 수 있고, 상위 레이어에는 서비스를 제공 할 수 있습니다.
2. TCP 및 IP 프로토콜 계열: 일반적으로 사용되는 소켓 프로그래밍은 TCP 및 UDP 프로토콜을 기반으로 하며 계층 관계는 아래 그림과 같습니다.
셋, 파이썬의 문자열 인코딩 방식
파이썬에서는 문자열의 인코딩 방식을 utf-8 형식으로 변환해야 합니다!
동일한 숫자에 대해 이를 표현하는 다양한 방법을 선택할 수 있습니다. 어떤 솔루션을 선택하든 유니코드에 대한 인코딩 방법입니다(utf-8은 유니코드 인코딩 방법의 특정 구현입니다).
Python은 문자열을 표현하기 위해 내부적으로 유니코드를 사용하므로, 모든 한자를 인쇄하려면(유니코드와 영어 문자 및 숫자의 utf-8 인코딩은 동일함) 유니코드 인코딩 방법인지 확인해야 합니다. "utf-8" 인코딩 방법인 경우(출력은 이진 코드 묶음이고, 한자의 UTF-8 인코딩은 3바이트, 즉 아래와 같이 이진 표현의 세 세그먼트임) 다음을 사용할 수 있습니다. .decode("utf-8")로 디코딩합니다. 하드디스크에 저장하거나 인터넷으로 전송할 때(소켓 등 통신관련 사항을 이용하여) UTF-8로 변환해야 합니다.
(파이썬에서 utf-8로 인코딩한 결과)
내부적으로 UTF-8을 계속 사용하면 어떨까요? 그러면 변환할 필요가 없나요? 여기에는 UTF-8의 단점이 있습니다. 즉, 문자열 길이를 계산하고 하위 문자열을 찾는 것은 매우 비효율적입니다. UCS2를 사용할 때 문자열의 길이를 알고 싶다면, 차지하는 바이트 수를 확인한 다음 2로 나누면 됩니다. UTF-8의 경우 문자별로 계산해야 합니다. 하위 문자열 검색을 수행할 때 다음 문자가 몇 바이트를 차지하는지 모르기 때문에 효율적인 검색 알고리즘이 작동하지 않습니다.
결론
다음번에는 모두가 이해하고 실습할 수 있도록 간단한 예문을 들고 오겠습니다. 마지막으로, 이 글을 읽으신 후 작은 좋아요와 격려를 부탁드립니다. 이 글을 쓴 지 두 시간이 넘었습니다. 이는 단지 지식 공유, 함께 배우기 위한 것입니다. , 그리고 함께 성장해요! ! ! (솔직히 남의 글을 읽고 나면 별로 안 좋아해요. 이건 좋은 습관이 아니거든요. 바로 바꿀게요 우우)