이 문서에서는 표준 입력(stdin)에서 문자열 데이터의 줄을 읽는 이유를 조사하는 것을 목표로 합니다. ) C를 사용하는 것은 일반적으로 Python을 사용하는 것보다 훨씬 느립니다. 먼저 제공된 코드를 검사하여 잠재적인 문제 영역을 식별합니다.
string input_line; long line_count = 0; time_t start = time(NULL); int sec; int lps; while (cin) { getline(cin, input_line); if (!cin.eof()) line_count++; }
이 코드는 getline()을 사용하여 텍스트 줄을 읽습니다. stdin을 사용하여 파일의 줄 수를 계산합니다. 그러나 내부 루프 내에서 한 번에 하나씩 파일의 각 문자를 읽습니다. 이 접근 방식은 비효율적이고 과도한 시스템 호출로 이어져 실행 속도가 느려집니다.
Python과 달리 C 스트림에는 C 스타일 표준과의 동기화를 우선시하는 기본 설정이 있습니다. 입력 및 출력 기능. 이러한 동기화를 통해 C 및 C 스트림 모두 입력 및 출력 리소스에 일관되게 액세스할 수 있습니다. 그러나 이 동기화는 또한 C 스트림이 보다 효율적인 버퍼링 메커니즘을 사용하는 것을 방지합니다.
cin은 stdio와 동기화되어 입력 버퍼링을 방지합니다. 결과적으로 cin은 한 번에 한 문자만 읽으므로 프로세스에 더 많은 시간이 소요됩니다.
C 코드의 성능을 향상하려면, cin과 stdio 간의 동기화를 비활성화할 수 있습니다. 프로그램 시작 부분에 cin.sync_with_stdio(false) 문을 추가하면 C 스트림이 I/O를 독립적으로 버퍼링하여 속도를 크게 향상시킬 수 있습니다.
성능 향상을 위한 또 다른 효과적인 접근 방식은 fgets()를 대신 사용하는 것입니다. getline(). fgets는 stdin에서 지정된 수의 문자를 문자 배열로 읽어 버퍼링 프로세스를 더욱 강력하게 제어하는 C 함수입니다.
성능 차이로 인해 1억 라인이 포함된 파일을 벤치마킹에 사용했습니다. 원본(동기화된) C 코드, 동기화가 비활성화된 C 코드, Python을 사용한 결과는 다음과 같습니다.
Implementation | Lines per Second |
---|---|
Python (default) | 3,571,428 |
cin (default/naive) | 819,672 |
cin (no sync) | 12,500,000 |
fgets | 14,285,714 |
wc (not a fair comparison) | 54,644,808 |
C에서 동기화를 비활성화하면 상당한 개선이 이루어졌으며 fgets를 사용하면 훨씬 더 나은 성능을 얻을 수 있습니다. wc를 사용하는 것은 라인 계산을 위해 특별히 설계되었기 때문에 공정한 비교가 아니라는 점에 유의하는 것이 중요합니다.
C 스트림의 기본 설정을 이해하고 구현함으로써 스트림 동기화 비활성화 또는 fgets 사용과 같은 적절한 최적화를 통해 stdin에서 행을 읽는 C 코드의 성능이 저하될 수 있습니다. 대폭 향상되어 Python과 동등하거나 훨씬 더 빠릅니다.
위 내용은 C의 `stdin` 줄 읽기가 Python의 것보다 현저히 느린 이유는 무엇이며 어떻게 개선할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!