Rumah >pembangunan bahagian belakang >Tutorial Python >Mengapa Bacaan Baris `stdin` C Jauh Lebih Lambat Daripada Python dan Bagaimana Ia Boleh Diperbaiki?

Mengapa Bacaan Baris `stdin` C Jauh Lebih Lambat Daripada Python dan Bagaimana Ia Boleh Diperbaiki?

DDD
DDDasal
2024-11-25 03:17:15661semak imbas

Why Is C  's `stdin` Line Reading Significantly Slower Than Python's, and How Can It Be Improved?

Mengapa Membaca Baris daripada stdin Jauh Lebih Lambat dalam C Daripada Python?

Dalam artikel ini, kami berhasrat untuk menyiasat mengapa membaca baris data rentetan daripada input standard (stdin ) menggunakan C pada umumnya lebih perlahan daripada rakan sejawat Pythonnya. Kami mulakan dengan memeriksa kod yang disediakan, mengenal pasti kawasan yang berpotensi menjadi kebimbangan.

Kod C

string input_line;
long line_count = 0;
time_t start = time(NULL);
int sec;
int lps;

while (cin) {
    getline(cin, input_line);
    if (!cin.eof())
        line_count++;
}

Kod ini menggunakan getline() untuk membaca baris teks daripada stdin dan mengira bilangan baris dalam fail. Walau bagaimanapun, ia membaca setiap aksara fail satu demi satu dalam gelung dalaman. Pendekatan ini tidak cekap dan membawa kepada panggilan sistem yang berlebihan, mengakibatkan pelaksanaan yang perlahan.

Tetapan Lalai Strim C

Tidak seperti Python, strim C mempunyai tetapan lalai yang mengutamakan penyegerakan dengan standard gaya C fungsi input dan output. Penyegerakan ini memastikan bahawa kedua-dua aliran C dan C mengakses sumber input dan output secara konsisten. Walau bagaimanapun, penyegerakan ini juga menghalang strim C daripada menggunakan mekanisme penimbalan yang lebih cekap.

cin disegerakkan dengan stdio, yang menyebabkannya mengelakkan sebarang penimbalan input. Akibatnya, cin hanya membaca satu aksara pada satu masa, menjadikan proses itu lebih memakan masa.

Peningkatan Prestasi

Untuk meningkatkan prestasi kod C, kita boleh melumpuhkan penyegerakan antara cin dan stdio. Dengan menambahkan pernyataan cin.sync_with_stdio(false) pada permulaan program, kami boleh membenarkan aliran C menimbal I/O mereka secara bebas, yang membawa kepada peningkatan kelajuan yang ketara.

Alternatif: Menggunakan fgets

Satu lagi pendekatan berkesan untuk meningkatkan prestasi ialah menggunakan fgets() sebaliknya daripada getline(). fgets ialah fungsi C yang membaca bilangan aksara tertentu daripada stdin ke dalam tatasusunan aksara, memberikan kawalan yang lebih besar ke atas proses penimbalan.

Hasil Penanda Aras

Untuk menunjukkan perbezaan prestasi, fail yang mengandungi 100 juta baris telah digunakan untuk penanda aras. Keputusan menggunakan kod C asal (disegerakkan), C dengan penyegerakan dilumpuhkan dan Python adalah seperti berikut:

Implementation Lines per Second
Python (default) 3,571,428
cin (default/naive) 819,672
cin (no sync) 12,500,000
fgets 14,285,714
wc (not a fair comparison) 54,644,808

Melumpuhkan penyegerakan dalam C menghasilkan peningkatan yang ketara, manakala penggunaan fgets menawarkan prestasi yang lebih baik. Adalah penting untuk ambil perhatian bahawa menggunakan wc bukanlah perbandingan yang adil kerana ia direka khusus untuk mengira baris.

Kesimpulan

Dengan memahami tetapan lalai strim C dan melaksanakan pengoptimuman yang sesuai, seperti melumpuhkan penyegerakan strim atau menggunakan fgets, prestasi kod C untuk membaca baris daripada stdin boleh dipertingkatkan secara mendadak, menjadikannya setanding atau lebih pantas daripada rakan Pythonnya.

Atas ialah kandungan terperinci Mengapa Bacaan Baris `stdin` C Jauh Lebih Lambat Daripada Python dan Bagaimana Ia Boleh Diperbaiki?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn