今日、curl_init関数を使用してSohuのWebページをクロールしたところ、分析の結果、サーバーがgzip圧縮機能をオンにしていることがわかりました。 gzip を解析するために関数curl_setopt に複数のオプション CURLOPT_ENCODING を追加するだけで、正しくデコードできます。
また、キャプチャされた Web ページが GBK でエンコードされているが、スクリプトが実際には utf-8 でエンコードされている場合、キャプチャされた Web ページは関数 mb_convert_encoding を使用して変換する必要があります。