Zhihu クローラーに Java を最初から書き込み、キャプチャしたコンテンツをローカルに保存します (2)-＆＃＆チュートリアル-php.cn

ホームページ

Java

＆＃＆チュートリアル

Zhihu クローラーに Java を最初から書き込み、キャプチャしたコンテンツをローカルに保存します (2)

黄舟

Dec 24, 2016 am 11:50 AM

これら 2 つの関数を後で使用できるように FileReaderWriter.java ファイルにカプセル化します。
その後、Zhihu クローラーに戻ります。
ローカルに書き込むときに植字をフォーマットする関数を Zhihu の Zhihu カプセル化クラスに追加する必要があります。

コードは次のとおりです:

public String writeString() {  
        String result = "";  
        result += "问题：" + question + "\r\n";  
        result += "描述：" + questionDescription + "\r\n";  
        result += "链接：" + zhihuUrl + "\r\n";  
        for (int i = 0; i < answers.size(); i++) {  
            result += "回答" + i + "：" + answers.get(i) + "\r\n";  
        }  
        result += "\r\n\r\n";  
        return result;  
}

OK、これでほぼ完了です。次に、main メソッドの System.out.println を

コードは次のとおりです:

// 写入本地  
        for (Zhihu zhihu : myZhihu) {  
            FileReaderWriter.writeIntoFile(zhihu.writeString(),  
                    "D:/知乎_编辑推荐.txt", true);  
        }

実行すると、内容がわかります。最初はコンソール上で表示されていました。コンテンツはローカル txt ファイルに書き込まれています:

Zhihu クローラーに Java を最初から書き込み、キャプチャしたコンテンツをローカルに保存します (2)

一見したところ、問題はありませんが、よく見ると問題が見つかります。主に HTML タグが多すぎます。これらのタグは出力中に処理できます。
まず、io ストリーム内の
を rn に置き換えてから、すべての HTML タグを削除して、よりわかりやすくします。

コードは次のとおりです:

public String writeString() {  
    // 拼接写入本地的字符串  
    String result = "";  
    result += "问题：" + question + "\r\n";  
    result += "描述：" + questionDescription + "\r\n";  
    result += "链接：" + zhihuUrl + "\r\n";  
    for (int i = 0; i < answers.size(); i++) {  
        result += "回答" + i + "：" + answers.get(i) + "\r\n\r\n";  
    }  
    result += "\r\n\r\n\r\n\r\n";  
    // 将其中的html标签进行筛选  
    result = result.replaceAll("<br>", "\r\n");  
    result = result.replaceAll("<.*?>", "");  
    return result;  
}

ここの replaceAll 関数は正規表現を使用できるため、最後にすべてのタグが削除されます。

上記は、キャプチャされたコンテンツをローカルに保存するためのゼロ基礎で Java Zhihu クローラーを作成する内容です (2) さらに関連するコンテンツについては、PHP 中国語 Web サイト (www.php.cn) に注目してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

JVMは、Javaの「Write and、Run Anywhere」（Wora）機能にどのように貢献しますか？May 02, 2025 am 12:25 AM

JVMは、バイトコード解釈、プラットフォームに依存しないAPI、動的クラスの負荷を介してJavaのWORA機能を実装します。 2。標準API抽象オペレーティングシステムの違い。 3.クラスは、実行時に動的にロードされ、一貫性を確保します。

Javaの新しいバージョンは、プラットフォーム固有の問題にどのように対処しますか？May 02, 2025 am 12:18 AM

Javaの最新バージョンは、JVMの最適化、標準的なライブラリの改善、サードパーティライブラリサポートを通じて、プラットフォーム固有の問題を効果的に解決します。 1）Java11のZGCなどのJVM最適化により、ガベージコレクションのパフォーマンスが向上します。 2）Java9のモジュールシステムなどの標準的なライブラリの改善は、プラットフォーム関連の問題を削減します。 3）サードパーティライブラリは、OpenCVなどのプラットフォーム最適化バージョンを提供します。

JVMによって実行されたバイトコード検証のプロセスを説明します。May 02, 2025 am 12:18 AM

JVMのバイトコード検証プロセスには、4つの重要な手順が含まれます。1）クラスファイル形式が仕様に準拠しているかどうかを確認し、2）バイトコード命令の有効性と正確性を確認し、3）データフロー分析を実行してタイプの安全性を確保し、検証の完全性とパフォーマンスのバランスをとる。これらの手順を通じて、JVMは、安全で正しいバイトコードのみが実行されることを保証し、それによりプログラムの完全性とセキュリティを保護します。

プラットフォームの独立性は、Javaアプリケーションの展開をどのように簡素化しますか？May 02, 2025 am 12:15 AM

java'splatformendencealLowsApplicationStorunOperatingSystemwithajvm.1）singlecodebase：writeandcompileonceforallplatforms.2）easyUpdates：updatebytecodeforsimultaneousdeployment.3）テストの実験効果：scalbortffortfforduniverbehaviol.4）

Javaのプラットフォームの独立性は、時間とともにどのように進化しましたか？May 02, 2025 am 12:12 AM

Javaのプラットフォームの独立性は、JVM、JITコンピレーション、標準化、ジェネリック、ラムダ式、Projectpanamaなどのテクノロジーを通じて継続的に強化されています。 1990年代以来、Javaは基本的なJVMから高性能モダンJVMに進化し、さまざまなプラットフォームでのコードの一貫性と効率を確保しています。

Javaアプリケーションでプラットフォーム固有の問題を緩和するためのいくつかの戦略は何ですか？May 01, 2025 am 12:20 AM

Javaはプラットフォーム固有の問題をどのように軽減しますか？ Javaは、JVMおよび標準ライブラリを通じてプラットフォームに依存します。 1）bytecodeとjvmを使用して、オペレーティングシステムの違いを抽象化します。 2）標準のライブラリは、パスクラス処理ファイルパス、CHARSETクラス処理文字エンコードなど、クロスプラットフォームAPIを提供します。 3）最適化とデバッグのために、実際のプロジェクトで構成ファイルとマルチプラットフォームテストを使用します。

Javaのプラットフォームの独立性とマイクロサービスアーキテクチャの関係は何ですか？May 01, 2025 am 12:16 AM

java'splatformentencentenhancesmicroservicesecturectureby byofferingdeploymentflexability、一貫性、スケーラビリティ、およびポート可能性。1）展開の展開の展開は、AllosmicRoserviThajvm.2）deploymentflexibility lowsmicroserviceSjvm.2）一貫性のあるAcrossServicessimplisimpligiessdevelisementand

GraalvmはJavaのプラットフォーム独立目標とどのように関係していますか？May 01, 2025 am 12:14 AM

Graalvmは、Javaのプラットフォームの独立性を3つの方法で強化します。1。言語間の相互運用性、Javaが他の言語とシームレスに相互運用できるようにします。 2。独立したランタイム環境、graalvmnativeimageを介してJavaプログラムをローカル実行可能ファイルにコンパイルします。 3.パフォーマンスの最適化、Graalコンパイラは、Javaプログラムのパフォーマンスと一貫性を改善するための効率的なマシンコードを生成します。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。