ホームページ >WeChat アプレット >WeChatの開発 >WeChat ミニ プログラムにおける複雑なリッチ テキスト解析の詳細な説明

WeChat ミニ プログラムにおける複雑なリッチ テキスト解析の詳細な説明

迷茫
迷茫オリジナル
2017-03-25 16:42:332642ブラウズ

最近、WeChat アプレットで使用するために Web ページを解析する必要があるクローラーを作成しています。テキストと画像の分析はどちらも理解しやすく、ミニ プログラムにはプレゼンテーション用に対応するテキストと画像のタグも含まれています。テーブルなどのより複雑なものは、サーバー側の解析でもミニ プログラムのレンダリングでも、非常に手間がかかり、すべての状況をカバーするのは困難です。そこで、表に対応するHTMLコードを画像に変換することが回避策になるのではないかと考えました。

ここでは、PhantomJS を軽量にカプセル化し、Web ページをスクリーンショットとして簡単に保存できる、node-webshot モジュールを使用します。 D まず Node.js と Phantomjs をインストールし、次にノード Web ショット モジュールをロードするための新しい JS ファイルを作成します。

ここでオプションを定義します:ブラウザウィンドウの幅は状況に応じて適切に設定する必要があります。 Web ページで、高さを非常に小さな値に設定できる場合は、ページのドキュメント領域の高さをすべてに設定する必要があり、幅はデフォルトでウィンドウの幅に設定されるため、最小でも表全体のスクリーンショットを撮ることができます。サイズ。
次に、html
文字列
を定義します。

内部の HTML コードは改行を削除し、二重引用符を置き換える必要があることに注意してください。一重引用符で囲みます。このようにして、HTML コードからローカル画像への変換が実現され、後で Qiniu クラウドにアップロードできますなど。サーバーサイドの解析であっても、ミニプログラムのプレゼンテーションであっても、難しいことはありません。

以上がWeChat ミニ プログラムにおける複雑なリッチ テキスト解析の詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。