1.scrapy シェル
は、scrapy パッケージの優れた対話型ツールです。現在、私は主に xpath の選択結果を確認するために使用しています。 Scrapy をインストールすると、cmd 上で直接 Scrapy シェルを操作できるようになります。
Scrapy Shell
Scrapy ターミナルは、スパイダーを起動せずにコードを試してデバッグすることができ、XPath 式や CSS 式がどのように機能するかをテストすることもできるため、Web ページのクロールが容易になります。から抽出されたデータ。
IPython がインストールされている場合、Scrapy ターミナルは (標準の Python ターミナルの代わりに) IPython を使用します。 IPython ターミナルは他のターミナルよりも強力で、インテリジェントなオートコンプリート、強調表示された出力、その他の機能を提供します。 (IPythonのインストールを推奨します)
Scrapy Shellを起動します
プロジェクトのルートディレクトリに入り、以下のコマンドを実行してシェルを起動します:
scrapy Shell "http://www.itcast.cn/channel/Teacher .shtml"
Scrapy Shell は、ダウンロードしたページに基づいて、Response オブジェクトや Selector オブジェクト (HTML および XML コンテンツ用) などの便利なオブジェクトを自動的に作成します。
シェルがロードされると、応答データを含むローカル応答変数を取得します。応答本文を出力するには、response.body を入力し、応答ヘッダーを表示するには、response.headers を入力します。
response.selectorと入力すると、responseによって初期化されたクラスSelectorのオブジェクトが取得されます。このとき、response.selector.xpath()またはresponse.selector.css()を使用してレスポンスをクエリできます。
Scrapy は、(前のケースと同様に) 有効にすることができる、response.xpath() や response.css() などのいくつかのショートカットも提供します。
セレクター
Scrapy Selectors には XPath および CSS セレクター式メカニズムが組み込まれています
Selector には 4 つの基本的なメソッドがあり、最も一般的に使用されるのは xpath です:
xpath(): xpath 式を渡し、式を返します。対応するすべてのノードのリスト
extract(): ノードを Unicode 文字列にシリアル化し、リストを返します
css(): CSS 式を渡し、式に対応するすべてのノードのセレクター リストを返します。構文は次のとおりです。 BeautifulSoup4
re()と同じ: 受信した正規表現に従ってデータを抽出し、Unicode文字列リストを返します
2. ipython
公式ではipythonを使用することをお勧めしますwebsite スクレイピーシェルを実行するのでインストールしてみました。私の Python 環境は以前 conda を介して構成されていたため (前の記事を参照)、conda を介して ipython をインストールすると非常に便利です
conda install -c conda-forge ipython
そうすれば、ipython パッケージ全体がダウンロードされます。すべてコンパイルされているため、煩わしいコンパイルは必要ありませんプロセスが失敗しました。
3. ipython と ipython 上で Scrapy シェルを実行します
現在の cmd 実行ボックスでは、システム環境が構成されているため、Python パッケージを直接実行できます。そのため、cmd 実行ボックスに直接次のように入力します。 ipython を ipython に入力すると、ipython 実行ボックスに入ります。これはシステム標準の cmd に似ていますが、より豊富な機能、豊富な色、より優れたレイアウトを備えています。
しかし、scrapy シェルコマンドを直接入力すると、そのようなコマンドは存在しないと表示され続けて失敗します。ここで立ち往生しました。
後で、scrapy シェルの説明を注意深く読んでください
IPython がインストールされている場合、Scrapy シェルは (標準の Python コンソールの代わりに) それを使用します
つまり、scrapy シェルは ipython を見つけます。フレーム自体で実行されます。
そのため、cmd の標準の実行ボックスに直接、scrapy shell
以上がScrapy シェルを使用して xpath 選択の結果を確認する方法に関する詳細なチュートリアルの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

PythonとCにはそれぞれ独自の利点があり、選択はプロジェクトの要件に基づいている必要があります。 1)Pythonは、簡潔な構文と動的タイピングのため、迅速な開発とデータ処理に適しています。 2)Cは、静的なタイピングと手動メモリ管理により、高性能およびシステムプログラミングに適しています。

PythonまたはCの選択は、プロジェクトの要件に依存します。1)迅速な開発、データ処理、およびプロトタイプ設計が必要な場合は、Pythonを選択します。 2)高性能、低レイテンシ、および緊密なハードウェアコントロールが必要な場合は、Cを選択します。

毎日2時間のPython学習を投資することで、プログラミングスキルを効果的に改善できます。 1.新しい知識を学ぶ:ドキュメントを読むか、チュートリアルを見る。 2。練習:コードと完全な演習を書きます。 3。レビュー:学んだコンテンツを統合します。 4。プロジェクトの実践:実際のプロジェクトで学んだことを適用します。このような構造化された学習計画は、Pythonを体系的にマスターし、キャリア目標を達成するのに役立ちます。

2時間以内にPythonを効率的に学習する方法は次のとおりです。1。基本的な知識を確認し、Pythonのインストールと基本的な構文に精通していることを確認します。 2。変数、リスト、関数など、Pythonのコア概念を理解します。 3.例を使用して、基本的および高度な使用をマスターします。 4.一般的なエラーとデバッグテクニックを学習します。 5.リストの概念を使用したり、PEP8スタイルガイドに従ったりするなど、パフォーマンスの最適化とベストプラクティスを適用します。

Pythonは初心者やデータサイエンスに適しており、Cはシステムプログラミングとゲーム開発に適しています。 1. Pythonはシンプルで使いやすく、データサイエンスやWeb開発に適しています。 2.Cは、ゲーム開発とシステムプログラミングに適した、高性能と制御を提供します。選択は、プロジェクトのニーズと個人的な関心に基づいている必要があります。

Pythonはデータサイエンスと迅速な発展により適していますが、Cは高性能およびシステムプログラミングにより適しています。 1. Python構文は簡潔で学習しやすく、データ処理と科学的コンピューティングに適しています。 2.Cには複雑な構文がありますが、優れたパフォーマンスがあり、ゲーム開発とシステムプログラミングでよく使用されます。

Pythonを学ぶために1日2時間投資することは可能です。 1.新しい知識を学ぶ:リストや辞書など、1時間で新しい概念を学びます。 2。練習と練習:1時間を使用して、小さなプログラムを書くなどのプログラミング演習を実行します。合理的な計画と忍耐力を通じて、Pythonのコアコンセプトを短時間で習得できます。

Pythonは学習と使用が簡単ですが、Cはより強力ですが複雑です。 1。Python構文は簡潔で初心者に適しています。動的なタイピングと自動メモリ管理により、使いやすくなりますが、ランタイムエラーを引き起こす可能性があります。 2.Cは、高性能アプリケーションに適した低レベルの制御と高度な機能を提供しますが、学習しきい値が高く、手動メモリとタイプの安全管理が必要です。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター

メモ帳++7.3.1
使いやすく無料のコードエディター

PhpStorm Mac バージョン
最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境
