Dreamweaver システムは、一般的に使用される記事システムとしては比較的操作が簡単です。数ある機能の中でも収集システムは、収集領域の設定ミスや収集ルールの編集ミス、収集後の空白など、初心者にとっては頭の痛い問題かもしれません。今回は、起こりやすいトラブルについて詳しく解説していきます。
まず、バックグラウンドでログインし、[コレクション] -- [コレクション ノード管理] をクリックして、コレクション管理設定インターフェイスに入ります。
次の 2 つがあります。ここでのオプションの 1 つは、元のノードを変更する (主に、収集やその他の設定が不可能になった以前の設定エラーが原因) です。1 つは、ノード (ほとんどが新しいノード) を直接追加し、クリックして次のステップです。 「通常記事」を選択して確定します。
次に、ノード名を入力します (インポート中のエラーを避けるために、列に関連した名前にすることをお勧めします)。実際の名前を入力するだけです。次に最初のキーポイントは、ターゲットページのエンコーディングです。自分の Web ページではなく、ターゲット Web ページのコードを入力する必要があります。表示方法: 対象の Web サイトの任意のページを開き、空白スペースを右クリックし、ソース コードを表示します (通常、エンコードは最初の数行にあります)
次に入力します。リスト ルールの 1 つは、URL のバッチ生成です。一般に、強力なルールがある場合、または上から下まで収集する必要がある場合に適しています。たとえば、次の列をターゲットにします:
最初のページのリスト: http://youqubu.cn/tansuo/list_5_1.html
2 番目のページのリスト: http://youqubu.cn/tansuo /list_5_2.html。
このリスト ルールで最も重要なことは、類似点と相違点を見つけることです。類似点を埋め、一致する記号 (変数) で相違点を補います。実際、この比較から、 http://youqubu.cn/tansuo/list_5_ .html はすべて同じであることがわかり、変数は 1.2.3.4 になります。 。したがって、一致する URL は
http://youqubu.cn/tansuo/list_5_(*).html です。
#もう 1 つのリスト ルールは、リスト URL を手動で指定するもので、より一般的です。収集する必要があるすべてのアイテムのリストページに記入するだけです。 (特定のページだけを収集する場合や、より多くの変数を含むページを収集する場合に適しています)
注: 多くの Web サイトのコラムのホームページは、http://xxx.xx/xxx/ の形式で表示されます。以下の可変項目が欠落していることが判明しました。したがって、変数項目を見つける方法は、リストの次のページをクリックします。まだ不明な場合は、次のページをクリックしてください。リストの 2 ページ目と 3 ページ目を比較すると、次のステップでも変数項目を見つけることができます。 4.
このステップでは、リスト内の記事のすべてのアドレスを取得します。リスト ページからすべての記事ページのアドレスを取得する必要があります。 http://youqubu.cn/tansuo/list_5_1.html のリストを例として見てみましょう。リストの下の最初の記事のタイトルをコピーし、リスト ページの空白スペースを右クリックします。ソース コードを表示し、Ctrl F を押して検索し、コピーしたタイトルを貼り付け、ソース コード内の位置を見つけます。テキスト。実際、これには一定のルールがあります。次に、ソース コードのどの部分が一意で、リスト内のすべての記事のアドレスを含めることができるかを見つけます (注: 開始コードの検索はリストの最初の記事のタイトルから開始して上に進み、終了コードの検索は行う必要があります)リストの最初の記事のタイトルから開始する必要があります (下から見てください)。このソースコードからそれがわかります。開始コード:
- および終了コード:
下一步的缩略图我们可以选择不采集,因为织梦本身是会把第一张图片默认为缩略图的,这个看实际情况。下面是对网址的筛选:包含的意思是:这个步骤六选择的代码区间的文章网址只有包含了这部分才会被采集(这里有两种情况:1。譬如上面演示的地址,它是以超链接的形式,不是完整的网址,所以这种情况千万不要填写包含。2.就是列表涉及到多个链接的,比如标签这样的,最好填写包含,填写你想要的网址有的,不想要的网址没有的部分)。然后下一步。这边会列出因为上面填写的规则所采集到的列表页中文章的网址。如果是空白:我们可以先删除必须包含和不能包含,点击下一步测试,如果能采集到连接但是很乱,那就是你这步包含相关填错了;如果这样操作还是没有采集到东西,那就是“包含文章网址区域”这步填写错了。
分页规则也主要分两种:一种是直接填写默认代码:{path}{file}_{p}{ext} 然后选择分页列表规则(如下图)。 另一种是打开目标文章页,找到有上下几页的文章,右键查看源码,找到这部分代码,填写方式和文章页网址区域的方法一样,然后右边选择:全部列出的分页列表。(第二种方法要注意,因为涉及到多页,填写首尾代码的时候一定要多翻几张,然后查看源代码,把你认为共同的代码在多个页面查找下,因为可能出现你选择的代码在首页是可以找到的,在2.3四页后面就没有了,那就说明这个不是公用代码,你填上去也会导致采集不到分页的)
分页设置好后,我们主要设置标题规则和内容规则。时间规则和作者、来源规则这里不细说,这个不是所有人都需要的,这步谈到的规则都可以获取区间的方式得到内容或者填入固定的词语。首先是标题规则:我们以:http://youqubu.cn/tansuo/362.html。这个文章页来做说明。我们先复制标题名字,然后在源代码中查找。示例中查找我们可以发现这里有五个相同的部分,而且冲对比中发现,这个其实是有两种写法的。1.完全包含这个文字的代码区间,不带其他文字:
DedeCMS チュートリアル 列を参照してください。学ぶために!
以上がdedecms コレクション ルールの作成方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

DVWA
Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

メモ帳++7.3.1
使いやすく無料のコードエディター

ホットトピック









