Heim  >  Artikel  >  CMS-Tutorial  >  So schreiben Sie dedecms-Erfassungsregeln

So schreiben Sie dedecms-Erfassungsregeln

尚
Original
2019-07-19 11:41:223890Durchsuche

So schreiben Sie dedecms-Erfassungsregeln

Als häufig verwendetes Artikelsystem ist das Dreamweaver-System relativ einfach zu bedienen. Unter den vielen Funktionen kann das Sammlungssystem einigen Anfängern Kopfschmerzen bereiten, z. B. falsche Einstellungen für den Sammlungsbereich, falsche Bearbeitung von Sammlungsregeln und Leerzeichen nach der Sammlung. Heute werden wir einige der Probleme, die häufiger auftreten, im Detail erläutern.

Zuerst melden wir uns im Backend an, klicken auf Sammlung – Sammlungsknotenverwaltung und rufen die Einstellungsschnittstelle für die Sammlungsverwaltung auf

So schreiben Sie dedecms-Erfassungsregeln

Es gibt zwei Optionen Hier besteht eine darin, die ursprünglichen Knoten zu ändern (hauptsächlich aufgrund früherer Einstellungsfehler, die dazu führten, dass keine Erfassung oder andere Einstellungen möglich sind), eine darin, Knoten direkt hinzuzufügen, von denen die meisten neue Knoten sind, auf sie zu klicken und dann im nächsten Schritt auszuwählen „Gewöhnlicher Artikel“ zur Bestätigung.

So schreiben Sie dedecms-Erfassungsregeln

Geben Sie dann den Knotennamen ein (es wird empfohlen, einen Namen zu verwenden, der sich auf die Spalte bezieht, um Fehler beim Import zu vermeiden). Dann der erste wichtige Punkt: Zielseitenkodierung. Sie müssen den Code der Zielwebseite eingeben, nicht Ihrer eigenen Webseite. Anzeigemethode: Öffnen Sie eine beliebige Seite der Zielwebsite, klicken Sie mit der rechten Maustaste auf die leere Stelle – Quellcode anzeigen (die Codierung befindet sich normalerweise in den ersten paar Zeilen)

So schreiben Sie dedecms-Erfassungsregeln

Dann ausfüllen Bei den Listenregeln handelt es sich um eine Batch-Generierung von URLs, die im Allgemeinen für diejenigen geeignet ist, die starke Regeln haben oder von oben nach unten erfasst werden müssen. Wir zielen beispielsweise auf diese Spalte ab:

Liste der ersten Seite: http://youqubu.cn/tansuo/list_5_1.html

Liste der zweiten Seite: http://youqubu.cn/tansuo /list_5_2.html.

Das Wichtigste an dieser Listenregel ist, Ähnlichkeiten und Unterschiede zu finden. Füllen Sie die Ähnlichkeiten aus und ergänzen Sie die Unterschiede mit passenden Symbolen, die Variablen sind. Tatsächlich können wir aus diesem Vergleich erkennen, dass http://youqubu.cn/tansuo/list_5_ .html alle gleich sind, sodass die Variable 1.2.3.4 ist. . Die passende URL lautet also:

http://youqubu.cn/tansuo/list_5_(*).html.

So schreiben Sie dedecms-Erfassungsregeln

Die andere Listenregel besteht darin, die Listen-URL manuell anzugeben, was beliebter ist. Füllen Sie einfach die Listenseite mit allen Artikeln aus, die Sie sammeln müssen. (Eher geeignet, um nur bestimmte Seiten oder Seiten mit mehr Variablen zu sammeln)

Hinweis: Die Spalten-Homepages vieler Websites werden in der Form http://xxx.xx/xxx/ angezeigt. Sie können sie mit vergleichen Oben Es wurde festgestellt, dass die folgenden variablen Elemente fehlten. So finden Sie die variablen Elemente: Klicken Sie auf die nächste Seite der Liste. Wenn Sie sich noch nicht sicher sind, klicken Sie auf die nächste Seite der Liste. Wir können die variablen Elemente auch in Schritt finden 4.

So schreiben Sie dedecms-Erfassungsregeln

Dieser Schritt besteht darin, alle Adressen der Artikel unter der Liste abzurufen. Wir müssen alle Artikelseitenadressen von der Listenseite abrufen. Nehmen wir als Beispiel die Liste unter http://youqubu.cn/tansuo/list_5_1.html. Kopieren Sie den Titel des ersten Artikels unter der Liste, klicken Sie dann mit der rechten Maustaste auf die leere Stelle der Listenseite – zeigen Sie den Quellcode an, drücken Sie Strg + F zum Suchen, fügen Sie den gerade kopierten Titel ein und suchen Sie die Position im Quellcode von der Text. Tatsächlich gibt es dafür bestimmte Regeln. Dann finden wir heraus, welcher Teil des Quellcodes eindeutig ist und die Adressen aller Artikel in der Liste enthalten kann (Hinweis: Die Suche nach dem Startcode sollte beim Titel des ersten Artikels in der Liste beginnen und nach oben gehen, und die Suche nach dem Endcode sollte mit dem Titel des ersten Artikels in der Liste beginnen. Beginnen Sie mit der Suche nach unten. Dies ist aus diesem Quellcode ersichtlich. Startcode:

    und Endcode:
    kann alle Artikellisten enthalten und der Code ist eindeutig

    So schreiben Sie dedecms-Erfassungsregeln

    下一步的缩略图我们可以选择不采集,因为织梦本身是会把第一张图片默认为缩略图的,这个看实际情况。下面是对网址的筛选:包含的意思是:这个步骤六选择的代码区间的文章网址只有包含了这部分才会被采集(这里有两种情况:1。譬如上面演示的地址,它是以超链接的形式,不是完整的网址,所以这种情况千万不要填写包含。2.就是列表涉及到多个链接的,比如标签这样的,最好填写包含,填写你想要的网址有的,不想要的网址没有的部分)。然后下一步。这边会列出因为上面填写的规则所采集到的列表页中文章的网址。如果是空白:我们可以先删除必须包含和不能包含,点击下一步测试,如果能采集到连接但是很乱,那就是你这步包含相关填错了;如果这样操作还是没有采集到东西,那就是“包含文章网址区域”这步填写错了。

    So schreiben Sie dedecms-Erfassungsregeln

    So schreiben Sie dedecms-Erfassungsregeln

    分页规则也主要分两种:一种是直接填写默认代码:{path}{file}_{p}{ext}  然后选择分页列表规则(如下图)。  另一种是打开目标文章页,找到有上下几页的文章,右键查看源码,找到这部分代码,填写方式和文章页网址区域的方法一样,然后右边选择:全部列出的分页列表。(第二种方法要注意,因为涉及到多页,填写首尾代码的时候一定要多翻几张,然后查看源代码,把你认为共同的代码在多个页面查找下,因为可能出现你选择的代码在首页是可以找到的,在2.3四页后面就没有了,那就说明这个不是公用代码,你填上去也会导致采集不到分页的)

    So schreiben Sie dedecms-Erfassungsregeln

    分页设置好后,我们主要设置标题规则和内容规则。时间规则和作者、来源规则这里不细说,这个不是所有人都需要的,这步谈到的规则都可以获取区间的方式得到内容或者填入固定的词语。首先是标题规则:我们以:http://youqubu.cn/tansuo/362.html。这个文章页来做说明。我们先复制标题名字,然后在源代码中查找。示例中查找我们可以发现这里有五个相同的部分,而且冲对比中发现,这个其实是有两种写法的。1.完全包含这个文字的代码区间,不带其他文字:

    世界神秘十大历史遗迹
    。这个很容易就可以写出规则:
    [内容]
    . 2. Das andere ist, dass der Text im Code enthalten ist, es aber auch andere ähnliche Textverwirrungen gibt. Zum Beispiel:Die zehn geheimnisvollsten historischen Relikte der Welt_Interessante und kuriose Website – Die Wunder der Welt kennen, die Wunder der Welt betrachten und ungelöste Rätsel lösen – www.youqubu.cn Es ist offensichtlich, dass es einige gibt. Es ist einzigartig, ein Teil davon ist das, was wir wollen, und der andere Teil ist universell, sodass wir einfach die Regeln schreiben können: [Content]_Interessante und neugierige Website – Die Wunder kennen die Welt, die Wunder der Welt beobachten und die ungelösten Probleme lösen. Mystery-www.youqubu.cn Warum wählen Sie hier nicht ein paar andere aus? Der Hauptgrund ist, dass es sich bei den anderen um Variablen handelt und es keine Möglichkeit gibt, sie abzurufen.

    So schreiben Sie dedecms-Erfassungsregeln

    1So schreiben Sie dedecms-Erfassungsregeln

    1So schreiben Sie dedecms-Erfassungsregeln

    Der folgende Inhalt ist derselbe, nämlich der Werbecode oder Um unnötige Dinge zu blockieren, werden hier „Filterregeln“ verwendet. Unter normalen Umständen kann alles außer IMG gefiltert werden. Wenn Sie nicht einmal Bilder möchten, wählen Sie einfach alle aus.

    1So schreiben Sie dedecms-Erfassungsregeln

    1So schreiben Sie dedecms-Erfassungsregeln

    Klicken Sie abschließend auf „Speichern“, um mit dem Sammeln von Webseiten zu beginnen. Nachdem die Sammlung abgeschlossen ist, klicken wir auf „Sammlung-Sammelknotenverwaltung“. Aktivieren Sie nach der Eingabe das Kontrollkästchen vor dem gerade erfassten Knoten, klicken Sie dann auf „Daten exportieren“, wählen Sie die Spalte aus, die Sie importieren möchten, und bestätigen Sie. (Am besten legen Sie im letzten Einstellungsschritt einen sich wiederholenden Titel fest.)

    1So schreiben Sie dedecms-Erfassungsregeln

    Weitere technische Artikel zu DedeCMS finden Sie in der Spalte DedeCMS-Tutorial lernen!

Das obige ist der detaillierte Inhalt vonSo schreiben Sie dedecms-Erfassungsregeln. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn