Heim  >  Artikel  >  Backend-Entwicklung  >  Stellen Sie kurz die XML-Dokumenterstellungsmethode des Baidu News Open Protocol vor

Stellen Sie kurz die XML-Dokumenterstellungsmethode des Baidu News Open Protocol vor

黄舟
黄舟Original
2017-03-14 16:06:162247Durchsuche

Protokollübersicht öffnen Die Verwendung dieses offenen Protokolls wird mehr Verkehr auf Ihre Website bringen! „Internet News Open Protocol“ ist ein von Baidu News Search formulierter Such- Index--Standard für die Einbeziehung von Nachrichtenquellen. Websites können veröffentlichte Nachrichteninhalte in XML erzeugen, die diesem offenen Protokoll folgen. Webseiten im -Format (unabhängig vom ursprünglichen Format der Pressemitteilung) werden für die Suchmaschinenindizierung bereitgestellt, und die von der Website veröffentlichten Nachrichteninformationen werden automatisch und zeitnah veröffentlicht Übersicht über das offene Protokoll
Die Verwendung dieses offenen Protokolls bringt mehr Verkehr auf Ihre Website!
Das „Internet News Open Protocol“ ist der von Baidu News Search formulierte Standard für die Einbeziehung von Nachrichtenquellen in Suchmaschinen. Die Website kann den veröffentlichten Nachrichteninhalt in eine Webseite im XML-Format umwandeln, die diesem offenen Protokoll (unabhängig von der ursprünglichen Pressemitteilungsform) für die Suchmaschinenindizierung folgt, und die Baidu-Suchmaschine aktiv und zeitnah über die von der Website veröffentlichten Nachrichteninformationen informieren .
Die Einführung des „Internet News Open Protocol“ ist gleichbedeutend damit, dass die Nachrichten der Website von Suchmaschinen abonniert werden. Über die Plattform von Baidu, der weltweit größten chinesischen Suchmaschine, können Internetnutzer in einem breiteren Umfeld häufiger darauf zugreifen Bringen Sie Neuigkeiten auf Ihre Website und sorgen Sie so für potenziellen Traffic auf Ihrer Website.
Das offene Protokoll ist ganz einfach! Mit unserer Hilfe können Sie es problemlos verwenden. Inhalt des offenen Abkommens
Das Bild unten zeigt eine Webseite im XML-Format, die in Übereinstimmung mit dem „Internet News Open Agreement“ erstellt wurde. Die Webseite listet relevante Informationen zu den von der Website veröffentlichten Nachrichten in einem Standardformat auf.
Beispiel für eine XML-Webseite:
Stellen Sie kurz die XML-Dokumenterstellungsmethode des Baidu News Open Protocol vor
XML-Tag-Beschreibung: Die mit einem Sternchen markierten sind erforderlich, die ohne Sternchen markierten sind optional. .
*7085e5d2616a356d5ecf9e268517440a – markiert den Anfang und das Ende des gesamten XML-Dateiinhalts.
*6d88e32f12c595d0a92c0477538a6c33 – Website-Adresse.
*f23cbc012a16cf9c5773f9cfa7d6c5ad——E-Mail der verantwortlichen Person. Bei Bedarf werden wir Sie unter dieser Adresse kontaktieren.
*8fbdad4f01ff120bc74aaeb3922e03f7——Aktualisierungszeitraum, in Minuten. Suchmaschinen folgen diesem Zyklus, um auf die Seite zuzugreifen, sodass die Nachrichten auf der Seite zeitnaher in Baidu News erscheinen.
*5083cbefc9e5095dae6431462e2af988——Markieren Sie den Anfang und das Ende jeder Nachrichteninformation. Die Marke enthält einzelne Nachrichteninformationen, ausgenommen Nachrichtenthemen.
*b2386ffb911b14667cb8f0f91ea547a7 – Nachrichtentitel.
*2cdf5bf648cf2f33323966d7f58a7f3f – Nachrichten-URL-Adresse, die einem einzelnen Nachrichtenartikel entspricht; wenn mehrere URLs für Nachrichten in der Paginierung vorhanden sind, entspricht dies mehreren Nachrichtenartikeln.
8b55addfb40ddf4a384b1010d729e503——Nachrichteninhalt Einführung.
*28f128881ce1cdc57a572953e91f7d0f – Vollständiger Nachrichtentext (nur einschließlich Text, ausgenommen HTML-Sprache und andere andere Zeichen). Der Zweck dieses Elements besteht darin, die Nachrichten in den Suchergebnissen immer genauer erscheinen zu lassen.
*dc0870658837139040642baa5555a380 – Verwandte Bilder im Nachrichtentext, unter Verwendung absoluter Adressen. Wenn der Nachrichtenartikel keine zugehörigen Bilder enthält, kann er leer sein. Wenn er mehrere Bilder enthält, verwenden Sie dieses Tag bitte erneut. Der Zweck dieses Elements besteht darin, relevante Bilder dieses Nachrichtenartikels in den Suchergebnissen anzuzeigen.
d1fb19bd5635c426ed7fb276fe54c405 – Ein Schlagzeilenbild, das für Nachrichten erstellt wurde, die zu Schlagzeilen werden könnten, unter Verwendung absoluter Adressen.
1c49609193281a21c4aac8fed3ad89c0 ein oder mehrere Schlüsselwörter, die den thematischen Inhalt der Nachrichten widerspiegeln, getrennt durch Leerzeichen. Dieses Element dient nur als Referenz und die Suchergebnisse hängen nicht vollständig vom Inhalt dieses Tags ab.
4598d7f2e64db4a53dc924a52a7e24ba——Nachrichtenklassifizierung, Sie können dem Klassifizierungssystem der Website folgen, am besten verwenden Sie die Klassifizierung der ersten Ebene.
b753471a94dcfff32efcf6c992a2c269 – Nachrichtenautor, der eine Institution oder eine Einzelperson sein kann.
7ec7b794fb67b00e833bee6af24cffb8——Nachrichtenquelle, also Originalmedien oder andere Institutionen.
*986e6b71e5a3a4a0e77dc3e4175cc787——Zeitpunkt der Nachrichtenveröffentlichung, konsistent mit dem Veröffentlichungszeitpunkt auf der Nachrichten-HTML-Seite. Bitte seien Sie auf die Minute genau; wenn der Veröffentlichungszeitpunkt Ihrer Website keine Stunden und Minuten erfasst, geben Sie einfach Jahr, Monat und Tag an.
Empfohlenes Zeitformat: Jahr, Monat, Tag, Stunde, Minute, Sekunde 09. November 2005 10:37:00 |. Fr, 09. November 2005 10:37:00 GMT
Verwendung des offenen Protokolls
Bevor Sie verwenden, müssen Sie die folgenden Punkte kennen: Unabhängig davon, ob Ihre Website zu einer Baidu-Nachrichtenquelle geworden ist oder noch nicht in die Baidu-Nachrichtensuche aufgenommen wurde, können Sie dieses offene Protokoll verwenden. Die Inhalte, die Sie mithilfe offener Protokolle bereitstellen, sollten alle den folgenden „Standards zur Einbeziehung von Nachrichtenquellen“ entsprechen. Das „Internet News Openness Agreement“ ist lediglich eine Hilfe und sinnvolle Ergänzung der ursprünglichen Methode zur Sammlung von Nachrichtenquellen und kein vollständiger Ersatz.
Standards für die Einbeziehung von Nachrichtenquellen:
Baidu hofft, Nachrichtenquellen zu diversifizieren und originelle Nachrichteninhalte zu fördern. Wenn es sich um eine formelle und legale Medien-Website mit einer großen Menge wertvoller Nachrichteninhalte handelt, die zeitnah aktualisiert werden kann und der Website-Server stabil und schnell ist, entspricht dies den Grundprinzipien von Baidu zur Einbeziehung von Nachrichtenquellen. Der von Baidu News Search gesammelte Inhalt umfasst verschiedene Nachrichtenberichte und Medienkommentare zu aktuellen Themen, Unterhaltung, Sport, Finanzen, Wissenschaft, Bildung, Kultur, gesellschaftlichem Leben usw., Marktinformationen und Rezensionen zu digitalen Produkten, Immobilien, Automobile usw. sowie Trends und Trends in verschiedenen Branchen, Arbeitsaktualisierungen von Organisationen usw. sind von Fachleuten verfasste oder bearbeitete chinesische Informationen, ausgenommen persönliche Informationen, Foren, Blogs, Werbung, humorvolle Witze, emotionale Geschichten, Erotik und Fotos , Standbilder, Promi-Dateien, Rezepte, Downloads,
Multimedia und andere Arten von Internetinformationen in anderen Sprachen. Sie tragen die gesamte rechtliche Verantwortung für alle von Ihnen bereitgestellten Inhalte, stellen die Authentizität und Rechtmäßigkeit der von Ihnen bereitgestellten Inhalte sicher und dürfen die Rechte Dritter nicht verletzen.

Lass uns anfangen!
Schritt 1: XML-Datei erstellen
Lesen Sie vor dem Erstellen der XML-Datei unbedingt die Einbindungsstandards für Nachrichtenquellen von Baidu News Search und
achten Sie besonders darauf : 1. Nachrichtenquellen-Websites, die in Baidu News Search enthalten sind, müssen den nationalen „Internet News Information Service Management Regulations“ entsprechen und diese strikt einhalten und das Urheberrecht des Erstellers und der Quellenwebsite während des Veröffentlichungs- und Nachdruckprozesses respektieren .
2. Zu den Website-Typen, die nicht für die Aufnahme in die Baidu News Search geeignet sind, gehören: Foren, Blogs, Unternehmenswebsites usw.
3. Die Baidu-Nachrichtensuche umfasst keine persönlichen Informationen, Werbung, Ausschreibungen, Tutorials, humorvolle Witze, emotionale Geschichten, Erotik, Fotos, Standbilder, Promi-Dateien, Rezepte, Downloads, Multimedia und andere Arten von Internetinformationen in anderen Sprachen.
4. Baidu News Search hofft, hochwertige chinesische Nachrichten einzubeziehen, schließt jedoch keine englischen und anderen nicht-chinesischen Nachrichten ein.
5. Bitte erstellen Sie eine XML-Datei gemäß dem oben veröffentlichten Inhalt des offenen Protokolls.

Weitere Anweisungen:
Zu den unterstützten Kodierungsformaten gehören GB2312, GB18030, UTF-8 und BIG5. Es wird empfohlen, das Format GB18030 oder UTF-8 zu verwenden. Sie können alle von der Website in einem bestimmten Zeitraum veröffentlichten Nachrichten in einer XML-Datei zusammenfassen oder sie nach Kanal oder Spalte in mehreren XML-Dateien zusammenfassen. Bitte halten Sie jede XML-Datei im Status der kontinuierlichen automatischen Aktualisierung
entsprechend dem Aktualisierungszyklus . Der Update-Zyklus kann jederzeit an Ihre Bedürfnisse angepasst werden. In jeder XML-Datei können bis zu 100 aktuelle Pressemitteilungen gespeichert werden. Vorherige Nachrichten müssen nicht gespeichert werden. Bitte sortieren Sie die veröffentlichten Nachrichten nach Zeit, d. h. die neuesten veröffentlichten Nachrichten stehen ganz oben, andernfalls können einige Nachrichten übersehen werden. Der XML-Tag-Inhalt darf keinen anderen Code als Text enthalten. Die Sonderzeichen in der Tabelle unten müssen in von XML definierte Escape-Zeichen umgewandelt werden. Andernfalls tritt ein Fehler auf und die Suchmaschine kann die Nachrichten auf der Seite nicht abrufen.

 

        

            

                字符

                转义后的字符

            

            

                HTML字符

                字符编码

            

            

                和(and)

                &

                &

                &

            

            

                单引号

                '

                '

                '

            

            

                双引号

                "

                "

                "

            

            

                大于号

                >

                >

                >

            

            

                小于号

                <

                &lt;

                &#60;

            

        

    

    转义字符中的"&"无需再转。

       建议您使用CDATA 部件。一个 CDATA 部件以"3005ee0b51d684587eb0f7123f28134a"标记结束。将包含代码或特殊字符的文本置于CDATA 部件内 ,就无需再对特殊字符进行转义。
第二步:验证XML文件
下面的地址提供了帮助您验证XML文件结构的多种工具:
http://www.php.cn/
http://www.php.cn/
通过验证的XML文件能够使您提供的信息更加标准,确保您发布的新闻信息不被搜索引擎遗漏。
第三步:提交XML网址
提交前请将XML文件上传到您的网站服务器,将XML文件的URL地址及其它信息输入下面对应的方框内。搜索引擎将定向访问该URL地址,当URL地址发生变化时需要重新提交。
若您的网站符合新闻源收录标准,百度新闻搜索将对您提交的数据进行测试和观察一周。如果XML文件基本按照 《互联网新闻开放协议》的要求制作但存在问题,我们会根据XML页面上提供的邮件地址与您联系。
注意:
1、 我们将对您提交的XML文件进行审核,百度新闻搜索不保证一定能收录您提交的全部内容。
2、站点名、地址为必填项,同一站点一天之内最多提交5个不同的XML文件地址。
3、提交地址后请您注意查看弹出窗口中的信息,以确认是否提交成功。
第四步:查询XML文件状态
您可以在下面的方框中输入您提交的XML文件地址,查询该文件的处理进度和反馈信息。
注意:输入的地址必须完整,即与您提交时的地址完全一致。                                                

Das obige ist der detaillierte Inhalt vonStellen Sie kurz die XML-Dokumenterstellungsmethode des Baidu News Open Protocol vor. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn