ホームページ  >  記事  >  バックエンド開発  >  Baidu News Open Protocol XML ドキュメント作成方法を簡単に紹介します。

Baidu News Open Protocol XML ドキュメント作成方法を簡単に紹介します。

黄舟
黄舟オリジナル
2017-03-14 16:06:162224ブラウズ

オープンプロトコルの概要 このオープン プロトコルを使用すると、Web サイトへのトラフィックが増加します。 「インターネット ニュース オープン プロトコル」は、百度ニュース 検索 によって策定された検索 インデックス エンジンのニュース ソース コレクション標準です。Web サイトは、公開されたニュース コンテンツを、このオープン プロトコルに準拠した XML 形式の Web ページに作成できます (元のニュース リリースとは独立しています)。形式)を検索エンジンのインデックスに登録し、Web サイトで公開されるニュース情報を自動的かつタイムリーに提供できます。 オープン プロトコルの概要
このオープン プロトコルを使用すると、Web サイトへのトラフィックが増加します!
「インターネット ニュース オープン プロトコル」は、Baidu News Search によって策定された検索エンジンのニュース ソース包含標準です。Web サイトはニュース コンテンツを公開できます。 Web を作成します。このオープン プロトコル (元のニュース リリース フォームとは独立した) に準拠した XML 形式のページを検索エンジンのインデックス作成に使用し、Web サイトによってリリースされたニュース情報を Baidu 検索エンジンに積極的かつタイムリーに通知します。
「インターネット ニュース オープン プロトコル」を採用することは、世界最大の中国の検索エンジンである百度のプラットフォームを通じて、ウェブサイトのニュースが検索エンジンによって購読されることに相当し、ネチズンはより広範囲かつより高い頻度であなたにアクセスできるようになります。 Web サイトのニュースにより、Web サイトに潜在的なトラフィックがもたらされます。
オープンプロトコルは非常に簡単で、私たちの助けを借りて簡単に使用できます。 オープン プロトコルのコンテンツ
下の図は、「インターネット ニュース オープン プロトコル」に準拠して作成された XML 形式の Web ページを示しています。この Web ページには、Web サイトが公開するニュースに関する関連情報が標準形式でリストされています。
XML Web ページの例:
Baidu News Open Protocol XML ドキュメント作成方法を簡単に紹介します。
XML タグの説明: アスタリスクが付いているものは必須であり、アスタリスクの付いていないものはオプションです。
*cda14e2a0e0fb84f90a700c41ccf0327 - XML ファイルの内容全体の始まりと終わりをマークします。
*6d88e32f12c595d0a92c0477538a6c33—— サイトのアドレス。
*f23cbc012a16cf9c5773f9cfa7d6c5ad——担当者のメール。必要に応じてこのアドレスにご連絡させていただきます。
*a5fcace7c976e279954e0cbdb65fdd95——update期間、分単位。検索エンジンはこのサイクルに従ってページにアクセスし、ページ上のニュースがよりタイムリーに百度ニュースに表示されます。
*5083cbefc9e5095dae6431462e2af988——各ニュース情報の始まりと終わりをマークします。マークにはニューストピックスを除いた単独のニュース情報が含まれます。
*b2386ffb911b14667cb8f0f91ea547a7——ニュースのタイトル。
*2cdf5bf648cf2f33323966d7f58a7f3f—単一のニュース記事に対応するニュース URL アドレス。ページネーション ニュースに複数の URL がある場合、それは複数のニュース記事に相当します。
8b55addfb40ddf4a384b1010d729e503——ニュースコンテンツはじめに
*28f128881ce1cdc57a572953e91f7d0f—完全なニュース テキスト (HTML 言語や他の 文字を除き、テキストのみを含みます)。この項目の目的は、ニュースをより正確に検索結果に表示させることです。 *dc0870658837139040642baa5555a380——絶対アドレスを使用した、ニュース本文内の関連する
画像。ニュース記事に関連する写真がない場合は空にすることができます。複数の写真が含まれている場合は、このタグを再利用してください。この項目の目的は、このニュース記事に関連する画像を検索結果に表示することです。 c1031a07ef224264c80331fe6b862f75 - 絶対アドレスを使用して、見出しになる可能性のあるニュース用に作成された見出し画像。 6b74c4dd821657586c8208bb88db14ff—ニュースのトピック内容を反映する、スペースで区切られた 1 つ以上のキーワード。この項目は参考用であり、検索結果はこのタグの内容に完全に依存するものではありません。 c58a1130350e5f417b7f5c3a9765ab7e——ニュースの分類。ウェブサイト独自の分類システムに従うことができますが、第 1 レベルの分類を使用するのが最善です。
48fe722b397613e801e59f453d6c9330——ニュースの著者。機関または個人の場合があります。
e02da388656c3265154666b7c71a8ddc——ニュースソース、つまりオリジナルメディアまたはその他の機関。
*986e6b71e5a3a4a0e77dc3e4175cc787——ニュースのリリース時刻。ニュース HTML ページのリリース時刻と一致します。ウェブサイトの公開時刻が分単位で記録されていない場合は、年、月、日のみを入力してください。
推奨される時刻形式: 年、月、日、時、分、秒
例: 2005-11-09 10:37|2005/11/09 10:37:00|2005.11.09 10:37:00|
2005 年 11 月 9 日 10:37:00 | Fri, 09 Nov 2005 10:37:00 GMT
使用可能なオープンプロトコル
使用する前に次の点を知っておく必要があります: Web サイトが Baidu ニュース ソースになっているか、Baidu ニュース検索にまだ含まれていないかに関係なく、このオープン プロトコルを使用できます。 オープン プロトコルを使用して提供するコンテンツはすべて、次の「ニュース ソースの包含基準」に準拠する必要があります。 「インターネット ニュース オープン性協定」は、完全に置き換えるものではなく、元のニュース ソース収集方法を補助し有用に補足するものにすぎません。
ニュースソースの包含基準:
Baidu はニュースソースを多様化し、オリジナルのニュースコンテンツを奨励したいと考えています。貴重なニュース コンテンツを大量に掲載し、タイムリーに更新できる正式かつ合法的なメディア ウェブサイトであり、ウェブサイトのサーバーが安定していて高速であれば、ニュース ソースを含めるという百度の基本原則に沿っています。 百度ニュース検索が収集するコンテンツには、時事問題、エンターテイメント、スポーツ、金融、科学、教育、文化、社会生活などに関するさまざまなニュースレポートやメディアのコメント、デジタル製品、不動産、自動車などの市場情報やレビューが含まれます。など、さまざまな業界、団体の動向や価格、団体の最新情報などは専門家によって執筆または編集された中国語情報であり、個人情報、フォーラム、ブログ、広告、ユーモアジョーク、感動的な物語、エロティカ、写真、静止画は含まれません。 、有名人のファイル、レシピ、ダウンロード、 マルチメディア
および他の種類のインターネット情報を他言語で提供します。 あなたは、提供するすべてのコンテンツに対するすべての法的責任を負い、提供するコンテンツの信頼性と合法性を保証し、第三者の権利を侵害してはなりません。
始めましょう!

ステップ 1: XML ファイルを作成します
XML ファイルを作成する前に、Baidu News Search のニュース ソースの包含基準を必ずお読みになり、特別な注意を払ってください
:
1. Baidu News Search に含まれるニュース ソースの Web サイトは、次のことを行う必要があります。国の「インターネットニュース情報サービス管理規則」を遵守し、これを厳格に遵守し、ニュースリリースおよび転載に際し、作成者およびソースWebサイトの著作権を尊重します。 2. Baidu ニュース検索に含めるのに適さない Web サイトの種類には、フォーラム、ブログ、企業 Web サイトなどが含まれます。 3. Baidu ニュース検索には、個人情報、広告、入札、チュートリアル、ユーモアのあるジョーク、感情的なストーリー、エロティカ、写真、静止画、有名人のファイル、レシピ、ダウンロード、マルチメディア、および他の言語での他の種類のインターネット情報は含まれません。
4. Baidu News Search では、質の高い中国語ニュースを含めたいと考えていますが、英語やその他の中国語以外のニュースは含めていません。
5. 上記で公開されているオープンプロトコルの内容に従ってXMLファイルを作成してください。

その他の指示:

サポートされているエンコード形式には、GB2312、GB18030、UTF-8、および BIG5 が含まれます。GB18030 または UTF-8 形式を使用することをお勧めします。 Web サイトが一定期間内に発表したすべてのニュースを 1 つの XML ファイルに含めることも、チャネルまたはコラムごとに複数の XML ファイルに含めることもできます。 各XMLファイルは更新周期に従って継続的かつ自動更新な状態にしておいてください。更新サイクルは、必要に応じていつでも調整できます。 各 XML ファイルには、最新のニュース リリースを最大 100 件保存できます。
以前のニュースを保存する必要はありません
。 リリースされたニュースを時間順に並べ替えてください。つまり、最新のニュースが一番上に表示されます。そうしないと、一部のニュースが見逃される可能性があります。 XML タグのコンテンツには、テキスト以外のコードを含めることはできません。以下の表の 特殊文字 は、XML で定義されたエスケープ文字に変換する必要があります。そうしないと、エラーが発生し、検索エンジンがページ上のニュースを取得できなくなります。

 

        

            

                字符

                转义后的字符

            

            

                HTML字符

                字符编码

            

            

                和(and)

                &

                &

                &

            

            

                单引号

                '

                '

                '

            

            

                双引号

                "

                "

                "

            

            

                大于号

                >

                >

                >

            

            

                小于号

                <

                &lt;

                &#60;

            

        

    

    转义字符中的"&"无需再转。

       建议您使用CDATA 部件。一个 CDATA 部件以"3005ee0b51d684587eb0f7123f28134a"标记结束。将包含代码或特殊字符的文本置于CDATA 部件内 ,就无需再对特殊字符进行转义。
第二步:验证XML文件
下面的地址提供了帮助您验证XML文件结构的多种工具:
http://www.php.cn/
http://www.php.cn/
通过验证的XML文件能够使您提供的信息更加标准,确保您发布的新闻信息不被搜索引擎遗漏。
第三步:提交XML网址
提交前请将XML文件上传到您的网站服务器,将XML文件的URL地址及其它信息输入下面对应的方框内。搜索引擎将定向访问该URL地址,当URL地址发生变化时需要重新提交。
若您的网站符合新闻源收录标准,百度新闻搜索将对您提交的数据进行测试和观察一周。如果XML文件基本按照 《互联网新闻开放协议》的要求制作但存在问题,我们会根据XML页面上提供的邮件地址与您联系。
注意:
1、 我们将对您提交的XML文件进行审核,百度新闻搜索不保证一定能收录您提交的全部内容。
2、站点名、地址为必填项,同一站点一天之内最多提交5个不同的XML文件地址。
3、提交地址后请您注意查看弹出窗口中的信息,以确认是否提交成功。
第四步:查询XML文件状态
您可以在下面的方框中输入您提交的XML文件地址,查询该文件的处理进度和反馈信息。
注意:输入的地址必须完整,即与您提交时的地址完全一致。                                                

以上がBaidu News Open Protocol XML ドキュメント作成方法を簡単に紹介します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。