搜尋
首頁後端開發XML/RSS教程簡單介紹百度新聞開放協議XML文件製作方法

開放協定概述 使用此開放協議,將會為您的網站帶去更多流量! 《網路新聞開放協定》是百度新聞搜尋制定的搜索引擎新聞動態收錄標準,網站可將發佈的新聞內容製作成遵循此開放協定的XML 格式的網頁(獨立於原有的新聞發布形式)供搜尋引擎索引,將網站發佈的新聞資訊主動、及 開放協議概述
使用此開放協議,將會為您的網站帶去更多流量!
《互聯網新聞開放協議》是百度新聞搜尋制定的搜尋引擎新聞源收錄標準,網站可將發佈的新聞內容製作成遵循此開放協議的XML格式的網頁(獨立於原有的新聞發布形式)供搜尋引擎索引,將網站發布的新聞資訊主動、及時地告知百度搜尋引擎。
採用了《互聯網新聞開放協議》,就相當於網站的新聞被搜尋引擎訂閱,透過百度——全球最大的中文搜尋引擎這個平台,網友將有可能在更大範圍內更高頻率地訪問到您網站的新聞,進而為您的網站帶來潛在的流量。
開放協定非常簡單! 您可以在我們的幫助下輕鬆使用。 開放協議內容
下圖為遵照《網路新聞開放協議》製作的XML格式的網頁,網頁上依照標準格式列出了網站發佈的新聞的相關資訊。
XML網頁範例:
簡單介紹百度新聞開放協議XML文件製作方法
XML標籤說明: 其中帶有星號標記的為必選項,未帶星號標記為可選項。
*document>-標記整個XML檔案內容的開始和結束。
*——網站位址。
*——負責人員的Email。當有必要時,我們透過這個地址與您聯繫。
*datePeri>——更新週期,以分鐘為單位。搜尋引擎將遵照此週期造訪該頁面,使頁面上的新聞更及時地出現在百度新聞中。
*——標記每篇新聞資訊的開始和結束。標記內為單篇新聞訊息,不包括新聞專題。
*——新聞標題。 <br>*<link>——新聞url地址,與單篇新聞一一對應;若<a href="http://www.php.cn/php/php-tp-paging.html" target="_blank">分頁</a>的新聞存在多個URL,相當於多篇新聞。 <br><description>——新聞內容<a href="http://www.php.cn/code/7126.html" target="_blank">簡介</a>。 <br>*<text>-完整的新聞正文(只包含正文文字,不包含HTML語言等<a href="http://www.php.cn/html5/html5-3-mip-normal.html" target="_blank">其它</a>字元)。此項的目的是使該篇新聞更多、更準地出現在搜尋結果中。 <br>*<image>——新聞正文內相關<a href="http://www.php.cn/css/css-rwd-images.html" target="_blank">圖片</a>,採用絕對地址。若該篇新聞無相關圖片,可為空;若含有多張圖片,請重複使用該標籤。此項的目的是讓該篇新聞的相關圖片展現在搜尋結果中。 <br>headlineImg>——為有可能成為頭條的新聞製作的頭條圖,採用絕對地址。 <br>keyw<a href="http://www.php.cn/wiki/1360.html" target="_blank">ord</a>s>——反映新聞主題內容的一個或多個關鍵字,關鍵字之間以空格隔開。此項目僅作為參考,檢索結果不完全依賴此標籤中的內容。 <br><category>——新聞分類, 可以遵循網站本身的分類體系,最好是一級分類。 <br><author>——新聞作者,可以為機構或個人 。 <br><source>——新聞來源,即原創媒體或其它機構 。 <br>*<pubdate>-新聞發佈時間,與該篇新聞HTML頁面上的發佈時間一致。請精確到分鐘;若您網站的發佈時間未記錄小時分鐘,提供年月日即可。 <br>建議時間格式:年月日小時分鐘秒<br>如:2005-11-09 10:37|2005/11/09 10:37:00|2005.11.09 10:37:00|<br> 2005年11月09日10時37分00秒|Fri, 09 Nov 2005 10:37:00 GMT<br>開放協議使用<br><strong>使用之前</strong>,<strong>您需要了解以下幾點:</strong>    無論您的網站已經成為百度動態消息來源,或是尚未被百度新聞搜尋收錄,都可以使用此開放協議。    您使用開放協議提供的內容應全部符合以下《新聞動態收錄標準》。    《網路新聞開放協定》只是原始動態消息收錄方式的一種協助與有益補充,而非完全取代。 <br><strong>新聞源收錄標準:<br></strong>百度希望新聞源多樣化,鼓勵原創新聞內容。如果是具有大量有價值的新聞內容並能及時更新的正規、合法媒體網站,且網站伺服器穩定、高速,就符合了百度收錄新聞源的<a href="http://www.php.cn/html/html-yuanze.html" target="_blank">基本原則</a>。 <br>百度新聞搜尋收錄的內容包括時政、娛樂、體育、財經、科教文化、社會生活等各類新聞報道及媒體評論,數碼產品、房產、汽車等行情資訊及評測,各行業的動態及行情,組織機構的工作動態等,是由專業人士撰寫或編輯的中文信息,不包括發布的個人信息、論壇、博客、廣告、幽默笑話、情感故事、情色、寫真、劇照、明星檔案、食譜、下載、<a href="http://www.php.cn/code/9304.html" target="_blank">多媒體</a>等其它類型、其它語言互聯網資訊。 <br>您應對提供的全部內容承擔一切法律責任,保證您提供內容的真實性、合法性,並不得侵犯任何第三方的權益。 <br><strong>下面就開始吧! <br></strong><strong>第一步:建立XML檔案<br></strong>請您在建立XML檔案前務必閱讀百度新聞搜尋的新聞源收錄標準,並<strong>特別注意</strong>: <br> 1、百度新聞搜尋收錄的新聞源網站必須符合及嚴格遵守國家《網路新聞資訊服務管理規定》,並在新聞發布和轉載過程中尊重創作人和源網站的著作權。 <br> 2、百度新聞搜尋不適合收錄的網站類型包括:論壇、部落格、公司網站等。 <br> 3、百度新聞搜尋不收錄個人資訊、廣告、招標、教學、幽默笑話、情感故事、情色、寫真、劇照、明星檔案、食譜、下載、多媒體等其它類型、其它語言網路資訊。 <br> 4、百度新聞搜尋希望收錄高品質的中文新聞,不收錄英文等其它非中文新聞。 <br> 5、請依照上述的開放協議內容製作XML檔。 <br><strong>其它說明:<br></strong>#    支援的編碼格式有GB2312、GB18030、UTF-8、BIG5,建議使用GB18030或UTF-8格式。    您可以將網站某一時段發佈的全部新聞放在一個XML檔案中,也可以分頻道或欄位放在多個XML檔案中。    請保持每個XML檔案處於按更新週期持續自動更新<a href="http://www.php.cn/code/8243.html" target="_blank">狀態</a>。更新周期可隨時依照您的需求調整。    每個XML檔案至多存放最新發布的100條新聞,<span style="FONT-SIZE: 10.5pt; FONT-FAMILY: 宋体">無需保存先前的新聞</span>。    請將發佈的新聞依照時間排序,即最新發佈的新聞在最上端,否則可能有新聞被遺漏。    XML標籤內容中,除文字文字以外不能包含其它任何程式碼,下表中的<a href="http://www.php.cn/wiki/88.html" target="_blank">特殊字元</a>必須轉換為XML定義的轉義字元。否則將發生錯誤導致搜尋引擎無法取得頁面上的新聞。  </pubdate></source></author></category></image></text></description>

 

        

            

                字符

                转义后的字符

            

            

                HTML字符

                字符编码

            

            

                和(and)

                &

                &

                &

            

            

                单引号

                &#39;

                &apos;

                &#39;

            

            

                双引号

                "

                "

                "

            

            

                大于号

                >

                >

                >

            

            

                小于号

                <

                <

                <

            

        

    

    转义字符中的"&"无需再转。

       建议您使用CDATA 部件。一个 CDATA 部件以""标记结束。将包含代码或特殊字符的文本置于CDATA 部件内 ,就无需再对特殊字符进行转义。
第二步:验证XML文件
下面的地址提供了帮助您验证XML文件结构的多种工具:
http://www.php.cn/
http://www.php.cn/
通过验证的XML文件能够使您提供的信息更加标准,确保您发布的新闻信息不被搜索引擎遗漏。
第三步:提交XML网址
提交前请将XML文件上传到您的网站服务器,将XML文件的URL地址及其它信息输入下面对应的方框内。搜索引擎将定向访问该URL地址,当URL地址发生变化时需要重新提交。
若您的网站符合新闻源收录标准,百度新闻搜索将对您提交的数据进行测试和观察一周。如果XML文件基本按照 《互联网新闻开放协议》的要求制作但存在问题,我们会根据XML页面上提供的邮件地址与您联系。
注意:
1、 我们将对您提交的XML文件进行审核,百度新闻搜索不保证一定能收录您提交的全部内容。
2、站点名、地址为必填项,同一站点一天之内最多提交5个不同的XML文件地址。
3、提交地址后请您注意查看弹出窗口中的信息,以确认是否提交成功。
第四步:查询XML文件状态
您可以在下面的方框中输入您提交的XML文件地址,查询该文件的处理进度和反馈信息。
注意:输入的地址必须完整,即与您提交时的地址完全一致。                                                

以上是簡單介紹百度新聞開放協議XML文件製作方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
縮放XML/RSS處理:性能優化技術縮放XML/RSS處理:性能優化技術Apr 27, 2025 am 12:28 AM

處理XML和RSS數據時,可以通過以下步驟優化性能:1)使用高效的解析器如lxml提升解析速度;2)採用SAX解析器減少內存使用;3)利用XPath表達式提高數據提取效率;4)實施多進程並行處理提升處理速度。

RSS文檔格式:探索RSS 2.0及以後RSS文檔格式:探索RSS 2.0及以後Apr 26, 2025 am 12:22 AM

RSS2.0是一種開放標準,允許內容髮布者以結構化的方式分發內容。它包含了豐富的元數據,如標題、鏈接、描述、發布日期等,使得訂閱者能夠快速瀏覽和訪問內容。 RSS2.0的優勢在於其簡潔和擴展性。例如,它允許自定義元素,這意味著開發者可以根據需求添加額外的信息,如作者、分類等。

理解RSS:XML觀點理解RSS:XML觀點Apr 25, 2025 am 12:14 AM

RSS是一種基於XML的格式,用於發布經常更新的內容。 1.RSSfeed通過XML結構化組織信息,包括標題、鏈接、描述等。 2.創建RSSfeed需按照XML結構編寫,添加元數據如語言和發布日期。 3.高級用法可包含多媒體文件和分類信息。 4.調試時使用XML驗證工具,確保必需元素存在且編碼正確。 5.優化RSSfeed可通過分頁、緩存和保持結構簡潔來實現。通過理解和應用這些知識,可以有效管理和分發內容。

XML中的RSS:解碼標籤,屬性和結構XML中的RSS:解碼標籤,屬性和結構Apr 24, 2025 am 12:09 AM

RSS是一種基於XML的格式,用於發布和訂閱內容。 RSS文件的XML結構包括根元素、元素和多個元素,每個代表一個內容條目。通過XML解析器讀取和解析RSS文件,用戶可以訂閱並獲取最新內容。

XML在RSS中的優勢:技術深度潛水XML在RSS中的優勢:技術深度潛水Apr 23, 2025 am 12:02 AM

XML在RSS中具有結構化數據、可擴展性、跨平台兼容性和解析驗證的優勢。 1)結構化數據確保內容的一致性和可靠性;2)可擴展性允許添加自定義標籤以適應內容需求;3)跨平台兼容性使其在不同設備上無縫工作;4)解析和驗證工具確保Feed的質量和完整性。

XML中的RSS:揭示內容聯合的核心XML中的RSS:揭示內容聯合的核心Apr 22, 2025 am 12:08 AM

RSS在XML中的實現方式是通過結構化的XML格式來組織內容。 1)RSS使用XML作為數據交換格式,包含頻道信息和項目列表等元素。 2)生成RSS文件需按規範組織內容,發佈到服務器供訂閱。 3)RSS文件可通過閱讀器或插件訂閱,實現內容自動更新。

超越基礎:高級RSS文檔功能超越基礎:高級RSS文檔功能Apr 21, 2025 am 12:03 AM

RSS的高級功能包括內容命名空間、擴展模塊和條件訂閱。 1)內容命名空間擴展RSS功能,2)擴展模塊如DublinCore或iTunes添加元數據,3)條件訂閱根據特定條件篩選條目。這些功能通過添加XML元素和屬性實現,提升信息獲取效率。

XML主鏈:RSS提要如何結構XML主鏈:RSS提要如何結構Apr 20, 2025 am 12:02 AM

RSSFEEDSUSEXMLTOSSTRUCTURECONTUPDATE.1)XMLPROVIDEDIDESAHIERARCHICALSTRUCTUREFFORDATA.2)THEELEMENTDEFINESTHEEFEED'SIDENTITYANDCONTAINS ELEMENT.3)ELEMENTEMERPREPRESERPRESENTERPRESENTIVIDIVIVELPIECTUALPIECES.4)RSSSSSSSSSSSISEXTEXTENSIBLERECTICERSINCREECTINCERINCTICENT.5)

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能