>백엔드 개발 >XML/RSS 튜토리얼 >상대 Python RSS 서비스 설명

상대 Python RSS 서비스 설명

Y2J
Y2J원래의
2017-05-06 09:30:161844검색

지금까지 가장 성공적인 XML 서비스는 Python RSS입니다. 그 기원은 매우 혼란스럽기는 하지만 Python 언어는 실제로 RSS 처리에 사용할 수 있는 몇 가지 모듈을 소개합니다.

RSS는 "RDF 사이트 요약(RDF Site Summary)", "Really Simple Syndication", "Rich Site" 요약(Rich Site Summary)" 등 다양한 확장자로 표시할 수 있는 약어입니다. 아마도 다른 확장을 사용하여 이를 표현할 수 있습니다. 이렇게 혼란스러운 이름 뒤에는 그렇게 평범한 기술 분야와 관련된 놀라운 이야기가 많이 있습니다. RSS는 웹사이트에 콘텐츠 요약을 배포하는 데 사용되는 간단한 XML 형식입니다. 뉴스레터, 웹사이트

업데이트

, 이벤트 달력, 소프트웨어 업데이트, 추천 콘텐츠 컬렉션, 웹사이트 등을 포함한(이에 국한되지 않음) 다양한 정보를 공유하는 데 사용할 수 있습니다. 경매를 위한 기반 품목. Python RSS는 1999년 Netscape에서 만들어졌으며 여러 정보 소스의 콘텐츠를 Netcenter 포털에 집계할 수 있었습니다(이 포털은 현재 더 이상 존재하지 않습니다). UserLand 커뮤니티의 웹 매니아들은 RSS의 초기 지지자가 되었고 RSS는 빠르게 매우 인기 있는 형식이 되었습니다.

이러한 인기로 인해 RSS를 더 많은 곳에서 사용할 수 있도록 개선하는 것이 어려워졌습니다. 이러한 제한으로 인해 RSS 개발에 차이가 생겼습니다. 한 그룹은 수많은 RDF 도구와 모듈을 활용하기 위해 RDF 기반 접근 방식을 선택했고, 다른 그룹은 보다 컴팩트한 접근 방식을 선택했습니다.

전자를 RSS 1.0, 후자를 RSS 0.91이라고 합니다. 지난달에는 RSS의 비RDF 변종인 "RSS 2.0"이라는 새로운 버전이 등장하면서 두 회사 간의 경쟁이 더욱 심화되었습니다.

RSS 0.91과 1.0은 매우 인기가 높으며 많은 포털과 웹 로그에서 사용됩니다. 실제로 블로그 커뮤니티는 RSS의 주요 사용자이므로 XML 교환을 위한 기존 네트워크 중 일부가 인상적입니다.

이러한 네트워크는 유기적으로 성장했으며 실제로 현존하는 가장 성공적인 XML 제공 네트워크가 되었습니다. RSS는 인터넷 프로토콜을 통해 XML 정보를 교환하는 데 사용되기 때문에 XML 서비스가 됩니다(RSS 교환의 대부분은 Python RSS 문서의 간단한 HTTP GET입니다).

이 기사에서는 RSS와 함께 사용할 수 있는 다양한 Python 도구 중 몇 가지만 소개했습니다. RSS에 대한 기술적인 소개는 다른 많은 기사에서 볼 수 있으므로 제공하지 않습니다.

(참고자료 참조). 먼저 RSS 지식에 잠시 익숙해지고 XML을 이해하는 것이 좋습니다. RDF를 이해할 필요는 없습니다. [RSS는

WSDL

대신 XML 설명을 사용하므로 RSS를 "웹 서비스"가 아닌 "XML 서비스"로 취급합니다. - 편집자 주 ] Mark Nottingham이 작성한 RSS.py는 RSS 처리를 위한 Python 라이브러리입니다. 매우 완전하고 잘 작성되었습니다. Python 2.2와 PyXML 0.7.1이 필요합니다.

설치

는 매우 간단합니다. Mark의 홈페이지에서 Python 파일을 다운로드하여 PYTHONPATH에 복사하기만 하면 됩니다. 대부분의 RSS.py 사용자는 RSS.py가 제공하는 두 가지 클래스인 CollectionChannel과 TrackingChannel에만 신경 쓰면 됩니다. 두 클래스 중 후자가 더 유용한 것 같습니다. TrackingChannel은 각 항목의 키워드로

인덱스된 모든 RSS 데이터를 포함하는 데이터 구조입니다. CollectionChannel은 유사한 데이터 구조이지만 구조는 RSS 문서 자체와 더 유사합니다.

최상위 채널 정보는 항목 세부정보를 가리키는 해시 값의 URL 표현을 사용합니다. RSS.ns 구조에서 유틸리티 네임스페이스 선언을 사용할 가능성이 높습니다. 목록 1은 Python 뉴스에 대한 Python RSS 피드를 다운로드 및 구문 분석하고 간단한 목록에 있는 각 항목의 모든 정보를 인쇄하는 간단한 스크립트입니다.

TrackingChannel 인스턴스를 생성하고 http://www.python.org/channews.rdf의 RSS 피드에서 구문 분석된 데이터로 채우는 것으로 시작합니다. RSS.py는 RSS 데이터의

속성

이름으로 튜플을 사용합니다.

파이썬 시스템 프로그램의 폭넓은 응용 요령

파이썬 응용 기능 소개 그림

파이썬 응용 분야 소개

파이썬을 이용하여 프로그래밍을 위한 스크립트 언어 Editor

Python 개발 프로그램의 원리 분석

XML 처리 기술에 익숙하지 않은 사람들에게는 이 방법이 이상하게 보일 수도 있지만 실제로 RSS 원본 파일의 내용을 정확히 이해하는 데 매우 효과적인 방법입니다. 따라서 RSS 0.91 제목 요소는 동일한 이름의 RSS 1.0 요소와 다른 것으로 간주됩니다.

애플리케이션에는 원하는 경우 각 튜플의 네임스페이스 부분을 무시하여 이 차이를 무시할 수 있을 만큼 충분한 데이터가 있지만 기본 API는 원본 RSS 파일의 구문과 동일합니다. 결합되므로 이 정보는 손실되지 않습니다.

코드에서는 이 속성 데이터를 사용하여 뉴스피드의 모든 항목을 집계하여 표시합니다. 특정 항목이 어떤 속성을 가질 수 있는지 가정하지 않도록 주의하십시오. 다음 코드와 같이 safe 형식을 사용하여 속성을 검색합니다.

【관련 추천사항】

1. RSS대학 입문강의

위 내용은 상대 Python RSS 서비스 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.