>CMS 튜토리얼 >Dedecms >Dedecms 컬렉션을 사용하는 방법

Dedecms 컬렉션을 사용하는 방법

(*-*)浩
(*-*)浩원래의
2019-07-16 15:04:203911검색

Dreamweaver 공식 웹사이트를 예로 들어보겠습니다. 웹마스터 아카데미에서 PHP 튜토리얼 칼럼을 모아서 목록 주소 http://www.dedecms.com/web-art/PHP_jiaocheng을 엽니다.

Dedecms 컬렉션을 사용하는 방법

백엔드에 로그인하고 "컬렉션 노드 관리"를 입력하고 새 노드를 생성한 다음 콘텐츠 모델을 "일반 기사"로 선택합니다.

1. 노드의 기본 정보를 설정합니다 (추천 학습: dedecms tutorial)

먼저 기억하기 쉬운 노드 이름을 입력하고, 대상 페이지 인코딩을 GB2312로 선택하고, 안티 핫링크 모드는 대상 사이트가 이를 수행하지 않기 때문에 제한되며, 이 항목은 수정되지 않으며 시스템 기본 시간 초과는 10초입니다.

2. 목록 URL 획득 규칙 설정

이 단계에서는 몇 가지 설정을 하고, 기사 목록 주소를 가져오고, 대상 사이트 목록 페이지로 돌아가서 페이지 간의 변경 사항을 관찰하면 "14_" 이후의 숫자는 정기적인 증분 변경입니다.

홈페이지: http://www.dedecms.com/web-art/PHP_jiaocheng/list_14_1.html

중간: http://www.dedecms.com/web-art/PHP_jiaocheng/list_14_(*).html

마지막 페이지: http://www.dedecms.com/web-art/PHP_jiaocheng/list_14_172.html

페이징 주소를 복사하고 "컬렉션 노드 추가" 페이지로 돌아가서 "소스 속성"을 "일괄 생성"으로 선택합니다. "URL"을 나열하고 "일치하는 URL"에 주소를 붙여넣고 일반 변경 사항을 (*)로 수정하고 "일괄 생성 주소 설정"(*)에 1~172를 입력합니다. 이는 첫 번째 페이지를 생성한다는 의미입니다. 목록의 마지막 172개 페이지의 모든 주소입니다.

테스트해 보세요. 팝업 상자에서 172개의 주소 레코드가 루프 아웃되고 원활하게 설정되는 것을 볼 수 있습니다. 때때로 얻기 어려운 목록이 있는 경우 불규칙한 주소를 "수동으로 지정한 목록 URL" 텍스트 상자에 복사하여 수집할 수 있습니다.

3. 기사 URL 일치 규칙 설정

위에서 기사 주소 소스 페이지가 지정되었습니다. 이 단계에서는 이러한 페이지 중에서 요구 사항을 충족하는 기사 주소 페이지를 찾아야 합니다. 목록 페이지를 열고 왼쪽 열의 상자에 필요한 모든 주소가 포함되어 있는지 확인하세요. 이 경우 "영역 시작 부분의 HTML" 및 "끝 부분의 HTMLL"을 사용하여 명확하게 구분되는 페이지를 필터링할 수 있습니다. 지역" 설정을 참조하세요.

그러나 다른 방법도 사용할 수 있습니다. 다양한 링크 주소로 마우스를 이동하고 브라우저의 왼쪽 하단에 표시된 전체 주소를 관찰합니다. 필요한 주소에는 모두 "PHP_jiaocheng/20"이 포함되어 있으며 "Must Contain"을 채웁니다.

두 가지 방법 모두 주소를 필터링할 수 있으며, 일반 규칙을 추가하면 필터링할 수 없는 주소가 거의 없습니다. 마지막으로 확인하고 다음 단계인 "웹 콘텐츠 획득 규칙"으로 이동합니다.

Dedecms 컬렉션을 사용하는 방법

4. 웹페이지 콘텐츠 획득 규칙

위에서는 목록 설정 방법을 소개합니다. 다음으로 컬렉션이 요리를 제공하는 경우 위의 기능을 입력합니다. 세 단계는 단지 애피타이저가 메인 코스의 전조 역할을 하는 것입니다. 다음 단계는 대상 사이트에서 기사 콘텐츠를 수집하는 방법을 소개하는 것입니다. 이 단계는 전체 컬렉션의 가장 핵심적인 부분입니다.

계속해서 DreamWeaver의 PHP 튜토리얼 목록으로 돌아가서 목록에서 기사를 엽니다. 여기에서는 "정규 표현식" 기사를 예로 들어 보겠습니다. http://www.dedecms.com/web-art/PHP_jiaocheng /20070420 /38633.html, 이 주소를 "미리보기 URL"에 복사하세요; 드림위버의 모든 글은 페이지가 매겨져 있지 않기 때문에 여기서 페이지 매김을 설정할 필요도 없고, 바로 "고정 컬렉션 프로젝트" 페이지로 들어가실 수 있습니다

( 참고: 수집하는 콘텐츠에 페이징이 포함된 경우 페이징 탐색 부분에서 일치 규칙만 설정하면 됩니다. 여기에 나열된 모든 페이징 목록, 상단 및 하단 페이지 또는 콘텐츠에 따라 설정할 수 있는 불완전한 페이징 목록이 있습니다.)

다음은 인용 내용입니다. 내용:

모든 페이지가 매겨진 목록: 페이지가 매겨진 콘텐츠는 아래 그림과 같이 모든 링크가 나열됩니다.

상하 페이지 형식 또는 불완전한 페이지 매김 목록: 단일 페이지에 현재 페이지가 매겨진 콘텐츠가 표시됩니다. 불완전한 목록 양식

5. 고정 컬렉션 항목

이 단계에 들어가서 페이지 소스 코드 분석을 시작하세요. 컬렉션은 필요한 콘텐츠를 얻기 위해 HTML 페이지의 구조를 분석하는 것 이상입니다. 따라서 HTML 코드에 대한 어느 정도 이해가 필요하며, 페이지 소스 파일을 보고 필요한 내용을 찾을 수 있어야 하며, 분석을 위해 여러 페이지를 더 열어서 유사점을 찾는 것이 가장 좋습니다.

모든 사람에게 Dreamweaver 분석을 사용하도록 권장합니다. 페이지 코드를 분석할 때 검색 기능을 자주 활용하면 훨씬 편리할 것입니다. 특히 태그를 찾은 후에는 중복된 부분이 있는지 검색해 분석 오류를 줄여보세요.

1) 기사 제목: 이 페이지의 제목은 "정규 표현식"입니다. 복사한 후 Dreamweaver에서 Ctrl+F를 누르면 전체 30개의 기록이 있습니다. 고유성 때문에 여기서는 105행에서 "

정규식

" 태그를 선택하고 이를 "Fixed Collection Project" 기사 제목의 일치 규칙에 복사한 다음 키워드 "[ 콘텐츠]" 제목, 최종적으로는

[콘텐츠]

입니다.

2) 작성자: 작성자를 키워드로 계속 검색하세요. 고유한 항목이 있는 줄은 110개뿐입니다. 일치 규칙에 사용 전후의 태그와 함께 복사하고, 수집할 위치를 바꾸려면 [content]를 사용하세요.

3) 출처 : 위와 동일 109행에서 라벨을 찾아 복사한 후, [content]를 이용하여 수집할 위치를 바꿔주세요. 소스에 제거하려는 하이퍼링크 태그가 포함되어 있는 경우 필터 규칙 상자에 다음 규칙을 입력하여 필터링합니다.

<a>]*)> <br></a><br>

4) 릴리스 시간: 위와 동일, 111행에서 복사, 붙여넣기 및 수정.

5) 기사 내용: 기사 내용의 시작 부분을 검색합니다. 예를 들어 "Part One"은 118행에서 대상을 찾습니다. 상태 표시줄

을 클릭하면 모든 기사 내용을 선택할 수 없습니다. 이전

. 파란색 콘텐츠는
라는 것을 알고 모든 콘텐츠를 선택합니다. 콘텐츠 앞뒤의 태그를 일치 규칙에 복사합니다.

이제 콘텐츠 필터링 설정이 완료되었습니다.

6. 노드 수집

수집 노드가 한 번에 완료되어 테스트에 성공하면 안내에 따라 버튼을 눌러 직접 수집합니다. 단, 노드가 이전에 작성되어 있는 경우에는 확인이 필요합니다. "노드 관리 페이지" 노드를 수집하려면 "수집" 버튼을 눌러 수집하세요. 모든 노드에서 새로운 콘텐츠를 수집하려면 모니터링 수집 페이지로 이동하여 운영하세요.

각 페이지 모음마다 페이지당 수집되는 데이터 수를 설정할 수 있습니다. 일반적으로 너무 높게 설정하지 마세요. 그렇지 않으면 시스템이 처리하지 못하고 일부 부분을 수집하지 못할 수 있으므로 초과하지 않는 것이 좋습니다. 15.

스레드 수는 매번 동시에 수집하는 스레드 수를 의미합니다. 스레드 수를 늘리면 수집 속도가 빨라지지만, 서버 리소스 점유도 늘어나므로 주의해서 사용하시기 바랍니다. 대상 사이트에 새로 고침 방지 제한이 있는 경우 대상 사이트의 새로 고침 방지 제한 시간에 따라 여기에서 설정할 수 있습니다. 그렇지 않은 경우 기본값은 0초입니다.

추가 옵션 이 세 가지 설정은 말 그대로 이해하기 쉬우므로 실제 필요에 따라 선택할 수 있습니다.

수집이 완료되었습니다.

더 많은 WordPress 관련 기술 기사를 보려면 wordpress 튜토리얼 칼럼을 방문하여 알아보세요!

위 내용은 Dedecms 컬렉션을 사용하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.