코어 포인트
Apache Solr는 전체 텍스트 검색, 측면 검색, 결과 강조 및 지리 공간 검색을 제공하는 강력한 검색 플랫폼입니다. HTTP를 통해 모든 프로그래밍 언어와 통합 될 수 있으며 PHP 사용자의 경우 Solarium Project 가이 통합을 단순화합니다.
Solr은 웹 서비스로 실행되어 문서의 검색 인덱스를 만듭니다. 전체 텍스트 검색을 허용하고 인덱스 검색 문서에 추가 정보를 추가합니다. 가장 유용한 기능 중 하나는 패싯 검색으로 사용자가 검색 결과를 필터링 할 수 있습니다.
Solr을 설치하려면 운영 체제에 설정하고 서버를 시작하고 관리 인터페이스를 통해 설치를 확인하는 것이 포함됩니다. 패턴은 색인화 된 문서의 필드를 정의하고 기본 디렉토리를 복사하고이를 사용자 정의하여 설정할 수 있습니다. -
Solarium은 Solr에 연결하고 쿼리를 실행하고 처리 응답을 실행하는 프로세스를 단순화하는 Solr의 클라이언트 라이브러리입니다. Composer (PHP의 종속성 관리 도구)를 사용하여 설치할 수 있습니다. 설치 후 SOLR 서버에 연결하도록 구성해야합니다.
-
Apache Solr는 Apache Lucene을 기반으로 한 엔터프라이즈 수준의 검색 플랫폼입니다. Faceted 검색, 결과 강조 및 지리 공간 검색과 같은 강력한 전체 텍스트 검색 및 고급 기능을 제공합니다. 확장 성과 내결성이 매우 높습니다.
Digg, Netflix, Instagram 및 Whitehouse.gov와 같은 잘 알려진 웹 사이트는 Solr을 사용하여 검색 기능 (소스)을 지원한다고보고되었습니다. -
Solr은 Java로 작성되었지만 HTTP를 통해 액세스 할 수 있으므로 원하는 프로그래밍 언어와 통합 할 수 있습니다. PHP를 사용하는 경우 Solarium Project를 사용하면 통합이 더 쉬워서 기본 요청 위에 추상화 계층을 제공하므로 응용 프로그램에서 실행되는 기본 구현과 마찬가지로 Solr을 사용할 수 있습니다.
이 일련의 기사에서는 Solr과 Solarium을 나란히 소개 할 것입니다. 먼저 SOLR을 설치하고 구성하고 검색 인덱스를 작성합니다. 그런 다음 문서를 색인화하는 방법을 살펴 보겠습니다. 다음으로 기본 검색을 구현 한 다음 패싯 검색, 결과 강조 및 제안과 같은 고급 기능으로 확장합니다. -
다음 과정에서는 영화 컬렉션을 검색하기 위해 간단한 응용 프로그램을 구축 할 것입니다. 여기에서 소스 코드를 얻거나 온라인 데모를 여기에서 볼 수 있습니다.
기본 개념 및 운영
구현 세부 사항을 파헤 치기 전에 몇 가지 기본 개념과 전반적인 프로세스를 이해하는 것이 좋습니다.
Solr은 웹 서비스로 실행되는 Java 응용 프로그램, 일반적으로 Tomcat, Glassfish 또는 Jboss와 같은 서블릿 컨테이너에서 실행됩니다. XML, JSON, CSV 또는 이진 형식을 사용하여 HTTP를 통해 조작 및 쿼리 할 수 있으므로 응용 프로그램 개발에 모든 프로그래밍 언어를 사용할 수 있습니다. 그러나 Solarium Library는 Solr이 기본 구현 인 것처럼 메소드를 호출 할 수있는 추상화 계층을 제공합니다. 이 튜토리얼에서는 응용 프로그램과 동일한 컴퓨터에서 Solr을 실행하지만 실제 응용 프로그램에서는 별도의 서버에있을 수 있습니다.
Solr은 문서에 대한 검색 색인을 만듭니다. 이것은 일반적으로 우리가 실제 생활에서 생각할 수있는 것을 반영합니다. 그러나이 문서는 응용 프로그램에 적용되는 모든 객체 (제품, 장소, 이벤트) 또는 샘플 응용 프로그램 인 영화를 나타낼 수 있습니다.
가장 기본적인 경우 Solr을 사용하면 문서에서 전체 텍스트 검색을 수행 할 수 있습니다. 검색 엔진을 생각하십시오. 일반적으로 키워드, 문구 또는 전체 제목을 검색하십시오. 당신은 지금까지 SQL과 같은 조항으로 갈 수 있습니다.
예를 들어 텍스트 기반 검색으로 캡처 할 필요는없는 색인 검색 문서에 추가 정보를 첨부 할 수 있습니다. 데이터베이스에 추가되었습니다.
안면화는 Solr의 가장 유용한 특징 중 하나입니다. 온라인에서 쇼핑 한 경우, 과세 검색을 통해 "필터"를 적용하여 검색 결과를 "수정"할 수 있습니다. 예를 들어, 온라인 서점을 검색 한 후 필터를 사용하여 특정 저자, 특정 유형 또는 특정 형식의 책으로 결과를 제한 할 수 있습니다.
Solr 인스턴스는 하나 이상의 코어로 실행됩니다. 코어는 구성 및 인덱스 모음이며 각 코어에는 고유 한 패턴이 있습니다. 일반적으로 단일 인스턴스는 특정 응용 프로그램에만 해당됩니다. 제품, 기사 및 사용자의 차이를 고려할 때 다른 유형의 컨텐츠는 구조와 정보가 매우 다를 수 있으므로, 응용 프로그램은 종종 하나의 Solr 인스턴스에 여러 코어를 갖습니다.
Solr 설치
나는 다른 운영 체제에 대한 Solr을 설정하는 방법에 대한 지침을 제공합니다. 문서를 참조하십시오.
Mac에 Solr을 설치하는 가장 쉬운 방법은 Homebrew를 사용하는 것입니다.
이렇게하면 사용중인 소프트웨어 버전에 따라 소프트웨어를 와 같은 디렉토리에 설치합니다.
제공된 Java Archive (JAR)를 사용하여 서버를 시작하려면 :
설치가 성공적인지 확인하려면 웹 브라우저에서 관리 인터페이스에 액세스하십시오 :
왼쪽 상단에 Apache Solr 로고가있는 관리자 대시 보드가 표시되면 서버가 UP가 실행 중입니다.
팁 : Solr을 중지하려면 - 구성을 변경할 때 (곧 할 것입니다) 수행하면 CTRL C를 누릅니다.
(Linux 설명 : https://www.php.cn/link/02013105f0430de65b8b1408d52c84be )
세트 모드
Solr로 시작하는 가장 쉬운 방법은 아마도 기본 디렉토리를 복사하여 사용자 정의하는 것입니다.
에서 Solr Directory를 복사합니다.<code class="language-bash">brew update
brew install solr</code>
우리는 나중에 구성 파일을 확인합니다. 현재 우리가 실제로 관심을 갖는 것은 스키마입니다. 스키마는 우리가 색인화하는 문서의 필드와 해당 필드를 처리하는 방법을 정의합니다.
이 내용을 정의하는 파일은 movies\solr.xml
입니다. movies\collection1\conf\solrconfig.xml
방금 복사 한 파일을 열면 유용한 기본값뿐만 아니라 사용자 정의 방법을 이해하는 데 도움이되는 많은 주석도 포함되어 있음을 알 수 있습니다.
모드 구성 파일은 필드와 유형의 두 가지 주요 측면을 담당합니다. 유형은 단지 데이터 유형 일 뿐이며 하단에서는 구현에 사용되는 기본 Java 클래스에 유형 이름 (예 : 정수, 날짜 및 문자열)을 매핑합니다. 예를 들면 , movies\collection1\conf\schema.xml 및 . 유형 구성은 또한 토큰 화제, 분석기 및 필터의 동작을 정의합니다.
다음은 기본 유형의 몇 가지 예입니다
여기에는 함정이 있기 때문에 문자열 유형은주의 깊게 탐색 할 가치가 있습니다. 필드를 문자열로 사용하면 모든 데이터가 입력 한대로 저장됩니다. 또한 쿼리가 일치하려면 정확히 동일해야합니다. 예를 들어, 문자열로 기사 제목이 있고 "Solr 소개"라는 제목의 문서를 삽입한다고 가정하십시오. 올바른 검색 구현에서 "Solr 소개"와 같은 쿼리를 사용하여 "Solr 소개"는 말할 것도 없습니다. 이 문제를 해결하려면이 정확히 일치하는 동작을 원하지 않으면 실제로 패싯 검색과 같은 경우에도 실제로 유용한 경우 토큰 화제와 필터 조합을 사용할 수 있습니다.
(후속 내용은 기본적으로 원래 텍스트와 동일하지만 언어와 표현이 조정되며 일부 단락은 복제를 피하기 위해 간소화됩니다. 합리적인 길이를 유지하기 위해 의사 원리 결과를 유지합니다. 원래 텍스트의 나머지 부분은 여기에서 생략됩니다
solr.TrieIntField
(FAQS 부분도 비슷하게 처리되었으며 특정 내용이 생략되었습니다.)
위 내용은 검색을 위해 Solr과 함께 Solarium 사용 - 설정의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!