이 기사에서는 기본 중국 분석기, Paoding 플러그인, CJK 분석기, SmartCN 분석기 및 ICU 플러그인을 포함하여 Elasticsearch에서 중국 내용을 분석하기위한 몇 가지 솔루션에 대해 설명하고 장점 및 단점 및 적용 가능한 시나리오를 분석합니다.
중국 검색의 도전
중국어는 단어 나 형태소 (언어에서 가장 작은 의미있는 단위)를 나타내는 표표입니다. 함께 결합되면 그 의미는 완전히 새로운 단어를 나타냅니다. 또 다른 어려움은 단어와 문장 사이에 공백이 없으므로 컴퓨터가 단어가 시작되고 끝나는 위치를 알기가 어렵다는 것입니다.
화재 : 화재
산 : 산
Pinyin, 로마 화 된 만다린 형태 : Shū fǎ 컨텐츠를 이진화하는 분석기;
분석기 : 는 모든 한자를 단어 요소로 만 나눕니다. 따라서 휴대폰과 휴대폰의 두 가지 어휘 요소가 있습니다. Elasticsearch의
또는 와 같은 플러그인은 올바르게 처리하지 않기 때문입니다.
추가 개선 분사를 사용합니다.
Elasticsearch
플러그인은 더 이상 유지 관리되지는 않지만 매우 좋은 사전을 기반으로합니다
Chinese
standard
Chinese
플러그인 : standard
거의 업계 표준이며 우아한 솔루션으로 간주됩니다. 불행히도 Elasticsearch 용 플러그인은 유지되지 않으며 수정 후 버전 1.0.1에서만 실행할 수 있습니다. (설치 단계가 생략되고, 원본 텍스트가 제공됩니다) 설치 후 새로운 워드 세그먼트와 두 개의 수집기 : 및 가 나타납니다. 기본적으로 공개 분석기가 없으므로 새 분석기를 선언해야합니다. (구성 단계가 생략되고 원본 텍스트가 제공됩니다) 두 구성 모두 명확하고 고유 한 어휘 요소로 좋은 결과를 제공합니다. 또한 더 복잡한 문장을 다룰 때 매우 잘 작동합니다. paoding
분석기 : 텍스트 만 바이너리로 변환하는 매우 간단한 분석기. "휴대 전화"만 인덱스 paoding는 좋지만, 우리가 "랜턴 페스티벌 (Lantern Festival)"(랜턴 페스티벌)과 같은 더 긴 단어를 사용하면 랜턴 페스티벌과 Xiao Festival, "랜턴 페스티벌"을 의미합니다. 그리고 각각 "Xiao Festival". paoding
max_word_len
most_word
cjk
ICU 플러그인 : 또 다른 공식 플러그인. (설치 단계는 생략되고 원본 텍스트가 제공됩니다) 영어 이외의 언어를 다루는 경우이 플러그인을 사용하는 것이 좋습니다. 그것은 , , 등과 같은 많은 강력한 분석 도구뿐만 아니라 A 워드 세그먼터를 공개합니다. 그것은 중국어 그룹을 추론하기 위해 단어 빈도에 대한 정보를 포함하는 중국어와 일본 사전을 사용합니다. "휴대 전화"에서는 모든 것이 정상이며 예상대로 작동하지만 "랜턴 페스티벌"에서는 랜턴 페스티벌과 페스티벌 - "랜턴 페스티벌"과 "축제"가 "랜턴 페스티벌보다 더 중요하기 때문입니다. ". 흔한. 手机
smartcn
는 "랜턴 페스티벌"에서 약간 실망하지만 전통적인 중국인을 다루는 데 매우 능숙합니다. smartcn
전통적인 중국 지원 smartcn_tokenizer
smartcn
paoding
elasticsearch-analysis-stconvert
cjk
icu_tokenizer
(FAQ 부품 생략, 원본 텍스트 제공)
위 내용은 Elasticsearch를 사용한 효율적인 중국 검색의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Laravel은 직관적 인 플래시 방법을 사용하여 임시 세션 데이터 처리를 단순화합니다. 응용 프로그램에 간단한 메시지, 경고 또는 알림을 표시하는 데 적합합니다. 데이터는 기본적으로 후속 요청에만 지속됩니다. $ 요청-

이것은 Laravel 백엔드가있는 React Application을 구축하는 데있어 시리즈의 두 번째이자 마지막 부분입니다. 이 시리즈의 첫 번째 부분에서는 기본 제품 목록 응용 프로그램을 위해 Laravel을 사용하여 편안한 API를 만들었습니다. 이 튜토리얼에서는 Dev가 될 것입니다

PHP 클라이언트 URL (CURL) 확장자는 개발자를위한 강력한 도구이며 원격 서버 및 REST API와의 원활한 상호 작용을 가능하게합니다. PHP CURL은 존경받는 다중 프로모토콜 파일 전송 라이브러리 인 Libcurl을 활용하여 효율적인 execu를 용이하게합니다.

Laravel은 간결한 HTTP 응답 시뮬레이션 구문을 제공하여 HTTP 상호 작용 테스트를 단순화합니다. 이 접근법은 테스트 시뮬레이션을보다 직관적으로 만들면서 코드 중복성을 크게 줄입니다. 기본 구현은 다양한 응답 유형 단축키를 제공합니다. Illuminate \ support \ Facades \ http를 사용하십시오. http :: 가짜 ([ 'google.com'=> 'Hello World', 'github.com'=> [ 'foo'=> 'bar'], 'forge.laravel.com'=>

고객의 가장 긴급한 문제에 실시간 인스턴트 솔루션을 제공하고 싶습니까? 라이브 채팅을 통해 고객과 실시간 대화를 나누고 문제를 즉시 해결할 수 있습니다. 그것은 당신이 당신의 관습에 더 빠른 서비스를 제공 할 수 있도록합니다.

이 기사에서는 Laravel 웹 프레임 워크에서 알림 시스템을 탐색 할 것입니다. Laravel의 알림 시스템을 사용하면 다른 채널을 통해 사용자에게 알림을 보낼 수 있습니다. 오늘은 알림을 보낼 수있는 방법에 대해 논의합니다

기사는 PHP 5.3에 도입 된 PHP의 LSB (Late STATIC BING)에 대해 논의하여 정적 방법의 런타임 해상도가보다 유연한 상속을 요구할 수있게한다. LSB의 실제 응용 프로그램 및 잠재적 성능

PHP 로깅은 웹 애플리케이션을 모니터링하고 디버깅하고 중요한 이벤트, 오류 및 런타임 동작을 캡처하는 데 필수적입니다. 시스템 성능에 대한 귀중한 통찰력을 제공하고 문제를 식별하며 더 빠른 문제 해결을 지원합니다.


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

에디트플러스 중국어 크랙 버전
작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

맨티스BT
Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

안전한 시험 브라우저
안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

드림위버 CS6
시각적 웹 개발 도구

PhpStorm 맥 버전
최신(2018.2.1) 전문 PHP 통합 개발 도구
