다음과 같은 여러 데이터 조각이 있다고 가정해 보겠습니다.
으아악이제 이 데이터 중 어떤 것이 유효한 회사 등록 이름인지 확인하는 방법에 대해 몇 가지 아이디어를 제공해 주시기 바랍니다.
PHP中文网2017-05-18 10:57:32
이러한 산업 및 상업 정보를 확인하려면 산업 및 상업 웹사이트에 접속하는 것이 가장 좋습니다. 그러나 산업 및 상업 웹사이트에는 쿼리 제한, 인증 코드 등이 있습니다. 자동으로 처리되는 경우 주의해야 합니다.
PHP中文网2017-05-18 10:57:32
이것은 NER(Named Entity Recognition)에 속합니다. 그냥 적용하고 싶다면 import jieba
.
원리를 자세히 배우고 싶다면 종이 NLP를 처음부터 추천합니다