>일반적인 문제 >자연어 처리는 언어학, 컴퓨터 과학 등을 통합하는 과학입니다.

자연어 처리는 언어학, 컴퓨터 과학 등을 통합하는 과학입니다.

青灯夜游
青灯夜游원래의
2021-02-02 10:39:176309검색

자연어 처리는 언어학, 컴퓨터 과학, 수학을 통합하는 과학입니다. 자연어 처리는 주로 기계 번역, 여론 모니터링, 자동 요약, 의견 추출, 텍스트 분류, 질문 답변, 텍스트 의미 비교, 음성 인식, 중국어 OCR 등에 사용됩니다.

자연어 처리는 언어학, 컴퓨터 과학 등을 통합하는 과학입니다.

이 튜토리얼의 운영 환경: Windows 7 시스템, Dell G3 컴퓨터.

자연어 처리(NLP)는 언어학, 컴퓨터 과학, 수학을 통합하는 과학입니다.

자연어 처리란 인간의 의사소통에 사용되는 자연어를 활용하여 기계와 상호작용하는 기술을 말합니다. 자연어를 인공적으로 처리함으로써 컴퓨터는 자연어를 읽고 이해할 수 있습니다. 자연어 처리에 관한 관련 연구는 인간의 기계 번역 탐구에서 시작되었습니다. 자연어 처리에는 발음, 문법, 의미, 화용론 등 다차원적인 연산이 포함되지만, 간단히 말해서 자연어 처리의 기본 작업은 온톨로지 사전, 단어 빈도 통계, 문맥 의미를 기반으로 처리할 코퍼스를 분할하는 것입니다. 분석 등을 통해 말의 가장 작은 부분을 기반으로 하고 의미가 풍부한 어휘 단위를 형성합니다.

자연어 처리는 언어를 객체로 삼아 컴퓨터 기술을 이용하여 자연어를 분석, 이해, 처리하는 언어 연구의 강력한 도구로 컴퓨터를 활용하여 컴퓨터의 지원을 받아 언어 정보에 대한 정량적 연구를 수행하고 언어를 제공합니다. 인간과 컴퓨터 사이에 사용될 수 있는 설명. 여기에는 NLU(자연어 이해)와 NLG(자연어 생성)의 두 부분이 포함됩니다. 언어과학, 컴퓨터과학, 수학, 인지, 논리학 등을 포괄하며, 컴퓨터와 인간(자연)언어의 상호작용에 초점을 맞춘 대표적인 엣지 학제간 과목입니다. 컴퓨터를 사용하여 자연어를 처리하는 과정은 NLU(Natural Language Understanding), HLT(Human Language Technology), 전산 언어학(Computational Linguistics), 양적 언어학(Quantitative Linguistics), 수학 언어학(Mathematical Linguistics)이라고도 합니다.

인간과 기계 사이의 자연어 통신을 실현한다는 것은 컴퓨터가 자연어 텍스트의 의미를 이해하고 주어진 의도, 생각 등을 자연어 텍스트로 표현할 수 있게 한다는 것을 의미합니다. 전자를 자연어 이해라고 하고, 후자를 자연어 생성이라고 합니다. 따라서 자연어 처리는 일반적으로 자연어 이해와 자연어 생성의 두 부분으로 구성됩니다. 역사적으로 자연어 이해에 대한 연구는 더 많이 이루어졌지만 자연어 생성에 대한 연구는 적습니다. 그러나 그것은 바뀌었습니다.

관련 추천: "프로그래밍 학습"

자연어 이해든 자연어 생성이든 사람들이 원래 상상했던 것만큼 단순하지는 않지만 매우 어렵습니다. 현재의 이론적, 기술적 현황으로 볼 때 보편적이고 고품질의 자연어 처리 시스템은 여전히 ​​장기적인 목표이지만 특정 응용 분야에서는 상당한 자연어 처리 기능을 갖춘 실용적인 시스템이 등장했으며 일부는 상용화되었습니다. , 심지어 산업화를 시작했습니다. 일반적인 예로는 다국어 데이터베이스 및 전문가 시스템을 위한 자연어 인터페이스, 다양한 기계 번역 시스템, 전체 텍스트 정보 검색 시스템, 자동 요약 시스템 등이 있습니다.

자연어 처리, 즉 인간과 기계 사이의 자연어 의사소통을 이루거나, 자연어 이해와 자연어 생성을 이루는 것은 매우 어렵습니다. 어려움의 근본 원인은 자연어 텍스트와 대화의 모든 수준에 존재하는 다양한 모호성입니다.

자연어(문자열)의 형태와 그 의미 사이에는 다대다 관계가 있습니다. 사실 이것이 바로 자연어의 매력이다. 그러나 컴퓨터 처리 관점에서 우리는 모호성을 제거해야 하며 어떤 사람들은 자연어 이해의 핵심 문제, 즉 잠재적으로 모호한 자연어 입력을 모호하지 않은 내부 컴퓨터 표현으로 변환하는 것이 중요하다고 생각합니다.

모호성 현상이 광범위하게 존재하려면 이를 제거하기 위해 많은 양의 지식과 추론이 필요하며, 이는 언어학 기반 방법과 지식 기반 방법에 큰 어려움을 초래하므로 이러한 방법을 기반으로 한 수십 가지의 자연어 처리 연구가 주류를 이루었습니다. 최근 이론과 방법 면에서 많은 성과가 있었지만, 대규모의 실제 텍스트를 처리할 수 있는 시스템의 개발 측면에서는 그 성과가 크지 않습니다. 개발된 시스템의 대부분은 소규모 연구 실증 시스템입니다.

현재 문제는 두 가지 측면을 가지고 있습니다. 한편으로는 지금까지의 문법은 고립된 문장의 분석에 국한되어 있습니다. 이 문장에 대한 맥락과 대화 환경의 제약과 영향에 대한 체계적인 연구가 여전히 부족합니다. 따라서 모호성, 단어생략, 대명사의 분석은 같은 문장이라도 상황에 따라, 사람에 따라 의미가 달라지는 등의 문제에 대해서는 아직까지 따라야 할 명확한 규칙이 없으며 화용론 연구에서 이를 강화할 필요가 있다. 점차적으로 해결해보세요. 반면, 사람들은 문법뿐만 아니라 생활 지식, 전문 지식 등 수많은 관련 지식을 활용하여 문장을 이해합니다. 이 모든 지식은 컴퓨터에 저장될 수 없습니다. 따라서 제한된 범위의 어휘, 문장 패턴, 특정 주제 내에서만 서면 이해 시스템을 구축할 수 있으며, 컴퓨터의 저장 용량과 작동 속도가 크게 향상되어야만 범위를 적절하게 확장할 수 있습니다. 기존의 문제는 자연어 이해가 됩니다. 기계 번역 적용의 주요 문제는 오늘날 기계 번역 시스템의 번역 품질이 여전히 이상적인 목표와 거리가 멀고 번역 품질이 성공 또는 실패의 열쇠인 이유 중 하나입니다. 기계 번역 시스템의 중국의 수학자이자 언어학자인 Zhou Haizhong 교수는 고전 논문 "기계 번역의 50년"에서 다음과 같이 지적했습니다. 기계 번역의 품질을 향상하려면 먼저 해결해야 할 것은 프로그래밍 문제보다는 언어 자체입니다. 몇 가지 프로그램만으로는 기계 번역 시스템을 구축하여 기계 번역의 품질을 향상시키는 것은 확실히 불가능합니다. 또한, 인간이 아직 뇌가 언어의 퍼지 인식과 논리적 판단을 어떻게 수행하는지 이해하지 못하면 기계 번역이 어렵습니다. "충실함, 표현력, 우아함"의 수준을 달성합니다.

더 많은 관련 기사를 보려면

PHP 중국어 웹사이트

를 방문하세요! !

위 내용은 자연어 처리는 언어학, 컴퓨터 과학 등을 통합하는 과학입니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.