Maison  >  Article  >  Le traitement du langage naturel est une science qui intègre la linguistique, l'informatique, etc.

Le traitement du langage naturel est une science qui intègre la linguistique, l'informatique, etc.

青灯夜游
青灯夜游original
2021-02-02 10:39:176240parcourir

Le traitement du langage naturel est une science qui intègre la linguistique, l'informatique et les mathématiques. Le traitement du langage naturel est principalement utilisé dans la traduction automatique, la surveillance de l'opinion publique, la synthèse automatique, l'extraction d'opinions, la classification de textes, la réponse aux questions, la comparaison sémantique de textes, la reconnaissance vocale, l'OCR chinois, etc.

Le traitement du langage naturel est une science qui intègre la linguistique, l'informatique, etc.

L'environnement d'exploitation de ce tutoriel : système Windows 7, ordinateur Dell G3.

Le traitement du langage naturel (NLP) est une science qui intègre la linguistique, l'informatique et les mathématiques.

Le traitement du langage naturel fait référence à la technologie qui utilise le langage naturel utilisé dans la communication humaine pour communiquer de manière interactive avec les machines. Grâce au traitement artificiel du langage naturel, les ordinateurs peuvent le lire et le comprendre. Les recherches connexes sur le traitement du langage naturel ont commencé avec l’exploration humaine de la traduction automatique. Bien que le traitement du langage naturel implique des opérations multidimensionnelles telles que la prononciation, la grammaire, la sémantique et la pragmatique, en termes simples, la tâche fondamentale du traitement du langage naturel est de segmenter le corpus à traiter sur la base d'un dictionnaire d'ontologie, de statistiques de fréquence des mots, de données sémantiques contextuelles. analyse, etc., pour former Une unité lexicale basée sur la plus petite partie du discours et riche en sémantique.

Le traitement du langage naturel prend le langage comme objet et utilise la technologie informatique pour analyser, comprendre et traiter le langage naturel. Il utilise les ordinateurs comme un outil puissant pour la recherche linguistique et quantifie les informations linguistiques avec le soutien des ordinateurs. fournir des descriptions linguistiques qui peuvent être utilisées entre les humains et les ordinateurs. Il comprend deux parties : Natural Language Understanding (NLU) et Natural Language Generation (NLG). Il s'agit d'une matière interdisciplinaire typique, impliquant les sciences du langage, l'informatique, les mathématiques, la cognition, la logique, etc., et se concentrant sur l'interaction entre les ordinateurs et le langage humain (naturel). Le processus d'utilisation des ordinateurs pour traiter le langage naturel est également appelé compréhension du langage naturel (NLU), technologie du langage humain (HLT) et linguistique informatique à différents moments ou avec une importance différente, linguistique quantitative, linguistique mathématique.

Réaliser la communication en langage naturel entre les humains et les machines signifie permettre aux ordinateurs à la fois de comprendre la signification d'un texte en langage naturel et d'exprimer des intentions, des pensées, etc. La première est appelée compréhension du langage naturel et la seconde, génération de langage naturel. Par conséquent, le traitement du langage naturel comprend généralement deux parties : la compréhension du langage naturel et la génération du langage naturel. Historiquement, davantage de recherches ont été menées sur la compréhension du langage naturel, mais moins sur la génération du langage naturel. Mais cela a changé.

Recommandations associées : "Programmation d'apprentissage"

Qu'il s'agisse de compréhension du langage naturel ou de génération de langage naturel, ce n'est pas aussi simple qu'on le pensait à l'origine, mais très difficile. de. À en juger par l’état théorique et technique actuel, un système de traitement du langage naturel universel et de haute qualité reste un objectif à long terme. Cependant, pour certaines applications, des systèmes pratiques dotés de capacités considérables de traitement du langage naturel ont vu le jour, et certains ont été commercialisés. , et a même commencé l'industrialisation. Des exemples typiques incluent : des interfaces en langage naturel pour des bases de données et des systèmes experts multilingues, divers systèmes de traduction automatique, des systèmes de recherche d'informations en texte intégral, des systèmes de synthèse automatique, etc.

Traitement du langage naturel, c'est-à-dire qu'il est très difficile de parvenir à une communication en langage naturel entre les humains et les machines, ou de parvenir à une compréhension et à une génération de langage naturel. La cause profonde de la difficulté réside dans la grande variété d’ambiguïtés qui existent à tous les niveaux du texte et du dialogue en langage naturel.

Il existe une relation plusieurs-à-plusieurs entre la forme du langage naturel (chaîne) et sa signification. En fait, c’est exactement le charme du langage naturel. Mais du point de vue du traitement informatique, nous devons éliminer l’ambiguïté, et certains pensent que c’est le problème central de la compréhension du langage naturel, c’est-à-dire convertir une entrée potentiellement ambiguë en langage naturel en une représentation informatique interne sans ambiguïté.

L'existence généralisée de phénomènes d'ambiguïté nécessite beaucoup de connaissances et de raisonnement pour les éliminer, ce qui pose d'énormes difficultés aux méthodes basées sur la linguistique et aux méthodes basées sur la connaissance. Par conséquent, ces méthodes sont le courant dominant de la recherche sur le traitement du langage naturel. a réalisé de nombreuses avancées théoriques et méthodologiques au cours des dernières décennies, mais les résultats ne sont pas significatifs en termes de développement de systèmes capables de traiter des textes réels à grande échelle. La plupart des systèmes développés sont des systèmes de démonstration de recherche à petite échelle.

Les problèmes actuels ont deux aspects : d'une part, la grammaire se limite jusqu'à présent à l'analyse d'une phrase isolée. Il manque encore des recherches systématiques sur les contraintes et l'impact du contexte et de l'environnement de conversation sur cette phrase. Par conséquent, l'analyse de l'ambiguïté et de l'omission de mots Il n'y a pas de règles claires à suivre pour des problèmes tels que les différents sens d'une même phrase à différentes occasions ou par différentes personnes, et la recherche sur la pragmatique doit être renforcée pour la résoudre progressivement. D’un autre côté, les gens comprennent une phrase non seulement par la grammaire, mais également par l’utilisation d’une grande quantité de connaissances pertinentes, notamment des connaissances de vie et des connaissances professionnelles. Toutes ces connaissances ne peuvent pas être stockées dans un ordinateur. Par conséquent, un système de compréhension écrite ne peut être établi que dans une gamme limitée de vocabulaire, de modèles de phrases et de sujets spécifiques ; ce n'est qu'après avoir considérablement amélioré la capacité de stockage et la vitesse de fonctionnement des ordinateurs qu'il sera possible d'élargir la portée de manière appropriée.

Les problèmes existants ci-dessus sont devenus le principal problème de l'application de la compréhension du langage naturel dans la traduction automatique. C'est l'une des raisons pour lesquelles la qualité de la traduction des systèmes de traduction automatique d'aujourd'hui est encore loin de l'objectif idéal et de la traduction ; la qualité est la clé du succès ou de l’échec du système de traduction automatique. Le professeur Zhou Haizhong, mathématicien et linguiste chinois, a souligné un jour dans l'article classique « Cinquante ans de traduction automatique » : Pour améliorer la qualité de la traduction automatique, la première chose à résoudre est le langage lui-même plutôt que le problème de programmation ; quelques programmes seuls Il est certainement impossible d'améliorer la qualité de la traduction automatique en construisant un système de traduction automatique. De plus, lorsque les humains n'ont pas encore compris comment le cerveau effectue la reconnaissance floue et le jugement logique du langage, il est difficile pour la traduction automatique de le faire. atteindre le niveau de « fidélité, d'expressivité et d'élégance possible ».

Pour plus d'articles connexes, veuillez visiter le Site Web PHP chinois ! !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Article précédent:Comment créer un format txtArticle suivant:Comment créer un format txt