Maison  >  Article  >  Périphériques technologiques  >  Ant Group et l'Université du Zhejiang lancent conjointement OneKE, un cadre d'extraction de connaissances open source à grande échelle

Ant Group et l'Université du Zhejiang lancent conjointement OneKE, un cadre d'extraction de connaissances open source à grande échelle

WBOY
WBOYavant
2024-04-19 21:20:011225parcourir

Récemment, OneKE, un cadre d'extraction de connaissances à grande échelle développé conjointement par Ant Group et l'Université du Zhejiang, a été annoncé comme open source et offert à la communauté des graphes de connaissances ouverts OpenKG.

Le graphe de connaissances est l'une des technologies clés pour assurer la fiabilité et la contrôlabilité des grands modèles. L'extraction de connaissances peut aider à créer des graphiques de connaissances de domaine. OneKE s'engage à aider les chercheurs et les développeurs à mieux gérer des problèmes tels que l'extraction d'informations, la structuration des données textuelles et la construction de graphiques de connaissances.

L'extraction d'événements à risque, d'entités personnelles, d'entités institutionnelles, etc. via OneKE peut présenter clairement le contexte de l'événement, les tendances de développement des événements et les relations entre les entités. Le graphique construit peut aider les grands modèles à réaliser un raisonnement complexe entre les entités et les documents. OneKE est bilingue chinois et anglais, prend en charge les frameworks open source OpenSPG et DeepKE et peut être utilisé immédiatement.

Les grands modèles linguistiques ont considérablement amélioré la capacité des systèmes d’intelligence artificielle à traiter les connaissances du monde. Cependant, les informations du monde réel sont très fragmentées et non structurées, de sorte que lorsque de grands modèles de langage gèrent des tâches d'extraction d'informations, ils auront toujours des résultats médiocres en raison de l'énorme différence entre le contenu extrait et les expressions en langage naturel, en plus des informations textuelles en langage naturel ; Il existe de nombreuses ambiguïtés, polysémies, métaphores, etc., qui posent de plus grands défis à la tâche d'extraction des connaissances. Cela conduit également au fait que l'intelligence artificielle générative représentée par les grands modèles de langage présente toujours des problèmes tels qu'une capacité de raisonnement insuffisante, un manque de connaissances factuelles et des résultats de génération instables, ce qui entrave grandement l'industrialisation des grands modèles de langage.

Le cadre unifié d'extraction de connaissances peut réduire considérablement le coût de création de graphiques de connaissances de domaine et propose un large éventail de scénarios d'application. Cela signifie qu'en extrayant des connaissances structurées à partir de données massives, en créant des graphiques de connaissances de haute qualité et en établissant des connexions logiques entre les éléments de connaissances, des décisions de raisonnement explicables peuvent être prises, et cela peut également être utilisé pour améliorer de grands modèles afin d'atténuer les illusions et d'améliorer la stabilité. accélérer l’application de grands modèles dans les domaines verticaux.

Dans le domaine médical, la gestion des connaissances de l'expérience des médecins est réalisée grâce à l'extraction de connaissances, et des diagnostics et traitements auxiliaires contrôlables ainsi que des questions et réponses médicales sont construits. Dans le domaine financier, le service d'extraction de connaissances est utilisé pour les indicateurs financiers, les événements à risque, les relations causales, les chaînes industrielles, etc. afin de réaliser la génération automatique de rapports de recherche financière, la prévision des risques, l'analyse de la chaîne industrielle, etc. Dans les scénarios d'affaires gouvernementales, la connaissance des réglementations des affaires gouvernementales peut être réalisée pour améliorer l'efficacité et la prise de décision précise des services des affaires gouvernementales.

Pour accélérer la mise en œuvre industrielle de l'intelligence artificielle basée sur la production, Ant Group et l'Université du Zhejiang ont créé un laboratoire commun de graphes de connaissances pour se concentrer sur des sujets tels que la construction de graphes de connaissances améliorés à grande échelle, les fonctions de génération fiables et contrôlables améliorées par les connaissances, et cartes du monde des connaissances du domaine. Mener une coopération globale en vue d'établir un paradigme fonctionnel de génération contrôlable avec une amélioration bidirectionnelle des grands modèles de langage et des graphiques de connaissances grâce à des recherches techniques conjointes.

Ant Group et l'Université du Zhejiang ont établi et amélioré conjointement les capacités du grand modèle Ant Bailing dans le domaine de l'extraction de connaissances, et ont publié OneKE, un cadre d'extraction de connaissances sur grand modèle bilingue chinois-anglais, et ont open source une version basée sur LLaMA2 complète. -mise au point des paramètres. Les indicateurs de test montrent que OneKE a obtenu des résultats relativement bons sur plusieurs tâches d’extraction d’entités/relations/événements entièrement supervisées et sans échantillon.

Ant Group et lUniversité du Zhejiang lancent conjointement OneKE, un cadre dextraction de connaissances open source à grande échelle

OneKE est un excellent outil d'extraction de connaissances généralisables bilingue chinois-anglais. Il a obtenu des résultats relativement bons dans les tâches de reconnaissance d'entités nommées NER chinois, les tâches d'extraction de relations RE et les tâches d'extraction d'événements EE.

Liang Lei, responsable du graphe de connaissances chez Ant Group, a déclaré qu'Ant continuera d'optimiser les performances de l'extraction des connaissances pour répondre aux besoins contrôlables et fiables des grands modèles dans différents scénarios. À l'avenir, nous travaillerons avec des partenaires industriels pour appliquer les systèmes techniques pertinents à divers domaines verticaux tels que la finance, les soins médicaux et les affaires gouvernementales, et favoriserons la mise en œuvre industrielle d'une technologie de génération contrôlable, pilotée par des graphiques de connaissances et de grands modèles de langage.

Page d'accueil officielle de OneKE : http://oneke.openkg.cn/

OpenSPG GitHub : https://github.com/OpenSPG/openspg

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer