Maison > Questions et réponses > le corps du texte
Maintenant, je segmente les mots par titre, chaque titre contient 3 mots
J'ai construit un tableau de balises séparé pour stocker les mots divisés, avec un enregistrement pour chaque mot, lors de la lecture d'articles connexes, je lis au hasard une balise, puis je recherche. la même balise de table de balises, c'était bien quand il y avait peu de données dans le passé, mais maintenant il y a plus de 100 millions de données dans la table de balises, et elle est très lente à lire. La table de balises n'a que 2 champs, un identifiant d'article et une segmentation de mots, qui sont tous indexés puis partitionnés.
Existe-t-il un autre moyen d'écrire des articles connexes ?
Maintenant, 5W+++ est ajouté chaque jour
淡淡烟草味2017-05-18 10:53:12
La mesure de la pertinence doit avoir plusieurs dimensions :
1. La section à laquelle appartient l'article, comme le divertissement
2 Quelle est l'idée centrale ou le thème de l'article, qui doit être extrait
3. l'objet principal (personnage, événement)
Un article peut avoir plusieurs objets sujets et peut être lié à travers les sections