Heim >Backend-Entwicklung >PHP-Tutorial >So rufen Sie 20 Millionen Zeilen Textdaten ab

So rufen Sie 20 Millionen Zeilen Textdaten ab

WBOY
WBOYOriginal
2016-08-04 09:19:111004Durchsuche

Ein TXT-Dokument enthält 20 Millionen Datenzeilen. Das Format der Daten ist wie folgt: .. ...
Acht Unsterbliche überqueren das Meer_Destiny

Wie kann ich schnell nach Redewendungen oder englischen Wörtern suchen? Bitte geben Sie mir den Algorithmus, danke Experten.


Antwortinhalt:

Ein TXT-Dokument enthält 20 Millionen Datenzeilen. Das Format der Daten ist wie folgt: .. ...

Acht Unsterbliche überqueren das Meer_Destiny

Wie kann ich schnell nach Redewendungen oder englischen Wörtern suchen? Bitte geben Sie mir den Algorithmus, danke Experten.


Ist Ihr Ziel, festzustellen, ob eine bestimmte Redewendung/ein bestimmtes Wort im Englischen existiert, oder zu zählen, wie oft diese Redewendung/dieses Wort vorkommt?
Ich denke, egal mit welcher Methode, die größte Möglichkeit besteht darin, den gesamten Text zu lesen. Wenn die Häufigkeit Ihres Abrufs sehr hoch ist, ist es am schnellsten, die 20 Millionen Daten in den Speicher zu legen und sie dann zu indizieren und zu speichern. Wenn es nur einmal ausgeführt wird, ist es am schnellsten, alle Dateien zu lesen (. Berechnen Sie die Anzahl der Vorkommen).


Erstellen Sie einen Solr und erstellen Sie einen Index, was die Sucheffizienz erheblich verbessert

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn