Heim  >  Artikel  >  Java  >  Vergleich von Spracherkennungsbibliotheken (und API) mit Java/ColdFusion/CFML

Vergleich von Spracherkennungsbibliotheken (und API) mit Java/ColdFusion/CFML

WBOY
WBOYOriginal
2024-09-06 06:00:32937Durchsuche

Comparing Language Detection Libraries (& API) Using Java/ColdFusion/CFML

La détection de la langue est une fonctionnalité dont nous avions besoin dans un projet antérieur. J'ai écrit un article en 2020 concernant l'utilisation du fork kju2 de la bibliothèque Java d'Optimaize Language Detector. La bibliothèque Optimaize n'a pas été mise à jour depuis 2015 et le fork kju2 a été placé en mode lecture seule le 16 avril 2023.

J'ai évalué la bibliothèque Java Lingua. Elle prétend être « la bibliothèque de détection de langage naturel la plus précise pour Java et la JVM, adaptée aussi bien aux textes longs que courts » et semble également être activement mise à jour et prise en charge. Dans mon petit test unitaire, Lingua semblait être légèrement plus lent et ne pouvait pas identifier correctement le texte malais.

Le temps de détection pour les deux bibliothèques Java était assez aléatoire pour l'anglais. Parfois, il renvoyait une réponse en 295 ms et d'autres fois, en plus de 48 000 ms. (Peut-être que c'est juste mon PC de développeur.) kju2 semblait être plus rapide en moyenne.

J'ai également trouvé une API Detect Language tierce qui prend en charge 165 langues et prétend avoir une "haute précision". Il nécessite une clé API et propose des forfaits gratuits et premium.

Si vous effectuez une détection de langage avec Java et/ou ColdFusion/CFML, qu'utilisez-vous ?

Sollte sein kju2 lang kju2 ms lingua lang lingua ms API-Sprache api ms Beispieltext
ENGLISCH ENGLISCH 2272 ENGLISCH 570 de 537 Eine gute Möglichkeit, spanische Vokabeln zu lernen, ist das Lesen von Texten, Geschichten oder Artikeln, die vollständig in der Sprache verfasst sind. Aus diesem Grund haben wir eigene kurze Lesepassagen auf Spanisch zu verschiedenen Themen verfasst.
GRIECHISCH GRIECHISCH 6 GRIECHISCH 12 el 105 Βίβλος γενέσεως Ἰησοῦ Χριστοῦ υἱοῦ Δαυεὶδ υἱοῦ Ἀβραάμ.
FRANZÖSISCH FRANZÖSISCH 61 FRANZÖSISCH 78 fr 70 En hiver, il fait froid en France. Die Sonne lebe langsam. Es gab noch eine Nacht, als ich noch Mühe hatte. Parfois, es ist ein Même de la Neige.
HEBRÄISCH HEBRÄISCH 3 HEBRÄISCH 11 iw 110 כל ישראל יש להם חלק לעולם הבא ו ארץ, נצר מטעי מעשה ידי להתפאר.
ARABISCH ARABISCH 2 ARABISCH 19 ar 81 Die einzige Quelle, die ich vor einem Jahr gesehen habe. تسجّل الآن لحضور المؤتمر الدولي العاشر ليونيكود
CHINESISCH CHINESISCH 2 CHINESISCH 8 zh 74 虽然它长得不好看,但是它有一颗无比善良的心。小猴子乐乐的家被大水冲垮了,无家可归。丑丑就让乐乐住在自己的家,还把自己最喜欢吃的巧克力分给乐乐吃.不仅如此,谁头痛、生病了,没钱买药,它都会尽其所能进行帮助.
KOREANISCH KOREANISCH 12 KOREANISCH 3 ko 120 안녕하십니까 할리데이비슨 대구점 MC 우제헌입니다. 연결되지 않아 문자 드립니다.
SPANISCH SPANISCH 0 SPANISCH 116 es 92 Gewöhnlich wird dieser Flughafen auf alle Pisten ohne Flugzeuge in der Luft angewendet, da der Flughafen nicht mit einem Embargo belegt ist.
THAI THAI 1 THAI 14 th 105 ข้อ 1 มนุษย์ ทั้งหลาย เกิด มา มี อิสระ และ กัน ใน เกียรติศักด [เกียรติศักดิ์] และ สิทธิ ต่าง มี เหตุผล และ และ ควร ปฏิบัติ กัน ด้วย เจตนารมณ์ แห่ง ภราดรภาพ ภราดรภาพ
VIETNAMESISCH VIETNAMESISCH 2 VIETNAMESISCH 14 vi 98 Es ist nicht einfach, dies zu tun, und es ist wichtig, dass Sie es nicht verpassen. Ich bin mit dem Problem konfrontiert, dass ich nicht aufhören kann, dies zu tun.
TÜRKISCH TÜRKISCH 3 TÜRKISCH 93 tr 212 Yukarda mavi gök, asağıda yağız yer yaratıldıkta; ikisinin arasında wahnsinnig oğlu yaratılmış. İnsan oğulları üzerine ecdadım Bumın hakan, İstemi hakan tahta oturmuş; oturarak Türk milletinin ülkesini, türesini, idare edivermiş, tanzim edivermis. Dört taraf hep düşman imiş. Der Fragesteller hat die Antwort auf die Frage erhalten, ob er (altmodisch) viele Fehler gemacht hat. Başlılara baş eğdirmiş, dizlilere diz çöktürmüş.
JAPANISCH JAPANISCH 3 JAPANISCH 7 ja 194 幸運こううんにも、息子むすこはこの四月しがつから保育園ほいくえんに入はいることができ、私わたしはまた働はたらき始はじめた.
RUSSIAN RUSSIAN 2 RUSSIAN 1393 ru 96 Все люди рождаются свободными и равными в своем достоинстве и правах. Они наделены разумом и совестью и должны поступать в отношении друг друга в духе братства.
FINNISH FINNISH 6 FINNISH 383 fi 125 Jokaisella on oikeus saada opetusta. Opetuksen on oltava ainakin alkeis- ja perusopetuksen osalta maksutonta. Alkeisopetuksen on oltava pakollinen. Teknistä ja ammattiopetusta on oltava yleisesti saatavilla, ja korkeamman opetuksen on oltava avoinna yhtäläisesti kaikille heidän kykyjensä mukaan.
URDU URDU 1 URDU 22 ur 104 ایک ملک پر سخت گیر بادشاہ حکومت کرتا تھا۔وہ رعایا پر طرح طرح کے ٹیکس عائد کرتا اور ٹیکس کے پیسے دوسرے ممالک میں جاکر فضولیات میں ضائع کرتا۔
THAI THAI 1 THAI 2 th 78 Hello World สวัสดีชาวโลก
MALAY MALAY 2 UNKNOWN 291 id 88 Pesan moral dari Cerita Rakyat Bawang Merah Bawang Putih adalah Jangan terlalu tamak dan serakah. Setiap orang sudah memiliki rezekinya masing-masing. Orang yang terlalu serakah akan mendapatkan balasan yang setimpal dengan perbuatannya. Selalu berbuat baik lah dalam setiap tingkah laku, maka kita akan mendapatkan kebaikan dan kebahagiaan.

Source Code

https://gist.github.com/JamoCA/b883fbddf0303df8f4b0d597cfc2ae25

Das obige ist der detaillierte Inhalt vonVergleich von Spracherkennungsbibliotheken (und API) mit Java/ColdFusion/CFML. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn