Heim >Java >javaLernprogramm >Vergleich von Spracherkennungsbibliotheken (und API) mit Java/ColdFusion/CFML
La détection de la langue est une fonctionnalité dont nous avions besoin dans un projet antérieur. J'ai écrit un article en 2020 concernant l'utilisation du fork kju2 de la bibliothèque Java d'Optimaize Language Detector. La bibliothèque Optimaize n'a pas été mise à jour depuis 2015 et le fork kju2 a été placé en mode lecture seule le 16 avril 2023.
J'ai évalué la bibliothèque Java Lingua. Elle prétend être « la bibliothèque de détection de langage naturel la plus précise pour Java et la JVM, adaptée aussi bien aux textes longs que courts » et semble également être activement mise à jour et prise en charge. Dans mon petit test unitaire, Lingua semblait être légèrement plus lent et ne pouvait pas identifier correctement le texte malais.
Le temps de détection pour les deux bibliothèques Java était assez aléatoire pour l'anglais. Parfois, il renvoyait une réponse en 295 ms et d'autres fois, en plus de 48 000 ms. (Peut-être que c'est juste mon PC de développeur.) kju2 semblait être plus rapide en moyenne.
J'ai également trouvé une API Detect Language tierce qui prend en charge 165 langues et prétend avoir une "haute précision". Il nécessite une clé API et propose des forfaits gratuits et premium.
Si vous effectuez une détection de langage avec Java et/ou ColdFusion/CFML, qu'utilisez-vous ?
Sollte sein | kju2 lang | kju2 ms | lingua lang | lingua ms | API-Sprache | api ms | Beispieltext |
---|---|---|---|---|---|---|---|
ENGLISCH | ENGLISCH | 2272 | ENGLISCH | 570 | de | 537 | Eine gute Möglichkeit, spanische Vokabeln zu lernen, ist das Lesen von Texten, Geschichten oder Artikeln, die vollständig in der Sprache verfasst sind. Aus diesem Grund haben wir eigene kurze Lesepassagen auf Spanisch zu verschiedenen Themen verfasst. |
GRIECHISCH | GRIECHISCH | 6 | GRIECHISCH | 12 | el | 105 | Βίβλος γενέσεως Ἰησοῦ Χριστοῦ υἱοῦ Δαυεὶδ υἱοῦ Ἀβραάμ. |
FRANZÖSISCH | FRANZÖSISCH | 61 | FRANZÖSISCH | 78 | fr | 70 | En hiver, il fait froid en France. Die Sonne lebe langsam. Es gab noch eine Nacht, als ich noch Mühe hatte. Parfois, es ist ein Même de la Neige. |
HEBRÄISCH | HEBRÄISCH | 3 | HEBRÄISCH | 11 | iw | 110 | כל ישראל יש להם חלק לעולם הבא ו ארץ, נצר מטעי מעשה ידי להתפאר. |
ARABISCH | ARABISCH | 2 | ARABISCH | 19 | ar | 81 | Die einzige Quelle, die ich vor einem Jahr gesehen habe. تسجّل الآن لحضور المؤتمر الدولي العاشر ليونيكود |
CHINESISCH | CHINESISCH | 2 | CHINESISCH | 8 | zh | 74 | 虽然它长得不好看,但是它有一颗无比善良的心。小猴子乐乐的家被大水冲垮了,无家可归。丑丑就让乐乐住在自己的家,还把自己最喜欢吃的巧克力分给乐乐吃.不仅如此,谁头痛、生病了,没钱买药,它都会尽其所能进行帮助. |
KOREANISCH | KOREANISCH | 12 | KOREANISCH | 3 | ko | 120 | 안녕하십니까 할리데이비슨 대구점 MC 우제헌입니다. 연결되지 않아 문자 드립니다. |
SPANISCH | SPANISCH | 0 | SPANISCH | 116 | es | 92 | Gewöhnlich wird dieser Flughafen auf alle Pisten ohne Flugzeuge in der Luft angewendet, da der Flughafen nicht mit einem Embargo belegt ist. |
THAI | THAI | 1 | THAI | 14 | th | 105 | ข้อ 1 มนุษย์ ทั้งหลาย เกิด มา มี อิสระ และ กัน ใน เกียรติศักด [เกียรติศักดิ์] และ สิทธิ ต่าง มี เหตุผล และ และ ควร ปฏิบัติ กัน ด้วย เจตนารมณ์ แห่ง ภราดรภาพ ภราดรภาพ |
VIETNAMESISCH | VIETNAMESISCH | 2 | VIETNAMESISCH | 14 | vi | 98 | Es ist nicht einfach, dies zu tun, und es ist wichtig, dass Sie es nicht verpassen. Ich bin mit dem Problem konfrontiert, dass ich nicht aufhören kann, dies zu tun. |
TÜRKISCH | TÜRKISCH | 3 | TÜRKISCH | 93 | tr | 212 | Yukarda mavi gök, asağıda yağız yer yaratıldıkta; ikisinin arasında wahnsinnig oğlu yaratılmış. İnsan oğulları üzerine ecdadım Bumın hakan, İstemi hakan tahta oturmuş; oturarak Türk milletinin ülkesini, türesini, idare edivermiş, tanzim edivermis. Dört taraf hep düşman imiş. Der Fragesteller hat die Antwort auf die Frage erhalten, ob er (altmodisch) viele Fehler gemacht hat. Başlılara baş eğdirmiş, dizlilere diz çöktürmüş. |
JAPANISCH | JAPANISCH | 3 | JAPANISCH | 7 | ja | 194 | 幸運こううんにも、息子むすこはこの四月しがつから保育園ほいくえんに入はいることができ、私わたしはまた働はたらき始はじめた. |
RUSSIAN | RUSSIAN | 2 | RUSSIAN | 1393 | ru | 96 | Все люди рождаются свободными и равными в своем достоинстве и правах. Они наделены разумом и совестью и должны поступать в отношении друг друга в духе братства. |
FINNISH | FINNISH | 6 | FINNISH | 383 | fi | 125 | Jokaisella on oikeus saada opetusta. Opetuksen on oltava ainakin alkeis- ja perusopetuksen osalta maksutonta. Alkeisopetuksen on oltava pakollinen. Teknistä ja ammattiopetusta on oltava yleisesti saatavilla, ja korkeamman opetuksen on oltava avoinna yhtäläisesti kaikille heidän kykyjensä mukaan. |
URDU | URDU | 1 | URDU | 22 | ur | 104 | ایک ملک پر سخت گیر بادشاہ حکومت کرتا تھا۔وہ رعایا پر طرح طرح کے ٹیکس عائد کرتا اور ٹیکس کے پیسے دوسرے ممالک میں جاکر فضولیات میں ضائع کرتا۔ |
THAI | THAI | 1 | THAI | 2 | th | 78 | Hello World สวัสดีชาวโลก |
MALAY | MALAY | 2 | UNKNOWN | 291 | id | 88 | Pesan moral dari Cerita Rakyat Bawang Merah Bawang Putih adalah Jangan terlalu tamak dan serakah. Setiap orang sudah memiliki rezekinya masing-masing. Orang yang terlalu serakah akan mendapatkan balasan yang setimpal dengan perbuatannya. Selalu berbuat baik lah dalam setiap tingkah laku, maka kita akan mendapatkan kebaikan dan kebahagiaan. |
https://gist.github.com/JamoCA/b883fbddf0303df8f4b0d597cfc2ae25
Das obige ist der detaillierte Inhalt vonVergleich von Spracherkennungsbibliotheken (und API) mit Java/ColdFusion/CFML. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!