ホームページ >Java >&#&チュートリアル >Java/ColdFusion/CFML を使用した言語検出ライブラリ (および API) の比較
言語検出は、過去のプロジェクトで必要だった機能です。 2020 年に、Optimaize Language Detector Java ライブラリの kju2 フォークの使用に関する記事を書きました。 Optimaize ライブラリは 2015 年以降更新されておらず、kju2 フォークは 2023 年 4 月 16 日に読み取り専用モードになりました。
Lingua Java ライブラリを評価しました。これは「Java および JVM 用の最も正確な自然言語検出ライブラリであり、長文にも短文にも同様に適しています」と主張しており、積極的に更新およびサポートされているようです。 私の小規模な単体テストでは、Lingua の速度がわずかに遅く、マレー語のテキストを正しく識別できなかったようです。
両方の Java ライブラリの検出時間は、英語ではかなりランダムでした。 295 ミリ秒で応答が返される場合もあれば、48,000 ミリ秒以上かかる場合もあります。 (私の開発用 PC だけかもしれません。) kju2 の方が平均的に速いようです。
また、165 の言語をサポートし、「精度が高い」と主張するサードパーティの Detect Language API も見つけました。 API キーが必要で、無料プランとプレミアム プランの両方が提供されます。
Java や ColdFusion/CFML を使用して言語検出を実行している場合、何を使用していますか?
そうあるべき | kju2 lang | kju2 ミリ秒 | リンガラン | リンガMS | API 言語 | API ms | サンプルテキスト |
---|---|---|---|---|---|---|---|
英語 | 英語 | 2272 | 英語 | 570 | ja | 537 | スペイン語の語彙を学ぶための優れた方法は、完全にスペイン語で書かれたテキスト、物語、記事を読むことです。だからこそ、私たちはさまざまなトピックについてスペイン語で独自の短い読み物を書きました。 |
ギリシャ語 | ギリシャ語 | 6 | ギリシャ語 | 12 | エル | 105 | Βίβλος γενέσεως Ἰησοῦ Χριστοῦ υἱοῦ Δαυεὶδ υἱοῦ Ἀβραάμ. |
フランス語 | フランス語 | 61 | フランス語 | 78 | フランス | 70 | お休みなさい、フランスは永遠に終わります。ル・ソレイユ・セ・レーヴ・タール。 Il fait encore nuit quand je vais au travail.パルフォワ、私はネージュのようなものです。 |
ヘブライ語 | ヘブライ語 | 3 | ヘブライ語 | 11 | わあ | 110 | כל ישראל יש להם חלק לעולם הבא, שנאמר ועמך כולם צדיקים, לעולם יירש |
アラビア語 | アラビア語 | 2 | アラビア語 | 19 | アル | 81 | عندما يريد العالم أن يتكلّم ، فهو يتحدّث بلغة يونيكود。 سجّل الآن لحضور المؤتمر الدولي العاشر ليونيكود |
中国語 | 中国語 | 2 | 中国語 | 8 | zh | 74 | 長くなると見栄えが悪くなるが、それでも善良な心を持っている。 小さな子に恵まれた家は、大水に襲われ、家には耐えられない。これに限らず、藁の痛み、病状、薬物摂取のない都市は、できるかぎり助けになります。 |
韓国語 | 12 | 韓国語 | 3 | こ | 120 | 안녕하십니까 할리데이비슨 대구점 MC 우제헌입니다。 | |
スペイン語 | 0 | スペイン語 | 116 | は | 92 | 習慣的に、航空便の運航を停止し、航空便の運航を停止してください。 | |
タイ | 1 | タイ | 14 | 番目 | 105 | ข้อ 1 มนุษย์ทั้งหลายเกิดมามีอิสระและเสมอภ意味:意味ด้วยเจตนารมณ์แห่งภราดรภาพ | |
ベトナム語 | 2 | ベトナム語 | 14 | ヴィ | 98 | これは、私があなたに与えられたことです。 Mọi con người đều được tạo hoa ban cho lý trí và lương tâm và cần phải đối xử với nhau trong tình anh em. | |
トルコ語 | 3 | トルコ語 | 93 | tr | 212 | ユカルダ マヴィ ギョク、アサドゥ ヤジズ ヤラトゥルドゥクタ;イキシニン アラシンダ インサン オール ヤラトゥルムシュ。 İnsan oğulları üzerine ecdadım Bumın hakan, İstemi hakan tahta oturmuş; oturarak テュルク ミレチニン ülkesini、türesini、idare edivermiş、tanzim edivermis。デルト・タラフ・ヘップ・デュシュマン・イミシュ。質問者は、あなたの意見を聞いてください。 Başlılara baş eğdirmiş、dizlirere diz çöktürmüş. | |
日本語 | 3 | 日本語 | 7 | じゃ | 194 | 幸運こううんにも、息子むすこはこの四月しがつから保育園ほいくえんは中に入れるができ、私はまた働いてたらき始めました。 | |
ロシア語 | ロシア語 | 2 | ロシア語 | 1393 | る | 96 | すべての人は生まれながらにして自由であり、その尊厳と権利は平等です。彼らには理性と良心が与えられており、兄弟愛の精神でお互いに行動しなければなりません。 |
フィンランド語 | フィンランド語 | 6 | フィンランド語 | 383 | フィ | 125 | 誰もが教育を受ける権利を持っています。教育は、少なくとも初等教育と基礎教育については無料でなければなりません。初等教育は義務教育でなければなりません。技術教育および職業教育は普遍的に受けられなければならず、高等教育は能力に応じてすべての人に平等に開かれていなければなりません。 |
ウルドゥー語 | ウルドゥー語 | 1 | ウルドゥー語 | 22 | 君 | 104 | を使用してください。 |
タイ | タイ | 1 | タイ | 2 | 番目 | 78 | こんにちは世界|
マレー語 | 2 | 不明 | 291 | ID | 88 | ペサンの道徳はセリタ・ラクヤット・バワン・メラ・バワン・プティ・アダラ・ジャンガン・テリヤ・タマク・ダン・セラカです。セピアプ・オラン・スーダ・メミリキ・レゼキンヤ・マシング・マシング。オラン・ヤン・テリブ・セラカ・アカン・メンダパット・バラサン・ヤン・セットンパル・デンガン・ペルブアタンヤ。 Selalu berbuat baik lah Dalam ikiap hanpah laku、maka kitakan mendapat kebidahan dan happanika. |
以上がJava/ColdFusion/CFML を使用した言語検出ライブラリ (および API) の比較の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。