搜尋
首頁web前端js教程如何偵測瀏覽器中的程式碼語言

How to detect code language in browser

儲存庫:https://github.com/ray-d-song/guesslang-js

示範:https://ray-d-song.github.io/guesslang-js/

最近在做一個叫EchoRSS的項目,有一個非常想要的功能,就是攔截訂閱中的外部連結(閱讀全文、引用等)並直接顯示在當前頁面上。

存在回傳的HTML程式碼區塊遺失語言標註的問題(或原程式碼區塊中的pre和code標籤上沒有標註語言),因此無法使用shiki或prism.js等工具進行高亮顯示。

我找到了三種偵測程式語言的解決方案:

1. 語言學家

這是一個部署在伺服器上的Ruby項目,Github使用它來偵測儲存庫的語言組成。如果你需要極高的精度並且可以在伺服器上計算,這是最好的解決方案。

2. HLJS

highlight.js 是一個非常有名的網頁程式碼高亮函式庫,也是唯一提供自動程式碼偵測的函式庫。

原理很簡單,就是枚舉該語言的關鍵字,然後將它們與文本一一匹配,最後看哪一個匹配度最高。

hljs 有四個問題。

  • 需要非常長的程式碼長度,大多數語言至少需要300個字元才能達到相對較好的準確性。
  • 偵測語言的部分並不是一個單獨的模組,而是與解析器和渲染器緊密耦合,而且程式碼也非常命令式,很難提取出有用的部分。
  • 如果不提取偵測模組,在使用hljs高亮時,程式碼的原始格式(換行和縮排)將會遺失。
  • 需要大量正規匹配,效能較差,且由於原因2,無法在Web Worker中運作。

3. 猜測

guesslang是一個基於tensorflow.js的機器學習專案。

微軟在2021年將此專案移植到node.js,並在vscode中加入了自動語言偵測功能。

三年前有個越南小夥hieplpvip也把這個項目移植到瀏覽器上,但是也存在三個問題:

  • 記憶體洩漏,記憶體洩漏...
  • 僅支援; tag引入umd格式,不支援esm,不支援bundle
  • 同樣,由於原因2,它不支援Web Worker

這傢伙還沒有維護這個項目,三月支持esm的壯舉請求也沒有得到回應。

於是我從hljs中提取了檢測模組,並fork了guesslang-js來修復上述問題,最終guesslang獲勝,結果是這樣的:
https://github.com/ray-d-song/guesslang-js

我覺得說的太多了,也許以後有人需要,所以我就發一下。

如果有人了解tensorflow.js,希望能推薦一些學習資料,我想進一步修改為web gpu計算以提高效率。

以上是如何偵測瀏覽器中的程式碼語言的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
JavaScript引擎:比較實施JavaScript引擎:比較實施Apr 13, 2025 am 12:05 AM

不同JavaScript引擎在解析和執行JavaScript代碼時,效果會有所不同,因為每個引擎的實現原理和優化策略各有差異。 1.詞法分析:將源碼轉換為詞法單元。 2.語法分析:生成抽象語法樹。 3.優化和編譯:通過JIT編譯器生成機器碼。 4.執行:運行機器碼。 V8引擎通過即時編譯和隱藏類優化,SpiderMonkey使用類型推斷系統,導致在相同代碼上的性能表現不同。

超越瀏覽器:現實世界中的JavaScript超越瀏覽器:現實世界中的JavaScriptApr 12, 2025 am 12:06 AM

JavaScript在現實世界中的應用包括服務器端編程、移動應用開發和物聯網控制:1.通過Node.js實現服務器端編程,適用於高並發請求處理。 2.通過ReactNative進行移動應用開發,支持跨平台部署。 3.通過Johnny-Five庫用於物聯網設備控制,適用於硬件交互。

使用Next.js(後端集成)構建多租戶SaaS應用程序使用Next.js(後端集成)構建多租戶SaaS應用程序Apr 11, 2025 am 08:23 AM

我使用您的日常技術工具構建了功能性的多租戶SaaS應用程序(一個Edtech應用程序),您可以做同樣的事情。 首先,什麼是多租戶SaaS應用程序? 多租戶SaaS應用程序可讓您從唱歌中為多個客戶提供服務

如何使用Next.js(前端集成)構建多租戶SaaS應用程序如何使用Next.js(前端集成)構建多租戶SaaS應用程序Apr 11, 2025 am 08:22 AM

本文展示了與許可證確保的後端的前端集成,並使用Next.js構建功能性Edtech SaaS應用程序。 前端獲取用戶權限以控制UI的可見性並確保API要求遵守角色庫

JavaScript:探索網絡語言的多功能性JavaScript:探索網絡語言的多功能性Apr 11, 2025 am 12:01 AM

JavaScript是現代Web開發的核心語言,因其多樣性和靈活性而廣泛應用。 1)前端開發:通過DOM操作和現代框架(如React、Vue.js、Angular)構建動態網頁和單頁面應用。 2)服務器端開發:Node.js利用非阻塞I/O模型處理高並發和實時應用。 3)移動和桌面應用開發:通過ReactNative和Electron實現跨平台開發,提高開發效率。

JavaScript的演變:當前的趨勢和未來前景JavaScript的演變:當前的趨勢和未來前景Apr 10, 2025 am 09:33 AM

JavaScript的最新趨勢包括TypeScript的崛起、現代框架和庫的流行以及WebAssembly的應用。未來前景涵蓋更強大的類型系統、服務器端JavaScript的發展、人工智能和機器學習的擴展以及物聯網和邊緣計算的潛力。

神秘的JavaScript:它的作用以及為什麼重要神秘的JavaScript:它的作用以及為什麼重要Apr 09, 2025 am 12:07 AM

JavaScript是現代Web開發的基石,它的主要功能包括事件驅動編程、動態內容生成和異步編程。 1)事件驅動編程允許網頁根據用戶操作動態變化。 2)動態內容生成使得頁面內容可以根據條件調整。 3)異步編程確保用戶界面不被阻塞。 JavaScript廣泛應用於網頁交互、單頁面應用和服務器端開發,極大地提升了用戶體驗和跨平台開發的靈活性。

Python還是JavaScript更好?Python還是JavaScript更好?Apr 06, 2025 am 12:14 AM

Python更适合数据科学和机器学习,JavaScript更适合前端和全栈开发。1.Python以简洁语法和丰富库生态著称,适用于数据分析和Web开发。2.JavaScript是前端开发核心,Node.js支持服务器端编程,适用于全栈开发。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。