您是否想知道 Whatsapp 或 Telegram 等訊息傳遞應用程式如何讓您查看發送的連結的預覽?
在這篇文章中,我們將使用 Deno 建立一個抓取 API,它接受 URL 並檢索它的元標記,這樣我們就可以從幾乎任何網站獲取標題、描述、圖像等欄位。
例如:
curl https://metatags.deno.dev/api/meta?url=https://dev.to
將給出這個結果
{ "last-updated": "2024-10-15 15:10:02 UTC", "user-signed-in": "false", "head-cached-at": "1719685934", "environment": "production", "description": "A constructive and inclusive social network for software developers. With you every step of your journey.", "keywords": "software development, engineering, rails, javascript, ruby", "og:type": "website", "og:url": "https://dev.to/", "og:title": "DEV Community", "og:image": "https://dev-to-uploads.s3.amazonaws.com/uploads/articles/8lvvnvil0m75nw7yi6iz.jpg", "og:description": "A constructive and inclusive social network for software developers. With you every step of your journey.", "og:site_name": "DEV Community", "twitter:site": "@thepracticaldev", "twitter:title": "DEV Community", "twitter:description": "A constructive and inclusive social network for software developers. With you every step of your journey.", "twitter:image:src": "https://dev-to-uploads.s3.amazonaws.com/uploads/articles/8lvvnvil0m75nw7yi6iz.jpg", "twitter:card": "summary_large_image", "viewport": "width=device-width, initial-scale=1.0, viewport-fit=cover", "apple-mobile-web-app-title": "dev.to", "application-name": "dev.to", "theme-color": "#000000", "forem:name": "DEV Community", "forem:logo": "https://media.dev.to/cdn-cgi/image/width=512,height=,fit=scale-down,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F8j7kvp660rqzt99zui8e.png", "forem:domain": "dev.to", "title": "DEV Community" }
很酷,不是嗎?
元標籤以及為什麼我們需要它們
元標記是 HTML 元素,用於向搜尋引擎和其他用戶端提供有關頁面的附加資訊。
這些標籤通常包括定義資訊類型的名稱或屬性屬性,以及包含該資訊的值的內容屬性。這是兩個元標記的範例:
<meta name="description" content="The <meta> HTML element represents metadata that cannot be represented by other HTML meta-related elements, like <base>, <link>, <script>, <style> or <title>."> <meta property="og:image" content="https://developer.mozilla.org/mdn-social-share.cd6c4a5a.png">
第一個標籤提供頁面的描述,而第二個標籤是開放圖譜標籤,定義在社群媒體上分享頁面時要顯示的圖像。
元標籤的一個實際應用是建立書籤管理器。您無需為每個書籤手動新增標題、描述和圖像,而是可以使用元標記自動從新增書籤的 URL 中抓取此資訊。
打開圖
Open Graph 是一種互聯網協議,最初由 Facebook 創建,旨在標準化網頁內元數據的使用來表示頁面內容,它可以幫助社交網絡生成豐富的鏈接預覽。
在這裡閱讀更多相關資訊。
為什麼是德諾?
- Deno 具有安全預設設置,這意味著它需要明確的檔案、網路和環境存取權限,從而降低安全漏洞的風險。
- Deno 基於Web 標準構建,使用ES 模組,旨在使用Web 平台API(例如fetch)而不是專有API,使Deno 程式碼與您在瀏覽器中編寫的程式碼非常相似- 但仍然有一些規範與瀏覽器的偏差。
- Deno 具有內建的 TypeScript 支持,可讓您無需建置步驟即可編寫 TypeScript 程式碼。
- Deno 附帶一個標準函式庫,其中包括用於 HTTP 伺服器、檔案系統操作等常見任務的模組。
- Deno 提供了 Linter、Formatter 和 Test runner,讓您可以使用該平台而不是依賴第三方軟體包或工具,使其成為 Javascript 開發的一體化工具。
- Deno 提供 Deno Deploy,這是一個可擴展的平台,適用於全球分佈的無伺服器 JavaScript/Typescript 應用程序,確保最小的延遲和最長的正常運行時間。
我們正在建立的 API 將由兩個部分組成,一個用於取得和解析元標記的函數,以及一個回應 HTTP 請求的 API 伺服器。
取得元標籤
讓我們先到 Deno Deploy 並登入。
登入後點選「New Playground」
這將為我們提供一個 hello world 起點。
現在我們將新增一個名為 getMetaTags 的函數,該函數接受 url 並使用 Fetch API 取得所請求 URL 的 HTML 並將其傳遞到用於 HTML 解析的套件 (deno-dom)。
要將 deno-dom 新增到我們的專案中,我們可以使用 jsr 套件管理器:
curl https://metatags.deno.dev/api/meta?url=https://dev.to
現在我們將使用 Fetch API 來取得 HTML 文字:
{ "last-updated": "2024-10-15 15:10:02 UTC", "user-signed-in": "false", "head-cached-at": "1719685934", "environment": "production", "description": "A constructive and inclusive social network for software developers. With you every step of your journey.", "keywords": "software development, engineering, rails, javascript, ruby", "og:type": "website", "og:url": "https://dev.to/", "og:title": "DEV Community", "og:image": "https://dev-to-uploads.s3.amazonaws.com/uploads/articles/8lvvnvil0m75nw7yi6iz.jpg", "og:description": "A constructive and inclusive social network for software developers. With you every step of your journey.", "og:site_name": "DEV Community", "twitter:site": "@thepracticaldev", "twitter:title": "DEV Community", "twitter:description": "A constructive and inclusive social network for software developers. With you every step of your journey.", "twitter:image:src": "https://dev-to-uploads.s3.amazonaws.com/uploads/articles/8lvvnvil0m75nw7yi6iz.jpg", "twitter:card": "summary_large_image", "viewport": "width=device-width, initial-scale=1.0, viewport-fit=cover", "apple-mobile-web-app-title": "dev.to", "application-name": "dev.to", "theme-color": "#000000", "forem:name": "DEV Community", "forem:logo": "https://media.dev.to/cdn-cgi/image/width=512,height=,fit=scale-down,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F8j7kvp660rqzt99zui8e.png", "forem:domain": "dev.to", "title": "DEV Community" }
取得HTML 後,我們可以使用deno-dom 對其進行解析,然後使用標準DOM 函數(如querySelectorAll)獲取所有元HTML 元素,迭代它們並使用getAttribute 獲取每個元素的名稱、屬性和內容這些標籤:
<meta name="description" content="The <meta> HTML element represents metadata that cannot be represented by other HTML meta-related elements, like <base>, <link>, <script>, <style> or <title>."> <meta property="og:image" content="https://developer.mozilla.org/mdn-social-share.cd6c4a5a.png">
最後,我們也會查詢
import { DOMParser, Element } from "jsr:@b-fuze/deno-dom";
它不完全是一個元標記,但我認為它是一個有用的字段,所以無論如何它將成為我們 API 的一部分。 :)
我們最終的 getMetaTags 函數應如下所示:
const headers = new Headers(); headers.set("accept", "text/html,application/xhtml+xml,application/xml"); const res = await fetch(url, { headers }); const html = await res.text();
伺服器
為了簡單起見,我決定使用 Deno 內建的 http 伺服器,這只是一個簡單的 Deno.serve() 呼叫。
由於 deno 是基於 Web 標準建構的,因此我們可以使用 Fetch API 中內建的 Response 物件來回應請求。
curl https://metatags.deno.dev/api/meta?url=https://dev.to
我們的伺服器解析請求 URL,檢查是否收到對 /api/meta 路徑的 GET 請求,並呼叫我們建立的 getMetaTags 函數,然後傳回元標記作為回應正文。
我們還新增了兩個標頭,第一個是 Content-Type,客戶端需要它來了解他們在回應中取得的資料類型,在我們的範例中是 JSON 回應。
第二個標頭是Access-Control-Allow-Origin,它允許我們的API 接受來自特定來源的請求,在我們的例子中,我選擇「*」接受任何來源,但您可能希望將其改為只接受來自以下來源的請求你前端的起源。
請注意,CORS 標頭只會影響瀏覽器發出的請求,這表示瀏覽器將根據標頭中指定的來源阻止請求,但仍可從伺服器直接呼叫 API。在這裡閱讀有關 CORS 的更多資訊。
您現在可以點選「儲存並部署」
然後等待 deno deploy 將程式碼部署到 Playground:
右上角的url 是你的Playground 的url,複製它並添加/api/meta?url=https://dev. 來查看它的實際情況,該url 應該類似於https://metatags.deno.dev / api/meta?url=https://dev.to
現在您應該看到 API 使用 dev.to 的元標記進行回應!
部署
使用 Deno 部署的 Playground 意味著您的程式碼在技術上已經部署,它是公開的並且任何人都可以存取。
對於像我們正在建置的這樣的簡單API,單一檔案遊樂場就足夠了,但在許多情況下,我們希望進一步擴展我們的項目,為此,您可以使用Deno 部署的Github 匯出來為以下專案建立適當的程式碼儲存庫:您的API,支援自動建立新程式碼推送:
或從遊樂場的設定:
注意事項
本文中介紹的抓取方法僅適用於從伺服器返回的html 檔案中具有元標記的網站,這意味著伺服器渲染或預先渲染的網站更有可能返回正確的結果,單頁應用程式也可以工作因為元標記是在建置時設定的,而不是在運行時設定的。
結論
我們示範了使用Deno 建置和部署API 是多麼快速和簡單,我們已經了解了Meta 標籤,以及如何使用Fetch API、DOM 解析器和Deno 內建伺服器來建立元標記在40 行程式碼內抓取API 。
要查看本文中建立的項目,您可以查看Deno 部署遊樂場(您需要將/api/meta?url=https://dev.to 新增至右側的網址列才能看到回應範例)或此github 儲存庫。
您接下來要建構什麼?
我希望這篇文章能啟發您探索元標籤和 Deno 的力量!嘗試建立您自己的 API 版本或將其整合到書籤管理器等專案中。
遇到困難、有疑問或想展示您建造的內容?請在下面發表評論或在 Twitter/X 上與我聯繫 – 我很樂意收到您的來信!
查看我之前關於用不到 40 行程式碼建立 React 狀態管理函式庫的文章。
以上是在程式碼行下建立元標籤抓取 API的詳細內容。更多資訊請關注PHP中文網其他相關文章!

JavaScript是現代網站的核心,因為它增強了網頁的交互性和動態性。 1)它允許在不刷新頁面的情況下改變內容,2)通過DOMAPI操作網頁,3)支持複雜的交互效果如動畫和拖放,4)優化性能和最佳實踐提高用戶體驗。

C 和JavaScript通過WebAssembly實現互操作性。 1)C 代碼編譯成WebAssembly模塊,引入到JavaScript環境中,增強計算能力。 2)在遊戲開發中,C 處理物理引擎和圖形渲染,JavaScript負責遊戲邏輯和用戶界面。

JavaScript在網站、移動應用、桌面應用和服務器端編程中均有廣泛應用。 1)在網站開發中,JavaScript與HTML、CSS一起操作DOM,實現動態效果,並支持如jQuery、React等框架。 2)通過ReactNative和Ionic,JavaScript用於開發跨平台移動應用。 3)Electron框架使JavaScript能構建桌面應用。 4)Node.js讓JavaScript在服務器端運行,支持高並發請求。

Python更適合數據科學和自動化,JavaScript更適合前端和全棧開發。 1.Python在數據科學和機器學習中表現出色,使用NumPy、Pandas等庫進行數據處理和建模。 2.Python在自動化和腳本編寫方面簡潔高效。 3.JavaScript在前端開發中不可或缺,用於構建動態網頁和單頁面應用。 4.JavaScript通過Node.js在後端開發中發揮作用,支持全棧開發。

C和C 在JavaScript引擎中扮演了至关重要的角色,主要用于实现解释器和JIT编译器。1)C 用于解析JavaScript源码并生成抽象语法树。2)C 负责生成和执行字节码。3)C 实现JIT编译器,在运行时优化和编译热点代码,显著提高JavaScript的执行效率。

JavaScript在現實世界中的應用包括前端和後端開發。 1)通過構建TODO列表應用展示前端應用,涉及DOM操作和事件處理。 2)通過Node.js和Express構建RESTfulAPI展示後端應用。

JavaScript在Web開發中的主要用途包括客戶端交互、表單驗證和異步通信。 1)通過DOM操作實現動態內容更新和用戶交互;2)在用戶提交數據前進行客戶端驗證,提高用戶體驗;3)通過AJAX技術實現與服務器的無刷新通信。

理解JavaScript引擎內部工作原理對開發者重要,因為它能幫助編寫更高效的代碼並理解性能瓶頸和優化策略。 1)引擎的工作流程包括解析、編譯和執行三個階段;2)執行過程中,引擎會進行動態優化,如內聯緩存和隱藏類;3)最佳實踐包括避免全局變量、優化循環、使用const和let,以及避免過度使用閉包。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

Atom編輯器mac版下載
最受歡迎的的開源編輯器

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

禪工作室 13.0.1
強大的PHP整合開發環境

WebStorm Mac版
好用的JavaScript開發工具