微軟 已宣布Azure Translator 中內建的文件翻譯功能現在可以掃描和翻譯 PDF 文件。該公司表示,用戶在嘗試翻譯文件之前不再需要透過 OCR 引擎對文件進行預處理。
文件翻譯功能於一年前首次推出,能夠一次將多個文件翻譯成 110 多種語言和方言。今天的更新意味著現在完全支援 PDF 文件以及 Word 和 PowerPoint 文件。據該公司稱,能夠掃描帶有掃描影像內容的 PDF 是非常需要的。
解釋一些功能,微軟說:
文件翻譯服務現在擁有智慧
- 識別PDF 文件是否包含掃描的圖像內容,
- 將包含掃描影像內容的PDF 路由到內部的OCR 引擎以提取文本,
- 將翻譯後的內容重建為常規文本PDF,同時保留原始佈局和結構。
雖然文件翻譯適用於 110 種語言和方言,但新的掃描功能僅適用於 68 種原始語言和 87 種目標語言。微軟已承諾在「適當的時候」增加對更多的支援。
微軟表示無需更改程式碼即可開始使用新功能,並且所有 PDF 都可以立即提交給 Translator。新功能不會讓客戶多花錢。透過 Azure 提供兩種用於文件翻譯的定價方案;它們包括現收現付計劃和針對更高數量的 D3 數量折扣計劃。
以上是Azure 翻譯機現在可以掃描和翻譯 PDF 文檔的詳細內容。更多資訊請關注PHP中文網其他相關文章!