微软 已宣布Azure Translator 中内置的文档翻译功能现在可以扫描和翻译 PDF 文档。该公司表示,用户在尝试翻译文档之前不再需要通过 OCR 引擎对文档进行预处理。
文档翻译功能于一年前首次推出,能够一次将多个文档翻译成 110 多种语言和方言。今天的更新意味着现在完全支持 PDF 文件以及 Word 和 PowerPoint 文件。据该公司称,能够扫描带有扫描图像内容的 PDF 是非常需要的。
解释一些功能,微软说过:
文件翻译服务现在拥有智能
- 识别 PDF 文档是否包含扫描的图像内容,
- 将包含扫描图像内容的 PDF 路由到内部的 OCR 引擎以提取文本,
- 将翻译后的内容重建为常规文本 PDF,同时保留原始布局和结构。
虽然文档翻译适用于 110 种语言和方言,但新的扫描功能仅适用于 68 种源语言和 87 种目标语言。微软已承诺在“适当的时候”增加对更多的支持。
微软表示无需更改代码即可开始使用新功能,并且所有 PDF 都可以立即提交给 Translator。新功能不会让客户多花钱。通过 Azure 提供两种用于文档翻译的定价计划;它们包括现收现付计划和针对更高数量的 D3 数量折扣计划。
以上是Azure 翻译器现在可以扫描和翻译 PDF 文档的详细内容。更多信息请关注PHP中文网其他相关文章!