「今天,許多產業對影像圖形的處理有了更加多元化的需求,這也是掃描產品在商業層面的全新機會。」近日,在「AIGC應用助力企業經營提效」主題沙龍上,阿里智慧資訊事業群夸克視覺技術負責人黃銳華表示,大模型技術運用在掃描場景後已經發生兩方面變化,一方面它能升級多項掃描技術的核心能力,給企業提供更精準的掃描服務。另一方面,大模型開啟了更多掃描場景,為日常辦公帶來更多效率上的提升。
(阿里智慧資訊事業群夸克視覺科技負責人黃銳華)
OCR技術面臨手寫體、小語種、複雜公式等挑戰,傳統掃描難以完全理解和還原內容。大模型出現後,掃描產品可透過學習完善和創造內容,呈現更完美結果。
黃銳華表示,手機掃描產品具備了便利性、雲端處理能力和個人化編輯能力,這使得手機掃描效果超過了傳統掃描器。以往,掃描一份文件需要將圖片轉換成Word才能進行編輯,這個過程不僅複雜而且容易導致精確度損失。夸克掃描王採用了更複雜但用戶體驗更好的方式,用戶可以直接在掃描後的圖片上編輯文字,這是掃描產品技術創新的重要突破。
有產業專家指出,今年將是產業升級的元年,尤其是在多模態和垂直領域方面。黃銳華表示,夸克掃描王將藉助自研的大模型,全面升級掃描的多項能力和用戶體驗,重點關注文檔智能、掃描與圖像處理等核心場景,以構建適用於企業的全新服務能力。
去年8月,夸克掃描王率先應用大模型技術。近期,夸克掃描王在智慧排版、文件編輯、影像修復等方面加大創新投入。
根據《國家行動互聯網軟體產品品質檢驗檢測中心》的評測報告顯示,夸克掃描王在公式識別、複雜排版(分段)識別和複雜排版(縮進)等掃描難度較高的複雜場景中表現出色。準確率分別達到了86.92%、99.72%和93.73%的高分,遠超過業界平均。這證明夸克掃描王在處理複雜掃描場景時具有優異的辨識能力,為使用者提供了更準確、高效的掃描體驗。
夸克掃描王的多項技術能力已應用於國內電商、海外票據、醫療健康和教育學習等多個領域。黃銳華認為,隨著企業開始採用大型模型技術和AIGC應用越來越成熟,整個市場將會迎來新一輪的快速發展。
以上是AI技術提升企業效率,夸克掃描王大規模應用落地的詳細內容。更多資訊請關注PHP中文網其他相關文章!