|
|
 |
| |
|
產品概述
"華通OCR"是華通辨識系統在 Windows環境下的最新版本。它保留了原有版本繁、
簡體多體中文辨識、中外文混排同時辨識、橫豎版面混排及複雜版面分析、理解與文字辨
識、表格自動辨識、批次辨識及將辨識結果自動送入其他應用程式和剪貼簿等功能外,新
增加了韓文辨識、語音校對等功能,辨識字形檔達到2萬餘字,手寫體辨識率大幅度提高,
並且支援彩色影像處理。因而應用面更廣,實用性更強,是"華通OCR"文字
辨識領域的新的里程碑。
|
系統特色
精準的OCR識別
顛覆將經過掃描獲得的、不能編輯修改、佔用較大磁碟空間的電子"圖像文件"進行識別,轉化易於編輯修改、佔用較小磁碟空間的電子文檔。這是本系統的核心。
 |
高效校對
利用橫向校對及縱向校對手段對識別後所得的電子文檔進行校對改錯,使檔案的文字正確率達98%。這是保證系統工作質量的重要環節。
利用內建的常用詞庫自動校對辨識出的文字,並標示出辨識時所碰到的疑問字,大幅節省使用者校對的時間。
|
版面還原
將經校對改錯的電子文檔以用戶所需的格式(HTML、RTF、TXT等)導出在相應的應用軟體中,可實現圖文結合(TXT格式除外),進行原式原樣的編輯,並可調整、豐富版面資訊,使生成最佳的版面。還可以從文檔建立邏輯結構,便於輸入資料庫。
|
相似字編輯修改
漢字辨別的過程,是系統按照一定的演算法和準則,確定出一系列與掃描得到的影像比較相似的漢字,其中最相似的一個也就是辨別結果。而這裏所說的相似字,則是指由系統列出所有這些可能的漢字,從而供用戶選擇正確的結果。在華通OCR 系統的辨別輸入過程中,無論辨別出錯的漢字屬於一個辭彙,還是一個與前後漢字都無法組成辭彙的單字,採用相似字的編輯方法,都是比較方便而有效的。因此, 華通OCR 系統在進入編輯環境後,總是自動處於相似字狀態,便於用戶進行編輯修改。
|
|
自動版面分析
影像輸入後系統後,系統可自動進行版面分析(藍框:橫向文字,紅框:直向文字),大大結省使用者框選版面時間。
|
常用符號編輯修改
常用符號,主要指那些鍵盤上不易輸入而又常常用到的標點或其他符號。如果辨別出錯的是符號,就可方便地通過【常用符號】的方式進行編輯修改。當切換到【常用符號】狀態後,螢幕左下角的編輯修改狀態欄域內,檢視出"常用符號"四個字,並在其後面的編輯修改候選字區域內,列出常用的符號。螢幕上每次列出的常用符號都是十個,可以按鍵盤上的【Shift + > 】鍵或【Shift + < 】鍵進行滾動檢視,也可以用滑鼠按螢幕上符號前面的 或 進行滾動檢視。如果螢幕上檢視出所需要的符號,按符號前面相應的數位鍵或直接用滑鼠按所需的符號即可。
|
識別多國語言
印刷體的文字,包括簡(繁)體多體漢字、純英文、日文、韓文、漢英混排文本。
|
識別多種影像模式
對黑白二值、256級灰度及24位元元彩色圖像的各種複雜版面的中文報紙均可進行版面分析、版面理解,並有準確的復原能力。
|
支援多種格式輸出
TXT、HTML、RTF等標準格式,並可製作成能供電腦閱讀和查詢檢索的電子文檔。
|
系統需求
|
一般配備 |
建議配備 |
作業系統 |
Windows XP、Vista、7
| Windows XP、Vista、7
|
處理器 |
Intel E3300 或更高機型
| Intel Core i3 或更高機型
|
記憶體 |
1GB | 2GB |
硬碟空間 |
250MB (系統安裝空間)
| 250MB (系統安裝空間)
|
其他設備 |
光碟機/ USB 2.0 連接埠
| 光碟機/ USB 2.0 連接埠
|
|
|
|
|