時(shí)間:2017-05-16 15:07:42 作者:不思議游戲 瀏覽量:36
在使用ABBYY FineReader 14識(shí)別文檔時(shí),要想獲得快速準(zhǔn)確的結(jié)果,選擇正確的OCR選項(xiàng)很重要,決定好要使用的選項(xiàng)之后,還應(yīng)該考慮文檔的類型和復(fù)雜性,以及如何去使用識(shí)別結(jié)果。
OCR選項(xiàng)位于ABBYY FineReader‘選項(xiàng)’對(duì)話框的OCR選項(xiàng)卡上(點(diǎn)擊工具 > 選項(xiàng)…打開此對(duì)話框)。
ABBYY FineReader 14可以自動(dòng)識(shí)別添加到OCR項(xiàng)目的任何頁面,當(dāng)前選定的選項(xiàng)將用于OCR過程,你也可以在圖像處理選項(xiàng)卡上關(guān)閉最新添加的圖像的自動(dòng)分析和OCR。
注意:如果在文檔識(shí)別之后修改OCR選項(xiàng),需再次運(yùn)行OCR過程,通過新選項(xiàng)識(shí)別文檔。
1、PDF識(shí)別模式
這些設(shè)置僅適用帶有文本層和圖片的PDF文檔,這種PDF文檔通常從可編輯格式的文檔創(chuàng)建,其他類型的PDF文檔,比如可搜索的PDF文檔和僅圖像PDF文檔,通常在‘使用OCR’模式中處理,處理這種類型的PDF文檔無需額外的設(shè)置。
有三種識(shí)別模式可以使用:
•自動(dòng)在OCR和PDF中的文字之間選擇
程序會(huì)檢測文本層,如果它包含高質(zhì)量的文本,便使用現(xiàn)有的高質(zhì)量文本層,OCR將用于創(chuàng)建新的文本層。
•使用OCR
OCR將用于創(chuàng)建新的文本層,這種模式花費(fèi)的時(shí)間更多,但更適用于文本層質(zhì)量較差的文檔。
•僅使用PDF中的文字
這是帶有文本層PDF文檔的默認(rèn)模式,程序會(huì)使用原始文本層,無需運(yùn)行OCR。
2、在OCR速度和準(zhǔn)確度之間平衡
ABBYY FineReader 14可以讓你:
•通篇識(shí)別
在這種模式下,F(xiàn)ineReader 14既可以分析和識(shí)別簡單的文檔,也可以分析識(shí)別布局復(fù)雜的文檔。這種識(shí)別需要更多時(shí)間,但最終的效果也更好。
•快速識(shí)別
這種模式建議用于處理布局簡單且圖像質(zhì)量較好的較大文檔。
3、檢測結(jié)構(gòu)元素
選擇你希望程序檢測的結(jié)構(gòu)元素:頁眉和頁腳、腳注、目錄以及編號(hào)列表,保存文檔之后,選中的元素將可點(diǎn)擊。
4、條碼
如果你的文檔包含條碼,你希望將它們轉(zhuǎn)化為字符串和數(shù)字,而不是保存為圖片,則勾選‘轉(zhuǎn)化條形碼為字符串’,該功能通常是默認(rèn)禁用的。