尚書七號電腦版是一款優(yōu)秀的ocr文字識別軟件,能識別宋體、仿宋、楷、黑、魏碑、隸書、圓體、行楷等一百多種字體,并支持多種字體混排。無論是書籍報刊、還是報表票據(jù)、公文檔案都可以用尚書七號錄入,只需將紙質(zhì)文檔掃描,即可在尚書七號中將掃描的圖片中的文字提取出來,形成電子檔以便存檔,無需人工操作,高效且省時省力。趕緊來下載使用吧!
1、識別字符
簡體字符集:國標GB2312-80的全部一、二級漢字6800多個。
2、純英文字符集。
簡繁字集:除了簡體漢字外,還可以混識臺灣繁體字5400多個以及香港繁體字和GBK漢字。
3、識別字體種類
能識別宋體、仿宋、楷、黑、魏碑、隸書、圓體、行楷等一百多種字體,并支持多種字體混排。
4、識別字號
初號、小六號字體。
5、表格識別
可以自動判斷、拆分、識別和還原各種通用型印刷體表格。
6、可支持繁體WINDOWS系統(tǒng)
用掃描儀掃描的文字圖像,不能對個別文字進行編輯修改,在教學(xué)中,需要利用文字識別軟件,將文字圖像進行識別,將圖像格式轉(zhuǎn)化成文本格式,常見的文字識別軟件有很多,主要功能基本相同,尚書七號就是其中很優(yōu)秀的一款。用尚書七號對文字圖像識別轉(zhuǎn)化的過程,利用其主菜單:“文件”、“編輯”、“識別”、“輸出”可以很方便地完成。具體步驟為:
1、獲取文字圖像文件
選擇“文件”菜單下的“掃描”或“打開圖像”(將已經(jīng)掃描好的圖像文件打開)命令,打開圖像文件。如果連接了多臺掃描儀,可以選擇“文件”菜單下的“選擇掃描儀”命令,調(diào)用掃描儀。
2、對掃描的圖像頁進行調(diào)整
選擇“編輯”菜單下“圖像頁面的處理”子菜單下的“圖像頁的傾斜校正”(提供自動和手動實現(xiàn)方法)及“旋轉(zhuǎn)”等命令,將掃描的圖像頁進行調(diào)整。
3、版面分析與文字識別轉(zhuǎn)化
版面分析,選擇識別范圍,在進行文字識別前要選擇識別范圍,識別過程的核心是“版面分析”。
尚書七號的自動版面分析功能很強,對報紙雜志等復(fù)雜的版面,也能保持很高的分析正確率。
設(shè)置好后,直接點擊“開始識別”的按鈕就可以進行文字識別了。
4、校對修改
自動識別完畢,識別結(jié)果的“文本窗口”會彈出,這個窗口能夠提供識別結(jié)果的校對,為了校對方便,尚書七號增加了光標跟隨顯示原圖像行的校對方法(如圖3出現(xiàn)的黃色提示行的出現(xiàn))。
提供的校對方法,一眼就能夠看到圖像原文和識別出文本的差別,如果發(fā)現(xiàn)識別有誤,可以進行修改。
5、輸出
如果檢查修改后確認無誤,選擇識別結(jié)果的“輸出”菜單,輸出的文件格式有:RTF、HTML、XLS、22238,可以根據(jù)自己的需要選擇對應(yīng)的格式。如果用戶想得到類似原文的識別結(jié)果,請選擇RTF格式。把RTF格式輸出的文件用WORD打開后,會發(fā)現(xiàn)幾乎保留了原文的所有痕跡,包括原來頁面中的彩色圖像,都已經(jīng)保留在WORD中了。
尚書七號識別效果不佳?
1、掃描設(shè)置不當,掃描圖像時的掃描分辨率(Resolution)一般應(yīng)設(shè)為300dpi,如果文檔字體較小則需要將掃描分辨率設(shè)定為更高值如400dpi或600dpi。縮放比例(Scaling)設(shè)為100%,亮度閥值(Threshold,Brightness)需根據(jù)紙張和印刷的質(zhì)量調(diào)節(jié),避免掃描圖像過黑或過淡 。
解決方法:
1.尚書七號識別圖片時如果全部顯示亂碼,說明圖片的分辨率較低,無法識別。
尚書七號官方下載
2.這時候可以用photoshop把圖片分辨率調(diào)大,這樣分辨率高了,雖然看清來不清晰,但是對于尚書七號來說足夠了。
2、如自動版面分析有錯誤,這時請用戶用鼠標自己劃分出正確的版面塊;版面塊的版式設(shè)置錯誤,如將橫版的設(shè)置為豎版,豎版的設(shè)置為橫版等,這時請用戶自行將塊的版式修改正確。
3、原稿印刷質(zhì)量太差,筆畫斷裂嚴重、油墨太濃、字與字之間粘連嚴重等也可能使識別率顯著降低。
4、識別語言選項選擇不當,應(yīng)根據(jù)原稿正確選擇“簡體”、“簡繁”或“英文”。
尚書7號ocr文字識別系統(tǒng)中出現(xiàn)綠色的框是怎么回事?
“可以把掃描上的文字直接用于編輯”與掃描儀無關(guān),什么掃描儀都可以。能“直接用于編輯”屬于漢字識別,是靠OCR(光學(xué)字符識別)軟件實現(xiàn)的。
1、支持彩色、灰度圖像文件直接進行識別的OCR工具。
2、尚書六號支持TIFF、BMP和JPG格式等掃描。
3、OCR也就是文字識別技術(shù),運用電腦或者掃描儀來識別圖片或者數(shù)字圖片文件里的文字內(nèi)容,方便文字錄入,提高工作效率。
4、使用只需要用本軟件打開要識別的文字的圖片,點擊識別即可,識別率非常高,即便是有嚴重劃痕和干擾的圖片,也能達到驚人的98.5%。
本欄目為大家?guī)淼氖嵌喙δ軣o誤差文字識別軟件免費下載,包括:VeryPDF OCR to Any Converter(文字識別軟件),金鳴表格文字識別系統(tǒng),金鳴文表識別系統(tǒng)等。小伙伴們,有時候文字不能...
下載地址
網(wǎng)友評論
0條評論
分類列表
相關(guān)文章