關于pdf識別流程(建議本身是圖片的pdf文檔使用該軟件):
1.pdf轉換成圖片。
2.圖片OCR成文字。
關于排版:
1.支持自動分段。
2.界面上有個強制分段的滑塊,表示一個閥值,當識別的一行的文本個數(shù)小于該數(shù)值時,強制分段。
由于時間原因,該軟件僅僅進行接口維護。
1.1更新
1.優(yōu)化了下排版接口。
2.增加了工作區(qū)域滾動條。
1.2更新
1.支持tif格式圖片
2.增加了工作區(qū)域可以進行Ctrl+↑或Ctrl+↓進行移動,同時可以進行拖動方便排版。
3.對于導入的文檔順序進行了部分優(yōu)化。
使用方法:
1.選擇目錄或者拖入文件。
2.選擇word配置。
3.點擊識別按鈕。
4.等待識別完成。
5.對于表格區(qū)域,按住Ctrl+上鍵(下鍵)可以進行移動。
滑塊作用:更改某行文本小于某個數(shù)值時強制分段