PDFlux是一款有支持macOS、Windows系統(tǒng)、小程序以及瀏覽器多平臺(tái)使用的一款表格智能提取神器,可以一鍵識(shí)別、一鍵提取PDF、掃描件、圖片中的表格、文本段落、圖片等要素,讓用戶能夠能夠智能的提取來(lái)自PDF的表格,并且還能夠進(jìn)行文件上面的轉(zhuǎn)換,相信這是很多的用戶在辦公或者學(xué)習(xí)當(dāng)中所遇到的問(wèn)題,pdf當(dāng)中躲避表格提取變成了非常大的問(wèn)題,使用非常方便。
PDFlux智能表格提取工具功能
1、表格識(shí)別
精準(zhǔn)識(shí)別無(wú)線框表格。
精準(zhǔn)識(shí)別復(fù)雜排版頁(yè)面的表格。
精準(zhǔn)識(shí)別表格內(nèi)部單元格合并。
跨頁(yè)表格自動(dòng)合并。
支持掃描件的表格識(shí)別:去除印章、角度矯正。
2、格式轉(zhuǎn)換
將PDF轉(zhuǎn)化為Word、Excel、HTML等格式。
將PDF轉(zhuǎn)化為EPUB、MOBI等電子書(shū)格式,可以在手機(jī)或Kindle等電紙書(shū)上閱讀。
精準(zhǔn)保留文本段落、表格等內(nèi)容塊信息。
精準(zhǔn)識(shí)別文檔的章節(jié)目錄結(jié)構(gòu)。
支持復(fù)雜排版的PDF文檔的轉(zhuǎn)換。
3、SaaS服務(wù)
提供一套完整易用的REST API,供計(jì)算機(jī)調(diào)用,讓您把PDF復(fù)雜格式拋諸腦后。
將PDF文檔解析為文本段落、表格、圖片等內(nèi)容塊的序列,保留原文檔的閱讀順序。
支持中英文多欄復(fù)雜排版的PDF文檔解析,跨欄和跨頁(yè)內(nèi)容塊智能自動(dòng)合并。
智能識(shí)別表格的內(nèi)部結(jié)構(gòu):?jiǎn)卧窈喜?,單元格文字的?duì)齊方式、縮進(jìn)、顏色、加粗、斜體等樣式信息,跨頁(yè)和跨欄表格智能合并單元格文字。
智能識(shí)別文檔的目錄結(jié)構(gòu),支持多達(dá)10個(gè)層級(jí),長(zhǎng)文檔信息抽取必不可少。
支撐后續(xù)各類文檔智能的應(yīng)用:PDF文檔全文檢索、文檔級(jí)別信息抽取等。
亮點(diǎn)
新版本PDFlux的上線增加了鉆?、金幣機(jī)制,對(duì)個(gè)人用戶開(kāi)放了充值購(gòu)買(mǎi)功能,現(xiàn)在只需要選擇你想使用的功能并充值對(duì)應(yīng)的鉆石、金幣,就可以馬上實(shí)現(xiàn)“PDFlux在手,你想要的全都有”。OCR功能迎來(lái)了上線后的重大優(yōu)化升級(jí),可在保留原文檔(如字體大小、對(duì)齊方式、文本縮進(jìn)等)格式的基礎(chǔ)上進(jìn)行復(fù)制。
在工具欄中點(diǎn)擊激活 OCR識(shí)別文字 按鈕,框選需要識(shí)別的段落后,客戶端右側(cè)會(huì)出現(xiàn)一個(gè)文本編輯器,此時(shí)可以對(duì)編輯器中的結(jié)果進(jìn)行編輯,編輯后再點(diǎn)擊編輯器左上角的復(fù)制按鈕即可。
批量復(fù)制功能。PDFlux首次開(kāi)放了批量操作的功能,在客戶端中找到工具欄,點(diǎn)擊即可激活批量復(fù)制 按鈕,激活后使用 鼠標(biāo)左鍵 單擊選中需要復(fù)制的段落和表格后,點(diǎn)擊頂部浮框中的復(fù)制 按鈕即可。
合并跨頁(yè)表格、單元格。如下圖所示,可點(diǎn)擊 合并表格 按鈕對(duì)跨頁(yè)表格進(jìn)行合并操作;表格成功合并后,點(diǎn)擊合并下一頁(yè)表格單元格 按鈕可合并跨頁(yè)表格單元格。
自動(dòng)識(shí)別圖表。點(diǎn)擊 截圖 按鈕,PDFlux會(huì)自動(dòng)識(shí)別PDF中的圖表,一鍵復(fù)制為圖片,也可以手工畫(huà)框截圖。
以上便是WinWin7分享給大家的PDFlux智能表格提取工具!