pdfbox是一個(gè)主要用于處理PDF文檔的Java工具,該工具支持多種語言和平臺的PDF工具,而且操作簡單,可以從PDF和XFDF格式中導(dǎo)入或?qū)С霰韱螖?shù)據(jù)。
【功能介紹】
1、文本提?。簭腜DF文檔中提取文本。
2、合并&分割:可以把多個(gè)PDF文檔合并成單個(gè),也可以把單個(gè)PDF分拆成多個(gè)PDF文檔。
3、表單填充:可以從PDF表單中提取數(shù)據(jù),或者是填充PDF表單。
4、PDF/A驗(yàn)證:驗(yàn)證PDF文檔是否滿足PDF/A ISO標(biāo)準(zhǔn)。
5、PDF打?。喊裀DF文檔輸出到打印機(jī)——利用了Java的打印API。
6、PDF轉(zhuǎn)換:可以把PDF文檔轉(zhuǎn)換成映像文件。
7、PDF創(chuàng)建:可以從頭創(chuàng)建新的PDF文檔。
8、集成Lucene搜索引擎:Lucene搜索引擎與PDF索引相集成。
【更新內(nèi)容】
V2.0.6:
這個(gè)版本是基于 2.0.5 版本的增量式 bug 修復(fù)版本,包含了幾個(gè)修復(fù)和小改進(jìn),更新如下:
Bug 修復(fù)
[PDFBOX-3313] - Java 9 InaccessibleObjectException
[PDFBOX-3318] - IllegalArgumentException in PDPageTree constructor: root cannot be null
[PDFBOX-3347] - COSName parsing doesn't handle ISO-8859-1 encoded bytes