【奇迹防挂源码】【查看activity源码】【草莓庄园 源码】pdfbox 源码

2024-11-21 02:22:13 来源:公文流转 源码 分类:百科

1.我想问下 JAVA中 如何读取PDF文件里面的源码内容 谁给个详细的 例子 谢谢

pdfbox 源码

我想问下 JAVA中 如何读取PDF文件里面的内容 谁给个详细的 例子 谢谢

       用Java简单的读取pdf文件中的数据:

       第一步:下载PDFBox-0.7.2.jar。提供一个下载地址:/Resource.aspx?源码CID=--4ae1-b-c9e&RID=cd8f-1cee-b6-a3df-0eff8e0d2解压后,把lib文件下的源码奇迹防挂源码PDFBox-0.7.2.jar,PDFBox-0.7.2-log4j.jar放到你classpath路径下。源码(我把源码以及jar包都放到下面的源码查看activity源码附件里,方面你的源码草莓庄园 源码使用。)

       第二步:写个简单的源码读取pdf文件的程序。(PdfReader.java)

       import java.io.File;

       import java.io.FileOutputStream;

       import java.io.OutputStreamWriter;

       import java.io.Writer;

       import java.net.MalformedURLException;

       import java.net.URL;

       import org.pdfbox.pdmodel.PDDocument;

       import org.pdfbox.util.PDFTextStripper;

       public class PdfReader {

        public void readFdf(String file) throws Exception {

        // 是源码否排序

        boolean sort = false;

        // pdf文件名

        String pdfFile = file;

        // 输入文本文件名称

        String textFile = null;

        // 编码方式

        String encoding = "UTF-8";

        // 开始提取页数

        int startPage = 1;

        // 结束提取页数

        int endPage = Integer.MAX_VALUE;

        // 文件输入流,生成文本文件

        Writer output = null;

        // 内存中存储的源码PDF Document

        PDDocument document = null;

        try {

        try {

        // 首先当作一个URL来装载文件,如果得到异常再从本地文件系统//去装载文件

        URL url = new URL(pdfFile);

        //注意参数已不是源码以前版本中的URL.而是File。

        document = PDDocument.load(pdfFile);

        // 获取PDF的源码文件名

        String fileName = url.getFile();

        // 以原来PDF的名称来命名新产生的txt文件

        if (fileName.length() > 4) {

        File outputFile = new File(fileName.substring(0, fileName

        .length() - 4)

        + ".txt");

        textFile = outputFile.getName();

        }

        } catch (MalformedURLException e) {

        // 如果作为URL装载得到异常则从文件系统装载

        //注意参数已不是以前版本中的URL.而是File。

        document = PDDocument.load(pdfFile);

        if (pdfFile.length() > 4) {

        textFile = pdfFile.substring(0,源码 pdfFile.length() - 4)

        + ".txt";

        }

        }

        // 文件输入流,写入文件倒textFile

        output = new OutputStreamWriter(new FileOutputStream(textFile),源码卡iphonex源码

        encoding);

        // PDFTextStripper来提取文本

        PDFTextStripper stripper = null;

        stripper = new PDFTextStripper();

        // 设置是否排序

        stripper.setSortByPosition(sort);

        // 设置起始页

        stripper.setStartPage(startPage);

        // 设置结束页

        stripper.setEndPage(endPage);

        // 调用PDFTextStripper的writeText提取并输出文本

        stripper.writeText(document, output);

        } finally {

        if (output != null) {

        // 关闭输出流

        output.close();

        }

        if (document != null) {

        // 关闭PDF Document

        document.close();

        }

        }

        }

        /

**

        * @param args

        */

        public static void main(String[] args) {

        // TODO Auto-generated method stub

        PdfReader pdfReader = new PdfReader();

        try {

        // 取得E盘下的SpringGuide.pdf的内容

        pdfReader.readFdf("E:\\SpringGuide.pdf");

        } catch (Exception e) {

        e.printStackTrace();

        }

        }

       }

        这样就简单的完成了从pdf中读取数据了。在你的源码pdf文件所在的目录下生成一个同名的txt文件。

源码linux yum源码

更多资讯请点击:百科

热门资讯

源码分析pdf

2024-11-21 01:502972人浏览

商城 源码 php_商城源码php

2024-11-21 01:021958人浏览

微信群 源码

2024-11-21 00:06197人浏览

推荐资讯

opengl编程指南 源码_opengl编程基础

1.OpenSceneGraph三维渲染引擎编程指南目录2.OpenGL编程指南作者简介3.OpenGL学习之旅3)---Shader编程4.OpenSceneGraph三维渲染引擎编程指南内容简介5

php 商城 源码_php商城源码

1.禾匠榜店小程序商城后台源码安装教程最详版)禾匠榜店小程序商城后台源码安装教程最详版) 前提: 1、确保使用PHP7.2,数据库版本为5.6。 2、选择与PHP7.2版本相匹配的phpM

游戏php源码_php游戏源码网

1.php修仙文字游戏源码2.仿小皮手游网帝国CMS模板源码 大型手游门户网站系统源码+手机版+火车头采集3.PHP是什么意思(python编程)4.怎么看一个php网站源码?php修仙文字游戏源码