相关文章推荐
另类的砖头  ·  将txt文件编码改为utf-8格式_txt ...·  1 年前    · 
沉着的汉堡包  ·  Camunda大杂烩(一:搭建) - ...·  2 年前    · 
酷酷的金鱼  ·  在报表中创建“应用所有切片器”和“清除所有切 ...·  2 年前    · 
爱健身的灭火器  ·  nuxtjs如何在单独的js文件中引入sto ...·  2 年前    · 
Code  ›  如何逐行读取pdf开发者社区
string pdf
https://cloud.tencent.com/developer/ask/sof/114383436/answer/136959284
坏坏的凳子
1 年前
首页
学习
活动
专区
工具
TVP 最新优惠活动
返回腾讯云官网
提问

问 如何逐行读取pdf

Stack Overflow用户
提问于 2017-07-18 13:01:28
EN

我有一个名为 example1.pdf的pdf 。

我想用line.let来读它,第一行是 Hello my name is jhon 。所以我想用一个名为 line 的字符串。我正在使用 PDFTextStripper 和pdfBox进行尝试,但没有找到任何方法。任何帮助都将不胜感激。

2 11.2K 0 票数 2
EN
pdfbox
java
pdf

Stack Overflow用户

发布于 2019-01-22 07:30:34

这种方法容易得多。

代码语言: javascript
复制
public static void main(String[] args) throws Exception, IOException 
    File file = new File("File.pdf"); 
    PDDocument document = PDDocument.load(file);
    PDFTextStripper pdfStripper = new PDFTextStripper();
    pdfStripper.setStartPage(1);
    pdfStripper.setEndPage(1);
    //load all lines into a string
    String pages = pdfStripper.getText(document);
    //split by detecting newline
    String[] lines = pages.split("\r\n|\r|\n");
    int count=1;   //Just to indicate line number
 
推荐文章
另类的砖头  ·  将txt文件编码改为utf-8格式_txt ansi转化成utf-8-CSDN博客
1 年前
沉着的汉堡包  ·  Camunda大杂烩(一:搭建) - 正在学习的小小灰 - 博客园
2 年前
酷酷的金鱼  ·  在报表中创建“应用所有切片器”和“清除所有切片器”按钮 - Power BI | Microsoft Learn
2 年前
爱健身的灭火器  ·  nuxtjs如何在单独的js文件中引入store和router - 古兰精 - 博客园
2 年前
今天看啥   ·   Py中国   ·   codingpro   ·   小百科   ·   link之家   ·   卧龙AI搜索
删除内容请联系邮箱 2879853325@qq.com
Code - 代码工具平台
© 2024 ~ 沪ICP备11025650号