中关村在线

软件

Linux下PDF转文本方法

PDF中的部分文字无法直接复制,面对大量内容时逐字输入耗时费力,尤其是几百页的文档几乎难以完成。我在Linux系统中发现了一些实用的转换工具,经过实际测试,效果非常理想,能够高效提取文字内容,接下来将为大家逐一介绍这些工具的使用方法。

1、 装软件

2、 启动LibreOffice Writer,将之前截取的图片拖入文档中即可。

3、 点击保存为PDF,文件名为text。

4、 找到已保存的text.pdf文件,右键选择打开终端。

5、 在终端执行 pdftoppm text.pdf a,生成的文件为 a-1.ppm。

6、 输入命令:tesseract a-1.ppm a,即可生成a.txt文件。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具