如何使用PDFrw在Python中从PDF中提取数据

如何使用PDFrw在Python中从PDF中提取数据,第1张

概述我正在尝试使用PDFrw从某个PDF获取数据(比如说 HERE页右上角的那个).我使用PDFrw来做到这一点.我查看了他们提供的文档(我找不到太多)并查看了他们在git上发布的示例代码,但我似乎无法获得足够的信息来做我想做的事情.如何使用PDFrw制作一个简单的程序进入PDF(或者如果有更好的那个,则进入另一个程序)并提取某段文本.我正在考虑将其转换为HTML …这会更容易吗?看看我上面提供的PD 我正在尝试使用pdfrw从某个pdf获取数据(比如说 HERE页右上角的那个).我使用pdfrw来做到这一点.我查看了他们提供的文档(我找不到太多)并查看了他们在git上发布的示例代码,但我似乎无法获得足够的信息来做我想做的事情.如何使用pdfrw制作一个简单的程序进入pdf(或者如果有更好的那个,则进入另一个程序)并提取某段文本.我正在考虑将其转换为HTML …这会更容易吗?看看我上面提供的pdf作为一个例子,我想得到(让我们说)电压,这在pdf中是600瓦…我怎样才能以最简单的方式做到这一点?我找不到任何关于此的任何其他堆栈溢出问题,所以希望有人可以帮助以前使用它!

谢谢!

解决方法 我是pdfrw的作者,它并不是真的为此而设计的.你应该看看pdfminer. 总结

以上是内存溢出为你收集整理的如何使用PDFrw在Python中从PDF中提取数据全部内容,希望文章能够帮你解决如何使用PDFrw在Python中从PDF中提取数据所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/langs/1194200.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-06-03
下一篇2022-06-03

发表评论

登录后才能评论

评论列表(0条)

    保存