在.net下如何提取PDF的文字并检索相关数据

在.net下如何提取PDF的文字并检索相关数据,第1张

FileStream ReadPdf = new FileStream(@"d:\books\vbnet\testpdf", FileModeOpen);

long FileSize;

FileSize = ReadPdfLength;

byte[] Buffer = new byte[(int)FileSize];

ReadPdfRead(Buffer, 0, (int)ReadPdfLength);

ReadPdfClose();

FileStream CreatePdf = new FileStream(@"d:\books\vbnet\test1pdf", FileModeCreate);

CreatePdfWrite(Buffer,0,BufferLength);

CreatePdfClose();

希望能帮带你的忙~告一段落~谢谢~

引用 1 楼 bao22314483 的回复:将PDF转换为Excel只能用Adobe Acrobat 9 Pro手动批量转吧,代码实现不了 哦 我用的工具转的,效果还算理想吧,无乱码现象,可惜得到的Excel格式不正确。 该空行的不空,不该空行的却有空行现象,可能是导出的格式控制不好吧

word文档

将各数据之间以“,”或“

”分割排列,然后将word文档另存为。TXT文档,关闭文档。打开EXECL文件,文件-打开-选择刚才的TXT文件-按照提示一步一步打开文件即可导入EXEXL表格中。

PDF文档:

首先转换成TXT或word文件,其它同上。

如讲得不够详细,可发消息联系!

下面是我用的笨办法,希望你满意!

附件:word转execlpdf

以上就是关于在.net下如何提取PDF的文字并检索相关数据全部的内容,包括:在.net下如何提取PDF的文字并检索相关数据、怎么正确的从PDF中读取数据、如何自动抓取word或者pdf文档中的数据等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/9311281.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-27
下一篇2023-04-27

发表评论

登录后才能评论

评论列表(0条)

    保存