在.net下如何提取PDF的文字并检索相关数据_框架

FileStream ReadPdf = new FileStream(@"d:\books\vbnet\testpdf", FileModeOpen);

long FileSize;

FileSize = ReadPdfLength;

byte[] Buffer = new byte[(int)FileSize];

ReadPdfRead(Buffer, 0, (int)ReadPdfLength);

ReadPdfClose();

写

FileStream CreatePdf = new FileStream(@"d:\books\vbnet\test1pdf", FileModeCreate);

CreatePdfWrite(Buffer,0,BufferLength);

CreatePdfClose();

希望能帮带你的忙~告一段落~谢谢~

引用 1 楼 bao22314483 的回复:将PDF转换为Excel只能用Adobe Acrobat 9 Pro手动批量转吧,代码实现不了哦我用的工具转的，效果还算理想吧，无乱码现象，可惜得到的Excel格式不正确。该空行的不空，不该空行的却有空行现象，可能是导出的格式控制不好吧

word文档：

将各数据之间以“，”或“

”分割排列，然后将word文档另存为。TXT文档，关闭文档。打开EXECL文件，文件－打开－选择刚才的TXT文件－按照提示一步一步打开文件即可导入EXEXL表格中。

PDF文档：

首先转换成TXT或word文件，其它同上。

如讲得不够详细，可发消息联系！

下面是我用的笨办法，希望你满意！

附件：word转execlpdf

以上就是关于在.net下如何提取PDF的文字并检索相关数据全部的内容，包括:在.net下如何提取PDF的文字并检索相关数据、怎么正确的从PDF中读取数据、如何自动抓取word或者pdf文档中的数据等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

在.net下如何提取PDF的文字并检索相关数据