如何从pdf文件中搜索和抓取内容

如何从pdf文件中搜索和抓取内容,第1张

如果是电子版本的PDF,可对 其内容进行搜索或抓取。如果 是单纯扫描版的,则不可以。

如果你用Adobe Acrobat XI Pro的创建PDF扫描生成双层PDF文档,即在扫描的选项如下图对使内容可搜索打钩,即可对 其内容进行搜索或抓取。

sing System;

using SystemDrawing;

using SpirePdf;

using SpirePdfGeneralFind;

namespace 获取指定文字的坐标

{

class Program

{

static void Main(string[] args)

{

//加载文档

PdfDocument doc = new PdfDocument();

docLoadFromFile(@"E:\ProgramFiles\PDFpdf");

PdfTextFind[] result = null;

foreach (PdfPageBase page in docPages)

{

result = pageFindText("PDF")Finds;

foreach (PdfTextFind text in result)

{

//获取文字的坐标,宽度和高度

PointF pf = textPosition;

SizeF size = textSize;

ConsoleWriteLine(pf);

ConsoleWriteLine(size + "\n");

}

}

}

}

}

其实你可以在word里面画图的,pdf貌似不可以,需要下载插件之类的估计

在word里面画好了,保存成了,然后再插入到pdf中,或是用软件转换成pdf

具体步骤是:

1执行“绘图/绘图网格/在屏幕上显示网格(注意数据设置)/确定”命令,使页面上显示绘图网格;

2用“绘图”工具栏上的“箭头”画坐标轴,画时按住Shift键,保证画出的线水平、垂直;

3用“直线”或“椭圆”画坐标轴上的刻度;

4用“本框”制作数轴上数据标识;

5把直线、刻度、数据标识同时选中并右击,执行“组合/组合”命令,把所有图形组合起来成为一个完整的平面直角坐标系,便于整体移动摆放。

6用“椭圆”制作坐标点(画时按住Shift键)、用“直线”画点向坐标轴引的垂线、用“文本框”制作点的坐标。

7用“绘图”工具栏上的“自选图形”制作函数图形。

二、双击文本框的框框,点“颜色”,选白色就OK了。

以上就是关于如何从pdf文件中搜索和抓取内容全部的内容,包括:如何从pdf文件中搜索和抓取内容、c#中如何设置PDF文件的宽高、PDF文件里面能画坐标轴吗xoy那种数学坐标轴等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/9765891.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-01
下一篇2023-05-01

发表评论

登录后才能评论

评论列表(0条)

    保存