python前视图转换为俯视图

python前视图转换为俯视图,第1张

想要把前视图转化大悄为鸟瞰图,有两种做法

1.在没有标定的情况下,只能选取四个点对了

在有标定的情况下,可以直接使用标定的参数

这里主要介绍1

1.没有标定的情况下,主要用到了两个函数

M = cv2.getPerspectiveTransform(src, dst)

warped = cv2.warpPerspective(img, M, (img.shape[1], img.shape[0] + 1080))

cv2.getPerspectiveTransform 从四个点对中计算透视变换,返回值为3*3的透视变换矩阵

cv2.warpPerspective 计算透视变换后的图像

这里自己遇到的坑是,在计算透视变换矩阵的时候,怎么获取那四个点对,翻了很多blog,都没搞清,最后认认真真的找了一个认认真真的阅读之后,总算摸到门道了,有了一种融会贯通的感觉。

现在的目标是将图像由前视图转化为鸟瞰图,根据先验知识,在鸟瞰图下,长方形物体显示出来肯定是长方形,因此,我们只要在前视图中找到一个正方形的物体,并指定他在俯视图中的坐标就可以了,这里有个但是,由于先验信息里面只有矩形这个信息,具体的长宽比什么的,以及实际的大小未知,所以转化到鸟瞰图下并不能反应物体的真实长度。

这里怎么定义转化后的坐标要自己把握

790ec7dc8aa1

原图

比如说转化到黄色的坐型仿镇标(内接矩形),这时候就会内缩,图像出现黑边

790ec7dc8aa1

转化到黄色坐标

如果转化到蓝色的,那么能看到的方位就很小了,只有当前车道了(外接矩形)

790ec7dc8aa1

转化到蓝色坐标

dst的坐标也可以自己写,想要转成多大的图像也可以自己填

比如说根据车道的宽度和虚线的长度,可以大概估算出实际长宽比,一个车道宽度为3.75米 这种城市道路一般虚线是两米,间隔4米(高速一般是69,也就是15米)大概估计一下,高度是12米,也就是说长宽比为12:7,想要显示出4个车道,图像的宽度为1920,折算了一下,目标图像的坐标大概是(这里要注意,图像的坐标是从左上角开始算的)

790ec7dc8aa1

自定义

坐标定义代码:

src = np.float32([(1242,1949),(1961,1949), (2695, 2542), (133, 2542)])

#内接矩形

dst = np.float32([(1242, 1949), (1961, 1949), (1961, 2542), (1242, 2542)])

#外接矩形

dst = np.float32([(132, 1949), (2695, 1949), (2695, 2542), (133, 2542)])

#自定义

dst = np.float32([(480,1560-1080), (1440,1560-1080), (1440,3096-1080), (480,3096-1080)])

2.使用标定参数来转化

这个转化就是真实的了,因为知道相机的内参,还有相卜粗机的pitch角以及相机距离地面的高度

matlab里面转的,要标定的参数

可以参考的透视变换

给你陆悉带个例子吧

Point2f src[4]/早芦/源陆悔图像中的点

Point2f dst[4]//目标图像中的点

src[0].x = 1

src[0].y = 1

src[1].x = 1

src[1].y = 480

src[2].x = 640

src[2].y = 97

src[3].x = 640

src[3].y = 384

dst[0].x = 1

dst[0].y = 1

dst[1].x = 1

dst[1].y = 480

dst[2].x = 640

dst[2].y = 1

dst[3].x = 640

dst[3].y = 480

环境

矩形 *** 作是我们在 OpenCV 里最常用的 *** 作,其中最为常见的就是包围框( Bounding Box )和旋转矩形( Rotated Box )。 其中包围框是最为常见的,对应 OpenCV 中的 boundingRect() ,使用正矩形框处物体,一般多用在目标检测中。使用包围框框柱目标物体,这种 *** 作比较简单,但是通常框中也会有一些其他的区域。其次就是使用旋转矩形,也叫最小外接矩形,对应 OpenCV 中的 minAreaRect() ,用来使用旋转矩形最大限度的框出目标物体,减小背景干扰,在 OCR 任务中较为常用。

minAreaRect() 返回了所需区域的最小斜矩形的参数,与包围框直接返回四个顶点的坐标不同,最小外接矩形返回的是矩形的 ((x, y), (w, h), angle) ,对应了矩形的中心,宽度,高度和旋转角度。

旋转角度 angle 是水平轴( x 轴)逆时针旋转,与碰到的矩形的第一条边的夹角。并且这个边的边长是 width ,答山另一条边边长是 height 。也就是说,在这里 width 与 height 不是按照长短来定义的。

在 OpenCV 中,坐标系原点在左上角,相对于 x 轴,逆时针旋转角度为负,顺时针旋转角度为正,所以函数 minAreaRect() 返回的角度范围时 [-90~0) 。想象一个平放的长矩形,调用 minAreaRect() 返回的角度为 -90 度。如清隐中果我们旋转图像,直到矩形树立起来,这是调用 minAreaRect() 得到的角度依然是 -90 度。

第一种裁剪旋转矩形的方法是通过仿射变换旋转图像的方式。

仿射变换( Affine Transformation ) 是一种二维坐标到二维坐标之间的线性变换,保持二维图形的“平直性”( straightness ,即变换后直线还是直线不会打弯,圆弧还是圆弧)和“平行性”( parallelness ,其实是指保二维图形间的相对位置关系不变,平行线还是平行线,相交直线的交角不变。)。

计算过程:

如果不做边长和角度的判断,则只会沿着 x 轴的顺时针方向做相同大小角度的旋转,不能保证旋转后的视角是正确的视角:

根据任务目标的类型,做边长和角度的判断并进行相应的调整,可以保证旋转后的视角是正确的视角:

第二种裁剪旋转矩形的方法是通过透视变换直接将旋转矩形的四个顶点映射到正矩形的四个顶点。

透视变换( Perspective Transformation )是将图片投影到一个新的视平面( Viewing Plane ),也称作投影映射( Projective Mapping )。

计算过程:

以上两种方法都可以用来抠取旋转矩形的内容。仿射变换方法需要预携虚先对整张图进行旋转,通过观察旋转后的图像可以发现,有一部分图像被旋转出了图像边界,如果你要抠取的目标正好在图像边缘附近,那么很容易出界导致图像抠取的缺失。同时我们需要对宽、高和角度做出动态的调整;透视变换的方法直接对抠取区域进行了映射,这种方法可以省略旋转的步骤,并且不会出现抠取内容的缺失。同时我们只需要对4个顶点之间的映射关系做好定义即可,不需要考虑角度的问题。相对的,透视变换相对于仿射变换计算量更大一些,不过这在 c++ 的底层实现上带来的时延差距小于 ms 。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/8189432.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-14
下一篇2023-04-14

发表评论

登录后才能评论

评论列表(0条)

    保存