
笔者ss="superseo">ss="superseo">根据个人经理人在战争时期教授的项目案例,从乘积论的角度对计算机视觉进行了计算,希望对你有所帮助。
计算机视觉是我的老伴侣,我以计算机视觉为常识开始打野智。最近受益于老麦带我逐日审计的算法,我减少了对慢坐(商汤)的《计算机视觉的完整链条,从成像到后期视觉再到识别理解》的阅读,发明了很多疑点。当时不觉得有什么,现在看了,每一步都有意义。
明天我将根据战争时期我的私人经理教的项目案例,从产品理论的角度计算计算机视觉。
1。媒体
计算机视觉是通过使用计算机和相关设备来模仿死亡物体的视觉。它的次要任务是通过进程停止处理采集到的图片或视频,得到响应场景的三维信息。
在慢坐的分享中,计算机视觉的完整链条分为三个部门:
成像(图像)
早期视觉
认可(承认)
本文还将所有连锁按照慢坐分为三个部门,用实际例子将三个部门中可以密切关注的路产品内容进行分离。
2。成像
成像是对相机原理的模仿,也就是在处理如何阻止拍照量的提升。
当我们在实践行业中使用它时,我们经常发明实践数据战争。实验室里的数据对新的一年来说是好的,并且试验数据的数量几乎比实验室里的好。更有甚者,当我们开始练习模具的时候,会发现实验室模具在练习场景,没有任何效果。
经过反复的实验测试,我们发现影响图像质量的水果元素有以下几种:
照明影响
不寻常的照明条件,如太暗或太亮,将大大扰乱模具的结果。在处理光线对这一成就的影响时,我认为有两种方法来完成这一过程:
1)从产品来看:
A.在用户可以改变情况的情况下(比如用脚踏机自拍等。),语音/世界可以提醒用户忽略当前情况并提出改变情况。
B.当用户无法把握变化的情况时(如人脸识别、车辆识别等摄像机稳固的场景),只能通过调试过程中的硬件设备来补偿结果。
早晨:在行业中,我们遇到过曝光过度和黑暗的情况,这种情况多发生在早晨,因为相机会主动切换到黑暗的夜景(从画面上看,会从彩色切换到吵架),所以在早晨明亮的光线下(比如车灯的反光),图像会出现曝光过度的情况。在这种情况下,我们可以通过进程强制将相机设置为白天(图像是彩色的)来停止它。从降低成本的角度来说,我们可以在相机中间切出一个没有电源的集光灯来弥补黑暗的情况。虽然这两个成就也可以通过购买较低数量的相机来处理,但这样做也意味着更低的成本。
白天:白天也会呈现明亮的情况,可以考虑使用滤镜之类的。
2)掌握算法角度
使用该算法停止图像处理可以将图像恢复到模糊水平。慢慢坐在文中,图解这样一幅图:
从暗到亮,那张图片最后的算法处理。不言而喻,我们可以观察到图片的所有内容。那种方法很敏感,但也对公司的算法提出了更低的要求。我们知道每个算法的过滤时间总是很重要的。如果对时间要求非常严格(人脸识别、车辆识别),在识别之前停止图像转换,无疑会减少输出时间。手艺少的公司,可以用需求来衡量。
模糊不清
恍惚也是业内常见的成绩,也是令人头疼的问题。在那里,我们将首先把恍惚状态分成几类:
活动恍惚:人体在动,车辆在动。
焦点恍惚:相机间距等要素,类似远视,图像中低频存在,低频不存在。就是需要用算法的思想去填补低频部。
分辨率低,数值好,恍惚:小图放大等。,图像中的低频存在,但低频不存在。就是需要用算法的思想去填补低频部。
混乱恍惚:多种恍惚范式并存。
关于trance产品能掌握的场景比原力还少,而且只有第一个活动是trance,并且产品和用户之间有交互的情况下才能做到。trance的其他例子要求接受算法停止处理。
我们发明了最流行的模型(包括face++和其他尖端公司的模型),但也呈现了大量的一般图像,被判断为处于恍惚状态。从算法的角度来说,不可能有这种事是天方夜谭,但从工业的角度来说,是可以容忍的。被误判为恍惚图像的一般图像,会被过滤掉,丢失,再用算法的方法处理掉之后再进行识别,会不适合用户使用。而且我们也可以保证阈值以上的图片都是一般的图片,这样也有利于模具的锻炼。因此,产品需求的准确率和召回率是非常值得关注的,在一定条件下可以降低需求。
有很多成果比如噪点,分辨率等。影响图像质量的因素。这些成果大多也是从算法和硬件上恶化的。值得注意的是,我的病情已经过去了,需要思考时间和成本的衡量。
3。早期视觉
早视力部其实在我之前就有大概的看法了。看完慢坐分享,它转过身来发明了“哦!当时大家在做的都是那个部门的内容”。
早期视觉是做什么的?是对二次图像分享、边缘补给、主动战深度的估算。那些内容实际上有间接结果,是一种“中心形式”。
图像好友分享是指将特定图像好友划分为[区域内差异]和[区域间差异]的技术,是图像处理中最基础也是最重要的类别之一。
图像共享有多种方法,如灰度阈值共享、边缘检测和区域跟踪。许多种类的图像或风景都有相应的对等分享方法,但同时,一些对等分享方法仅限于一些特殊的例子。
边缘检测的目标是找到图像中像素表面的汇聚点,这个汇聚点亮度变化剧烈,表面就是表面。
慢坐提出了今天早期设想的两个成就:
结果不准确。
不需要太多努力的常识沉淀下来就能实现。
第一级由端到端方法处理,而第二级可以是数据驱动的。
该部门的产品较少参与竞争。通常和算法同事一样的反应是图片分享有些不足。比如“如何利用那个中心的成果得到更好的利用?”在慢坐道中,古道认为这是比武力更容易回答的成就。所以产品大概可以用来思考间接使用后期视觉的场景。
4。认可
识别是需要将一个(输入)图映射到一个(输出)图,并且可能将一个(输入)图映射到一个中间结果。简单来说就是把一张图片对应到一支笔、一支墨水或者一个标签上。其中有两个主要的水果元素:标签和数据。两个水果元素的宽度和粗糙度越差,对霉菌的初始识别结果就越好。
标签
标签的定义其实就是规则的定义。我在上一篇文章《AI产品经理需要了解的数据标签化的事情》中提到,标签越精准肯定有利于模具的结果,但同时,标签越精准意味着那种标签下的数据量会越少,产品也需要思考那个水果元素。
有一些标志会受到客观水果元素的影响,比如颜值。每个人对颜值的评价都不一样。慢坐路在他们的颜值模具中会被分为“标致”和“不标致”两种标签,并且主要是通过在传播网站上打分星来区分群众。我之前也遵循过颜值的模式,我在我的模式里提炼颜值:优雅,一般,丑陋。除了社交网站和明星的方法,我的经验是一个场景很在意数据的例子,很多数据和相似的场景归为一类。像一朵花,我们觉得它丑吗?在大多数城市,女扮男装也被城市认为很丑。
其他更精细的标签分割会有更强的降天能力。印象最深的是有一个从前颜值模特的节日运营动作,主题是扮丑。做得越丑,礼物就越小。那次行动上线后,引起了用户朋友圈和商家的极大关注。当时接到那个动作,我的思维真的被颠覆了。因为我第一次想到颜值模型可以存在于场景中,主要是为了识别好人。比如我在一首歌播到一半的时候识别一个主播的颜值,推荐一个比较好的主播到最后一页等等,然后我就完全用上了。看完之后,我可以借用它,反过来用。在最后的那一步棋的启示中,我们也发现颜值的塑造是能够在娱乐中发掘更多的。
这样我们就能看到我们的模子里多了一个符号意义,就多了一个天上掉下来的可能,标签的重要性就不得而知了。
数据降级
数据的数量和质量对模具有很大影响。最近收到一个重磅消息:阿发狗的弟弟阿发元,通过一个完整的自我教育过程,被数据训练出来的阿发狗打败了,前提是他有任何先验知识。我相信现在的手艺会越来越多的被使用,不一定目前在某些领域是不幸的,有可能用海量数据完成模具锻炼。但是现在,我们在做计算机视觉,数据量是最重要的。
大家一定知道,数据退化可以让模具越做越好。如果一个例子的功能没有很好的表达出来,要补充相应的数据。除了这些知识之外,真实数据的恶化可以用来处理我们在锻炼过程中经常出现的成绩:过度训练。
什么是过度规划?
一般来说,是模具对数据研究的太深,数据中的细节和乐音也是学来的,导致模具的泛化功能更好。过度开放意味着一个模具(一个假设)在运动场上做得很好,但在测试场上做得不好也是好的。
那如何通过流程数据限制准开?
从头开始弄乱数据。数据中音乐太多会影响霉菌的结果,而泥泞的数据可以避免那种水果元素形成的过度模仿结果。
削减运动中分散的数据量。如果运动离散度在总数据中的比例太小,也会形成准开口。
当然,成果也可能受到过程算法的限制,例如正则化方法和丢弃方法。目前有空可以深化咨询。
5。项目理论(以车辆识别为例)
在车辆检测系统中有很多CV相干应用,如车型识别、车牌识别、车辆颜色识别等。先以车辆识别为例,探讨一下这个目标的详细过程。
当前准备工作
1。数据准备:
那个车模的主题是大和小。全球大概有三四百个车辆品牌,每个品牌上有几十辆。我们从0开始,至少需要包含所有常用的车辆和系统。大众、前田、奔驰、宝马、奥迪、当代等热点汽车品牌。需要得到所有的数据。每种车型至少有前、后、车身三个基础数据。
跑步就像C200:
那三张图代表了三种数据,而那三种数据在不同场景下的主要特征大概是不一样的。目前如果决定识别车型,需要二次利用的场景是“在停车场识别车辆”,那么车辆正面的数据就会变得越来越重要,需要付出更多的努力去收集。为什么?我们可以想象一下,停车场的车辆识别摄像头为了抓拍车辆商标,通常会将摄像头对准车辆,摄像头传输的数据很少包含杂边的车身数据甚至是车尾的数据。为了更快的使用我们的项目,减少天气,其他例子中数据比短的情况可以暂时放下,然后恶化。
在数据准备的过程中,要求爬虫先从网上抓取数据,然后野选过滤掉无用的数据,数据完全打开后才停止下一步。
2。文件准备
a)数据标注文档,包括我们项目总共几分钟的模型,以及每个模型对应的样式。在数据中标注需要注意的结果,多车、尖角的图片是否可以舍弃等等。
b)产品文件,包括一般文件,如高空坠落场景的澄清、待澄清文件等。在这种情况下,需要识别工业车辆来解释以下系统假设:
算法需要形态学(识别种类、类别、速度、准确性、不变性等。).
相机硬件需求、情况、数据发送和接收以及相机设置的外观。
法国风格的设想(车辆识别系统的前部、后部和尾部的设想)
数据关系形态学(车辆信息分析统计关系)
如果摄像头在局域网内,并且有分配控制功能(识别车辆黑名单的需求和供给),借用需求:
下载(思考从云端到本地的图像特征)
面对面场景(能够从互联网上检查本地摄像头)
项目过程跟踪
1.硬件硬件端:根据通用规则跟踪开发硬件硬件项目。
2.算法:车辆识别的过程基本如下:
车辆图像上传:通过摄像头/网络上传。
图像预处理:包括成像部门对trance图像的上述处理(activetrance对trance有一个快速算法:通过过程知道速度V和位移S,确认图像中任意曲面的值)
在早期视觉中,图像共享(从设定的图片中识别目标图像,方便图像识别,可以考虑边缘检测)和图像二值化(将图像中像素表面的灰度值设置为0约255,使用表面跟踪使目标表面更加凸起和隐藏)
图像特征提取
特性比较
项目测试
相机测试
摄像机表面广播法语测试
面授法(可以及时检查摄像头的法语法)考平台后台法语测试。
该算法采用后台测试和备用核测试。
霉菌识别时间测试
模具识别准确率和召回率的测试
服务器不变性测试
收集和发布期测试
阳性和阴性回测
其他平台和硬件产品的一般测试
项目检查和支持
根据产品流的功能,逐个检查分支。
6。附言[/s2/]
从明天产品论的角度,我梳理了一下计算机视觉的链条。里面没有算法常识。我更感兴趣的是念经,通过过程把自己的亲身经历分享给大家,让更多正面的产品相遇发生。
虽然整个过程中有很多有趣的事情,但是大家可以了解更多的相关常识,和我交流。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)