实战案例：AI产品经理如何介绍“计算机视觉”？_服务器

实战案例：AI产品经理如何介绍“计算机视觉”？

笔者ss="superseo">ss="superseo">根据个人经理人在战争时期教授的项目案例，从乘积论的角度对计算机视觉进行了计算，希望对你有所帮助。

计算机视觉是我的老伴侣，我以计算机视觉为常识开始打野智。最近受益于老麦带我逐日审计的算法，我减少了对慢坐(商汤)的《计算机视觉的完整链条，从成像到后期视觉再到识别理解》的阅读，发明了很多疑点。当时不觉得有什么，现在看了，每一步都有意义。

明天我将根据战争时期我的私人经理教的项目案例，从产品理论的角度计算计算机视觉。

1。媒体

计算机视觉是通过使用计算机和相关设备来模仿死亡物体的视觉。它的次要任务是通过进程停止处理采集到的图片或视频，得到响应场景的三维信息。

在慢坐的分享中，计算机视觉的完整链条分为三个部门:

成像(图像)

早期视觉

认可(承认)

本文还将所有连锁按照慢坐分为三个部门，用实际例子将三个部门中可以密切关注的路产品内容进行分离。

2。成像

成像是对相机原理的模仿，也就是在处理如何阻止拍照量的提升。

当我们在实践行业中使用它时，我们经常发明实践数据战争。实验室里的数据对新的一年来说是好的，并且试验数据的数量几乎比实验室里的好。更有甚者，当我们开始练习模具的时候，会发现实验室模具在练习场景，没有任何效果。

经过反复的实验测试，我们发现影响图像质量的水果元素有以下几种:

照明影响

不寻常的照明条件，如太暗或太亮，将大大扰乱模具的结果。在处理光线对这一成就的影响时，我认为有两种方法来完成这一过程:

1)从产品来看:

A.在用户可以改变情况的情况下(比如用脚踏机自拍等。)，语音/世界可以提醒用户忽略当前情况并提出改变情况。

B.当用户无法把握变化的情况时(如人脸识别、车辆识别等摄像机稳固的场景)，只能通过调试过程中的硬件设备来补偿结果。

早晨:在行业中，我们遇到过曝光过度和黑暗的情况，这种情况多发生在早晨，因为相机会主动切换到黑暗的夜景(从画面上看，会从彩色切换到吵架)，所以在早晨明亮的光线下(比如车灯的反光)，图像会出现曝光过度的情况。在这种情况下，我们可以通过进程强制将相机设置为白天(图像是彩色的)来停止它。从降低成本的角度来说，我们可以在相机中间切出一个没有电源的集光灯来弥补黑暗的情况。虽然这两个成就也可以通过购买较低数量的相机来处理，但这样做也意味着更低的成本。

白天:白天也会呈现明亮的情况，可以考虑使用滤镜之类的。

2)掌握算法角度

使用该算法停止图像处理可以将图像恢复到模糊水平。慢慢坐在文中，图解这样一幅图:

从暗到亮，那张图片最后的算法处理。不言而喻，我们可以观察到图片的所有内容。那种方法很敏感，但也对公司的算法提出了更低的要求。我们知道每个算法的过滤时间总是很重要的。如果对时间要求非常严格(人脸识别、车辆识别)，在识别之前停止图像转换，无疑会减少输出时间。手艺少的公司，可以用需求来衡量。

模糊不清

恍惚也是业内常见的成绩，也是令人头疼的问题。在那里，我们将首先把恍惚状态分成几类:

活动恍惚:人体在动，车辆在动。

焦点恍惚:相机间距等要素，类似远视，图像中低频存在，低频不存在。就是需要用算法的思想去填补低频部。

分辨率低，数值好，恍惚:小图放大等。，图像中的低频存在，但低频不存在。就是需要用算法的思想去填补低频部。

混乱恍惚:多种恍惚范式并存。

关于trance产品能掌握的场景比原力还少，而且只有第一个活动是trance，并且产品和用户之间有交互的情况下才能做到。trance的其他例子要求接受算法停止处理。

我们发明了最流行的模型(包括face++和其他尖端公司的模型)，但也呈现了大量的一般图像，被判断为处于恍惚状态。从算法的角度来说，不可能有这种事是天方夜谭，但从工业的角度来说，是可以容忍的。被误判为恍惚图像的一般图像，会被过滤掉，丢失，再用算法的方法处理掉之后再进行识别，会不适合用户使用。而且我们也可以保证阈值以上的图片都是一般的图片，这样也有利于模具的锻炼。因此，产品需求的准确率和召回率是非常值得关注的，在一定条件下可以降低需求。

有很多成果比如噪点，分辨率等。影响图像质量的因素。这些成果大多也是从算法和硬件上恶化的。值得注意的是，我的病情已经过去了，需要思考时间和成本的衡量。

3。早期视觉

早视力部其实在我之前就有大概的看法了。看完慢坐分享，它转过身来发明了“哦！当时大家在做的都是那个部门的内容”。

早期视觉是做什么的？是对二次图像分享、边缘补给、主动战深度的估算。那些内容实际上有间接结果，是一种“中心形式”。

图像好友分享是指将特定图像好友划分为[区域内差异]和[区域间差异]的技术，是图像处理中最基础也是最重要的类别之一。

图像共享有多种方法，如灰度阈值共享、边缘检测和区域跟踪。许多种类的图像或风景都有相应的对等分享方法，但同时，一些对等分享方法仅限于一些特殊的例子。

边缘检测的目标是找到图像中像素表面的汇聚点，这个汇聚点亮度变化剧烈，表面就是表面。

慢坐提出了今天早期设想的两个成就:

结果不准确。

不需要太多努力的常识沉淀下来就能实现。

第一级由端到端方法处理，而第二级可以是数据驱动的。

该部门的产品较少参与竞争。通常和算法同事一样的反应是图片分享有些不足。比如“如何利用那个中心的成果得到更好的利用？”在慢坐道中，古道认为这是比武力更容易回答的成就。所以产品大概可以用来思考间接使用后期视觉的场景。

4。认可

识别是需要将一个(输入)图映射到一个(输出)图，并且可能将一个(输入)图映射到一个中间结果。简单来说就是把一张图片对应到一支笔、一支墨水或者一个标签上。其中有两个主要的水果元素:标签和数据。两个水果元素的宽度和粗糙度越差，对霉菌的初始识别结果就越好。

标签

标签的定义其实就是规则的定义。我在上一篇文章《AI产品经理需要了解的数据标签化的事情》中提到，标签越精准肯定有利于模具的结果，但同时，标签越精准意味着那种标签下的数据量会越少，产品也需要思考那个水果元素。

有一些标志会受到客观水果元素的影响，比如颜值。每个人对颜值的评价都不一样。慢坐路在他们的颜值模具中会被分为“标致”和“不标致”两种标签，并且主要是通过在传播网站上打分星来区分群众。我之前也遵循过颜值的模式，我在我的模式里提炼颜值:优雅，一般，丑陋。除了社交网站和明星的方法，我的经验是一个场景很在意数据的例子，很多数据和相似的场景归为一类。像一朵花，我们觉得它丑吗？在大多数城市，女扮男装也被城市认为很丑。

其他更精细的标签分割会有更强的降天能力。印象最深的是有一个从前颜值模特的节日运营动作，主题是扮丑。做得越丑，礼物就越小。那次行动上线后，引起了用户朋友圈和商家的极大关注。当时接到那个动作，我的思维真的被颠覆了。因为我第一次想到颜值模型可以存在于场景中，主要是为了识别好人。比如我在一首歌播到一半的时候识别一个主播的颜值，推荐一个比较好的主播到最后一页等等，然后我就完全用上了。看完之后，我可以借用它，反过来用。在最后的那一步棋的启示中，我们也发现颜值的塑造是能够在娱乐中发掘更多的。

这样我们就能看到我们的模子里多了一个符号意义，就多了一个天上掉下来的可能，标签的重要性就不得而知了。

数据降级

数据的数量和质量对模具有很大影响。最近收到一个重磅消息:阿发狗的弟弟阿发元，通过一个完整的自我教育过程，被数据训练出来的阿发狗打败了，前提是他有任何先验知识。我相信现在的手艺会越来越多的被使用，不一定目前在某些领域是不幸的，有可能用海量数据完成模具锻炼。但是现在，我们在做计算机视觉，数据量是最重要的。

大家一定知道，数据退化可以让模具越做越好。如果一个例子的功能没有很好的表达出来，要补充相应的数据。除了这些知识之外，真实数据的恶化可以用来处理我们在锻炼过程中经常出现的成绩:过度训练。

什么是过度规划？

一般来说，是模具对数据研究的太深，数据中的细节和乐音也是学来的，导致模具的泛化功能更好。过度开放意味着一个模具(一个假设)在运动场上做得很好，但在测试场上做得不好也是好的。

那如何通过流程数据限制准开？

从头开始弄乱数据。数据中音乐太多会影响霉菌的结果，而泥泞的数据可以避免那种水果元素形成的过度模仿结果。

削减运动中分散的数据量。如果运动离散度在总数据中的比例太小，也会形成准开口。

当然，成果也可能受到过程算法的限制，例如正则化方法和丢弃方法。目前有空可以深化咨询。

5。项目理论(以车辆识别为例)

在车辆检测系统中有很多CV相干应用，如车型识别、车牌识别、车辆颜色识别等。先以车辆识别为例，探讨一下这个目标的详细过程。

当前准备工作

1。数据准备:

那个车模的主题是大和小。全球大概有三四百个车辆品牌，每个品牌上有几十辆。我们从0开始，至少需要包含所有常用的车辆和系统。大众、前田、奔驰、宝马、奥迪、当代等热点汽车品牌。需要得到所有的数据。每种车型至少有前、后、车身三个基础数据。

跑步就像C200:

那三张图代表了三种数据，而那三种数据在不同场景下的主要特征大概是不一样的。目前如果决定识别车型，需要二次利用的场景是“在停车场识别车辆”，那么车辆正面的数据就会变得越来越重要，需要付出更多的努力去收集。为什么？我们可以想象一下，停车场的车辆识别摄像头为了抓拍车辆商标，通常会将摄像头对准车辆，摄像头传输的数据很少包含杂边的车身数据甚至是车尾的数据。为了更快的使用我们的项目，减少天气，其他例子中数据比短的情况可以暂时放下，然后恶化。

在数据准备的过程中，要求爬虫先从网上抓取数据，然后野选过滤掉无用的数据，数据完全打开后才停止下一步。

2。文件准备

a)数据标注文档，包括我们项目总共几分钟的模型，以及每个模型对应的样式。在数据中标注需要注意的结果，多车、尖角的图片是否可以舍弃等等。

b)产品文件，包括一般文件，如高空坠落场景的澄清、待澄清文件等。在这种情况下，需要识别工业车辆来解释以下系统假设:

算法需要形态学(识别种类、类别、速度、准确性、不变性等。).

相机硬件需求、情况、数据发送和接收以及相机设置的外观。

法国风格的设想(车辆识别系统的前部、后部和尾部的设想)

数据关系形态学(车辆信息分析统计关系)

如果摄像头在局域网内，并且有分配控制功能(识别车辆黑名单的需求和供给)，借用需求:

下载(思考从云端到本地的图像特征)

面对面场景(能够从互联网上检查本地摄像头)

项目过程跟踪

1.硬件硬件端:根据通用规则跟踪开发硬件硬件项目。

2.算法:车辆识别的过程基本如下:

车辆图像上传:通过摄像头/网络上传。

图像预处理:包括成像部门对trance图像的上述处理(activetrance对trance有一个快速算法:通过过程知道速度V和位移S，确认图像中任意曲面的值)

在早期视觉中，图像共享(从设定的图片中识别目标图像，方便图像识别，可以考虑边缘检测)和图像二值化(将图像中像素表面的灰度值设置为0约255，使用表面跟踪使目标表面更加凸起和隐藏)

图像特征提取

特性比较

项目测试

相机测试

摄像机表面广播法语测试

面授法(可以及时检查摄像头的法语法)考平台后台法语测试。

该算法采用后台测试和备用核测试。

霉菌识别时间测试

模具识别准确率和召回率的测试

服务器不变性测试

收集和发布期测试

阳性和阴性回测

其他平台和硬件产品的一般测试

项目检查和支持

根据产品流的功能，逐个检查分支。

6。附言[/s2/]

从明天产品论的角度，我梳理了一下计算机视觉的链条。里面没有算法常识。我更感兴趣的是念经，通过过程把自己的亲身经历分享给大家，让更多正面的产品相遇发生。

虽然整个过程中有很多有趣的事情，但是大家可以了解更多的相关常识，和我交流。

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/zz/778136.html

实战案例：AI产品经理如何介绍“计算机视觉”？

发表评论

评论列表（0条）