事实证明,大多数人认为理所当然的东西,即能够看到、处理并对视觉输入采取行动的能力,在机器中是非常难以复制的。这正是计算机视觉(cv)的目标。虽然计算机视觉可能不如人类视觉先进,但它今天已经发展到在商业中非常重要的地步。
什么是计算机视觉?
计算机视觉描述了当使用人工智能算法的计算机能够识别和处理图像(照片、视频等),然后从分析中创建适当输出的过程,因为计算机实际上能够“理解”内容。具体来说,计算机视觉可以对物体进行分类、识别、验证和检测。近年来,机器学习技术,特别是神经网络的迭代学习过程,以及计算能力、数据存储和高质量但廉价的输入设备的重大飞跃,促进了计算机视觉的发展。
计算机视觉有三个主要组成部分。
1.获取图像:当数码相机捕获图像时,它会创建一个由0和1组成的数字文件。
2.处理:算法用于确定基本的几何元素,以利用二进制数据构建图像。
3.分析和理解:在计算机视觉的最后一步,数据被分析。然后使用高级算法根据图像进行决策。
由于最年轻的人类可以处理图像并理解它们,在机器中复制这种能力的挑战被低估了。最初看似简单的问题需要解决,结果却需要数十年的研究。视觉世界有很多复杂的东西,关于人类视觉是如何工作的,大脑是如何感知视觉输入的,还有很多未知的东西。
尽管到目前为止,计算机视觉领域已经克服了许多挑战,但根据计算机视觉的用途和它能够获得的数据,仍有许多障碍需要克服。计算机视觉需要大量的数据处理能力和存储空间,其结果会受到图像/数据质量的影响。计算机科学家仍在为所有应用程序优化计算机视觉。
计算机视觉在商业中是如何使用的?
在无数的应用中,从“看到”的可视数据中提取有用的信息。计算机视觉与其他技术相结合,如增强和虚拟现实,可以实现更多的功能。
面部识别由计算机视觉驱动,用于监视和安全系统以及Facebook背后的技术,用于识别人们在照片中“标记”。在中国,警察工作、支付门户等方面使用面部识别技术。甚至零售商店也使用该技术来监控库存,通过商店跟踪客户,并允许客户在面部识别技术将物品放入账单时通过虚拟支付来绕过收银机。
从福特到特斯拉的许多汽车制造商正在将他们的自动驾驶汽车版本投入批量生产。计算机视觉是使自动驾驶汽车成为可能的关键技术。自动驾驶车辆上的系统持续处理从道路标志到车辆和行人在路上的视觉数据,然后确定采取什么行动。
医学中的计算机视觉有助于诊断疾病和其他疾病,并在手术中扩大外科医生的视野。现在有一些智能手机应用程序允许你使用手机的摄像头诊断皮肤状况。事实上,90%的医学数据都是基于图像的X光片、扫描等,现在很多数据都可以用算法进行分析。
数字营销:通过使用计算机对数以百万计的在线图像进行分类和分析,营销人员可以绕过传统的人口统计研究,仍然将营销目标对准正确的在线受众,并且比人类更快地完成这项工作。营销人员甚至使用计算机视觉来确保广告不会被放置在与受众矛盾或有问题的内容附近。
金融机构使用计算机视觉来防止欺诈,允许移动存款,并可视化地显示数字信息。
在制造业中,计算机视觉使事物更高效、有效和安全。它用于预测性维护,在故障发生前确定问题,并用于质量控制措施。一台机器能验证的项目数量远远超过人类的能力。
农业工业使用计算机视觉通过监测寻找疾病或害虫迹象的田地来使操作更加成功,因此可以采取迅速行动来根除它。如国外的一种半自动联合收割机,在分析收获的谷物质量后,可以找到通过作物的最佳路径。
手写提取和分析:计算机视觉可以将手写会议笔记或创意头脑风暴转换为数字格式,从而更容易与公司中的其他人共享。
计算机视觉的应用是多种多样的,可以想象在我们的生活中计算机视觉随处可见。