
现在,大多数人经常在不知不觉中使用复杂的计算机视觉技术。例如,过去需要密码或指纹的密码验证,现在只需要看一眼智能手机就可以了。
40%的美国人每天至少使用一个应用程序来使用人脸生物识别和面部识别技术,而在 18 至34 岁的人群中,这一比例上升到 75%1。到 2030 年,全球计算机视觉市场预计将以指数级复合年增长率 19.6% 的速度增长 2,而其他深度学习技术则拓宽了当今计算机视觉技术的应用范围。
从解锁智能手机到通过机场面部扫描仪,计算机视觉技术正迅速融入我们的日常生活。
什么是计算机视觉?
计算机视觉是计算机科学和人工智能的一个分支领域,它利用计算机和系统从图像中收集有意义的信息。计算机视觉从图像中推断数据,从而做出决策。其最终目标是正确识别物体和人,从而采取适当的行动,例如自动驾驶汽车避开人行道上的行人,或准确识别可以解锁手机的智能手机用户。
计算机视觉如何工作?
计算机视觉技术旨在模仿人脑识别视觉信息的过程。它利用模式识别,吸收输入信息,将其标记为对象,并找出产生熟悉图像的模式。计算机视觉技术在对现实世界的视觉数据进行编目时,还能从图像中提取意义。
计算机视觉的历史
与人工智能的许多领域一样,计算机视觉的最初探索也发生在几十年前。20 世纪 60 年代,研究人员使用算法来处理和分析视觉数据。到了 20 世纪 70 年代,这项技术在图像处理和模式债务识别方面变得更加精确。
在接下来的几十年里,科学家们利用机器学习算法为大多数计算机视觉技术提供动力,最终取得了当时最大的突破之一,即 Viola-Jones 人脸检测算法。这一算法至今仍被用作机器学习物体检测的核心框架。随着 2000 年代技术的飞速发展,卷积神经网络使计算机能够以更高的精度检测物体和跟踪运动。
计算机视觉在现实生活中的应用
从改进癌症检测到自动驾驶汽车,计算机视觉技术正在彻底改变许多行业。面部识别、物体检测和增强现实等工具为现实生活中的应用提供了多种用例。
自动驾驶汽车
特斯拉是众所周知的自动驾驶汽车典范,但现代汽车最近也投资了一家深度学习计算机视觉初创公司,将该技术应用于其自动驾驶汽车3。计算机视觉是自动驾驶汽车的核心功能之一,它使自动驾驶汽车能够感知周围环境;传感器和硬件收集数十亿个视觉数据点,以创建车外情况的图像。从停车标志到道路上的危险物体,从行人到其他车辆,计算机视觉算法提高了自动驾驶汽车的安全性和效率。
癌症检测
人工智能在医疗保健行业发展迅速,癌症检测也不例外。X-ZELL 是一家利用先进的计算机视觉技术实现当天图像癌症诊断的公司4。计算机视觉利用先进的算法和机器学习来分析 X 光、核磁共振成像和 CT 扫描等医学图像,从而更准确地识别癌症的潜在迹象。计算机视觉可通过海量数据集进行学习,并能准确识别人类难以发现的微妙模式和特征。在医疗保健领域,这可以改善患者的治疗效果,提高治疗水平,并最终挽救生命。
学校和公共场所的安全
为了提高学校和公共区域的安全性,Visio.ai 将边缘计算与设备上的机器学习和复杂的视觉系统5 相结合。从机场的高流量人行道到大学和学校的入侵检测,深度学习智能可与普通监控摄像头相结合,利用面部识别分析来测量情绪和检测可疑活动。计算机视觉技术为改善学校、机场、交通系统等公共场所的安全提供了机会。
生产设置
从质量检测、生产监控到供应链物流,生产环境充满了计算机视觉技术的应用机会。例如,在质量检测中,计算机视觉可以自动检测缺陷、划痕和其他异常情况。利用射频识别(RFID)技术,计算机视觉技术可以追踪整个供应链的产品,优化库存、生产计划和交货。从改善供应链物流到确保半导体质量的一致性,计算机视觉技术可支持更好的照明、更好的产品一致性、更高的效率等。

计算机视觉的挑战
计算机视觉和边缘智能为关键领域的进步提供了看似无限的机会。虽然更安全的车辆和更快的癌症诊断似乎不成问题,但计算机视觉背后的智能却面临着挑战。
隐私问题
与许多人工智能工具一样,隐私和安全是人们最关心的问题。数据泄露的风险很高,而敏感的机密信息存储在可能不安全的平台上,网络犯罪分子就有很大的动机进行攻击。消费者担心向科技公司提供过多的个人数据,而随着网络犯罪的增加,计算机视觉人工智能工具需要确保它们已经加强了防御。
高成本
目前,计算机视觉技术的实施成本并不低,尤其是在更复杂的应用案例中,购买硬件和软件以及进行维护的成本很高。再加上需要清理、存储和维护的大型数据集,计算机视觉技术的成本格外高昂。此外,这些系统的维护费用也很高,因此有必要进行预测性维护,以便在潜在的设备缺陷演变成更大问题之前对其进行修复。
缺乏训练有素的专家
虽然计算机视觉发展迅速,但很少有公司或个人拥有丰富的专业知识。与任何较新的技术一样,教育和培训需要时间才能充分跟上实际应用的步伐。各公司都在努力维持专业技术人才,计算机视觉也不例外。企业还需要训练有素的专家来了解人工智能、机器学习和深度学习之间的区别,以便对系统进行充分的培训。
计算机视觉的未来
计算机视觉技术仍处于起步阶段,但社会已经看到了它在制造、教育、安全、零售、医疗保健、汽车行业等领域的巨大影响。随着人们对物联网(IoT)设备–虚拟现实头盔、增强现实智能眼镜等–的需求加速增长,消费级计算机视觉技术面临着巨大的机遇。随着硬件变得越来越复杂,但价格却越来越低廉,计算机视觉可穿戴设备和智能小工具可以逐渐普及到普通人。此外,随着生成式人工智能和深度学习的加速发展,计算机视觉模型将有更多的输入可供学习。
Ambiq 如何做出贡献
计算机视觉技术需要一种能够处理机器学习推理的嵌入式芯片。要使这种技术在边缘设备上实用,就必须以低功耗和最高效率运行。Ambiq 的超低功耗片上系统(SoC) 可使边缘设备具有最佳性能和能效,并可在设备上本地执行。
我们在北方机电公司(NMI)的朋友最近在其旗舰产品 NM180100 上进行了数字识别,该产品采用了 Ambiq 的Apollo3 SoC。在不到 2 秒的时间内就识别并返回了数字。请亲眼目睹:
资料来源
1 讯连科技最新报告发现超过 1.31 亿美国人每天使用人脸识别,其中近一半人每天访问三个或更多应用| 2022 年 11 月 22 日
2计算机视觉市场规模、份额和趋势分析报告(按组件、按产品类型、按应用、按垂直行业(汽车、医疗保健、零售)、按地区和细分市场预测,2023 – 2030年) | 2021 年
3现代汽车投资深度学习计算机视觉初创公司 allegro.ai| 2018年5月11日
4X-Zell | 2023年
5人工智能视觉在教育领域的九大应用| 2023年