正文
1.摘要MediaPipe Objectron 是一种用于日常物体的移动实时 3D 物体检测解决方案。它检测 2D 图像中的物体,并通过机器学习 (ML) 模型估计它们的姿势,该模型在 Objectron 数据集上训练。对象检测是一个被广泛研究的计算机视觉问题,但大部分研究都集中在二维对象预测上。虽然 2D 预测仅提供 2D 边界框,但通过将预测扩展到 3D,人们可以捕捉物体在世界中的大小、位置和
转载 2024-01-08 16:38:47
40阅读
编辑:QJP【导读】谷歌人工智能实验室近日发布 Objectron 数据集,这是一个以3D目标为中心的视频剪辑的集合,这些视频剪辑从不同角度捕获了较大的一组公共对象。数据集包括 15K 带注释的视频剪辑,并补充了从地理多样的样本中收集的超过 4M 带注释的图像(覆盖五大洲的 10 个国家)。Objectron 数据集链接(文末附下载):​​https://github.com/googl
转载 2022-10-09 11:18:53
205阅读
刚刚开源!
3月12消息,谷歌AI团队公布了一种全新的移动端3D识别方案:Objectron,其特点是可通过AI模型,在2D图像中预测物体在场景中的位置、尺寸和方向,可用于机器人、自动驾驶汽车、图像检索、AR等场景。 此外,Objectron的研发团队开发了一种图片标记工具,可以通过分屏视角显示2D视频帧,快速实现对3D边界框的手动标记。这些3D边界框将叠加在点云数据、摄像头画面和识别到的平面上面
导读:昨天,谷歌开源了能在移动设备上实时计算面向对象的3D边界框的MediaPipe Objectron,这一研究使得在移动端设备上实时地确定物体的位置、方向和大小成为可能。在2D图像中做3D目标检测很难?现在,拿着一部手机就能做到,还是实时的那种。这就是谷歌AI今天发布的MediaPipe Objectron,一个可以实时3D目标检测的pipeline。分开来看:MediaPipe是一个开源的跨
谷歌发布的MediaPipe Objectron,是一个可以实时检测3D物体检测的模型框架,先在2D图像上检测物体,然后估算出3D坐标。尽管目前2D物体检测已经相对成熟,但3D检测仍然是个挑战性的问题,主要是缺少大量有效的数据用于训练获取真实世界的数据现实世界中,针对3D物体检测的数据集是非常有限的。 为此,Google开发了一个基于增强显示(AR)的数据采集方法。 由于ARCore和ARKit的
与非网 3 月 13 日讯,谷歌AI在其官方博客上发布了一款名为 MediaPipe Objectron 的算法框架,利用这个算法框架,只要一部手机,就能实时从 2D 视频里识别3D物品的位置、大小和方向。这一技术可以帮助机器人,自动驾驶汽车,图像检索和增强现实等领域实现一系列的应用。我们知道,3D 数据集相对于 2D 来说,非常有限。为了解决这个问题,谷歌 AI 的研究人员使用移动增强现实(AR
在计算机视觉领域里,跟踪3D目标是一个棘手的问题,尤其是在有限的计算资源上。如何从2D图像中做3D目标检测,对于计算机视觉研究来说,一直是个挑战。 近日,谷歌AI在其官方博客上发布了一款名为MediaPipe Objectron的算法框架,利用这个算法框架,只要一部手机,就能实时从2D视频里识别3D物品的位置、大小和方向。这一技术可以帮助机器人,自动驾驶汽车,图像检索和增强现实等领域实