中文零镜头图像分类模型零镜头什么意思

转载

新新人类 2024-05-21 13:54:45

文章标签 中文零镜头图像分类模型人工智能数据应用程序 文章分类 计算机视觉人工智能

AI（人工智能）是现代文化中最完美的梦想领域。如果您问街上的普通人，人工智能在运行什么，他们可能不会提及培训数据。取而代之的是，他们可能会抱怨一些计算机程序，这些计算机程序神奇地学习如何从稀薄的空气中做有用的事情。

但是，当今一些最复杂的AI接近那个天真的梦想。我指的是一种仍在发展中的方法，称为“零镜头学习”。这种方法已在Microsoft ， Uber ，百度，阿里巴巴和其他AI驱动的企业中进行了探索，可在很少或没有培训数据的情况下实现有用的模式识别。

零镜头模式学习将使智能机器人能够动态识别并响应他们在训练中可能从未遇到过的陌生对象，行为和环境模式。我预测零击方法将越来越多地与强化学习相结合，以使机器人能够在混乱和一次性的环境中迭代地采取最佳行动。

此外，游戏应用程序将使用零击方法（例如迭代自玩）来替代训练成功游戏所产生的大量数据的方法。尽管一开始对这些游戏一无所知，这将使培训代理商能够掌握复杂的获胜策略。

此外，零散学习由于其驱动能力，有望使对象识别应用程序更加通用：

快速识别训练数据中可能会严重丢失的稀有，不熟悉和看不见的物体。

对很难获得已经用足够高的专业知识标记的训练数据的模式的识别。

检测对象类别的实例，其中细粒度类别的泛滥使获取足够数量的统计上多样化的，带有标签的训练数据变得困难或令人望而却步。

使零击学习成为可能的是现有知识的存在，这些知识可以通过统计或语义方法发现并重新利用。零击方法使用此知识来预测特征的较大语义空间，该特征既包含可见实例（训练数据中的实例）又包含看不见实例（训练数据中缺少的实例）。关于自动知识发现，用于零镜头学习的一些最有前途的技术方法包括：

根据在先前的有监督学习项目中获得的统计知识来建立分类模型，这些学习知识处于不同但在语义上相邻的对象识别域（根据从相关物种中提取的特征来识别从未见过的脊椎动物类别）。
从目标类的文本描述中提取目标对象的语义知识（草拟的Web文章，描述要识别的物种的视觉特征）。
给定目标类别的文本描述的可用性，使用单词向量和其他图形方法从源类别的语义特征中推断目标类别的语义特征。

除非数据科学家获得简化了对这些技术的访问的工具，否则零散学习将无法发挥其作为AI流水线加速器的潜力。相应地，这需要深度学习工具箱，该工具箱应支持在更大的范式（称为“ 转移学习 ”）下，根据已有功能构建块对新模型进行轻松的可视化设计。这取决于为数据科学家提供可重复使用的特征表示，神经节点分层，权重，训练方法，学习率以及先前模型的其他相关特征的工作台，这些工作可以快速引入零快照AI项目。

随着零射技术的采用，以及先验知识的增长，高质量AI的开发人员将不再依赖训练数据。在接下来的几年中，我们将看到数据科学家可以通过配置预先存在的统计和语义知识来构建更多的智能机器人，游戏和模式识别应用程序，而无需获取，准备和标记大量的新鲜训练数据。

当这一天到来时，更多基于AI的应用程序将能够通过即席，零击和情境自适应技术自动将其智能从纯粹的无知状态引导到深度知识之一。

这将标志着人工智能的真正开始，这个梦想从艾伦·图灵（Alan Turing）一直到现在一直激励着AI社区。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。