#斯坦福小镇机器人版的「斯坦福小镇」来了,专为具身智能研究打造首个专为各种机器人设计的模拟互动 3D 社会。还记得斯坦福的 AI 小镇吗?这是斯坦福的 AI 研究者打造的一个虚拟环境。在这个小镇上,25 个 AI 智能体正常生活、工作、社交,甚至谈恋爱,每个智能体都有自己的个性和背景故事。智能体的行为和记忆通过大语言模型来驱动,这些模型能够存储和检索智能体的经历,并根据这些记忆来规划行动。与之类似
#GPT-4o mini测评懂得不多,但答得极快GPT-4o mini主打一个字「快」。昨晚,OpenAI 突然上线新模型 GPT-4o mini, 声称要全面取代 GPT-3.5 Turbo。在性能方面,GPT-4o mini 在 MMLU 上的得分为 82%,在 LMSYS 排行榜的聊天方面分数优于 GPT-4。在价格方面,GPT-4o mini 比之前的 SOTA 模型便宜一个数量级,商用价
#UniADUniAD是围绕查询设计的,它的感知、预测、规划任务都使用交叉注意力来将前置任务的查询转换为当前任务的查询。每个任务的查询以及这些查询的组合,都用长度为256的向量表征。最初的表征(BEV元素)通过多个Transformer Decoder,每个Decoder的输出有不同任务的监督数据,这些任务引导了中间表示(dim=256的向量)的演化。在这个过程中,UniAD对表征做了很多组合和变
#Hydra-MDPNavsim冠军方案|告别单一轨迹,Hydra-MDP引领端到端自动驾驶规划新航向本文利用人类和基于规则的教师的知识蒸馏来训练学生模型,从而学习在各种闭环评估指标下模型应如何决策。凭借基于规则的教师的知识,Hydra-MDP能够学习环境如何以端到端的方式影响规划。该方法在今年的CVPR Navsim挑战赛中获得第一名 Github:://github.c
#AutoGPT爆火AutoGPT进阶版来了:节点、多智能体协同当然,下一代 AutoGPT 仍是开源的。还记得去年 AI 大牛 Andrej Karpathy 大力宣传的「AutoGPT」项目吗?它是一个由 GPT-4 驱动的实验性开源应用程序,可以自主实现用户设定的任何目标,展现出了自主 AI 的发展趋势。一年多的时间,该项目的 GitHub 星标总数已经超过了 16 万,足可见其持续受欢
#BEVWorldBEV潜在空间构建多模态世界模型,全面理解自动驾驶~一、引言世界模型建模了有关环境的知识,其可以通过给定的条件对未来进行合理的想象。未来想象要求世界模型具有物理规律的理解能力以及零样本的探索能力,使得其在自动驾驶领域有着广泛的应用前景,比如:长尾数据生成:生成鬼探头、前方车辆遗撒等稀缺数据,并通过条件拓展不同天气、光照等环境下的数据。闭环仿真测试:自动驾驶模型的planning结
#Chat-Edit-3D编辑能力无上限!北航&谷歌&旷视等开源Chat-Edit-3D: 3D 场景编辑新范式!本文提出了一种全新的3D场景编辑新范式—3D。该方法基于大规模语言模型,通过解耦2D编辑和3D重建过程,实现了灵活且高效的任意模型的集成,丰富了文本对话能力和场景编辑能力。文章链接:://arxiv.org/abs/2407.06842项目地址:htt
#LivePortrait快手开源LivePortrait,GitHub 6.6K Star,实现表情姿态极速迁移近日,快手可灵大模型团队开源了名为LivePortrait的可控人像视频生成框架,该框架能够准确、实时地将驱动视频的表情、姿态迁移到静态或动态人像视频上,生成极具表现力的视频结果。如下动图所示: 网友测试LivePortrait网友测试LivePortrait快手开源
一、开关电源纹波、噪声的产生原因及测量方法 本文简单地介绍开关电源产生纹波和噪声的原因和测量方法、测量装置、测量标准及减小纹波和噪声的措施。另外关于开关电源的基础概念,请移步此文:介绍开关电源的几个概念。纹波和噪声产生的原因 开关电源输出的不是纯正的直流电压,里面有些交流成分,这就是纹波和噪声造成的。纹波是输出直流电压的波动,与开
#HAFormer融合 CNN 与 Transformer 的高效轻量级语义分割模型HAFormer以的计算开销和紧凑的模型尺寸实现了高性能,在Cityscapes上的mIoU达到了74.2%,在CamVid测试数据集上的mIoU达到了71.1%,在单个2080Ti GPU上的帧率分别为10SFPS和118FPS。在语义分割任务中,卷积神经网络(CNNs)和Transformer都表现出了巨大
#大模型高效推理综述本文对现有的关于高效大模型推理的文献进行了全面的综述总结。大模型由于其在各种任务中的出色表现而引起了广泛的关注。然而,大模型推理的大量计算和内存需求对其在资源受限场景的部署提出了挑战。业内一直在努力开发旨在提高大模型推理效率的技术。本文对现有的关于高效大模型推理的文献进行了全面的综述总结。首先分析了大模型推理效率低下的主要原因,即大模型参数规模、注意力计算操的二次复杂度作和自回
#EVE-7B-HD-v1.0抛弃视觉编码器,这个「原生版」多模态大模型也能媲美主流方法一作刁海文,是大连理工大学博士生,导师是卢湖川教授。目前在北京智源人工智能研究院实习,指导老师是王鑫龙博士。他的研究兴趣是视觉与语言,大模型高效迁移,多模态大模型等。共同一作崔玉峰,毕业于北京航空航天大学,是北京智源人工智能研究院视觉中心算法研究员。他的研究兴趣是多模态模型、生成模型和计算机视觉,主要工作有 E
#HTCL超过所有视觉方案!HTCL:分层时间上下文问鼎OCC本文是对ECCV2024接受的文章 HTCL: 的介绍,HTCL在SemanticKITTI基准测试中超过了所有基于相机的方法,甚至在和OpenOccupancy基准测试中超过了LiDAR,实现了最先进的性能。代码已开源,欢迎大家试用和Star~代码链接:://github./Arlo0o/HTCL论文链接::
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号