VLA_51CTO博客

VLA简介

VLA 模型是“视觉-语言-动作”（Visual-Language-Action）模型的缩写。这是一种能够结合视觉、语言和动作信息的先进人工智能模型，专门设计用于机器人技术。VLA 模型的基本概念视觉（Visual）：指的是机器人通过摄像头或其他传感器获取的外部世界的信息。比如，机器人可以看到桌子上的物品、房间的布局等。语言（Language）：指的是机器人接收到的语言指令或者描述。比如，机器人可

VLA

人工智能

机器人

原创

大湿Mastwet

6月前

133阅读

变长数组VLA

C99标准中，支持变长数组，即方括号[]中可以用为一个变量，但是很多编译器并不能很好地支持。c++11标准中，不支持变长组进行增、删、改...

c/c++数组

变长数组（VLA）

动态数组

静态数组

数组

原创

江南又旧雨

2022-12-30 12:37:14

187阅读

hive first vla

Hive 是一个基于 Hadoop 的数据仓库基础设施，它提供了类似于 SQL 的查询语言 HiveQL，使得开发人员可以使用 SQL 语句在大规模的分布式数据集上进行查询和分析。Hive 的设计目标是使得非技术人员能够轻松地使用 Hadoop，从而将数据仓库的分析能力扩展到更广泛的用户群体。在 Hive 中，第一个关键概念是 Hive 表。Hive 表是数据的逻辑视图，它类似于关系型数据库中

Hive

HiveQL

数据仓库

原创

mob64ca12f21246

2024-01-21 08:49:14

17阅读

VLA技术论文阅读 - 详解

文章目录摘要introductionVLA容易讲解基础训练和评估VLA模型的指标训练方式评估指标VLATest method算子测试场景生成采样语义有效的目标对象采样混淆对象改变光照条件和相机姿势测试策略研究问题VLA模型总结任务分类实现细节实验结果RQ1：VLA模型在==常见==的机器人操作任务中 ...

目标对象

测试用例

数据集

转载

mob64ca1402a190

21天前

345阅读

c语言变长数组VLA的变通实现

c语言中近年出了重要新规范,C99,C11,其中C99提出了变长数组VLA，然后在C11中变成一个非必须实现的特性。由于Visual Studio/VC不支持变成数组VLA，于是有了这篇文章。malloc版本代码/* vla1.c -- 使用malloc函数模拟动态数组*/#include <stdio.h>#include <stdlib.h>int main(void)

C

数组

#include

#ifdef

原创

passedbylove

2022-08-19 09:18:23

510阅读

VLA自动驾驶方案的设计及实现

代码采用模块化设计，包含完整的视觉编码、语言理解、多模态融合、思维链推理和轨迹生成模块，并输出中间结果用于可解释性验证。针对量产上车的VLA（视觉-语言-动作）方案，我结合行业最新进展（如理想、元戎启行等企业的量产计划）设计一个具体方案。，将系统分为“感知-推理-动作”三层，确保中间结果（如场景描述、轨迹草案）可输出、可验证。这个实现框架为量产级VLA系统提供了完整的技术基础，可根据具体车型和芯片平台进行进一步优化。“雨天，前方公交车遮挡斑马线，疑似行人穿行，建议减速。，但通过模块化设计平衡黑箱问题。

自动驾驶

人工智能

sed

编码器

模态

转载

墨染心语

22天前

434阅读

c语言_顺序表（可变数组，变长数组，VLA）

一、#include"顺序表.h"#define Size 10typedef struct Table{ int *head;//声明一个

c语言

数据结构

可变数组

顺序表

#include

原创

江南又旧雨

2022-12-30 12:38:29

316阅读

智驾终局：VLA与WA的“强脑”之争

视频号：s

数据

激光雷达

自动驾驶

转载

mob64ca140d61c6

1月前

417阅读

NaVILA：用于足式机器人导航的VLA模型

本文提出的NaVILA模型是一种结合了视觉语言理解和低级运动控制的系统，用于实现在现实世界中的导航任务。该模型采用了高效的预训

机器人

机器学习

人工智能

泛化

数据

原创

一点人工一点智能

9月前

78阅读

完整教程：【论文阅读】纯视觉语言动作(VLA)模型：全面综述

调查论文《纯视觉语言动作（VLA）模型：综合综述》对新兴的VLA模型领域中三百多项近期研究进行了结构化分类和系统回顾。VLA模型整合了视觉感知、语言理解和机器人控制。该论文整合了基础资源，分析了其在各种机器人实体中的应用，并指出了实现通用机器人技术的关键挑战和未来研究方向。背景与语境视觉语言动作（VLA）模型代表了机器人技巧的一次重大演进，超越了传统的预编程框架，迈向了更具适应性、更通用的机器人代

真实世界

数据集

强化学习

转载

网络安全侠

23天前

447阅读

NeurIPS 2025 spotlight ｜FSDrive 自动驾驶最新VLA+世界模型

阿里高德与西安交大联合提出FutureSightDrive，创新性地采用“时空思维链”（Spatio-Temporal CoT）技术，让自动驾驶模型直接在视觉层面进行思考和预演未来。该方法通过生成未来图像作为中间推理步骤，避免了传统文本思维链造成的信息丢失问题。实验显示，这种视觉推理范式不仅提升了规划准确性，更将碰撞率降低31%。该研究为自动驾驶的视觉认知能力开辟了新方向，实现了从符号推理到视觉想象的范式升级。

人工智能

计算机视觉

自动驾驶

论文阅读

深度学习

转载

编程小达人

1月前

410阅读

NeurIPS 2025 spotlight 自动驾驶最新VLA+世界模型 FSDrive

阿里高德与西安交大联合研发的FutureSightDrive系统，创新性地提出"时空思维链"(Spatio-Temporal CoT)技术，突破传统自动驾驶模型依赖文本推理的局限。该系统让AI直接在视觉层面模拟未来路况，通过"骨架-主体-细节"的渐进式方式生成预测图像，实现更精准的路径规划。实验数据显示，该方法使碰撞风险降低31%，在nuScenes等测试基准上取得SOTA成绩。这一突破标志着自动驾驶技术从符号化推理向视觉化思考的重要转变，为行业开辟了新的发展方向。

#人工智能

#自动驾驶

#深度学习

#论文阅读

#计算机视觉

转载

mob64ca1416b5a8

1月前

417阅读

第九章 C99可变长数组VLA详解

C90及C++的数组对象定义是静态联编的，在编译期就必须给定对象的完整信息。但在程序设计过程中，我们常常遇到需要根据上下文环境来定义数组的情况，在运行期才能确知数组的长度。对于这种情况，C90及C++没有什么很好的办法去解决（STL的方法除外），只能在堆中创建一个内存映像与需求数组一样的替代品，这种替代品不具有数组类型，这是一个遗憾。C99的可变长数组为这个问题提供了一个部分解决方案。 &nbs

职场

休闲

C

指针

转载

superpopb2b

2010-08-27 15:33:13

883阅读

大模型 | VLA 初识及在自动驾驶场景中的应用

一、VLA 简介1.1 VLA 定义VLA （Vision Language Action）是一种多模态机器学习模型，结合了视觉、语言和动作三种能力，旨在实现从感知输入直接映射到控制动作的完整闭环能力。VLA 强调一体化多模态端到端架构，非感知规控的模块化方案。下图是常见端到端的框架，是 RT-2、OpenVLA、CLIP-RT 等 VLA 系统的典型代表，这些系统均采用基于 Transforme

编码器

生成模型

模态

转载

imking

10天前

393阅读

NeurIPS 2025 spotlight ｜FSDrive 自动驾驶最新VLA+世界模型 - 详解

IV-XJTU/FSDrive自动驾驶还在玩“文字游戏”？当下的VLM模型习惯于将视觉信息压缩成文本再进行推理，丢失了大量关键细节。阿里高德与西安交大联合提出FutureSig ...

自动驾驶

模态

3D

转载

网络安全守护先锋

1月前

346阅读

从“脚本式”到“会思考”：VLA技术能否重塑机房巡检机器人的未来？

随着数据中心规模的持续扩大和运维复杂度的不断提升，机房巡检机器人正逐步成为保障基础设施稳定运行的重要手段。目前，行业内主流产品普遍基于“固定动作编排”模式运行，能够完成预设路径下的温湿度检测、设备状态拍照、常规巡检等任务，在标准化场景中表现出良好的稳定性与可靠性。然而，面对非结构化指令理解、复杂环境感知与自主决策等方面的需求，这类系统仍存在明显局限。面对日益增长的智能化运维需求，这种“脚本式”智能也急需顺应技术发展做出勇敢转型。而近年来兴起的 VLA（Vision-Language-Action，视觉-语言-动作）模型，或许为这一领域带来了新的突破口。尽管该技术尚处于早期探索阶段，未形成成熟的工程落地路径，但其在感知-理解-执行一体化方面的潜力为下一代巡检机器人提供了新的技术思路。蒙帕始终关注前沿技术的发展动态，并着手开展 VLA 相关技术的研究与初步验证，积极探索其在机房巡检场景中的适配路径。

模态

数据

运维

原创

蒙帕智能运维

1月前

59阅读

机器人大脑的进化：Physical Intelligence如何用“知识隔离“破解VLA模型三大难题

本期聚焦VLA技术，详解其从概念到应用的全链路发展，分享工程落地策略与前瞻思考，开启机器人智能新纪元，推动VL高度。

机器人

人工智能

VLA

泛化

数据

原创

数据与后端架构提升之路

2月前

0阅读

谷歌 DeepMind 宣布推出 RT-2：全球第一个控制机器人的视觉 - 语言 - 动作（VLA）模型

夕小瑶科技说器人发命令

人工智能

语言模型

字符串

数据

转载

夕小瑶谈人工智能

2023-08-09 08:38:20

390阅读

AI终于能“眼见为实，动手就做”！VLA大模型全解析，小白也能看懂的具身智能“大脑”

近年来，人工智能（AI）的发展日新月异，从能与人对话的ChatGPT到能生成惊艳图片的Midjourney，AI似乎已经掌握了“看”和“说

#人工智能

#大模型学习

#大模型入门

#AI大模型

#大模型

原创

上马定江山

2月前

252阅读

2025别再瞎存数据！VLA训练三大神格式终极对决：HDF5、LeRobot、RLDS谁才是你的真命天子？

HDF5如本地硬盘，切片快、小数据友好；LeRobot云原生Parquet，边下边训，大模型预训练首选；RLDS/TFDS序列强，离线RL神器，TF生态无缝。按场景挑格式，别再全量下载！

具身数据

VLA

数据格式

数据

数据集

原创

数据与后端架构提升之路

1月前

207阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

VLA

VLA简介

变长数组VLA

hive first vla

VLA技术论文阅读 - 详解

c语言变长数组VLA的变通实现

VLA自动驾驶方案的设计及实现

c语言_顺序表（可变数组，变长数组，VLA）

智驾终局：VLA与WA的“强脑”之争

NaVILA：用于足式机器人导航的VLA模型

完整教程：【论文阅读】纯视觉语言动作(VLA)模型：全面综述

NeurIPS 2025 spotlight ｜FSDrive 自动驾驶最新VLA+世界模型

NeurIPS 2025 spotlight 自动驾驶最新VLA+世界模型 FSDrive

第九章 C99可变长数组VLA详解

大模型 | VLA 初识及在自动驾驶场景中的应用

NeurIPS 2025 spotlight ｜FSDrive 自动驾驶最新VLA+世界模型 - 详解

从“脚本式”到“会思考”：VLA技术能否重塑机房巡检机器人的未来？

机器人大脑的进化：Physical Intelligence如何用“知识隔离“破解VLA模型三大难题

谷歌 DeepMind 宣布推出 RT-2：全球第一个控制机器人的视觉 - 语言 - 动作（VLA）模型

AI终于能“眼见为实，动手就做”！VLA大模型全解析，小白也能看懂的具身智能“大脑”

2025别再瞎存数据！VLA训练三大神格式终极对决：HDF5、LeRobot、RLDS谁才是你的真命天子？

多模态大模型在具身智能领域里程碑工作！清华&字节开源DeeR-VLA：让算力内存双降

AutoLISP批量移动图元到指定图层

Trunk接口配置vlan all怎么修改成acc模式

OCP Java 自测(2)

OpenVLA - 将大语言模型 Llama 应用到机器人

机器人智能控制领域技术路线

Linux高级网络开发奇妙之旅

zabbix架构规划 zabbix架构类型

@网络通信之VLAN

TRUNK