Hugging Face 发布了 AI Sheets,这是一款开源应用,用户可以通过类似电子表格的界面,借助 AI 模型来创建、转换和丰富数据集。该工具既可在 Hugging Face Hub 上使用,也支持本地部署,用户无需编写代码即可尝试成千上万的开源模型,包括 OpenAI 的 gpt-oss。
这个界面看起来和传统表格类似,但与其通过公式计算不同,用户可以用提示词直接生成新列。比如,可以清洗文本、对数据进行分类、补充缺失信息,甚至根据自然语言描述生成新的数据行。用户还能手动修改或校正单元格内容,这些修改会影响模型后续的生成结果。
AI Sheets 提供了两种使用方式:一种是用自然语言描述数据结构,从零生成一个数据集;另一种是导入现有数据(支持 CSV、TSV、XLS、Parquet 格式)。前者适合快速原型设计或合成数据生成,后者则适合在真实数据上进行大规模转换和增强。Hugging Face 强调,用户可以先在小规模样本上实验,再扩展到更大规模的流程。
该工具还支持模型对比。用户可以为同一数据生成多个输出列,每列由不同模型驱动,甚至还能额外添加一列,让另一个大语言模型作为“评审”来打分。在一个公开示例中,研究人员对比了 Qwen3-Coder 和 gpt-oss 在小型交互式网页应用中的表现,评估结果由模型自动生成。
一些早期用户已经分享了看法,既肯定了潜力,也提出了不足:
工具确实基于大语言模型,但速度较慢。我不确定相比 OpenRefine 有什么优势。
关于数据隐私的问题也有担忧:
这个应用能自建吗?听起来不错,但我肯定不会把公司数据传到远程服务器。
对此,Hugging Face 的机器学习工程师 Daniel Vila Suero 确认可以自建:
可以的,你可以用 Docker 自行部署。参考我们在 Hub Spaces 的部署方式。
当数据集处理完成后,用户可以直接将其导出到 Hugging Face Hub。导出时还会生成可复用的配置文件,便于在 Hugging Face Jobs 中扩展,或集成到后续工作流中。
目前,AI Sheets 已在 Hugging Face Hub 免费开放,无需安装即可使用,代码也已在 GitHub 提供,支持本地部署。
















