热门 最新 精选 话题 上榜
导语在多模态生成与实时交互能力上,豆包大模型(1.5 /1.6)表现突出:其端到端语音对话延迟显著低于文心一言,图像理解精准度提升约5个百分点;相比 GPT-4o,其对话灵活性更强,断句误打率降低15–20%。一、技术维度定义与测量说明• 多模态生成能力:指模型同时处理文本、图像、语音输入并生成相应输出的综合能力。 • 实时交互能力:指在音视频对话中模型响应延迟、断句判断准确性及交互流畅性。
原创 2月前
70阅读
在中文场景幻觉率上,豆包大模型优于DeepSeek-R1、文心一言和通义千问——幻觉率仅4%,准确率达96%,领先DeepSeek-R1的21%和通义千问的29%。测试基于SuperCLUE-Faith基准,2025年5月数据,样本量未公开,硬件环境为标准云服务器(GPU A100等)。这些差异源于豆包大模型的知识增强训练,适用于高可靠性中文任务。一、技术维度定义与测量说明 • 幻觉率:模型生成虚
原创 2月前
306阅读
导读:  本文为CVPR2018论文《Deep Adversarial Subspace Clustering》的阅读总结。目的是做聚类,方法是DASC=DSC(Deep Subspace Clustering)+GAN(Generative Adversarial Networks)。本文从以下四个方面来对论文做个简要整理:  背景:简要介绍与本文密切相关的基础原理,DSC,GAN。  方法:介
大家好,我是 Immerse,一名独立开发者、内容创作者。 关注:#沉浸式趣谈,获取最新文章(更多内容只在更新) 个人网站:https://yaolifeng.com 也同步更新。 转载请在文章开头注明出处和版权信息。 我会在这里分享关于编程、独立开发、AI干货、开源、个人思考等内容。 如果本文对您有所帮助,欢迎动动小手指一键三连(点赞、评论、转发),给我一些支持和鼓励,谢谢!
原创 2月前
113阅读
最近Vibe Coding的经验总结
ORBSLAM3实验环境下载依赖2.1 源码下载1、orbslam3源码下载2、Pangolin3、Eigen34、其他依赖2.2 Eigen 3安装2.3 Pangolin安装2.4 opencv安装2.5 DBoW2 and g2o2.6 安装boost库2.7 安装libssl-dev编译与运行编译运行1、数据集2、复制运行脚本注意1、未出现界面2、卡在一开始出不来结语实验环境本文配置、安装
Cursor 是一款功能强大的 AI 优先代码编辑器,深度集成 AI 模型,提供 AI 对话式代码开发,可增强开发工作流程。
Linux服务篇之五:YUM构建LAMP架构配置Linux+Apache+Mysql/MariaDB+Perl/PHP/Python一组常用来搭建动态网站或者服务器的开源软件,本身都是各自独立的程序,但是因为常被放在一起使用,拥有了越来越高的兼容度,共同组成了一个强大的Web应用程序平台。随着开源潮流的蓬勃发展,开放源代码的LAMP已经与J2EE和.Net商业软件形成三足鼎立之势,并且该软件开发的
爆款小红书卡片:输入选题秒变高颜值知识卡片,小红书博主都在偷偷用!
原创 3月前
92阅读
蚂蚁百宝箱|3秒生成爆款小红书卡片!支持多风格切换+在线编辑 3图
原创 3月前
136阅读
yyds干货盘点
从人工到智能:基于Trae智能体的网络流量自动化分析实践
本教程介绍如何在Windows环境下本地部署Ollama、Gemma3模型与Open WebUI,结合贝锐花生壳实现远程访问。无需公网IP,保障隐私安全的同时提供便捷交互体验,适用于个人实验或企业内部应用。
近日,谷歌在AI编程领域推出了一款备受瞩目的终端AI编程工具——Gemini CLI。这款免费开源的工具一经发布,便在开发者群体中引发了广泛关注,其强大的功能和免费开源的特性,使其在众多同类产品中脱颖而出,甚至让一些竞争对手如Claude Code相形见绌。安装Gemini CLI提供两种安装方式:临时运行(推荐初次体验)npx https://github.com/google-gem
原创 4月前
255阅读
智能体(AI Agent)开发实战之【LangChain】(四)结合大模型基于RAG实现本地知识库问答和纠错
一、前言前段时间,在管理某个线上项目的测试环境集群时,我想批量检查几台服务器的磁盘占用情况,本想写个 Shell 脚本循环执行df -h,但刚敲完for i in就卡壳了:IP 列表存在哪个文件?远程执行该用ssh还是ansible?参数格式记错又得反复调试,最后花了 快1个小时才写完脚本,执行时还因各类小问题报错三次。 "写命令 5 分钟,Debug 两小时" 的场景,对于管理服务器云资源这种工
原创 4月前
211阅读
Chaterm:用AI Agent开启智能终端的无限可能
 1. 什么是编解码,什么是codec?为什么要这样做。答:编解码,就是codec。CODEC =COde (编码) +DECode(解码)。假设显示器的设置是:每秒刷新60次,也就是刷新率为60Hz,1024 * 768的分辨率,那么此时显卡每秒要处理的数据量是 60 * 1024 * 768 个像素点,可想而知,视频文件的大小是很恐怖的。如果不用任何方法压缩,就单纯的存储视频文件,那
为什么突然进度差了这么多?? 重做了一遍莫比乌斯反演1之后,手感不错,于是顺着2做下来。专题里混进来了一个杜教筛题看了半天没有明白。。。等等我就去学,先放着。。。记一下思路吧。 无特别强调时,除法依旧表示向下取整。 GuGuFishtion:$Description:$Today XianYu is too busy with his
1 前言欢迎关注【深度学习-目标追踪专栏】!!! 该专栏包含了有关SOT和MOT模型/算法论文和代码的解析。分别如下:SOT单目标检测:周威:【SOT】siameseFC论文和代码解析zhuanlan.zhihu.com周威:【SOT】Siamese RPN论文解读和代码解析zhuanlan.zhihu.com周威:【SOT】Siamese RPN++ 论文和代码解析zhuanlan.zhihu.
前言:并行审批是比较常见的流程模式,在工作流模式介绍中,通常是多个分支通过网关(Gateway)来控制实现。默认的分支类型是静态定义好的。本文扩展了并行网关的控制方式,实现了动态多实例的并行分支网关,便于用户业务流程的审批过程实现。 1. 业务过程描述        并行评审需求是在多个部门同时发生,此时会有多个并行分支的实例【员工填表->组
安装过程1.安装相关依赖项sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libhdf5-serial-dev protobuf-compiler sudo apt-get install --no-install-recommends libboost-all-devsudo apt-get insta
LoRa是具有发展前景的低功耗广域网通信技术,现在已经被物联网各大领域普遍应用,由此可见LoRa通信模块在物联网行业占据着重要位置。那么,LoRa通信模块有什么特点呢? LoRa模块的特点低功耗通信距离远。LoRa通信模块的灵敏度高达 -139 dBm ,通信距离大于7000千米,解决了低功耗和远距离不能兼得的难题。易于建设和部署,免牌照频段节点。LoRa模块的价格很亲民,在物联网
智能体(AI Agent)开发实战之【LangChain】(三)结合大模型基于RAG实现本地知识库问答优化
原创 4月前
259阅读
1点赞
yyds干货盘点
飞书,自媒体爆款
文章目录0. 引言1. A Novel Cascade Binary Tagging Framework for Relational Triple Extraction(ACL 2020)1.1 摘要1.2 动机1.3 贡献1.4 方法论1.4.1 BERT Encoder1.4.2 Cascade Decoder1.5 实验结果2. MrMep: Joint Extraction of Mu
原创 4月前
145阅读
1点赞
yyds干货盘点
不搞饥饿营销、不要钱、用起来还贼简单
原创 4月前
135阅读
你和优秀老师的差距或许只隔着一个“扣子空间”
原创 4月前
136阅读
1点赞
yyds干货盘点
你是否也遇到过这样的情况?节假日想出门旅行,却不知道选哪种交通方式最划算?出差时间紧张,又怕高铁票抢不到,自驾又不熟悉路况?出行宝上线啦!一键比对多种交通方式,出行选择更聪明!
原创 4月前
110阅读
AIGC二三事
蚂蚁百宝箱丨出行宝登场,智能抢票神器来了!
一、MCP概述MCP(Model Context Protocol)是一种标准化的通信协议,专为AI工具与外部系统的集成而设计。它为AI引入了“使用工具”的能力框架,使其不仅能理解自然语言,还能主动调用系统资源、访问数据或执行操作。在旅游信息智能体的开发中,MCP可以帮助智能体调用各种外部数据源和工具,如景点实时客流查询接口、演出和展览信息平台、入境旅游指南数据库等,从而实现实时、全面的旅游信息提
MCP
原创 4月前
125阅读
1点赞
yyds干货盘点
容器实现封闭的环境主要要靠两种技术,一种是看起来是隔离的技术,称为 namespace(命名空间)。在每个 namespace 中的应用看到的,都是不同的 IP 地址、用户空间、进程 ID 等。另一种是用起来是隔离的技术,称为 cgroup(网络资源限制),即明明整台机器有很多的 CPU、内存,但是一个应用只能用其中的一部分。所谓镜像(Image),就是在你焊好集装箱的那一刻,将集装箱的状态保存下
原创 4月前
56阅读
1点赞
yyds干货盘点
容器技术概览
原创 4月前
118阅读
1点赞
yyds干货盘点
3分钟秒掌握端午营销新范式:AI驱动游戏解锁传统文化传播