热门 最新 精选 话题 上榜
IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架,解决了传统方法在姿态引导的人物图像生成中的局限性,支持多场景适应、细节与语义融合、灵活的图像与姿态对齐以及全局与局部一致性。
Nanobrowser 是一款开源的 Chrome 扩展工具,基于多智能体系统实现复杂的网页任务自动化,支持多种大型语言模型,完全免费且注重隐私保护。
在全球化竞争与敏捷转型的双重驱动下,项目管理工具已成为团队效率的“隐形引擎”。本文精选7款国内外工具,从功能适配性、安全合规与成本效益多维度剖析,并重点解读国产平台Gitee如何以差异化优势破局。
大家都知道在文生图领域,一个常见的痛点就是角色的一致性问题:尤其是在长篇故事创作中。想要生成一系列图像,其中的角色在每一张插图中的形象、面部特征都要保持一致,但是随着故事情节推进及场景变化,角色的形象经常会发生偏离,影响了故事的连贯性和视觉体验。这不仅是对AI模型的挑战,更是对使用者使用方法的检验。刚好最近在 GitHub 上发现了可以解决该问题的一款开源项目:1Prompt1Story。它能够让
原创 6月前
374阅读
一个文生图角色一致性工具!让AI绘画角色始终如一,轻松生成长篇故事插图!
在工作中,我们常常遇到各种各样的PDF文件,其中不乏一些扫描版的文档。而在处理扫描的 PDF 文件时,虽然文件内容看似完整,但你却无法复制、搜索其中的文本。特别是对大量文档需要进行文本分析、存档、或者进行后期编辑时,这种不可搜索的状态极大降低了效率。还有的文档,都是图片,想要提取其中的文本就变得更加异常困难。现在给大家推荐一个神奇的工具:OCRmyPDF,它能够让您轻松解决这个问题,将扫描版PDF
原创 6月前
147阅读
高效的OCR处理工具!让扫描PDF文件变得可搜索、可复制!
随着人工智能的快速发展,聊天机器人已经成为企业与客户、用户之间重要的沟通桥梁。从简单的客户服务到复杂的自动化交互,AI聊天机器人的应用场景越来越广泛。然而,想要在多个平台(如QQ、微信、飞书等)上高效构建并管理一个功能完备的通信机器人,往往面临技术门槛、平台接入困难和扩展性不足等问题。今天,介绍一款功能强大、可扩展、多模态的即时通信机器人平台:LangBot,支持自定义接入多个主流大模型,并能无缝
每天,我们都在浏览器中完成各种任务:浏览网页、填写表单、搜索信息、整理数据……这些看似简单的操作,累积起来却耗费了大量时间。再反观市面上许多的自动化工具要么价格昂贵,要么需要复杂的配置,甚至牺牲隐私将数据上传到云端。Nanobrowser 作为一款刚刚在 GitHub 上开源的 AI 网页自动化工具,能完美解决以上痛点。作为 OpenAI Operator 的开源替代方案,它支持本地浏览
原创 6月前
550阅读
太酷了!刚刚开源的网页自动化神器,OpenAI Operator瞬间不香了!
URO-Bench 是一款专为端到端语音对话模型设计的全面基准测试工具,涵盖多语言、多轮对话、副语言信息等多维度任务,帮助开发者全面评估模型性能。
autoMate是一款基于AI和RPA的本地自动化工具,通过自然语言实现复杂任务的自动化操作,支持本地部署,确保数据安全和隐私,适合需要高效处理重复性工作的用户。
2025 两大现象级爆火:DeepSeek 与 哪吒2,一个来自 AI 技术圈,一个来自国漫娱乐圈。哪吒2昨日也破100亿票房,而 DeepSeek 的热度也居高不下!当然,今天文章的主角还是来自 AI 圈的 DeepSeek。自除夕以来,已经有众多海内外知名互联网大厂将 DeepSeek 服务接入自家的业务场景,其中不泛有谷歌、微软、腾讯、阿里、字节、OPPO等。接下来进入主
原创 6月前
269阅读
超强大且免费的DeepSeek R1 Vscode插件来了!
2025年被称之为 AI 代理(AI Agent)元年!这句话彻底被 Manus 的爆火破圈印证了!目前国内外 AI 技术已经非常成熟了,而 AI Agent 是能逐步改变我们的工作方式,它让 AI 不仅能理解、生成文本和编写代码,还能直接操作电脑、执行任务、浏览网页、处理文件。未来,它会像办公软件一样,在我们生活工作的方方面面扮演者各种角色。然而,像 Manus 这个全球最为强大的 AI 代理,
原创 6月前
564阅读
开源版Manus来了!14.7k标星的OpenManus,让AI替你全自动执行任务!
LaWGPT 是南京大学推出的中文法律大语言模型,基于 LLaMA 模型进行二次预训练,融入大量中文法律知识,适用于法律咨询、文书生成、司法考试辅助等多种场景。
【第二章 模型与设备连接】手把手教你玩转新版正点原子云玩过物联网的朋友们都知道,我们在接触各大主流云平台时会知道物模型的概念。本实验就是针对原子云中模型与设备连接,举个简单例子说明,温度传感器通过D40模块把数据传输到原子云,方便监控传感器的数据。模块的使用和如何从传感器数据传到云平台本文不再啰嗦,重点讲述原子云的使用。正点原子D40 Mini 4G Cat1 DTU数传资料下载:D40 Mini
原创 6月前
176阅读
【第二章 模型与设备连接】手把手教你玩转新版正点原子云
【第四章 定时任务】手把手教你玩转新版正点原子云承接上篇,除了报警联动这个功能,原子云还有一个特色功能也是各开发者喜欢用的,定时任务功能。【正点原子】云平台:原子云(点击登录原子云)前言:定时任务可以在云平台定时、定向地向设备发送数据。比如在设定好定时任务,我们就可以在我们所规定所需要的时间里向设备发送数据,以此对设备进行控制或者采集数据等等。实验内容介绍:接下来的实验主要介绍定时任务的三种任务类
【第一章 透传策略】手把手教你玩转新版正点原子云1. 本次实验使用正点原子D40 Mini 4G Cat1 DTU数传模块1.1 D40数传模块资料 具体使用和资料下载可到:D40 Mini 4G Cat1 DTU数传 — 正点原子资料下载中心 1.0.0 文档1.2 Mini DTU测试板资料 具体使用和资料下载可到:Mini DTU测试板 — 正点原子资料下载中心 1.0.0 文档2. 本次实
被字幕支配的恐惧,你遭遇过吗?熬夜做的产品宣传片,老板却让你“翻译成8国语言”;追一部冷门外语纪录片,全网找不到中文字幕……字幕,早已不再是简单的“文字叠加”,而是 信息传播的硬通货。但手动做字幕有多痛苦?对焦时间轴抠到眼花、翻译语句像“机翻鬼打墙”、多语种切换累到手抖……更别提复杂的剪辑软件劝退无数小白。(PS:当然剪映还是很好用的。)普通人想高效生成“专业级字幕”,几乎是个伪命题。直
原创 6月前
182阅读
一款超酷的智能字幕神器!0门槛、跨平台、集成DeepSeek翻译引擎!
3月6日,Manus 在AI科技圈掀起了一股热潮,其强大的功能和创新的设计让无数人眼前一亮。然而,昨天一早我们就已经看到了一些开源替代方案迅速崭露头角。小编也为大家整理了六个当下备受关注的类 Manus 的开源替代项目,虽然有些项目它们的核心代码可能由AI生成,但潜力仍不容小觑。1、OpenManusOpenManus 是目前 star 数最高的 Manus 开源替代项目,由 MetaG
原创 6月前
918阅读
6 个值得关注的 Manus 开源平替,收藏起来!
在 TTS(文本转语音)技术的快速发展下,如何生成更加自然、可控、个性化的 AI 语音,成为了语音合成领域的核心挑战。传统的 TTS 系统虽然能生成高质量语音,但往往存在 控制能力有限、跨语言表现较差、声音风格固定 等问题。Spark-TTS 作为一款刚刚开源的高质量语音合成(TTS)系统。不仅支持零样本语音克隆,还能进行细粒度语音控制,包括语速、音调、语气等多项参数调节,同时具备跨语言
原创 6月前
674阅读
太给力了!刚刚开源的TTS模型,1:1零样本声音克隆,连呼吸节奏都能控制!
OWL 是基于 CAMEL-AI 框架开发的多智能体协作系统,通过智能体之间的动态交互实现高效的任务自动化,支持角色分配、任务分解和记忆功能,适用于代码生成、文档撰写、数据分析等多种场景。
OpenManus 是 MetaGPT 团队推出的开源 AI Agent 复刻版,支持多种语言模型和工具链,能够执行代码、处理文件、搜索网络信息等复杂任务,具备实时反馈机制和灵活的配置选项。
OpenManus 是 MetaGPT 的开源 AI 平台,支持多语言模型和工具链,执行代码、处理文件等任务,具备实时反馈。OWL 基于 CAMEL-AI,支持角色分配、任务分解和记忆功能,实现高效任务自动化。
Resume Matcher 是一款开源AI简历优化工具,通过解析简历和职位描述,提取关键词并计算文本相似性,帮助求职者优化简历内容,提升通过自动化筛选系统(ATS)的概率,增加面试机会。
在内容创作和学术研究中,查找资料、整理大纲、打磨文章结构往往是最费时的环节。许多写作者在面对复杂主题时,常常会遇到写作逻辑混乱、不知道切入角度、缺乏背景资料等问题。斯坦福大学开源了一款 AI 写作工具:STORM,提供了一种全新的写作方式!已经在 GitHub 收获了 22.5k Star,可见深受众多用户青睐。它不仅能自动帮你深挖资料、生成写作大纲,甚至还能模拟专家与你对话,
昨日(3月6日),AI圈彻底炸锅了!一款名叫 Manus 的AI智能体直接刷屏朋友圈、微博和各大科技群。消息一出,邀请码疯抢,有人惊呼“这是继DeepSeek后的又一王炸”,甚至还有人戏称:“苹果刚发布M4芯片,Manus 就抢了风头!它是在3月5日晚发布的,仅仅一夜就爆火了,发酵起因就是因为看了 Manus 官网发布的一段长达四分钟的演示 demo,就被它强大的能力给震惊住了
FileCodeBox 是一个基于 FastAPI 、 Vue3 开发的轻量级文件分享工具。它允许用户通过简单的方式分享文本和文件,接收者只需要一个提取码就可以取得文件,就像从快递柜取出快递一样简单。
原创 6月前
308阅读
1点赞
FileCodeBox:像拿快递一样轻松分享文件
文章围绕开源中国董事长马越展开对话,探讨 DeepSeek 现象、开源商业化困境、国内软件生态问题。马越认为 DeepSeek 不是国运级创新,年轻人崛起才是关键。同时分享开源中国商业化路径,强调开源是强者的游戏,对 AI 创业等发表看法。
【第三章 警报联动】手把手教你玩转新版正点原子云新版原子云网址:原子云(点击登录原子云)原子云特色功能:设置警报联动,本实验就独立触发器和触发警报进行演示,操作简单易理解。大家也可以根据功能需求自定义设计。1. 承接上编,我们已经将设备和模型进行连接完毕,接下来本实验就以独立触发器来创建触发器,警报联动->独立触发器->创建触发器2. 创建触发器,依次填写,红色星号为必填项,其余自定义
原创 6月前
115阅读
【第三章 警报联动】手把手教你玩转新版正点原子云
一、摘要LocalAPI.ai 是一个开源的在线调用系统,专注于提供基于浏览器的 Ollama WEB UI客户端。该系统致力于为用户提供便捷、安全的 AI 服务体验,允许用户无需安装第三方软件即使用可进行智能对话、文本生成、模型管理等功能,并且支持在移动端(手机)进行远程使用。 在线体验: http://www.LocalAPI.aiGithub地址:https://github.com/vam
原创 6月前
182阅读
基于浏览器运行的 Ollama WEB客户端开源发布
QwQ-32B 是阿里巴巴开源的新型推理模型,基于强化学习训练,具备强大的数学推理和编程能力,性能媲美更大参数量的模型。
PodAgent 是由香港中文大学、微软和小红书联合推出的播客生成框架,基于多智能体协作系统,自动生成高质量对话内容,支持声音角色匹配和语音合成,适用于媒体、教育、企业推广等多个场景。