0 前言 第一期 ? AI发展之快令人难以置信,毕竟就在一年前,我们还在为生成正确数量的手指而苦恼 ?。 过去几年,开源模型和艺术工具迎来了关键性进展,AI 创意工具的可及性前所未有地提升,而我们可能才刚刚触及冰山一角。一起回顾 2024 年 AI & 艺术领域的重要里程碑、工具和突破,同时展望 2025 年的发展趋势。 1 2024 年重大发布 重点介绍在图像和视频生成等艺术创意领域的重
将内容上传至知识库后,要对内容进行分段与数据清洗。该阶段是内容的预处理与数据结构化过程,长文本将会被划分为多个内容分段。 1 分段 由于LLM的上下文窗口有限,无法一次性处理和传输整个知识库的内容,因此需对文档 中的长文本分段为内容块。即便部分大模型已支持上传完整的文档文件,但实验表明,检索效率依然弱于检索单个内容分段。 LLM能否精准回答出知识库中内容,关键在知识库对内容块的检索与召回效果。类似
这是可优化的细节。这里过时的提示倾向于说工作空间有一个默认的重新排名模型,但在执行一些前端逻辑后我们发现当前的重新排名模型是空的或未定义的,因此这个当前模型已过时。 但这里默认模型实际上是一个所有字段都是空字符串的模型结构: { "provider":"", "model": "" } 在这种情况下,缺省模型实
创建知识库并上传文档大致分为以下步骤: 通过上传本地文件、导入在线数据或创建一个空的知识库。 1 导入文本数据 轻点 Dify 平台顶部导航中 “知识库” → “**创建知识库”**: 可上传本地文件、导入在线数据两种方式上传文档至知识库内。 1.1 上传本地文件 拖拽或选中文件进行上传,支持批量上传,同时上传的文件数量限制取决于订阅计划: 本地上传文档文件的限制: 单文档上传大小限制≤ 1
1 定义 智能助手(Agent Assistant),利用LLM的推理能力,自主对复杂的人类任务进行目标规划、任务拆解、工具调用、过程迭代,在无人类干预的情况下完成任务。 2 咋用智能助手? “探索”中找到Agent的应用模板,添加到工作区或在此基础自定义。在工作室也可从0编排一个Agent。 选择智能助手的推理模型,智能助手的任务完成能力取决于模型推理能力,建议用Agent时选择推理能力更强的
工作室操作 Agent 选择模型时对话报错: "Model schema not found" error only in agents 是因为没打开模型的函数调用功能: 当然,也不是所有模型都支持该功能。 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! ? 魔都架构师 | 全网30W+技术追随者 ? 大厂分布式系统/数据中台实战专家 ? 主导交易系
0 前言 神经网络是一种人工智能方法,用于教计算机以受人脑启发的方式处理数据。这是一种机器学习过程,称为深度学习,它使用类似于人脑的分层结构中的互连节点或神经元。它可以创建自适应系统,计算机使用该系统来从错误中进行学习并不断改进。因此,人工神经网络可以尝试解决复杂的问题,例如更准确地总结文档或人脸识别。 1 为啥重要? 神经网络可在有限的人类协助下,帮助计算机制定明智的决策。这是因为它们可以学习非
刚接触 AI 和 PyTorch,理解 “张量 (Tensor)” 是入门关键。 简单来说,可将 PyTorch 中的张量 (Tensor) 理解为 Java 中的多维数组,但它比普通的 Java 数组强大得多,尤其在 AI 和深度学习领域。 1 张量(Tensor) VS Java 数组/列表 Java 数组 (Array) / 列表 (List): Java常用数组和列表来存储数据,
0 前言 2025年1月10日,DeepSeek发布名为R1的大语言模型,该初创公司声称其在推理任务上可与OpenAI的ChatGPT o1媲美。该应用在创纪录的时间内登顶App Store排行榜,不仅吸引科技行业关注,也引发了全球范围内的广泛讨论。其中一个尤引人注目的声明是:该模型训练成本低于600万美元(而OpenAI在GPT-4花费高达1亿美元)。这一消息在股市和新闻媒体中引发轩然大波。 但
1 运行 Ollama 与 qwen2:0.5b 聊天 ollama run qwen2:0.5b 启动成功后,ollama 在本地 11434 端口启动了一个 API 服务,可通过 http://localhost:11434 访问。 2 Dify 中接入 Ollama 2.1 添加模型 在 设置 > 模型供应商 > Ollama 添加模型: 填写 LLM 信息: 模型名称:以
0 为啥本地部署? 在本地运行 AI 模型具有以下优势: 隐私:你的数据保留在你的机器上 — — 不存在共享敏感信息的风险 成本: DeepSeek R1 可免费使用,无需订阅费或使用费 控制:无需外部依赖即可进行微调和实验 1 使用Ollama 1.1 下载并运行应用程序 直达官网: 1.2 选择你的平台 MacOS、windows 直接下载,找到对应操作系统的软件到本地: 点击安装即可
1 啥是 DeepSeek-R1? 如你曾为一道棘手数学题绞尽脑汁,就明白多花时间仔细思考多重要。OpenAI o1 模型证明,当 LLM 在推理时,通过增加计算量进行类似训练后,它们在数学、编程和逻辑等推理任务上的表现显著提升。 然而,OpenAI 推理模型的训练方法一直是秘密。直到DeepSeek发布DeepSeek-R1模型,瞬间引爆互联网(甚至影响股市!)。 除了性能达到或超越 o1,D
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 流量:某个时间段内的所有请求,通过手段把发送到A应用的所有请求录制,然后把这些请求统一转发到B应用,让B应用接收到的请求参数跟A应用一致,实现A接收到的请求在B应用里面重新请求了一遍。整个过程即“流量回放”。 1 流量回放的意义 经常多需求并行开发,还可能夹杂着应用重构和拆分。基本很难做到不改动老逻辑,只要有改动就可能存在考虑不
0 前言 基于Dify现有能力,已能对不少业务场景提供帮助,但对一些特定诉求,还要借助其扩展机制,本文利用翻译场景举例详细说明。 1 翻译场景复杂性分析 翻译是从简单到复杂各级都存在的场景,比较简单的翻译可能一句简单 Prompt,但对复杂、效果要求较高翻译场景,可能需要一些复杂 LLM 编排,如吴恩达开源的 Translation Agent 工作。 从效果层面看,有些翻译要求比较高的意译水平,
0 你的问题,我知道! 工作意义是啥?职业发展在人生啥角色? 1 工作意义 农村人努力学习考上大学,得好工作,为逃离同村同龄人十几岁就工厂打工命运,过不凡人生,实现改命的唯一途径。毕业就进入自带光环的大厂,有份让所有亲戚羡慕的公司和薪水。我认为工作价值是让自己自立,改变命运。 但现实挑战才开始。 工作前几年,职场战战兢兢,如履薄冰,尽心尽力做靠谱人靠谱事。交代任务二话不说就是干,加班熬夜不敢喊累。
0 你的问题,我知道! 和大厂朋友聊天,他感叹原来努力干活,做靠谱研发,积累职场经验,干下来,职业发展一般问题不大。而如今大厂“年轻化”,靠谱再不能为自己续航,企业似乎也不愿意持续为经验买单。 在这不确定时代,职业发展中有无硬通货? 更长远职业发展角度: 要抓住机会 要抵御风险,构建自己的职业发展护城河 1 机会来自不断积累职场燃料 机会和啥相关?职业发展机会来自不断积累职场燃料。 1.1 啥
0 你的问题,我知道! 我一整年工作这么拼,项目结果也不错,咋晋升挂? 我在岗四五年了,而他就三年,为啥主管提名它? 但这只是打工人视角看晋升的一厢情愿。 晋升本质 晋升并非奖励。若过去功劳特多,也应用绩效、年终奖奖励,而非晋升。大多企业,晋升也非论资排辈,不是你在岗位久,就该晋升。 在企业角度才能看懂,晋升是企业的内部人才选拔,选拔: 对公司未来发展更有价值 能承担更大责任的人 那这人才
人生发展阶段 人生大阶段都充满了幻灭感: 头20年,看山是山,看水是水。牙牙学语开始,父母给无微不至照顾,解决生活难题,认为他们无所不能。长大后,才发现父母也只是普通人,之前错觉是因没看到,他们转过身去品尝生活苦涩的样子 第二个20年,看山非山,看水非水。阶段开头,学业有成,迫不及待冲入职场欲大干一番。但很多人在第一次求职就早于滑铁卢,发现和梦中情司之间隔着一座大山。也许你更幸运些,获得了一个还
0 你的问题,我知道! OKR规划分两阶段: 高层业务负责人 针对 整条业务线 做业务规划 中层Team Leader 针对 专业团队 做团队规划 做团队规划,了解第二阶段就够?No,中层TL同样要了解第一阶段。你只有理解业务规划背后逻辑,才能做出匹配的团队规划。 这也是为啥很多公司,当你到P7+,就有机会参与业务规划讨论。 1 阶段一:业务规划 1.1 第一步:聚焦业务目标(O) 聚焦是OK
0 你的问题,我知道! 没有职场认知而产生的疑惑: 遇到问题就死磕,觉得问人丢人,麻烦别人不好意思,结果问题没解决,自己先纠结半天; 觉得工作特努力,常加班,但好绩效无缘 面临裁员,愤怒为什么裁我,又因无规划,觉得惶恐 这些问题是不是很眼熟?你或多或少也想过?其实,认识职场就是: 认识职场的底层规律,即“游戏规则” 底层规律之上,还要理解职场的事和人 1 职场的“游戏规则” 1.0 职场由
0 前言 一般用application.yml实现Spring Boot应用参数配置。但Spring配置有优先级,避免重复配置项的覆盖,须清晰优先级。 Spring通过Environment抽象出: Profile:规定场景。定义诸如dev、test、prod等环境 Property:PropertySources,各种配置源。一个环境中可能有多个配置源,每个配置源有许多配置项。查询配置信息时,
0 前言 大环境不好,很多程序员被优化,被逼转型传统行业,但: 不同级别的人,咋融入传统行业? 转型传统行业的同学会经历哪 3 个经典阶段? 入局后的“坑” 1 不同阶层,咋转型传统行业? 1.1 高层 总监及总监以上的 VP、C*O 等。最重要的是想尽一切办法找到价值,同时带领团队做出有价值的事: 找价值 建团队 1.1.1 找价值 大多去传统行业做数字化转型的高P,原是互联网大厂中层,
0 前言 单元化架构通过减少故障影响范围来增强系统的弹性。 单元化架构是对于那些无法接受停机或可能对最终用户产生负面影响的系统的良好选择。 单元化架构可能很复杂,有一些最佳实践可以遵循,以提高成功的机会。 在推出单元化架构或将现有的云原生/微服务架构改造/转变为单元化架构时,有一些实际步骤需要考虑。 单元不是微服务的替代品,而是一种帮助在大规模情况下管理微服务的方法。许多适用于微服务的最佳实践、
0 前言 我有个朋友说他们国企的系统从未性能调优,功能测试完就上线,线上也没性能问题,何必还做性能调优? 本文搞清: 为什么要做性能调优? 啥时开始做? 做性能调优是不是有标准? 1 为啥做性能调优? 有些性能问题是慢慢产生,到了时间就自爆 更多性能问题是由访问量波动导致,如活动或公司产品用户量上升 也可能一款产品上线后就半死不活,一直没有大访问量,所以还没有引发这颗定时炸弹 现在假设你的
OpenAI 推出了 GPT-5-Codex,这是 GPT-5 的一个专门版本,重点针对大型代码重构和复杂代码审查等软件工程任务进行优化。它为 Codex CLI、IDE 插件和云端环境特别设计,可以在无人干预的情况下连续运行 7 小时以上,独立完成工作任务。目前,该模型已成为 Codex 云服务的默认版本,并在开发者常用的 Codex 环境中全面上线。GPT-5-Codex 的一大亮点是自适应推
Replit 发布了最新的自主软件代理 Agent 3,进一步扩展了 AI 在编程和工作流自动化中的应用。不同于以往只提供自动补全或单步代码生成等零散帮助的编码助手,Agent 3 被设计成可以长时间独立执行任务的系统。它最多可连续运行 200 分钟,具备规划、编写、测试和优化完整软件组件的能力,无需开发者频繁干预。Agent 3 的一大技术亮点是其 自测与调试循环。在生成代码后,它会自动执行、发
AWS Integrates LocalStack with VS-Code Toolkit to Streamline Serverless Development
微软近日宣布推出一项新功能进入公测阶段,这一功能让 Azure Logic Apps(标准版) 可以作为 MCP 服务器运行,为开发者提供了一种灵活的方式来构建和管理智能代理。模型上下文协议(Model Context Protocol,MCP) 是一种开放标准,它让大型语言模型(LLM)、AI 代理和 MCP 客户端能够以安全、可发现、结构化的方式与外部系统和工具交互。该标准定义了如何描述、运行
本周(2025 年 9 月 8 日)的 Java 新闻重点包括:JDK 26 的新 JEP 目标与候选提案;GPULlama3.java 首次与 LangChain4j 集成;Spring Framework、Spring Data 和 Spring AI 的里程碑版本;Spring Authorization Server 并入 Spring Security;Open Liberty 9 月更
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号