0 前言 第一期 ? AI发展之快令人难以置信,毕竟就在一年前,我们还在为生成正确数量的手指而苦恼 ?。 过去几年,开源模型和艺术工具迎来了关键性进展,AI 创意工具的可及性前所未有地提升,而我们可能才刚刚触及冰山一角。一起回顾 2024 年 AI & 艺术领域的重要里程碑、工具和突破,同时展望 2025 年的发展趋势。 1 2024 年重大发布 重点介绍在图像和视频生成等艺术创意领域的重
将内容上传至知识库后,要对内容进行分段与数据清洗。该阶段是内容的预处理与数据结构化过程,长文本将会被划分为多个内容分段。 1 分段 由于LLM的上下文窗口有限,无法一次性处理和传输整个知识库的内容,因此需对文档 中的长文本分段为内容块。即便部分大模型已支持上传完整的文档文件,但实验表明,检索效率依然弱于检索单个内容分段。 LLM能否精准回答出知识库中内容,关键在知识库对内容块的检索与召回效果。类似
这是可优化的细节。这里过时的提示倾向于说工作空间有一个默认的重新排名模型,但在执行一些前端逻辑后我们发现当前的重新排名模型是空的或未定义的,因此这个当前模型已过时。 但这里默认模型实际上是一个所有字段都是空字符串的模型结构: { "provider":"", "model": "" } 在这种情况下,缺省模型实
创建知识库并上传文档大致分为以下步骤: 通过上传本地文件、导入在线数据或创建一个空的知识库。 1 导入文本数据 轻点 Dify 平台顶部导航中 “知识库” → “**创建知识库”**: 可上传本地文件、导入在线数据两种方式上传文档至知识库内。 1.1 上传本地文件 拖拽或选中文件进行上传,支持批量上传,同时上传的文件数量限制取决于订阅计划: 本地上传文档文件的限制: 单文档上传大小限制≤ 1
1 定义 智能助手(Agent Assistant),利用LLM的推理能力,自主对复杂的人类任务进行目标规划、任务拆解、工具调用、过程迭代,在无人类干预的情况下完成任务。 2 咋用智能助手? “探索”中找到Agent的应用模板,添加到工作区或在此基础自定义。在工作室也可从0编排一个Agent。 选择智能助手的推理模型,智能助手的任务完成能力取决于模型推理能力,建议用Agent时选择推理能力更强的
工作室操作 Agent 选择模型时对话报错: "Model schema not found" error only in agents 是因为没打开模型的函数调用功能: 当然,也不是所有模型都支持该功能。 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! ? 魔都架构师 | 全网30W+技术追随者 ? 大厂分布式系统/数据中台实战专家 ? 主导交易系
0 前言 神经网络是一种人工智能方法,用于教计算机以受人脑启发的方式处理数据。这是一种机器学习过程,称为深度学习,它使用类似于人脑的分层结构中的互连节点或神经元。它可以创建自适应系统,计算机使用该系统来从错误中进行学习并不断改进。因此,人工神经网络可以尝试解决复杂的问题,例如更准确地总结文档或人脸识别。 1 为啥重要? 神经网络可在有限的人类协助下,帮助计算机制定明智的决策。这是因为它们可以学习非
刚接触 AI 和 PyTorch,理解 “张量 (Tensor)” 是入门关键。 简单来说,可将 PyTorch 中的张量 (Tensor) 理解为 Java 中的多维数组,但它比普通的 Java 数组强大得多,尤其在 AI 和深度学习领域。 1 张量(Tensor) VS Java 数组/列表 Java 数组 (Array) / 列表 (List): Java常用数组和列表来存储数据,
0 前言 2025年1月10日,DeepSeek发布名为R1的大语言模型,该初创公司声称其在推理任务上可与OpenAI的ChatGPT o1媲美。该应用在创纪录的时间内登顶App Store排行榜,不仅吸引科技行业关注,也引发了全球范围内的广泛讨论。其中一个尤引人注目的声明是:该模型训练成本低于600万美元(而OpenAI在GPT-4花费高达1亿美元)。这一消息在股市和新闻媒体中引发轩然大波。 但
1 运行 Ollama 与 qwen2:0.5b 聊天 ollama run qwen2:0.5b 启动成功后,ollama 在本地 11434 端口启动了一个 API 服务,可通过 http://localhost:11434 访问。 2 Dify 中接入 Ollama 2.1 添加模型 在 设置 > 模型供应商 > Ollama 添加模型: 填写 LLM 信息: 模型名称:以
0 为啥本地部署? 在本地运行 AI 模型具有以下优势: 隐私:你的数据保留在你的机器上 — — 不存在共享敏感信息的风险 成本: DeepSeek R1 可免费使用,无需订阅费或使用费 控制:无需外部依赖即可进行微调和实验 1 使用Ollama 1.1 下载并运行应用程序 直达官网: 1.2 选择你的平台 MacOS、windows 直接下载,找到对应操作系统的软件到本地: 点击安装即可
1 啥是 DeepSeek-R1? 如你曾为一道棘手数学题绞尽脑汁,就明白多花时间仔细思考多重要。OpenAI o1 模型证明,当 LLM 在推理时,通过增加计算量进行类似训练后,它们在数学、编程和逻辑等推理任务上的表现显著提升。 然而,OpenAI 推理模型的训练方法一直是秘密。直到DeepSeek发布DeepSeek-R1模型,瞬间引爆互联网(甚至影响股市!)。 除了性能达到或超越 o1,D
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 流量:某个时间段内的所有请求,通过手段把发送到A应用的所有请求录制,然后把这些请求统一转发到B应用,让B应用接收到的请求参数跟A应用一致,实现A接收到的请求在B应用里面重新请求了一遍。整个过程即“流量回放”。 1 流量回放的意义 经常多需求并行开发,还可能夹杂着应用重构和拆分。基本很难做到不改动老逻辑,只要有改动就可能存在考虑不
0 前言 基于Dify现有能力,已能对不少业务场景提供帮助,但对一些特定诉求,还要借助其扩展机制,本文利用翻译场景举例详细说明。 1 翻译场景复杂性分析 翻译是从简单到复杂各级都存在的场景,比较简单的翻译可能一句简单 Prompt,但对复杂、效果要求较高翻译场景,可能需要一些复杂 LLM 编排,如吴恩达开源的 Translation Agent 工作。 从效果层面看,有些翻译要求比较高的意译水平,
0 你的问题,我知道! 工作意义是啥?职业发展在人生啥角色? 1 工作意义 农村人努力学习考上大学,得好工作,为逃离同村同龄人十几岁就工厂打工命运,过不凡人生,实现改命的唯一途径。毕业就进入自带光环的大厂,有份让所有亲戚羡慕的公司和薪水。我认为工作价值是让自己自立,改变命运。 但现实挑战才开始。 工作前几年,职场战战兢兢,如履薄冰,尽心尽力做靠谱人靠谱事。交代任务二话不说就是干,加班熬夜不敢喊累。
0 你的问题,我知道! 和大厂朋友聊天,他感叹原来努力干活,做靠谱研发,积累职场经验,干下来,职业发展一般问题不大。而如今大厂“年轻化”,靠谱再不能为自己续航,企业似乎也不愿意持续为经验买单。 在这不确定时代,职业发展中有无硬通货? 更长远职业发展角度: 要抓住机会 要抵御风险,构建自己的职业发展护城河 1 机会来自不断积累职场燃料 机会和啥相关?职业发展机会来自不断积累职场燃料。 1.1 啥
0 你的问题,我知道! 我一整年工作这么拼,项目结果也不错,咋晋升挂? 我在岗四五年了,而他就三年,为啥主管提名它? 但这只是打工人视角看晋升的一厢情愿。 晋升本质 晋升并非奖励。若过去功劳特多,也应用绩效、年终奖奖励,而非晋升。大多企业,晋升也非论资排辈,不是你在岗位久,就该晋升。 在企业角度才能看懂,晋升是企业的内部人才选拔,选拔: 对公司未来发展更有价值 能承担更大责任的人 那这人才
人生发展阶段 人生大阶段都充满了幻灭感: 头20年,看山是山,看水是水。牙牙学语开始,父母给无微不至照顾,解决生活难题,认为他们无所不能。长大后,才发现父母也只是普通人,之前错觉是因没看到,他们转过身去品尝生活苦涩的样子 第二个20年,看山非山,看水非水。阶段开头,学业有成,迫不及待冲入职场欲大干一番。但很多人在第一次求职就早于滑铁卢,发现和梦中情司之间隔着一座大山。也许你更幸运些,获得了一个还
0 你的问题,我知道! OKR规划分两阶段: 高层业务负责人 针对 整条业务线 做业务规划 中层Team Leader 针对 专业团队 做团队规划 做团队规划,了解第二阶段就够?No,中层TL同样要了解第一阶段。你只有理解业务规划背后逻辑,才能做出匹配的团队规划。 这也是为啥很多公司,当你到P7+,就有机会参与业务规划讨论。 1 阶段一:业务规划 1.1 第一步:聚焦业务目标(O) 聚焦是OK
0 你的问题,我知道! 没有职场认知而产生的疑惑: 遇到问题就死磕,觉得问人丢人,麻烦别人不好意思,结果问题没解决,自己先纠结半天; 觉得工作特努力,常加班,但好绩效无缘 面临裁员,愤怒为什么裁我,又因无规划,觉得惶恐 这些问题是不是很眼熟?你或多或少也想过?其实,认识职场就是: 认识职场的底层规律,即“游戏规则” 底层规律之上,还要理解职场的事和人 1 职场的“游戏规则” 1.0 职场由
0 前言 一般用application.yml实现Spring Boot应用参数配置。但Spring配置有优先级,避免重复配置项的覆盖,须清晰优先级。 Spring通过Environment抽象出: Profile:规定场景。定义诸如dev、test、prod等环境 Property:PropertySources,各种配置源。一个环境中可能有多个配置源,每个配置源有许多配置项。查询配置信息时,
0 前言 大环境不好,很多程序员被优化,被逼转型传统行业,但: 不同级别的人,咋融入传统行业? 转型传统行业的同学会经历哪 3 个经典阶段? 入局后的“坑” 1 不同阶层,咋转型传统行业? 1.1 高层 总监及总监以上的 VP、C*O 等。最重要的是想尽一切办法找到价值,同时带领团队做出有价值的事: 找价值 建团队 1.1.1 找价值 大多去传统行业做数字化转型的高P,原是互联网大厂中层,
0 前言 单元化架构通过减少故障影响范围来增强系统的弹性。 单元化架构是对于那些无法接受停机或可能对最终用户产生负面影响的系统的良好选择。 单元化架构可能很复杂,有一些最佳实践可以遵循,以提高成功的机会。 在推出单元化架构或将现有的云原生/微服务架构改造/转变为单元化架构时,有一些实际步骤需要考虑。 单元不是微服务的替代品,而是一种帮助在大规模情况下管理微服务的方法。许多适用于微服务的最佳实践、
0 前言 我有个朋友说他们国企的系统从未性能调优,功能测试完就上线,线上也没性能问题,何必还做性能调优? 本文搞清: 为什么要做性能调优? 啥时开始做? 做性能调优是不是有标准? 1 为啥做性能调优? 有些性能问题是慢慢产生,到了时间就自爆 更多性能问题是由访问量波动导致,如活动或公司产品用户量上升 也可能一款产品上线后就半死不活,一直没有大访问量,所以还没有引发这颗定时炸弹 现在假设你的
1 关键要点 尽管数据显示 Java 17 是最常用 JDK,但其用户占比并未超过半数。根据 New Relic 2024 Java 生态系统状态报告,Java 17、11 和 8 的用户比例分别为 35%、33% 和 29%。 New Relic 数据中所谓“快速采用”指 Java 21 的采用率仅为 1.4%。虽相较 Java 8 以来的所有LTS,增长速度更快,但这比例仍较低。 Java
1 前后端开发模式的演变 jQuery时对大部分Web项目,前端不能控制路由,要依赖后端项目的路由系统。通常,前端项目也部署在后端项目的模板里,项目执行示意图: jQuery前端都要学会在后端模板如JSP里写代码。此时,前端工程师无需了解路由。对每次的页面跳转,都由后端负责重新渲染模板。 前端依赖后端,且前端无需负责路由,有很多 优点 如开发速度快、后端也承担部分前端任务,所以至今很多内部管理系
0 前言 上文讲解了Jest框架对组件库测试,TypeScript和Jest都为代码质量和研发效率。之前实现Container和Button组件以渲染功能为主,可根据不同属性渲染不同样式去实现布局和不同格式的按钮。 本文的表单组件,除了要渲染页面组件,还支持很好页面交互,从Element3的表单组件开始。 1 表单组件 Element表单组件 页面里,可见表单种类的组件类型很多,输入框、单选框和评
0 前言 系统突然瘫痪,重启后,问题仍无规律重现。运维马上写个重启脚本,定时排队重启各服务,但“治标不治本”。 作为主力排查问题,通过各种 Linux 命令在线上环境查看性能指标,dump 日志文件,走查代码,最后问题,后面分析原因、制定解决方案、更新d版本等。这就是一次性能调优和解决技术问题思路。 很多 ROI 高系统会做大促。期间,系统不仅要保证处理请求业务的严谨性,还要历经短时间内高并发
0 前言 98年前的搜索引擎体验不好: 返回结果质量不高:搜索结果不考虑网页质量,而通过时间顺序检索 易被钻空:搜索引擎基于检索词检索,页面中检索词出现的频次越高,匹配度越高,这样就会出现网页的情况。有些网页为了增加搜索引擎的排名,故意增加某个检索词频率 当时Google拉里·佩奇提出PageRank算法,找到优质网页,这样Google的排序结果不仅能找到用户想要的内容,而且还会从
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号