Cloud Native Summit 最近公布了 2025 年奥克兰大会的演讲视频。多场分享展示了企业如何借助 Open Practice Library —— 一个收录协作模式的实践库,将团队的合作方式转化为成果。Andrea Magnorsky 介绍了她的 “Byte-Sized Architecture” 方法,用来帮助团队建立对架构的共同理解。而 Ahilan Ponnusamy 和 A
Hugging Face 推出了一个全新集成,让开发者可以在 Visual Studio Code 中直接把 Inference Providers 接入到 GitHub Copilot Chat。这意味着,像 Kimi K2、DeepSeek V3.1、GLM 4.5 等开源大语言模型,现在都能在 VS Code 编辑器内直接使用和测试,无需切换平台或来回操作多个工具。整个流程非常简单:开发者只
Hugging Face 推出了 FinePDFs,这是迄今为止最大、完全由 PDF 构建的公开语料库。该数据集涵盖了 4.75 亿份文档,涉及 1733 种语言,总计约 3 万亿个 token,整体大小达 3.65 TB。FinePDFs 的推出为开放训练数据集带来了新维度,利用了过去一直被认为过于复杂和昂贵而难以处理的 PDF 资源。大多数大规模语言模型的数据集主要依赖于 HTML 来源(如
Hugging Face 发布了 AI Sheets,这是一款开源应用,用户可以通过类似电子表格的界面,借助 AI 模型来创建、转换和丰富数据集。该工具既可在 Hugging Face Hub 上使用,也支持本地部署,用户无需编写代码即可尝试成千上万的开源模型,包括 OpenAI 的 gpt-oss。这个界面看起来和传统表格类似,但与其通过公式计算不同,用户可以用提示词直接生成新列。比如,可以清洗
Vercel 正式发布了面向生产环境的 AI Gateway。这个服务提供了一个统一的 API 接口,开发者可以通过它调用各种大语言模型和生成式模型,从而简化集成和管理过程。AI Gateway 让应用能够通过同一个端点向多个模型提供商发送推理请求。它支持“自带密钥”认证,开发者可以直接使用自己在 OpenAI、Anthropic 或 Google 等平台申请的 API key,而无需额外支付代币
Google DeepMind 推出了 EmbeddingGemma,这是一款拥有 3.08 亿参数的开源嵌入模型,专为本地高效运行而设计。它可以让检索增强生成(RAG)、语义搜索、文本分类等应用在无需服务器或联网的情况下顺利实现。该模型采用了 Matryoshka 表征学习,支持将嵌入向量裁剪为更小的维度,并结合了 量化感知训练,在保持精度的同时提升效率。据 Google 称,在 EdgeTPU
System Initiative 近日发布了其 AI原生基础设施自动化 平台,旨在为 DevOps 团队提供一种用自然语言管理基础设施的新方式。用户只需输入简单的指令,如“让负载均衡器的健康检查更严格”,平台的 AI 智能体就会自动找到相关的基础设施,模拟变更方案,并在用户确认后执行更新。System Initiative 表示,这一过程能够在保持自动化和生产环境安全的前提下完成。该平台由专门训
超时未支付订单,库存回滚:RabbitMQ延时队列利用延时队列实现支付订单的监听,根据订单支付状况进行订单数据库回滚1 秒杀流程用户下单,经秒杀系统实现抢单,下单后会向MQ发个30min延时消息,包含抢单信息启用延时消息监听,一旦监听到订单抢单信息,判断Redis缓存中是否存在订单信息,如存在,则回滚启动支付回调信息监听,若:支付完成,则将订单持久化到MySQL没完成,清理排队信息回滚库存每次秒杀
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!? 魔都架构师 | 全网30W技术追随者? 大厂分布式系统/数据中台实战专家? 主导交易系统百万级流量调优 & 车联网平台架构? AIGC应用开发先行者 | 区块链落地实践者? 以技术驱动创新,我们的征途是改变世界!? 实战干货:编程严选网0 前言超强AI,助力你的编码方式。每按下一个键,即可获得极速、全面的代码库上下文。
DeepSeek 正式推出了其大语言模型 V3.1 版本,引入了一种[混合架构](https://www.lyzr.ai/glossaries/hybrid-flow-ai-architecture/#:~:text=A Hybrid flow AI Architecture represents a sophisticated and strategic,into a unified%2C or
1 啥是RedLock?在Redis客户端实现的分布式锁算法,比单节点的方法更安全。2 特性2.1 安全互斥访问,即永远只有一个 client 能拿到锁2.2 避免死锁最终 client 都可能拿到锁,不会出现死锁的情况,即使原本锁住某资源的 client crash 了或者出现了网络分区2.3 容错性只要大部分 Redis 节点存活就可以正常提供服务3 单节点实现分布式锁3.1 加锁SET re
0 前言近来,生成式 AI 因能输出从洞察、战略到代码等各种成果而频频登上头条。但当企业逐渐将关注点从“输出”转向“结果”时,一种更具变革性的技术正悄然兴起:主动式 AI(Agentic AI)。主动式 AI 不仅仅是处理信息,而是能够付诸行动。这种自主系统被设计用来追求目标、做出决策、在真实环境中感知并行动,并能在极少监督下实时适应。它不需要等待提示,而是能够独立运作,跨越复杂工作流程,不仅能产
AWS 最近推出了 Cloud Control API (CCAPI) MCP Server,这是一款全新工具,旨在简化基础设施管理,让开发者和 AI 驱动的智能体能够通过自然语言来管理资源。该服务隶属于 awslabs/mcp 项目,充当对话式命令与 AWS 基础设施部署和管理之间的桥梁。这款服务器基于 AWS Cloud Control API,该 API 是一个标准化接口,支持超过 1,20
Anthropic has upgraded Claude Sonnet 4 to support a context length of up to 1 million tokens, a fivefold increase over its previous limit. The feature, now in public beta, is accessible thro
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!? 魔都架构师 | 全网30W技术追随者? 大厂分布式系统/数据中台实战专家? 主导交易系统百万级流量调优 & 车联网平台架构? AIGC应用开发先行者 | 区块链落地实践者? 以技术驱动创新,我们的征途是改变世界!? 实战干货:编程严选网0 前言Kiro,一个专为 vibe coding 应用带来结构的 IDE,默认内置
Anthropic 最近正式发布了 Claude Code Subagents,让开发者可以创建独立的、针对特定任务的 AI 子代理。这些子代理有自己独立的上下文、工具和提示词。Subagents 的设计目标是模块化开发。它们既可以被自动编排,也可以手动调用,这样团队就能把调试、文档编写、测试生成等工作分配给不同子代理,而不会让单一的上下文窗口负担过重。每个子代理都在独立环境中运行,不会
As part of Google AI Ultra subscription, Gemini 2.5 Deep Think is a model designed for creative problem-solving through the use of parallel thinking techniques and extended inference time.Ac
Recent research by Anthropic engineers explores identifiable patterns of activity that seems to give rise to an emerging personality. These traits, known as persona vecto
In a recent Reddit post, Unsloth published comprehensive tutorials of all of the open models they support. The tutorials can be used to compare the models’ strengths and weaknesses, as well
Key TakeawaysAs a Java developer, there’s no need to learn another language to get started writing AI-infused applications.Java developers can use the open-source project, LangChain4j, to manage inter
Google 宣布将其异步、基于智能代理的编码助手 Jules 正式推出,不再处于测试阶段,定位为帮助开发者处理日常编程任务的工具。Jules 基于 Gemini 2.5 Pro 模型,可执行多种编码相关工作,包括编写测试、开发新功能、修复漏洞、生成音频变更日志,以及更新依赖项等。与传统的实时编码助手不同,Jules 采用异步方式运行。它能直接连接开发者的现有代码仓库,将代码库克隆到 Google
能构建完整软件的 AI。你可能正开着好几个标签页:一个用 ChatGPT 写 PRD(产品需求文档)一个 AI 研究工具一个 AI 编码工具执行任务可能还有一个工具做代码审查和测试……本该是流畅的开发流程,却变成了在管理一群互不相识的 AI 助手,还得不断重复同样的信息。AI agent很强,各自解决问题没问题,但整体依旧割裂,离真正的成品发布还有距离。于是我们换了思路:如何打造一个真正推动软件开
OpenAI 正式发布了两款开源权重语言模型——gpt-oss-120b 和 gpt-oss-20b,专为高性能推理、工具调用和高效部署而设计。这是该公司自 GPT-2 以来首次开放完整模型权重,且采用宽松的 Apache 2.0 许可证。gpt-oss-120b 采用专家混合(Mixture-of-Experts)架构,每个 token 激活 51 亿个参数,在核心推理测试中表现可与专有模型 o
本周(2025 年 8 月 4 日)的 Java 新闻重点包括:JDK 25 和 Grails 7.0 首个候选版本发布;WildFly 37 发布;Payara 平台 8 月版本更新;LangChain4j、JBang、Hibernate 多个项目的小版本更新;以及 Spring AI、JobRunr、Apache Tomcat 的维护版本发布。JDK 25JDK 25 提前体验版的 Build
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!? 魔都架构师 | 全网30W技术追随者? 大厂分布式系统/数据中台实战专家? 主导交易系统百万级流量调优 & 车联网平台架构? AIGC应用开发先行者 | 区块链落地实践者? 以技术驱动创新,我们的征途是改变世界!? 实战干货:编程严选网OpenAI最先进的编码与智能体任务模型0 简介北京时间2025年8月8日凌晨一点,
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!? 魔都架构师 | 全网30W技术追随者? 大厂分布式系统/数据中台实战专家? 主导交易系统百万级流量调优 & 车联网平台架构? AIGC应用开发先行者 | 区块链落地实践者? 以技术驱动创新,我们的征途是改变世界!? 实战干货:编程严选网更强的 Agent 可控性当 Cursor 正在运行时发送消息,现可更有效地引导 A
“最新变化”页面的新形式对前沿技术的支持,如:Java 25Maven 4JSpecify为 Spring 开发者带来的重大体验提升:Spring 调试器Spring Modulith改进的 AI 辅助工作流:免费的新功能和更高的准确度以及 AI AssistantJunie:增强的性能和 MCP 客户端支持IntelliJ IDEA 现在可以充当第三方 AI 智能体的 MCP 服务器对数据库工作
OpenAI 推出了 ChatGPT 的学习模式(Study Mode),这是一项旨在通过循序渐进的方式引导用户解决问题的功能,而不是直接给出答案。它通过互动式提示、结构化回答以及后续提问,鼓励用户主动参与、加深理解。OpenAI 表示,这项功能是为了解决 AI 辅助学习中一个普遍存在的问题:虽然 ChatGPT 常被用于完成作业、备考或探索新知识,但直接提供答案可能会限制用户的学习效果。学习模式
在 7 月初举办的 Google Cloud Summit London 上,Google 公布了 Firebase Studio 的一系列重大更新,旨在提升基于云端的 Agentic AI(自主智能体)开发能力。此次更新包括:全新的自主 Agent 模式、对 Model Context Protocol(MCP)的原生支持,以及 Gemini CLI 的集成。这些功能将让 AI 智能体更独立、更
0 前言计算机系统的时间深刻影响分布式系统设计。先从单机系统的时间问题出发。举个例子来说,在构建分布式系统的时候,如果我们能在每个单机系统中,都获得精确的时间点或时间范围,就能大大简化分布式事务等相关设计。分布式系统存在多时钟的问题,理解这个问题之前,也需要先了解单机系统的时间问题。 计算机系统内部,主要有两种时钟:墙上时钟和单调时钟。1 墙上时钟又叫钟表时间,和我们平时使用的钟表的时间一样,表示
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号