大数据张老师的博客_Android,j2ee,互联网运营,OA,android控件,Activity,java(4)_51CTO博客

鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册

单词新招：教你使用扣子coze制作英语“单词主题卡片”生成工作流

单词新招：教你使用扣子coze制作英语“单词主题卡片”生成工作流

应小伙伴们的要求，今天给大家讲一下如何使用coze扣子制作单词卡片生成工作流。提取大模型生成的所有单词为一个像抠图节点。代码生成html节点。

#coze

#扣子工作流

#英语单词卡片制作

#AI英语

html

原创 2月前 56 阅读

面向AI推理服务的可扩展性设计

面向AI推理服务的可扩展性设计

该图展示了用户请求通过统一的推理入口服务进入系统，推理调度器根据模型类型和资源情况将请求路由至相应的推理服务，推理服务绑定至独立的GPU节点。

人工智能

架构

微服务

数据库

加载

原创 2月前 65 阅读

AI能力集成设计与Prompt策略

本节内容围绕AI能力集成的架构设计和Prompt策略展开，重点阐述了系统中各AI模块的职责划分与交互逻辑，并结合代码示例详解三类常见

人工智能

prompt

AI架构

生成器

代码示例

原创 2月前 56 阅读

AI智能客服系统中，资源调度策略的实现机制

AI智能客服系统中，资源调度策略的实现机制

系统通过资源请求（Requests）与资源限制（Limits）定义每个服务所需的最小与最大资源额度，并配合基于标签的节点选择策

人工智能

贪心算法

算法

AI架构

资源调度

原创 2月前 48 阅读

读写分离与数据库分片策略

读写分离与数据库分片策略

从原理讲解到架构设计，再到实践注意事项，帮助架构师在构建大规模高并发系统时，有效分担数据库压力，提升系统可

数据库

oracle

jvm

读写分离

数据

原创 2月前 53 阅读

CDN与静态资源优化

CDN与静态资源优化

在现代Web系统和AI应用中，随着用户访问量的不断攀升，静态资源（如HTML、CSS、JavaScript、图片、音视频、模型文件

数据库

网络

系统架构

静态资源

缓存

原创 2月前 46 阅读

【案例】微服务架构中的日志监控与日志收集策略

【案例】微服务架构中的日志监控与日志收集策略

日志监控不仅是系统运维的基础，也是微服务故障诊断、性能优化的重要支撑手段。在真实项目中，推荐采

架构

微服务

云原生

日志采集

Elastic

原创 2月前 45 阅读

自动化性能回退机制——蓝绿部署与灰度发布

自动化性能回退机制——蓝绿部署与灰度发布

蓝绿部署是一种通过维护两套几乎完全相同的生产环境（蓝环境和绿环境）来实现安全部署与快速回退的策略。其基本思想是，在新版本部

自动化

运维

系统架构

AI架构

灰度

原创 2月前 38 阅读

【案例】性能优化在持续集成与持续交付中的应用

【案例】性能优化在持续集成与持续交付中的应用

为了避免版本上线引发性能下降，项目组将性能优化工作前移至持续集成阶段，并在交付环节设定性能回退触发机制，实现了自动

性能优化

ci/cd

性能测试

流程图

原创 2月前 45 阅读

数据库索引的代价与副作用

在数据库性能优化中，索引是至关重要的工具。合理使用索引可显著提升查询效率，减少磁盘IO和CPU消耗。但同时也必

数据库

oracle

sql

字段

高并发

原创 2月前 63 阅读

收集性能基准测试与基准数据

收集性能基准测试与基准数据

通过科学设计测试场景、规范采集指标数据并建立统一的基准数据库，系统架构师可以在各个阶段量化性能表现，支撑自动化

#人工智能

#架构

#微服务

#负载均衡

#运维

原创 2月前 67 阅读

性能回退的策略与方案——从优化到恢复

性能回退的策略与方案——从优化到恢复

性能回退是指当某项性能优化措施实施后导致系统不稳定、响应变慢或用户体验下降时，通过一套预定义机制，快速恢复

java

开发语言

数据库

架构师

AI架构

原创 2月前 67 阅读

什么是持续优化，什么是性能回退

在实际的软件系统运行过程中，性能优化不仅仅是一次性的任务，而应是一项贯穿系统整个生命周期的持续性工作。同时

数据库

缓存

人工智能

架构

调优

原创 2月前 65 阅读

多区域协同的异地多活AI推理服务架构

多区域协同的异地多活AI推理服务架构

如果当前区域无部署目标模型，系统从**模型中心（集中仓库）**通过CDN分发模型权重至GPU节点，加快冷启动速度，避免长时间加载。如果主区域（如广州）出现负载过高或服务异常，DNS将自动切换请求至次优区域（如北京或上海），实现。，负责请求接收、预处理、身份验证、限流等操作。写入统一的日志分析平台，支持AIOps监

人工智能

架构

java

微服务

负载均衡

原创 2月前 139 阅读

微服务架构——配置管理与配置中心

微服务架构——配置管理与配置中心

在AI系统架构中，配置中心不仅是保障模型服务稳定运行的基础设施，更是实现模型动态切换、Prompt调优、实验参数控制等AI核心能力的中枢。建议开发者在系统设计初期就纳入配置中心的规划，并将所有与模型强相关的参数统一外置，为后续的演进提供灵活性与可控性。

架构

微服务

云原生

AI架构师

特征工程

原创 2月前 38 阅读

如何确定微服务的粒度与边界

如何确定微服务的粒度与边界

服务粒度不是静态的，它应根据业务复杂度、团队协作能力、系统性能压力等因素动态调整。项目初期，可以适当

微服务

人工智能

架构

特征工程

缓存

原创 2月前 33 阅读

对比Redis与向量数据库（如Milvus）在AI中的应用

此时，通过大模型（如BGE/BERT）提取语义向量，使用Milvus进行TopK向量相似度检索，可以找出系统中最“相近”的历史问题或文档条目，

数据库

redis

milvus

Redis

缓存

原创 2月前 72 阅读

缓存一致性与AI内容生成的幂等控制

设计建议理由缓存内容应结构化存储方便记录依赖字段、模型版本等元信息生成逻辑应严格分离输入/模板/参数保证输入稳定、控制变量所有生成应日志记录支持问题回溯、结果分析合理设置缓存时间对于“近似幂等”场景可短期复用，节省推理资源引入内容相似度检查防止不同表达导致生成冗余结果或回答冲突。

人工智能

缓存

AI架构

幂等

数据

原创 2月前 67 阅读

消息队列在异步推理任务中的作用

因此，许多系统选择通过**引入消息队列（Message Queue, MQ）**机制，实现“请求异步入队 + 后端推理消费 + 最终结果回调”的非阻塞处理流

AI架构

消息队列

解耦

应用场景

原创 2月前 139 阅读

异步处理与事件驱动中的模型调用链设计

优势类型说明异步解耦每个模块之间仅通过事件通信，修改互不影响弹性伸缩可对热点模块水平扩容，如推理节点错

python

AI架构

事件驱动

事件总线

链路

原创 2月前 49 阅读

异常处理与AI推理失败回退机制

异常处理与AI推理失败回退机制

本节重点讲解了AI推理任务中常见的异常类型及其影响，并介绍了从主模型到缓存兜底、模板返回再到统一提示的回退策略流程。本

AI架构师

缓存

异常类型

异常处理

原创 2月前 263 阅读

日志记录与AI链路追踪能力设计

随着AI系统的复杂度日益提升，单一模块的性能指标已无法全面衡量系统运行状态。开发者越来越需要一套，用于快速定位问题、监控模型异常追溯能力。。

人工智能

链路

字段

缓存

原创 2月前 303 阅读

AI客服系统项目总结与能力提升路径

在本章中，我们从实际需求出发，完整构建了一个具备AI能力的智能客服系统架构，涵盖系统设计、数据库建模、缓存优化、AI集成

人工智能

缓存

设计阶段

接口设计

原创 3月前 270 阅读

智能客服系统数据库设计

本节通过系统化的表结构设计，构建了智能客服系统的数据库基础，为后续的业务实现、AI能力集成和系统优化提供了坚实的数据支撑

数据库

oracle

AI架构

数据

数据库设计

原创 3月前 240 阅读

服务发现与动态负载均衡的结合

*服务发现（Service Discovery）**指系统中的各个组件能够自动识别并定位彼此的过程，通常由服务注册中心（如 Nacos、Consul、Eureka 等）实现。服务注册中心维护所有服务实例的信息，如 IP 地址、端口、运行状态等，任何客户端或网关都可以实时从注册中心拉取健康的服务列表。动态感知服务节点变化，避免硬编码地址，提高系统的灵活性和可维护

服务发现

负载均衡

运维

均衡器

原创 3月前 153 阅读

资源调度与分配策略

当一台GPU服务器同时运行多个模型服务实例，如果没有合理的资源调度机制，某些实例可能占用大量显存导致其他实例OOM

kubernetes

容器

云原生

资源调度

优先级

原创 3月前 160 阅读

实现自动化资源调度与弹性伸缩

明确关键业务指标（如 CPU、内存、GPU、请求队列长度、负载、响应延迟）。在微服务内部设置 QPS、任务队列长度等自定义指标，

#自动化

#运维

资源调度

Pod

运维

原创 3月前 149 阅读

常见的负载均衡算法

在 Redis Cluster 的 Proxy 层中，使用最少连接数策略实现写请求的均衡调度，有效降低单节点压力。：某AI模型推理服务集群中，GPU

负载均衡

算法

运维

权重

连接数

原创 3月前 113 阅读

什么是水平扩展

在现代系统架构设计中，可扩展性（Scalability）是衡量系统面对业务增长时应对能力的重要指标。而“水平扩展”（Horizontal Scal

架构

微服务

数据库

缓存

服务器

原创 3月前 154 阅读

缓存策略设计的目标与必要性

本节从架构设计视角，系统地讲解了智能客服系统中缓存与加速策略的分层结构与功能划分。通过结合浏览器缓存、CDN缓存与Redis缓存，可以在保障响

缓存

Redis

数据

原创 3月前 57 阅读

欢迎

首页
1
2
3
4
5
6
7
共183条记录