AI大模型学习

原创

qq5b7f4f8742fb5 2024-04-14 09:32:39 ©著作权

©著作权归作者所有：来自51CTO博客作者qq5b7f4f8742fb5的原创作品，请联系作者获取转载授权，否则将追究法律责任

AI大模型学习
理论基础
数据清洗、增强、精确索引
训练微调、推理加速
医学大模型方向
大模型安全

AI大模型学习_数据清洗

笔记收录，持续更新。

未来会更新，偏项目部分，现在偏原理。

【史上最本质】序列模型：RNN、双向 RNN、LSTM、GRU、Seq-to-Seq、束搜索、Transformer、Bert

从 GPT1 - GPT4 拆解

AI 芯片：商业项目 GPU 怎么选？

AutoDL 云/内网部署百川2、GLM2

【大模型数据增强】零一万物 Yi 数据处理思路

【大模型数据增强】Evol-Instruct 应用：扩充大模型数据多样性

GPT4 + 知识图谱，生成多样性 + 精准医学语料

MinHash-LSH 哈希模糊去重：如何解决医学大模型的大规模数据去重？

好用的GPTs：指定主题搜索、爬虫、数据清洗、数据分析自动化

【大模型向量库】从向量搜索到向量数据库

llama_index 从 0 到 1：别再用传统方法处理数据了！LlamaIndex如何革新你的信息检索？

DB-GPT：大模型 + 数据库，全流程自动化

大模型关键技术：上下文学习、思维链、RLHF、参数微调、并行训练、旋转位置编码、模型加速、大模型注意力机制优化、永久记忆、LangChain、知识图谱、多模态

vLLM：给大模型提提速，支持高并发吞吐量提高24倍，同时推理速度最少提高 8 倍

【附带大模型训练数据】大模型系统优化：怎么计算模型所需的算力、内存带宽、内存容量和通信数据量？

【所有方法一览】大模型推理优化：在更小的设备运行、推理增速

【文生视频】Diffusion Transformer：OpenAI Sora 原理、Stable Diffusion 3 同源技术

医学大模型的局限性 + 改进思路

统一大语言模型和知识图谱：如何解决医学大模型-问诊不充分、检查不准确、诊断不完整、治疗方案不全面？

Dialogue Transformers：如何解决医学大模型【偏离主诉和没抓住核心】，建立抗干扰的能力，使得发现用户问题会一追到底？

【最新汇总】市面上的医学大模型和他们的问题：不是各位卷死在下，就是在下卷死各位

读的医学大模型论文，我都记录在这

【大模型安全】怎么防御提示词注入攻击 — OWASP 十大威胁之首

如何解决大模型的「幻觉」问题？

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯