51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课 免费课 排行榜 短视频 直播课 软考学堂
全部课程 软考 信创认证 华为认证 厂商认证 IT技术 PMP项目管理 免费题库
在线学习
文章 资源 问答 课堂 专栏 直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
51CTO博客

51CTO博客

  • 首页
  • 关注
  • 排行榜
  • 精品课程升职加薪
  • 免费资料领资料
  • 软考题库软考题库
    软考题库
    科目全、试题精、讲解专业,扫码免费刷
  • 搜索历史 清空
    热门搜索
    查看【 】的结果
  • 写文章
  • 创作中心
  • 登录注册

人工智能微客

  • 动态
  • 博客
  • 分类
  • 订阅/关注
  • 意见
    反馈
  • 训练营训练营
aiweker

aiweker

AI 10年从业者,RAG慕课网讲师
  • 7.5万 人气
  • 144 原创
  • 2 粉丝
  • 4万 阅读数
关注
于 2024-01-11 加入 51CTO1.8年

热门文章

  • Flask 蓝图(Blueprints)完全指南:模块化开发的艺术
  • 八句话让大语言模型回答得更好:零基础也能上手的“魔法咒语” | AI小知识
  • 认识 Mermaid:让文档自己画图的「文本即图形」引擎
  • MinIO 总览:为什么今天必须了解它
  • 让大模型更懂你 | AI小知识

近期文章

  • 【性能测试利器】使用Locust:一个面向开发者的分布式负载测试框架
  • AI产品设计需要考虑什么?
  • Kubernetes 全面指南:核心功能解析与实战应用
  • DeepSeek 3.1 全面解析:混合推理时代的开源“六边形战士”
  • 大模型Agent工具调用:深入理解Function Calling实践指南
2025年
09月 1篇 08月 21篇 07月 15篇 06月 1篇 05月 15篇 03月 22篇 02月 15篇 01月 15篇
2024年 39篇
精品课程领资料
免费资料>
2025软考
系统架构设计师 系统规划与管理师 软件设计师 系统集成项目管理工程师
信创认证
系统架构师 信创集成项目管理师 信创规划管理师 系统开发工程师
厂商认证
CKA/CKS架构师 红帽认证工程师 Oracle-OCP认证 Oracle-OCM认证
IT技术
数据库高级工程师 AIGC大模型实战 Linux云计算架构师 Python全栈开发
华为认证
数通HCIP认证 云计算HCIE认证 华为存储HCIE认证 HCIP安全认证

七日热门

全部文章
Prometheus+Grafana实现Springboot服务监控
prometheus
grafana
spring boot
微服务
IP
停止滥用箭头函数:这5个场景请务必使用 function
构造函数
作用域
ES6
JavaScript中undefined的特点
赋值
作用域
数据类型
每周读书与学习->JMeter主要元件详细介绍(二)函数助手
JMeter
性能测试
性能分析
性能调优
性能监控
Java 8 ~ 24 新特性
List
函数式接口
System

Ta的分类

加载更多

近期来访

  • wx68831e8d1862d
  • 我只想躺平
  • 信安百科
  • 赵jiani
  • mb60b9a20e864f9
  • 51CTO博客
# transformer
  • 全部
    全部 原创 转载 翻译
  • 推荐/精选

大语言模型中常用的tokenizer算法

我们说了三个tokenize不同粒度:word/subword/char,现在最常用的是subword字词的模式,今天就和大家分享下字词的三个经典的算法:WordPiece、BPE/BBPE和unigram。

字符编码
语言模型
初始化
原创 精选 2024-07-11 21:47:28 934 阅读

欢迎

51CTO博客

Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号

关于我们
官方博客 全部文章 热门标签 班级博客
了解我们 网站地图 意见反馈
友情链接
鸿蒙开发者社区 51CTO学堂
51CTO 软考资讯