鲁班模锤的博客_最新科技_51CTO博客

鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册

Mamba：1 从RNN而聊起

Mamba：1 从RNN而聊起

Mamba自从出道就一直被拿来和Transformer对比，文章巨多，带着标题的爆炸性字样”颠覆“，”全面包围“等等。有些文章偏向技术，有些文章偏向宣媒，小编认为还是需要比较客观独立的来分析它，尤其是其背后设计的思路以及演化的过程更加重要。因此这个小专题将从历史说起，沿着SSM、S4、HIPPO一路走来，期间还会抛弃冗杂的文辞，以更加接地气的方式打开模型设计的思维逻辑。

mamba

ssm

rnn

大模型

s4

原创 2024-05-11 21:37:35 205 阅读

下一个AI前沿与革命：KAN 上

下一个AI前沿与革命：KAN 上

记得在《重新审视神经网络》这篇文章中提及，任何人都可以构建自己心目中的神经网络。就当小编还在准备Mamba时，说时迟，那时快。在不断发展的AI领域，五一劳动节期间一种新的架构正在掀起波澜，来自麻省理工学院的创新框架被称为柯尔莫哥洛夫-阿诺德网络（KAN），准备以其独特的方法改变传统模型。

激活函数

权重

多项式

原创 2024-05-11 21:28:32 256 阅读

xLSTM：拳打Transformer，脚踢Mamba？！

xLSTM：拳打Transformer，脚踢Mamba？！

记得在《重新审视神经网络》这篇文章中提及，任何人都可以构建自己心目中的神经网络。在Transformers、Mamba、KAN之后，长短期记忆 (LSTM) 架构的发明者Sepp Hochreiter和他在NXAI的团队推出了一种称为扩展LSTM (xLSTM) 的新变体。本文为通识版本，后续将会推出细究版本，敬请期待！

标量

建模

激活函数

原创 2024-05-11 21:21:58 338 阅读

欢迎