文章推荐


AI日报|斯坦福团队被曝抄袭国内大模型已删库跑路!英伟达打破摩尔定律,机器人时代到来

深度解析RAG技术在大模型时代的原理与实践

AI内容相关视频

我们即将制作AI内容相关视频,因此想提前通过五个问题,调研各位小伙伴对内容有哪些期待~感谢您的宝贵意见,期待制作精彩有趣的AI内容视频呈现给大家

⭐️问卷调查地址https://w.wjx.com/vm/OtQXUxV.aspx#

今日热点

昆仑万维开源2千亿稀疏大模型天工MoE,全球首创能用4090推理

6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE。

Skywork-MoE基于其之前开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型,

目前各大主流模型评测榜单的结果显示。在相同的激活参数量 20B(推理计算量)下,Skywork-MoE能力在行业前列,接近70B的Dense模型,使得模型的推理成本有近3倍的下降。

同时Skywork-MoE的总参数大小比DeepSeekV2的总参数大小要小1/3,用更小的参数规模做到了相近的能力。

AI日报|国产大模型迎来新卷王,天工MoE全球首用4090推理,马斯克计划豪掷90亿购买GPU_github

Skywork-MoE也是首个支持用单台4090服务器推理的开源千亿MoE大模型。8x4090服务器一共有192GB的GPU显存,在FP8量化下(weight占用146GB),使用非均匀Tensor Parallel并行推理方式,Skywork-MoE可以在合适的batch size内达到 2200 tokens/s 的吞吐。

  • 模型权重下载:

https://huggingface.co/Skywork/Skywork-MoE-base

https://huggingface.co/Skywork/Skywork-MoE-Base-FP8

澜舟科技正式开源轻量化大模型孟子3-8B,助力AI爱好者

在今年3月底成功开源Mengzi3-13B大模型后,澜舟科技再次推出全新轻量化大模型Mengzi3-8B,并已正式开源,支持免费商用。

Mengzi3-8B在写作、代码生成、摘要和阅读理解等多个场景中表现优异,模型参数规模更为精简,更适合个人开发者和AI爱好者使用。

Mengzi3-8B适用于多种自然语言处理任务,包括高质量文本生成、智能对话系统,以及提升开发者编码效率的代码生成。

Mengzi3-8B的核心优势具有以下两点:

  • \*\具有低显存、高推理速度的优势。\\*半精度下显存占用小于16G,适用于PC和大部分消费级显卡如RTX 4090、RTX 4080、RTX 4070Ti,特别适合个人开发者和AI爱好者;
  • \*\知识处理效果卓越。\\*中文能力、英语、世界知识(MMLU)、编程及数学等领域的知识处理和问题解决能力,均显著超越同尺寸开源模型。

AI日报|国产大模型迎来新卷王,天工MoE全球首用4090推理,马斯克计划豪掷90亿购买GPU_服务器_02

用户可通过Huggingface和Modecope平台获取模型和相关信息。

Huggingface:

https://huggingface.co/Langboat/Mengzi3-8B-Base

Modescope:

https://www.modelscope.cn/models/langboat/Mengzi3-8B-Base/summary

微软斥资32亿美元在瑞典扩展AI和云业务

微软计划投资32亿美元,扩展其在瑞典的人工智能(AI)和云业务。

微软此次投资的一个重要目标是在瑞典的数据中心部署20,000个最先进的图形处理单元(GPU),这些GPU能够加速计算。微软计划使用英伟达更快的处理器,并可能采用AMD和自己的芯片。

AI日报|国产大模型迎来新卷王,天工MoE全球首用4090推理,马斯克计划豪掷90亿购买GPU_服务器_03

不久前,微软和亚马逊承诺向法国的云和AI基础设施及就业领域共同投资52亿欧元(约合57亿美元)。这个大手笔的投资行为,也是在欧洲首个AI法规出台之后进行的。

https://www.pymnts.com/artificial-intelligence-2/2024/microsoft-will-spend-3-2-billion-on-swedish-ai-infrastructure/

埃隆·马斯克称明年将斥资90亿美元,为xAI购买30万台NVIDIA B200芯片

AI日报|国产大模型迎来新卷王,天工MoE全球首用4090推理,马斯克计划豪掷90亿购买GPU_服务器_04

当xAI在新一轮融资后估值达到180亿美元时,马斯克准备将至少50%的净资产用于购买NVIDIA的GPU。

虽然聊天机器人Grok目前是xAI的唯一产品,但这家初创公司打算通过加大对GPU集群的投资来大幅扩展其与AI相关的产品组合。

近期,Elon Musk在回应一项在线调查时透露,xAI的"下一大步"可能是到明年夏天,并使用CX8网络进行配套。该公司计划购买约30万台NVIDIA最新的B200 GPU,并使用CX8网络进行配套。

根据NVIDIA CEO Jensen Huang的预测,每台B200 GPU售价预计在3万到4万美元之间,这意味着xAI将在未来投入约90亿美元购置GPU。

https://wccftech.com/elon-musk-pledges-to-spend-around-9-billion-to-acquire-300000-units-of-nvidia-b200-chips-for-xai-by-next-summer/

报道称奥特曼已投资400多家公司,持股价值至少28亿美元

据《华尔街日报》报道,Sam Altman及其创投基金已投资超过400家公司,成为硅谷最活跃的个人投资者之一。截至今年初,他的投资组合总价值至少为28亿美元。

AI日报|国产大模型迎来新卷王,天工MoE全球首用4090推理,马斯克计划豪掷90亿购买GPU_开发者_05

Altman投资了Reddit、Stripe等公司,还利用长期合作的个人银行JPMorgan的信贷额度,向众多私营初创企业投资了数亿美元。Altman的多项投资与OpenAI有业务往来,引发了公众对其潜在利益冲突的质疑。

例如,Reddit宣布与OpenAI合作后,股票上涨超过10%,使Altman的个人持股收益增加了6900万美元。对此,OpenAI在一篇博客文章中表示,该合作由公司首席运营官领导,并经独立董事会批准。

尽管外界对其投资决策存在疑虑,但OpenAI董事会主席Bret Taylor强调,Altman始终遵循政策,透明公开地处理其投资事务。

https://uk.finance.yahoo.com/news/sam-altman-reportedly-invested-more-110450424.html?

"可信 AI 进展 " 公众号致力于最新可信人工智能技术的传播和开源技术的培育,覆盖大规模图学习,因果推理,知识图谱,大模型等技术领域,欢迎扫码关注,解锁更多 AI 资讯~

AI日报|国产大模型迎来新卷王,天工MoE全球首用4090推理,马斯克计划豪掷90亿购买GPU_github_06