国外的大模型主要就下面几个:

公司

大模型

备注

OpenAi

ChatGPT

Anthropic

Claude

Google

Gemini / Gemma

Meta

Llama

Mistral

Mistral

法国公司

Microsoft

Phi

他们之间有很多联系,在发布版本时,有时会看到有些针对性发布。

Anthropic

Anthropic 是 OpenAI 的劲敌,其核心团队同样是 OpenAI 的创业原班人马。团队因为与OpenAI 理念不合而分家,于2021年成立了新公司 Anthropic。

https://www.aixinzhijie.com/article/6809440

Anthropic 的联合创始人Dario Amodei曾是OpenAI的研究副总裁。因为对OpenAI变成CloseAI感到不满,于是自立门户创建了Anthropic公司。该公司在拿了微软的投资之后,又拿到了谷歌的投资。可以说,Claude与ChatGPT技术同源,但理念不同。

Meta

2023年2月发表的Llama原始研究论文的14位作者中,包括FAIR巴黎团队负责人Antoine Bordes在内的超过一半(7人)AI科学家离开了Meta,其中几位跳槽或创办了 AI 初创公司,或是到大公司,原因与内部算力资源斗争有关。

Mistral

Mistral AI,2023年5月由Meta和Google DeepMind前员工创立。

https://mistral.ai/

https://www.sohu.com/a/720060728_116132

Mistral AI的三位联合创始人中,首席执行官Arthur Mensch(中)曾任Google DeepMind的研究员,参与了包括Flamingo、Chinchilla、Gopher在内的多个DeepMind经典模型,也是Flamingo和Chinchilla的核心贡献者,对多模态、RAG、算法优化等技术有深刻理解。

首席技术官Timothée Lacroix(右)和首席科学家Guillaume Lample(左)此前都是Meta巴黎人工智能实验室的核心研究人员,两人对模型推理、预训练和模型嵌入有深入研究,是Llama和Llama2的核心技术贡献者,并发表过多篇重要学术论文。