国外的大模型主要就下面几个:
公司 | 大模型 | 备注 |
OpenAi | ChatGPT | |
Anthropic | Claude | |
Google | Gemini / Gemma | |
Meta | Llama | |
Mistral | Mistral | 法国公司 |
Microsoft | Phi |
他们之间有很多联系,在发布版本时,有时会看到有些针对性发布。
Anthropic
Anthropic 是 OpenAI 的劲敌,其核心团队同样是 OpenAI 的创业原班人马。团队因为与OpenAI 理念不合而分家,于2021年成立了新公司 Anthropic。
https://www.aixinzhijie.com/article/6809440
Anthropic 的联合创始人Dario Amodei曾是OpenAI的研究副总裁。因为对OpenAI变成CloseAI感到不满,于是自立门户创建了Anthropic公司。该公司在拿了微软的投资之后,又拿到了谷歌的投资。可以说,Claude与ChatGPT技术同源,但理念不同。
Meta
2023年2月发表的Llama原始研究论文的14位作者中,包括FAIR巴黎团队负责人Antoine Bordes在内的超过一半(7人)AI科学家离开了Meta,其中几位跳槽或创办了 AI 初创公司,或是到大公司,原因与内部算力资源斗争有关。
Mistral
Mistral AI,2023年5月由Meta和Google DeepMind前员工创立。
https://www.sohu.com/a/720060728_116132
Mistral AI的三位联合创始人中,首席执行官Arthur Mensch(中)曾任Google DeepMind的研究员,参与了包括Flamingo、Chinchilla、Gopher在内的多个DeepMind经典模型,也是Flamingo和Chinchilla的核心贡献者,对多模态、RAG、算法优化等技术有深刻理解。
首席技术官Timothée Lacroix(右)和首席科学家Guillaume Lample(左)此前都是Meta巴黎人工智能实验室的核心研究人员,两人对模型推理、预训练和模型嵌入有深入研究,是Llama和Llama2的核心技术贡献者,并发表过多篇重要学术论文。