背景介绍
作为一个资深开源参与者,我盘点下2023年有意思的开源项目,从GitHub热榜角度盘点下。
作为工程师我对技术理解顺势而为,当风口袭来拥抱研究使用,理解其中精髓为风口添砖加瓦。
2023年很特殊,AI生成开始火热起来,大部分上热榜的都跟AI相关。
AI生成(LLMs和GenAI)
2023年对于LLMs和GenAI来说是重要的一年,OpenAI的ChatGPT和GPT-4.0引领了这一趋势。
这些模型在规模和能力上树立了新标准,为LLMs的广泛应用奠定了基础。
OpenAI发布的GPTs和用户自定义ChatGPT的能力进一步展示了它们在该领域的领先地位。
模型名称 | 机构 | 地址 | 描述 | 许可 |
GPT-4 | openAI | GPT-4是OpenAI在2023年1月发布的最新语言模型 | 闭源 | |
文心一言 | 百度 | 作为你的智能伙伴,我既能写文案、想点子,又能陪你聊天、答疑解惑。 | 闭源 | |
通义千问/qwen-7b | 阿里巴巴 | 通义千问是由阿里巴巴集团旗下的云端运算服务的科技公司阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。 | 开源 | |
AndesGPT | OPPO | https://wccftech.com/oppo-unveils-andesgpt-debuting-first-on-the-find-x7-series-next-year/ | OPPO声称将带来很多AI能力。它还将能够利用诸如交换注意力之类的功能,并且它实际上将解决诸如第一个单词推理之类的问题,这通常是在这些模型中引起的。 | 闭源 |
智谱清言/chatglm | 清华 & 智谱 | 开源双语对话语言模型 | 开源 | |
Moonshot (KimiChat) | 月之暗面 | 语言模型,文字和API调用 | 闭源 | |
序列猴子 | 出门问问 | 语言驱动的深度学习大模型能够快速、准确地处理语言表达,支持多种交互方式,可以快速生成悦耳的语音、高质量的文本,以及与人机进行互动,以满足各种语音、文本和对话需求。 | 闭源 | |
Yi-34B-Chat | 零一万物 | Yi 系列模型以双语语言模型为目标,在 3T 多语言语料库上进行训练,成为全球最强的 LLM 模型之一,在语言理解、常识推理、阅读理解等方面表现出良好的前景 | 开源 | |
PCI-TransGPT | 佳都科技 | 自主研发的中英文双语翻译预训练语言模型 | 开源 | |
360GPT_Pro | 360 | 360 版 GPT 已经具备了一定的推理能力,但在回答具体问题时多次“翻车”,不少问题需要多次回答才能给出准确答复。 | 闭源 | |
Claude2 | Anthropic | 语言模型,擅长写作,市面上最长的上下文,支持高达100k令牌 | 闭源 | |
云雀大模型(豆包) | 字节跳动 | 云雀是一款由字节跳动研发的语言模型,通过便捷的自然语言交互,能够高效的完成互动对话、信息获取、协助创作等任务 | 闭源 | |
Gemini-pro | Google | Gemini,这是我们最大、功能最强大的人工智能模型,也是我们让人工智能为每个人提供更多帮助的旅程的下一步。它有三种尺寸:Ultra、Pro 和 Nano。我们已经开始在我们的产品中推出 Gemini:从Pixel 8 Pro开始, Gemini Nano 出现在Android中,而专门调整的 Gemini Pro 版本则出现在Bard中。 | 闭源 | |
baichuan-13b-chat | 百川智能 | Baichuan-13B 是由百川智能继 Baichuan-7B 之后开发的包含 130 亿参数的开源可商用的大规模语言模型,在权威的中文和英文 benchmark 上均取得同尺寸最好的效果。 | 开源 | |
xverse-13b-2-chat | 元象科技 | 相较于原始版本,新版本的模型训练更加充分(从 1.4T 增加到 3.2T),各方面的能力均得到大幅提升,同时新增工具调用能力 | 开源 | |
讯飞星火v3.0 | 科大讯飞 | 拥有跨领域的知识和语言理解能力,完成问答对话和文学创作等任务。持续从海量文本数据和大规模语法知识中学习进化,实现从提出问题、规划问题到解决问题的全流程闭环 | 闭源 | |
minimax(应事) | 稀宇科技 | https://yingshi-ai.com/?utm_source=ai-bot.cn&ref=cnainav.com | 应事AI是基于MiniMax最新一代中文大语言模型的AI聊天机器人,产品前身是Inspo,现已通过备案并向社会开放。 | 闭源 |
chinese-alpaca-2-13b | yiming cui | 一个包含130亿参数的中文语言模型,基于Meta发布的Llama-2进行扩展和优化 | 开源 | |
llama-2-13b-chat | Meta | Llama 2 是一组经过预训练和微调的生成文本模型,参数规模从 70 亿到 700 亿不等。 | 开源 | |
StableLM | Stability | StableLM 系列语言模型 | 开源 | |
ChatYuan | ClueAI | ChatYuan-large-v2是一个支持中英双语的功能型对话语言大模型。ChatYuan-large-v2使用了和 v1版本相同的技术方案,在微调数据、人类反馈强化学习、思维链等方面进行了优化。 | 开源 | |
colossalai | Colossal-AI | Colossal-AI: 让AI大模型更低成本、方便易用、高效扩展 | 开源 | |
colossalai | Colossal-AI | Colossal-AI: 让AI大模型更低成本、方便易用、高效扩展 | 开源 | |
BLOOM | bigscience | BLOOM 是一种自回归大型语言模型 (LLM),经过训练,可使用工业规模的计算资源根据大量文本数据的提示继续文本。 | 开源 | |
Falcon | tiiuae | Falcon-180B 是由TII构建的 180B 参数因果解码器模型,并在使用精选语料库增强的RefinedWeb的 3,500B 令牌上进行训练。 | 开源 | |
Aquila | BAAI | 我们开源了我们的 Aquila2 系列,现在包括基础语言模型 Aquila2-7B,Aquila2-34B 和 Aquila2-70B-Expr ,对话模型 AquilaChat2-7B,AquilaChat2-34B 和AquilaChat2-70B-Expr ,长文本对话模型AquilaChat2-7B-16k 和 AquilaChat2-34B-16k | 开源 |
AI绘画
AI绘画Midjourney一年时间登顶独角兽,让大家看到这个领域巨大潜力。
模型名称 | 机构 | 地址 | 描述 | 许可 |
Midjourney | Midjourney | Midjourney是一个由位于美国加州旧金山的同名研究实验室开发之人工智能程序,可根据文本生成图像,于2022年7月12日进入公开测试阶段,用户可透过Discord的机器人指令进行操作。 | 闭源 | |
DALL·E 3 | openai | OpenAI 开发的先进 AI 系统,可以通过文本描述生成高质量图像。 | 闭源 | |
DreamStudio | stability | Stable Diffusion的在线图形界面,易于上手使用。提供免费和收费版本。 | 闭源 | |
Disco Diffusion | Somnai_dreams | 这是一款基于文本的AI绘画工具,它能够根据用户提供的文字描述,生成具有艺术感的图片。Disco Diffusion使用了GAN和Diffusion的技术,能够生成高质量的图像,并且支持多种不同的艺术风格和工具。 | 闭源 | |
artflow | NeuralBay Inc | 多种 AI 生成能力,致力于提供数字创意工具的在线平台 | 闭源 | |
Firefly | Adobe | 使用生成式人工智能和简单的文本提示来创建最高质量的输出 - 美丽的图像、文本效果和新鲜的调色板。从参考图像中制作全新内容并更快地探索更多可能性。 | 闭源 | |
Image | google | Imagen,一种文本到图像的扩散模型 | 闭源 | |
Stable Diffusion | stability | AI绘画工具 | 开源 | |
文心一格 | 百度 | AI绘画工具 | 闭源 | |
Tiamat 2 | tiamat | AI绘画工具 。 | 闭源 | |
xunjieshipin | 迅捷 | 一键AI绘画是一款将文字描述通过AI智能一键生成为图像画面的图片软件,根据不同的文字描述可以生成风格迥异的图片内容,并且附带了智能抠图、老照片修复和图片编辑助手等实用功能。 | 闭源 | |
无界版图 | 杭州超节点信息科技 | 无界版图是杭州超节点信息科技有限公司创立的数字版权在线拍卖平台,依托区块链技术在资产确权、拍卖⽅⾯的优势,全面整合全球优质艺术资源,致力于为艺术家、创作者提供数字作品的版权登记、保护、使⽤与拍卖等⼀整套解决⽅案,同时也是新媒体、设计、⼴告、各类垂直⾏业及个⼈⽤户购买诸如摄影、插画、纯艺术、数字艺术的聚集地。 | 闭源 | |
即时 AI | 即时 | AI绘画工具 | 闭源 | |
PAI AI 绘画 | PAI AI | PAI是一个AI绘画生成网站 | 闭源 | |
YUAN 初 | AI中国(aicn.me) | AI绘画生成网站 | 闭源 | |
意间 AI 绘画 | 创意云 | 一个AI绘画小程序 | 意间AI绘画创意云是一个AI绘画小程序,无须下载在线绘画,直接在微信上就可以作画! | 闭源 |
盗梦师 Printidea | 西湖心辰 | 「盗梦师」是西湖心辰(杭州)科技有限公司和西湖大学深度学习实验室共同推出的一款AI绘画平台。 | 闭源 | |
KK 画廊 | kk 图画 | KK 画廊 | 闭源 | |
Draft | Draft | draft.art是一款免费的ai绘画生成器,素材丰富功能便捷,很适合新手使用。同时draft.art还有大量的优秀独立创作者分享作品,是一个人气极高的ai绘画网站。 | 闭源 | |
SolidUI | SolidUI | 数据图表生成模型 | 开源 |
AI视频
AI生成视频工具是一种利用人工智能技术来创建或编辑视频的软件。
一开始Runway 引发的热度,Runway 3个创始人之中有Stable Diffusion论文参与者。
Runway ML
MidJourney + Runway
描述:Runway ML提供了一个易于使用的界面,让用户可以利用最新的机器学习模型来编辑视频。它支持各种功能,如对象识别、风格转换和内容生成。
适用场景:艺术创作、视频编辑、视觉效果等。
Pika
AI Pika生成进击巨人
一个视频创作平台,旨在通过其先进的AI技术简化高质量视频的制作过程。
stable-video-diffusion
https://stability.ai/news/stable-video-diffusion-open-ai-video-model
Stability AI基于其图像生成模型Stable Diffusion开发的第一个开源视频生成模型。
Genmo AI
https://www.ainav.cn/go/?url=aHR0cHM6Ly93d3cuZ2VubW8uYWkv
使用Genmo AI,您的创意副驾驶,制作视频、3D模型、图像、艺术等
Animatediff Web Online
AnimateDiff.org:免费,简单的人工智能文本到视频转换
https://www.animatediff.org/
AI编程
AI生成编程是指使用人工智能技术自动编写或辅助编写代码的过程。这种技术通常依赖于机器学习模型,特别是大型语言模型,来理解编程语言的语法和逻辑,并生成有效的代码片段。
GitHub Copilot
由GitHub和OpenAI共同开发,Copilot是一个代码自动完成工具,可以在多种编程语言中生成代码片段和整个函数。
通义灵码
https://tongyi.aliyun.com/lingma 灵动指间,快码加编,你的智能编码助手
CodeGeeX
https://github.com/THUDM/CodeGeeX
开源项目
这是一个大规模的多语言代码生成预训练模型,包含130亿参数。
它支持多种编程语言的代码生成,包括Python、C++、Java、JavaScript、Go等。
AI语音
AI生成语音,也被称为文本到语音(Text-to-Speech, TTS)技术,是一种利用人工智能算法将文本信息转换为听起来像人声的语音的技术。这项技术在近年来得到了显著的发展,尤其是在自然语音生成和语音的真实感方面。
Google Cloud Text-to-Speech
Google的这项服务提供了广泛的语言和声音选择,支持多种不同的语言和口音。它使用深度学习技术生成自然听起来的语音,并提供了简单的API接口。
Whisper
https://openai.com/research/whisper
Whisper 的神经网络,它在英语语音识别方面的鲁棒性和准确性接近人类水平。
LLMOps
LLMOps 平台专注于提供大模型的部署、 运维和优化服务, 旨在帮助企业和开发者更高效地管理和使用这些先进的 AI 模型,快速完成从模型到应用的跨越。
LangChain
https://github.com/langchain-ai/langchain
LangChain 是一个开源项目,由 Harrison Chase 领导,旨在促进和简化大型语言模型(LLM)的集成和应用。LangChain 的核心理念是通过链式交互,使多个 LLM 模型能够串联工作,发挥各自的优势,并与外部数据源连接,从而产生更强大的语言理解和生成效果。
Dify.AI
https://github.com/langgenius/dify
Dify 是一个 LLM 应用开发平台,已经有超过 10 万个应用基于 Dify.AI 构建。它融合了 Backend as Service 和 LLMOps 的理念,涵盖了构建生成式 AI 原生应用所需的核心技术栈,包括一个内置 RAG 引擎。使用 Dify,你可以基于任何模型自部署类似 Assistants API 和 GPTs 的能力。
LLMAgent
LLM Agent 是一种基于 LLM 的智能代理, 它能够自主学习和执行任务,具有一定的“ 认知能力和决策能力 ” 。 LLM Agent 的出现, 标志着
LLM 从传统的模型训练和应用模式, 转向以 Agent 为中心的智能化模
式。
AutoGPT
https://github.com/Significant-Gravitas/AutoGPT
它使用的是 OpenAI 的 GPT-4 或GPT-3.5 API, 是首个使用 GPT-4 执行自主任务的应用程序实例 。
AutoGPT 最大的特点在于能根据任务指令自主分析和执行,当 收到一个需求或任务时, 它会开始分析这个问题, 并且给出执行目标和具体任务, 然后开始执行。
总结
2023年比较著名的开源项目和闭源项目都介绍,后续朋友指出补充,我再继续汇总。
我是dlimeng,独立开源软件开发者,SolidUI作者,对于新技术非常感兴趣,专注AI和数据领域,如果对我的文章内容感兴趣,请帮忙关注点赞收藏,谢谢!