介绍
本人是独立开源软件开发者,参与很多项目建设,谈下感受。
ChatGPT开始AI生成元年,经历一年依然是第一。
LLaMA的巧合开启开源大模型浪潮。
名词解释
- AIGC : AI-Generated Content 指利用人工智能技术(生成式AI路径)来生成内容的新型内容生成方式。
- GPT-4: 多模态大语言模型,输入输出不再局限于文本,具有推理感知能力,初步具有AGI能力。
- AGI : 通俗称为强人工智能或者通用人工智能。AGI 能够胜任任何任务,智能水准比肩人类或者超过人类。
- LLM:大型语言模型 (Large language model) 通俗来讲,语言模型就是一个可以分析和生成文本的人工智能系统。它通过学习大量文本数据,来理解人类语言的规则,知道哪些词语组合在一起才是合理流畅的。
- AI:人工智能(AI) 是一组技术,使计算机能够执行各种高级功能,包括查看、理解和翻译口语和书面语言、分析数据、提出建议等各种能力。
- AI Agents: LLM Agent 是一种基于 LLM 的智能代理,它能够自主学习和执行任务,具有一定的“认知能力和决策能力”。LLM Agent 的出现,标志着LLM 从传统的模型训练和应用模式,转向以 Agent 为中心的智能化模式。
我们做通用大模型的目标是GPT-4。例如:文心一言,通义千问等等。
产业图谱
上游:算力,数据,算法。
中游:LLM能力,AI开源社区,模型平台,AI Agents。
下游:内容消费,创作工具,企业服务
产业热点
显示了各个行业的增长,其中以最高的条形代表的某个特定行业预计增长最大。
多模态融合方案增长最快,具体应用以数字人为主,流量为王时代,视频激发数字人快速增长。
产业规模
2028年,中国AIGC产业规模预计将达到7202亿元,中国AIGC产业生态日益稳固,完成重点领域、关键场景的技术价值兑现,逐步建立完善模型即服务产业生态,2030年中国AIGC产业规模有望突破万亿元,达到11441亿元。
AI生成模型
生成模型列表
一年的影响世界热点事件
1月15日:ChatGPT成为历史上增长最快的消费者应用程序。
1月27日:微软向OpenAI投资100亿美元。
2月10日:微软发布“新必应”。
2月17日:林肯公园乐队发布首个AI生成的动画音乐视频,AI生成动画视频开始流行。
2月22日:Spotify推出AI驱动的新功能“DJ”。
2月24日:AWS与Hugging Face合作。
2月28日:Snapchat推出AI聊天机器人“我的AI”。
3月1日:OpenAI发布ChatGPT和Whisper API。
3月7日:ChatGPT登上南方公园。
3月17日:OpenAI发布GPT-4。
3月21日:AI在30天内创造出癌症治疗方法。
3月22日:谷歌发布Bard,股价随之暴跌。
3月22日:Adobe发布AI图像生成器Adobe Firefly。
3月24日:OpenAI发布ChatGPT插件,所有人都认为这是“AI应用商店”。
3月24日:Canva在Canva Create上发布新的AI工具。
3月28日:AI教皇方济各走红网络。
3月28日:Zoom发布AI助手“Zoom IQ”。
3月30日:伊隆·马斯克和AI专家呼吁在开发比GPT-4更强大的AI系统前暂停6个月。
4月3日:意大利禁用ChatGPT。
4月6日:Meta发布“分割任何东西模型”,用于从图像或视频中提取对象。
4月11日:阿里巴巴发布ChatGPT竞争对手“Tongyi问问”。
4月13日:AutoGPT和开源自主智能体在社交媒体上产生轰动。
4月14日:亚马逊和AWS发布Bedrock和CodeWhisperer。
4月17日:伊隆·马斯克创立xAI。
4月21日:谷歌大脑和DeepMind联手。
4月25日:格莱美批准使用她的声音创作AI生成的歌曲。
4月25日:AI发现一颗新的行星。
5月2日:杰弗里·辛顿从谷歌辞职,警告世人AI的危险。
5月3日:Inflection AI发布Pi。
5月10日:Meta发布新AI研究模型ImageBing。
5月11日:谷歌在I/O上宣布重大AI进展。
5月12日:Anthropic将Claude的token窗口扩大至10万。
5月19日:OpenAI推出免费的ChatGPT iOS应用。
5月19日:苹果禁止员工使用ChatGPT。
5月24日:微软发布Windows 11 AI Copilot、必应插件、必应浏览和Windows Terminal。
5月26日:瑞士科学家用AI重建脊髓。
6月2日:英伟达研究开发Neuralangelo,用于从2D视频剪辑中进行3D重建。
6月6日:苹果在WWDC上发布Apple Vision Pro。
6月13日:德国教堂举行了300多人的AI驱动仪式。
6月19日:Meta发布新语音合成AI Audiobox。
6月22日:10万多个ChatGPT账号被破解。
6月27日:突破性AI研究可以理解和解码鲸鱼语言。
6月28日:百度推出ERNIE 3.5。
6月29日:ChatGPT通过必应在移动搜索上获得解放。
7月3日:Humane发布“AI Pin”,取代智能手机。
7月4日:Midjourney推出新的“平移”功能。
7月6日:Inflection AI开发一个8.8亿美元的AI超级计算机。
7月6日:OpenAI推出超配准,以解决超智能一致性问题。
7月10日:AI在治疗脑癌方面展现出潜力。
7月12日:Anthropic发布Claude 2。
7月17日:好莱坞对AI技术发起罢工。
7月19日:Meta和微软发布Llama 2。
7月20日:苹果启动AI狂潮,发布 “Apple GPT”。
7月21日:ChatGPT更新允许“自定义指令”。
7月26日:日本经济产业省计划开发AI超级计算机。
7月27日:Stability AI发布SDXL 1.0。
8月7日:蒂姆·库克称苹果正在将AI整合到每一个产品中。
8月11日:HeyGen 宣布他们AI生成的克隆头像2.0版。
8月23日:Meta开源文本到视频模型SeamlessM4T。
8月24日:大脑植入物让瘫痪者通过AI发声。
8月30日:特斯拉启动一个强大的3亿美元AI超级计算机。
9月4日:研究人员创建一个AI模型来预测化学品的气味。
9月8日:微软与Paige合作开发癌症检测AI。
9月13日:可口可乐用AI创造了一个新的神秘口味。
9月20日:谷歌针对Workspace宣布Bard扩展。
9月21日:OpenAI宣布DALL-E 3。
9月22日:微软发布Copilot,“你的日常AI伴侣”。
9月26日:ChatGPT实现语音和图像的多模态。
9月27日:中情局为情报工作打造专有AI系统。
…更多看图片
OpenAI 2024需求清单
- AGI(请保持耐心):Sam Altman 明确表示无法在2024年实现这个目标。
- GPT-5
- 更好的语音模式
- 提高访问限制
- 更好的 GPTs
- 更好的推理能力
- 对觉醒/行为程度的控制
- 视频处理/生成能力
- 个性化定制
- 更强的联网搜索能力
- 使用 OpenAI 登录
- 开源:开源ChatGPT
算力
LLM 的算力指的是执行这些模型所需的计算资源。这包括用于训练和运行模型的硬件(如 GPU 或 TPU)、内存、存储空间以及处理
大量数据的能力。LLM 需要非常强大的算力来处理、理解和生成文本,因为它们涉及到数十亿甚至数万亿个参数的训练和推理。
LLM 的基石是算力,而算力的基石是硬件,硬件的性能直接影响着计算任务的速度、效率和能力。
据 OpenAI 测算,自 2012 年以来,人工智能模型训练算力需求每3~4个月就翻一番,每年训练 AI 模型所需算力增长幅度高达 10 倍
结语
赶上AI生成奇点,拥抱变化,展望未来。
我是dlimeng,独立开源软件开发者,SolidUI作者,对于新技术非常感兴趣,专注AI和数据领域,如果对我的文章内容感兴趣,请帮忙关注点赞收藏,谢谢!