一、ChatGPT发展的现状

ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,借助其最先进的深度神经网络技术架构,能更拟人化与人类交流互动,甚至能生成诗歌小说、电影剧本、论文、代码等。中国科学院大学人工智能学院教授、亚太人工智能学会执行主席雷渠江接受经济日报记者采访时表示,ChatGPT具有巨大的创新性,在很多方面都可以成为人们工作和生活的强有力助手。

ChatGPT看技术发展趋势_人工智能

ChatGPT借助其核心技术之一“Transformer神经网络架构”,极大增强了人工智能的能力,它利用从大型文本语料库中所学到的内容,可以自主生成文本,帮助用户找到问题的答案。ChatGPT除了能够模拟自然对话外,还能够执行写邮件、视频脚本、文案、翻译等任务。

1、ChatGPT的发展

ChatGPT是一种预训练的语言大模型,采用大量的参数和大量的数据进行训练,基于人类反馈的强化学习算法,将NLP技术和机器学习结合,极大地提升了模型算法的效率和能力。随着ChatGPT的热度不断攀升,多家科技公司都开始布局ChatGPT相关技术领域,NLP技术有望迅速进入平民化应用时代。

ChatGPT看技术发展趋势_AIGC_02

2、ChatGPT的使用

官方网站:>>>点击这里进入<<<

进行注册,需要一个国外手机号,如果没有可以找万能宝。如果提示“不能在当前国家服务”,则需要更改自己的IP,如果搞不定,同样建议找万能宝。

3、ChatGPT的功能

  1. 更精准:当你输入你的问题以后,它会很精准的给你你想要的结果,而不是还需要你像传统的搜索一样还要自己对搜索结果进行筛选。
  2. 更智能:你可以和它聊天,对话,更像是你和一个知识渊博的人在聊天一样,而且它还很有逻辑,它和你聊天的时候也会联系到你上面和它聊天的内容,让你真正能感受的到,它是真的理解你和它的聊天内容。
  3. 更实用:比如说你想写一篇新闻稿,你只需要输入时间地点大概的事件,它就能通过自己海量的数据库,寻找所有与这个事件相关的内容,给你生成一篇你想要的的新闻稿,同时还能保持真实性与唯一性。当然它的用途肯定不仅限于这一个行业。

二、ChatGPT带来的影响

ChatGPT具备强大的对话能力和生成能力,可以回答后续问题、承认错误、挑战不正确的前提、拒绝不适当的请求,这意味着ChatGPT能够颠覆搜索行业,在智能客服、游戏、虚拟人等领域也将得到广泛应用,从ChatGPT到AIGC,AI已经成为新时代新的生产力。

ChatGPT看技术发展趋势_ChatGPT_03

ChatGPT带动AIGC(AI-Generated Content)的革新。AIGC指利用人工智能技术自动生成的内容,与此前Web1.0、Web2.0时代的UGC(用户生产内容)和PGC(专业生产内容)相比,代表人工智能构思内容的AIGC,是新一轮内容生产方式变革,而且AIGC内容在Web3.0时代也将出现指数级增长。ChatGPT模型的出现对于文字模态的AIGC 应用具有重要意义,未来,与图形模态的AIGC相结合,有望打造从文字描述到图片生成的AI创作辅助工具,对AI产业上下游产生重大影响。

1、ChatGPT的应用场景

国外生成式AI产品应用方向多样,现象级产品迅速获取大量用户。根据知名创业组织Antler的统计,截止2022年年底,海外生成式AI产品数量达到190余个,包括视频、音频、游戏、数据、搜索等多种类型应用。同时,2022年年底图片生成应用Midjourney官方Discord中的关注人数超过百万,ChatGPT上线后一周内用户数量已近百万。

生成式AI产品在交互设计中,更注重用户体验。目前生成式AI产品形态包含插件、API网页交互、客户端等。其中,API网页交互无需下载安装产品,在云端即可获得生成内容,如用户可在百度的“文心ERNIE 3.0”产品网页中输入提示词生成内容。同时,生成式AI技术与搜索产品融合后,匹配内容、意图理解表现更好。例如,用户使用论文阅读助手SciSpace时,无需指定关键词即可搜索和查找相关论文,可提升阅读论文效率。

ChatGPT看技术发展趋势_生成式_04

2、ChatGPT的影响

ChatGPT强大的内容生成能力,引起了业界普遍关注,也加速了人工智能行业从决策式/分析式AI(Discriminant/Analytical AI)到生成式AI (Generative AI)的演化。

ChatGPT看技术发展趋势_ChatGPT_05

随着生成式AI技术的不断进步,生成模态不断更新,呈现多元化格局。 按照生成模态划分,生成式AI产品分为文本生成(以ChatGPT为代表)、图片生成、代码生成和音频生成多个方向。2022年9月Meta发布自研视频生成大模型Make-A-Video;2022年11月,NVIDIA公司发布了3D模型生成工具Magic3D;同月WebAR软件平台解决方案商Geenee AR发布了AI WebAR内容创造套件RT3D AI SDK。生成模态的多元也推动了生成式AI的多行业应用。

ChatGPT看技术发展趋势_人工智能_06

三、ChatGPT引发的思考

自1947年以来,AI领域取得的关键进展,(如Eliza、AlphaGo和chatGPT的发布),都是由西方主导,美国在AI技术发展的过程中不断进行颠覆性技术创新,尤其是最近十多年,更是建立先发优势和累加优势,逐步拉大中美在AI领域的差距。

ChatGPT看技术发展趋势_数据_07

1、国外的发展历程

以chatGPT的发展历程为例: 2015年12月,OpenAI成立,探索大模型路线。

2017年6月,Google发布Transformer论文。

2018年6月,OpenAI发布GPT-1,参数量1.17亿,预训练数据量5GB。

2019年2月,OpenAI发布GPT-2,参数量15亿,预训练数据量40GB。

2020年5月,OpenAI发布GPT-3,参数量1750亿,预训练数据量45TB。

2022年11月,OpenAI发布chatGPT。

2023年2月,Google发布Bard。

2、国内的发展历程

国内也在追赶AI的热潮,在ChatBot方面快速跟进:

2015年,科大讯飞发布了AIUI,定义为人机交互服务新界面。

2016年,百度发布了DuerOS,定义为对话式人工智能操作系统。

2017年-2019年,小米发布了水滴平台,阿里发布了天猫精灵,腾讯发布了小微,微软发布了小冰,思必驰发布了DUI,这段时间的补贴竞争就是“百箱大战”。

2019年,声智发布了Azero 2.0,定义为多模态与多技能的AI开发框架并对外开放。

2023年,百度将发布“文心一言”,预计三月份完成内测面向公众开放,未来或将接入百度搜索。京东宣布推出产业版“ChatJD”,应用路线图包括一个平台、两个领域(零售和金融)、五个应用(内容生成、人机对话、用户意图理解、信息抽取、情感分类)。字节跳动AI实验室也在开展类似ChatGPT和AICG相关研发,未来或为PICO提供技术支持。阿里类ChatGPT产品目前也处于内测阶段,会与钉钉产品结合。

虽然国内科技巨头和垂类成长型AI公司在努力布局,但是,回到大模型这个主题,从2022年12月chatGPT发布时候的大模型现状来看,美国的进展更加迅猛和稳健。

ChatGPT看技术发展趋势_AIGC_08

综上来看,我们要充分认识到我们在算法、模型、数据、算力等方面与美国的差异,这是几十年积累的差距,并有逐渐拉大的趋势,值得我们思考和警惕。

四、ChatGPT相关的建议

虽然生成式AI行业发展迅速,覆盖数据模态不断扩展,生成内容愈发具有创造力、多元化。但是另一方面,生成式AI的产品能力仍存在不足,预计仍需要3~5年时间的监督学习才会真正对生产力产生根本性影响,当然数据合规性、安全性也需进一步规范。

另外,国内开源生态和应用研究将面临挑战。OpenAI在GPT-3之后所有的应用都不再开源,而是提供API,这对于国内跟随研究将产生直接影响。OpenAI这种API方式带动了国外创业公司的生态发展,并且非常重视对真实世界数据调用的迭代和反馈,这种飞轮对于国外公司是闭环提升,对国内产业则是潜在隐患,国内公司若基于OpenAI进行迭代,则会加速国外的研究和产业进展,并且始终让我国受制于美国公司,从而形成新一轮卡脖子问题。

  1. 充分认识差距,保持战略定力。 充分认识到我国人工智能基础研究相对于美国的差距,要在质疑和焦虑等各种噪声中保持战略定力。人工智能自从诞生以后,每次浪潮都由欧美引领,自从2010年以后则由美国特别是企业研发机构引领,我国基本都是跟随研发而并没有重大创新突破,我们要对这种追赶并且挑战的现状充分认识,不能盲目自大也不能丢失信心,在各种噪声中保持对人工智能引领的数字经济信心。
  2. 加强大模型研究,探索多技能路线。 持续加强对人工智能基础研究机构的改革、整合和支持,参考美国人工智能的产品导向思路加强大模型的联合攻关,同时鼓励探索大模型之外的更多技术路线。面对当前我们国内在数据多样性、一致性和标注质量方面的差距,以及算力等数字基础设施的不足,应该鼓励以小模型为基础的多技能技术路线更多落地场景。这样大模型和多技能至少两个技术路线同步并进,从各个方面来缩小与美国的差距。当然我们也要看到,美国主流的这两个技术路线之外,在基础研究方面更是探索小样本学习等更多技术路线。
  3. 加快数据基建,推动数据共享。 美国面向全球多传感数据和非结构化数据采集的能力,以及美国科技公司相比较我国科技公司数据采集的多样性,是美国人工智能领先的关键因素。我国科技公司主要关注于用户画像的采集和分析,并将此作为商业变现模式,反而在人工智能关注的声、光、电、热、力、磁等多传感数据以及程序代码等非结构化数据方面缺乏积累。
  4. 健全数据标准,规范数据治理。 建立国家多传感数据和非结构化数据的标准体系,鼓励各个行业数据采集系统之间的互联互通,消除国内各行业之间的数据孤岛现象和数据不一致的问题。

五、ChatGPT应用

ChatGPT by OpenAI. 项目采用接口方式实现。

最新实现在:github.com/AIGCT/EASY*…

问题1

ChatGPT看技术发展趋势_ChatGPT_09

问题2

ChatGPT看技术发展趋势_人工智能_10