您的关注是对我最大的支持👇

理解AI思维-AI基础系列文章第14篇_AIGC

        在深入课程的其他部分之前,理解各种AI及其功能的一些基本概念非常重要。这些基础知识将提供对后续材料更清晰的理解。

不同的AI

        人工智能的领域广阔且多样,包含了数千,甚至数百万的不同模型。这些模型拥有广泛的能力和应用。有些是生成式的,被设计出来生成像图像、音乐、文本甚至视频这样的输出。相反,其他的是判别式的,被设计出来对各种输入进行分类或区分,比如一个图像分类器能区分猫和狗。然而,这个文章x系列将专注于生成式AI。

        在生成式AI中,只有少数几个拥有使它们特别适用于提示工程的高级能力。在这个系列文字中,我们主要关注ChatGPT和其他大型语言模型(LLMs)。我们探索的技术适用于大多数LLMs。

        当我们进入图像生成的领域时,我们将探索Stable Diffusion和DALLE的使用。

大型语言模型是如何工作的?

        生成文本的AI,如GPT-3和ChatGPT,基于一个复杂的神经网络类型,称为变压器架构进行操作。这种架构包含了数十亿的人工神经元。以下是关于这些AI如何工作的一些关键点:

  1. 在他们的核心,这些AI是数学函数。不像简单的函数如f(x)=x2,把他们想象成有数千个变量导致数千个可能输出的函数。
  2. 这些AI通过将句子分解为称为令牌的单位来处理句子,这些单位可以是单词或子词。例如,AI可能会读取"I don't like"为"I", "don", "'t", "like"。然后每个令牌被转换为AI处理的数字列表。
  3. AI通过预测基于前一个令牌的下一个令牌来生成文本。例如,在"I don't like"之后,AI可能预测"apples"。他们生成的每一个新令牌都受到前面的令牌的影响。
  4. 与人类从左到右或从右到左阅读不同,这些AI同时考虑所有的令牌。

        值得注意的是,"思考"、"大脑"和"神经元"这样的术语是用来描述这些AI工作的隐喻。实际上,这些模型是数学函数,而不是生物实体。他们并不像人类那样"思考";他们根据他们接受训练的数据进行计算。

结论

        理解AI的基本工作原理在我们深入这门课程时是至关重要的。虽然将AI人格化以便于理解是很有吸引力的,但是必须记住这些模型是数学函数,而不是思考的生物。他们基于数据和算法运行,而不是人类的认知。当我们继续探索和讨论AI的性质和能力时,这个基础知识将作为指导,帮助我们导航复杂且迷人的人工智能世界。


明日预告

《提示学习方法-AI基础系列文章第15篇》利用生成式AI解决问题的学习提示方法是一个在生成式AI领域解决问题的框架。它可以帮助你决定是否选择生成式AI作为解决方案,如何应用提示工程,选择什么工具等等。我们将逐步介绍这五个步骤,然后提供一个使用这种方法的案例研究。