如何让大模型生成更准确、可靠的结果？

原创

鼎道开发者联盟 2023-10-23 11:23:05 ©著作权

文章标签 人工智能数据自然语言处理 文章分类 代码人生

©著作权归作者所有：来自51CTO博客作者鼎道开发者联盟的原创作品，请联系作者获取转载授权，否则将追究法律责任

随着人工智能技术的不断发展， ChatGPT 、GPT-4 、文心一言等大模型陆续发布，自然语言模型（NLP）已经成为人工智能领域的热门话题。但这些模型的生成结果确是时好时坏的。

我们在夸赞强大的涌现能力的同时，也在吐槽其“造假”、“不准确”的问题。因此，开发者们在逐渐增加语言模型体量的同时，希望探索出更小巧轻量、更普适高效的方法，prompt 就是一个沿着此方向的尝试。

如何让大模型生成更准确、可靠的结果？_数据

大模型是指参数量巨大的深度学习模型，如 GPT-3.5 、T5 等。这些模型在自然语言处理、图像处理等领域中表现出了惊人能力。

例如， GPT-3.5 可以生成高质量的文章、对话等，T5 可以完成多种自然语言处理任务，如翻译、问答等。这些模型的能力已经超了以往的人工智能技术，成为了当前人工智能领域的热门话题。

如何让大模型生成更准确、可靠的结果？_自然语言处理_02

然而，大模型并非完美无缺，它也存在一些局限性。

首先，大模型的训练需要大量的计算资源数据，这使得它的应用门槛较高。其次，大模型的能力可能被高估，其解决部分任务的能力可能源于训练数据与任务数据有所重叠。

此外，大模型在某种意义上是一个记忆不佳的“吹牛者”。实际上，模型没有完全记住它所看到的信息，但它又想在提问者面前逞能，于是经常编造一些不存在的记忆。

大模型自身无法规避这种行为的出现，因此在使用大模型时需要注意其局限性。而同时，为了减少或避免这类行为的出现，prompt 应运而生。

如何让大模型生成更准确、可靠的结果？_数据_03

prompt 是 “Predictive Optimization with Machine Learning” 的缩写，翻译成中文为“机器学习预测优化”。它是一种自然语言处理技术，能够自动生成人类语言式的文本，例如问题回答、短文本生成等。

它通过优化提示词来改进模型生成结果质量的方法。对于同一个大模型，给予不同的提示词会生成不同的结果。因此， prompt 技术可以用于优化大模型的生成结果。

如何让大模型生成更准确、可靠的结果？_人工智能_04

如何让大模型生成更准确、可靠的结果？_人工智能_05

良好的 prompt 格式可以使大模型的生成结果更加准确、可靠。

以下是一些良好 prompt 的格式：

如何让大模型生成更准确、可靠的结果？_人工智能_06

在要求模型输出特定的结果前，可以给模型少许样本参考，让它学习其中的模式。例如，在要求模型生成一篇关于人工智能的文章时，可以给模型一些关于人工智能的文章样本，让它学习其中的模式。

如何让大模型生成更准确、可靠的结果？_数据_07

在要求模型回答问题时，可以将问题作为提示词，让模型生成回答。例如，在要求模型回答“人工智能是什么？”时，可以将“人工智能是什么？”作为提示词，让模型生成回答。

如何让大模型生成更准确、可靠的结果？_数据_08

在要求模型生成文章时，可以将文章主题作为提示词，让模型生成符合主题的文章。例如，在要模型生成一篇关于人工智能的文章时，可以将“人工智能”作为提示词，让模型生成符合主题的文章。

如何让大模型生成更准确、可靠的结果？_数据_09

prompt 技术的优势在于可以通过优化提示词来控制模型的生成结果，使其更加符合用户的需求：

在生成文章时，可以通过优化提示词来控制文章的主题、风格等，使生成的文章更加符合用户的需求；
在生成对话时，通过优化提示词来控制对话的情境、角色等，使生成的对话更加符合用户的需求。

prompt 技术的应用可以使大模型的生成结果更加实用，提高其应用价值。我们以 python 代码举例：

import openai
openai.api_key "YOUR_API_KEY"# 设计Prompt
prompt = "让我们写一篇关于人工智能的文章，介绍人工智能的定义、历、应用和未来发展方向。"# 生成文章
response = openai.Completion.create(
    engine="davinci",
    prompt=prompt,
    temperature=0.5,
    max_tokens=1024,
    n=1,
    stop=None,
)

# 输出结果print(response.choices[0].text)

我们可以通过设计一个简单的 prompt ，来要求模型生成一篇关于人工智能的文章，接着我们使用 OpenAI 的 Completion API 调用起 GPT-3 模型生成文章。这样，我们就可以得到生成的文章结果。

如何让大模型生成更准确、可靠的结果？_自然语言处理_10

然而，prompt 技术也存在一些局限性：比如无法自定义样式、只能输入文本数据、在移动端表现不佳等。

同时，优化提示词的过程不仅仅需要扎实的专业知识，还需要有一定的经验，否则就会出现一些特殊情况：

模型的过拟合，使其过于严谨导致在其他场景下的表现不佳；
模型的生成结果出现偏差，变得过于灵活而不够客观、准确。

因此，在使用prompt技术时注意其局限性，以充分发挥它的优势。

如何让大模型生成更准确、可靠的结果？_人工智能_11

得益于 prompt 技术在引导模型生成内容方面影响，很多人将 prompt 比喻为大模型的咒语。可以说， prompt 越精准，其语言、对话模型就可以生成更准确的内容。

如何让大模型生成更准确、可靠的结果？_数据_12

我们相信，在未来， NLP 和 prompt 的搭配可以真正实现准确率超高的对话机器人，但不可否认的是，无论是 prompt ，还是 NLP ，现阶段都有其局限性。

就像曾一度风头无两的 ChatGPT ，面向市场后也需要不停地优化和调整，我们不必神化每一个互联网的产品，因为其本质都是为了人们可以有更快捷、方便的体验。鼎道智联以及 DingOS 也在努力实现这一点，为用户们带来更安全、绿色、便捷的操作体验，为开发者带来更开放的合作环境，如果你也认可我们的想法，欢迎关注我们加入鼎道生态~