Claude LLM 大语言模型使用指南(中文版)

来源: Anthropic 文档
翻译:Claude
校对:ALLinLLM
翻译进度:31%

1. 介绍

1.1 开始使用 Claude

什么是 Claude

Claude 是由 Anthropic 创建的大型语言模型(LLM),旨在以会话方式提供帮助。

与 Claude 交互的方式有多种:

  • Web – 通过 Anthropic 的控制台,您可以与 Claude 进行聊天。
  • API – 允许将 Claude 集成到您的产品中,为客户提供服务。无论使用哪种接口,与 Claude 的交互方式基本相同,这使得您可以轻松地在控制台中尝试提示,并将其迁移到基于 API 的系统中。

获取 Claude 访问权限

Anthropic 正在谨慎推出 Claude,以确保其安全性和可扩展性,符合公司的价值观。我们与选定的合作伙伴合作推出 Claude。如果您有兴趣成为合作伙伴之一,请申请。由于收到的极大兴趣,回复可能需要一些时间。

如果您已通过某种接口(例如 Claude in Slack)与 Claude 交互,并希望切换到另一种接口(例如 API 访问),您需要分别申请每个产品的访问权限。

与 Claude 的第一次聊天

Claude 拥有多种功能,响应效果可能取决于您提问的方式。无论通过 Slack 还是网页界面,以下建议可以帮助您在初次交谈中获得更好的体验。

把 Claude 当作外包员工一样交谈

与 Claude 交谈时,像对待外包员工一样,而不是简单的文本补全 API。例如:

写一篇专家级的激光光学技术摘要。

Claude “记得” 整个线程

通过 Slack 或网页界面与 Claude 交互时,它可以看到您在该线程中写的任何内容,但无法记住其他线程中的内容。

需要记住的限制
  • 🎭 Claude 扮演一个有帮助的助手角色,可能会错误地报告自己的能力。
  • ➗ 在复杂的算术和推理方面,Claude 有时会出错。
  • 👻 Claude 可能会产生幻觉或编造信息。
  • 🌐 Claude 了解现实世界的知识,但无法访问互联网。
  • ⏳ Claude 的训练数据可能早于两年前。
  • 📅 Claude 不知道当前日期或事件。
  • 🔨 Claude 无法在现实世界中采取行动,但可以建议行动。
  • 📇 Claude 无法查阅信息,但可以建议查阅内容。

术语词典

以下是一些重要概念的简要总结:

  • 上下文窗口:指语言模型在生成文本时可以回顾和参考的文本量。
  • 微调:使用额外数据进一步训练预训练语言模型的过程。
  • HHH:代表 Anthropic 确保 Claude 有益于社会的目标。
  • LLM:大型语言模型,能够执行多种有用任务。
  • 预训练:在大型无标签文本语料上训练语言模型的过程。
  • RLHF:人工反馈强化学习,鼓励模型表现出与人类偏好一致的方式。
  • 温度:控制模型预测随机性的参数。
  • Token:语言模型的最小个别“原子”。

2. 提示词(Prompt)设计

2.1 设计提示词

Claude 被训练为一名有帮助的助手,您可以用标准英语指示它。将 Claude 想象成一名新雇佣的承包商,给它具体的说明。

提示词

您给 Claude 的文本旨在引发相关响应。提示通常采取问题或指示的形式。例如:

人类:为什么天空是蓝色的?
助手:

通过 API 发送的提示必须包含 人类:助手: 作为说话人的信号。

Claude 通过使用这样的数据进行 RLHF 方法训练和微调,因此您需要在 API 中使用这些提示以获得预期的结果。

响应

Claude 响应的文本称为“响应”。

“把内容喂到 Claude 的嘴里”

提示样式允许通过向 Claude 发送它以前说过的话进行持续的对话。

人类:请选择一个随机水果。
助手:这里是我为您随机选择的水果:番石榴。
人类:这种水果的颜色是什么?
助手:

2.2 避免歧义

与 Claude 交谈时,确保提示词的精确性,避免歧义。

明确描述需求

保持提示词的精确性,具备完整的主谓宾定状补。例如:

反例:纽约有多大?
正例:相比其他州,纽约州的面积和人口有多大?

提供示例

在提示中包含示例可以提高准确性。

人类:我想让你建议有趣的集体名词。例如:
舞者的一个有趣的集体名词可以是”一群 pirouette 的舞者”
嬉皮士的一个有趣的集体名词可以是”一群 fedora 的嬉皮士”
工程师的一个有趣的集体名词可以是”一群 nerd herd 的工程师”
想一个护士的有趣集体名词。
助手:

2.3 复杂任务

当您提供的说明很复杂时,可以考虑一些额外的技术。

编写子任务

将提示分解为步骤可以帮助 Claude 更好地理解任务。

人类:请按以下步骤操作:
1. 编写一段关于工蜂如何维护巢穴的段落。
2. 告诉我“蜜蜂”的德语单词。

2.4 迭代式地补充提示词

迭代扩展提示是指使用 Claude 的响应来提高后续提示的可靠性。

人类:我将给您一个句子,您需要告诉我它包含单词”苹果”的次数。
助手:是的,我理解。
人类:这里有一个句子:我吃了一个苹果,然后我吃了另一个苹果。 您的答案是什么?
助手:输入句子”我吃了一个苹果,然后我吃了另一个苹果。”包含单词”苹果”两次。因此,我的答案是[2]。

👉 野卡 | 一分钟注册,轻松订阅海外线上服务

(0)
上一篇 2025年7月1日
下一篇 2025年7月2日

相关推荐