来源: Anthropic 文档
翻译:Claude
校对:ALLinLLM
翻译进度:31%
1. 介绍
1.1 开始使用 Claude
什么是 Claude
Claude 是由 Anthropic 创建的大型语言模型(LLM),旨在以会话方式提供帮助。
与 Claude 交互的方式有多种:
- Web – 通过 Anthropic 的控制台,您可以与 Claude 进行聊天。
- API – 允许将 Claude 集成到您的产品中,为客户提供服务。无论使用哪种接口,与 Claude 的交互方式基本相同,这使得您可以轻松地在控制台中尝试提示,并将其迁移到基于 API 的系统中。
获取 Claude 访问权限
Anthropic 正在谨慎推出 Claude,以确保其安全性和可扩展性,符合公司的价值观。我们与选定的合作伙伴合作推出 Claude。如果您有兴趣成为合作伙伴之一,请申请。由于收到的极大兴趣,回复可能需要一些时间。
如果您已通过某种接口(例如 Claude in Slack)与 Claude 交互,并希望切换到另一种接口(例如 API 访问),您需要分别申请每个产品的访问权限。
与 Claude 的第一次聊天
Claude 拥有多种功能,响应效果可能取决于您提问的方式。无论通过 Slack 还是网页界面,以下建议可以帮助您在初次交谈中获得更好的体验。
把 Claude 当作外包员工一样交谈
与 Claude 交谈时,像对待外包员工一样,而不是简单的文本补全 API。例如:
写一篇专家级的激光光学技术摘要。
Claude “记得” 整个线程
通过 Slack 或网页界面与 Claude 交互时,它可以看到您在该线程中写的任何内容,但无法记住其他线程中的内容。
需要记住的限制
- 🎭 Claude 扮演一个有帮助的助手角色,可能会错误地报告自己的能力。
- ➗ 在复杂的算术和推理方面,Claude 有时会出错。
- 👻 Claude 可能会产生幻觉或编造信息。
- 🌐 Claude 了解现实世界的知识,但无法访问互联网。
- ⏳ Claude 的训练数据可能早于两年前。
- 📅 Claude 不知道当前日期或事件。
- 🔨 Claude 无法在现实世界中采取行动,但可以建议行动。
- 📇 Claude 无法查阅信息,但可以建议查阅内容。
术语词典
以下是一些重要概念的简要总结:
- 上下文窗口:指语言模型在生成文本时可以回顾和参考的文本量。
- 微调:使用额外数据进一步训练预训练语言模型的过程。
- HHH:代表 Anthropic 确保 Claude 有益于社会的目标。
- LLM:大型语言模型,能够执行多种有用任务。
- 预训练:在大型无标签文本语料上训练语言模型的过程。
- RLHF:人工反馈强化学习,鼓励模型表现出与人类偏好一致的方式。
- 温度:控制模型预测随机性的参数。
- Token:语言模型的最小个别“原子”。
2. 提示词(Prompt)设计
2.1 设计提示词
Claude 被训练为一名有帮助的助手,您可以用标准英语指示它。将 Claude 想象成一名新雇佣的承包商,给它具体的说明。
提示词
您给 Claude 的文本旨在引发相关响应。提示通常采取问题或指示的形式。例如:
人类:为什么天空是蓝色的?
助手:
通过 API 发送的提示必须包含 人类:
和 助手:
作为说话人的信号。
Claude 通过使用这样的数据进行 RLHF 方法训练和微调,因此您需要在 API 中使用这些提示以获得预期的结果。
响应
Claude 响应的文本称为“响应”。
“把内容喂到 Claude 的嘴里”
提示样式允许通过向 Claude 发送它以前说过的话进行持续的对话。
人类:请选择一个随机水果。
助手:这里是我为您随机选择的水果:番石榴。
人类:这种水果的颜色是什么?
助手:
2.2 避免歧义
与 Claude 交谈时,确保提示词的精确性,避免歧义。
明确描述需求
保持提示词的精确性,具备完整的主谓宾定状补。例如:
反例:纽约有多大?
正例:相比其他州,纽约州的面积和人口有多大?
提供示例
在提示中包含示例可以提高准确性。
人类:我想让你建议有趣的集体名词。例如:
舞者的一个有趣的集体名词可以是”一群 pirouette 的舞者”
嬉皮士的一个有趣的集体名词可以是”一群 fedora 的嬉皮士”
工程师的一个有趣的集体名词可以是”一群 nerd herd 的工程师”
想一个护士的有趣集体名词。
助手:
2.3 复杂任务
当您提供的说明很复杂时,可以考虑一些额外的技术。
编写子任务
将提示分解为步骤可以帮助 Claude 更好地理解任务。
人类:请按以下步骤操作:
1. 编写一段关于工蜂如何维护巢穴的段落。
2. 告诉我“蜜蜂”的德语单词。
2.4 迭代式地补充提示词
迭代扩展提示是指使用 Claude 的响应来提高后续提示的可靠性。
人类:我将给您一个句子,您需要告诉我它包含单词”苹果”的次数。
助手:是的,我理解。
人类:这里有一个句子:
助手:输入句子”我吃了一个苹果,然后我吃了另一个苹果。”包含单词”苹果”两次。因此,我的答案是[2]。