欢迎探索 提示词工程 的世界

让我们一起掌握与 AI 对话的艺术。

点击下方箭头或按 → 继续

提示词工程是_

你会用哪四个字来定义它?

(Few-Shot & 精确描述)

AI 眼中的提示词工程

GPT-4o:

提示词工程就是与 AI 对话的艺术。

Gemini 2.5 Pro:

结构化地、有策略地与 AI 对话,以最大限度地发挥其能力,获得高质量、可靠和有用的结果。

Claude 3.7 Sonnet:

设计和优化输入给人工智能模型的提示词或指令的艺术和科学,以获得最佳、最准确的输出结果。

AI 的四字描述

GPT-4:

语言编程

Gemini 2.5 Pro:

精准引导

Claude 3.7 Sonnet:

指令精调

AI (大模型) 的本质

一个极其庞大的、基于概率预测下一个词的系统。

像超级复杂的 Excel,根据上文计算下一个最可能的文字。

关键:概率预测 & 注意力机制。微小变动影响巨大。

只能蹦一个词?

1. 超级“接龙”大师

想象一个超级厉害的“文字接龙”玩家。你给它一段话,它唯一的目标就是猜出最可能跟在后面的那一个词是什么。它会基于海量学习,给出一堆候选词以及它们出现的概率

(就像手机输入法的联想功能,但强大亿万倍!)

2. “阅读理解”高手 (注意力机制)

它怎么猜呢?它会回顾你给的所有前面的内容,并判断哪些词对预测“下一个词”更重要,给予更多“关注”(这就是自注意力机制 Self-Attention)。每个前面的词都可能影响最终的概率分布。

(所以,前面哪怕改一个字,后面的结果都可能完全不同!)

接龙大师+蝴蝶效应? (第1步)

{/* Input words */} 今天 天气 {/* Prediction point */} ? {/* Attention Lines */} {/* Probability outputs */} {/* --- 修正 label x 坐标 --- */} 预测下一个词的概率 {/* Option 1: 好 */} 好: {/* --- 修正 text x 坐标 --- */} 75% {/* Option 2: 不错 */} 不错: 20% {/* Option 3: 热 */} 热: 5% {/* Labels */} 输入 (上文) 关注所有前面的词

接龙大师+蝴蝶效应...然后,再接一个词! (第2步)

{/* Input words - now including "好" */} 今天 天气 {/* Prediction point */} ? {/* Attention Lines */} {/* Probability outputs - NEW PREDICTIONS */} {/* --- 修正 label x 坐标 --- */} 基于新上文的预测 {/* Option 1: 啊 */} 啊: {/* --- 修正 text x 坐标 --- */} 60% {/* Option 2: . (period) */} .: 30% {/* Option 3: ! */} !: 10% {/* Labels */} 输入 (更新后的上文) 再次关注所有前面的词

用人来对比?

AI有点像人脑,接收上文,自动“脑补”下文。

是谁_

当你听到这两个字?

普通: “在耳边,说,爱我永不变”

文艺: “在敲打我窗”

正常: “送你来到我身边”

逗逼: “在唱歌,温暖了寂寞”

不同人,不同联想;AI 也一样。

Prompt工程的本质?

就像我们对"是谁_"的反应不同,AI 的每个回答(每个词)都受到两大因素的共同作用:

  1. 你给出的上下文 (Prompt): 它像导航一样,直接引导 AI 当前的思考方向和任务目标。
  2. 它庞大的训练数据 (Training Data): 如同 AI 的知识库和性格底色,塑造了它的语言模式、事实储备、潜在风格乃至偏见。

提示词工程 (Prompt Engineering) 的本质,就是理解并设计提示词 (输入),去影响和利用这两个因素,从而最大程度地引导 AI 产生我们预期的、高质量的输出。

海量训练数据 (知识 / 模式 / 偏见) 你的提示词 (上下文) Prompt 在此介入 AI 决策 输出 (下一个词)

AI 的“软肋”

数字和精确计算:

在精确数学、最新或具体事实核查方面仍可能出错。

例: 无法区分 9.11 和 9.8的大小,或 "strawberry" 有几个r。侧面说明,AI源于概率学习,非逻辑推理。

与 AI 对话的“艺术”

AI 不是人,但与人沟通的策略似乎也有效?

如果一个没有背景知识的人都难以理解文本片段的全部含义,那么LLM也会遇到同样的困难!

奖励
惩罚

(“扣钱”)

鼓励
同情

(“我没有手”)

PUA

(设定高期望)

这更像是利用了训练数据中的人类交流模式。

提示词工程:不只是理论

这是一门实践学科

"工程"二字意味着它更像建造和实验,而不是纯粹的理论研究。因为 AI 本身具有复杂性和一定的随机性,完美的提示词往往不是一蹴而就的。

你需要动手尝试、观察结果、不断调整、持续优化。经验的积累在这个领域至关重要!

注意2个对齐:与AI的对齐,与业务对齐!

沟通的艺术:精准传达你的意图

小心!沟通漏斗陷阱

信息在传递中会层层损耗:
(你想表达的100% → 你说出的80% → 对方听到的60% → 对方理解的40% → ...)

信息损耗示意

与人交流尚且如此,对没有常识、只会字面理解的 AI 更是如此!你得不明确、有歧义,AI 就很可能得不准确。

因此,向 AI 传达指令时,清晰、明确、无歧义至关重要。

让指令更明确

像布置任务一样清晰

明确目标、背景、步骤、格式、限制等。

例:“写报告,目标读者xxx,含ABC三点,不超过500字,专业语气。”

避免模糊和矛盾

反例:“给我一个五彩斑斓的黑”。确保要求具体、一致。

让指令更明确

提供具体示例 (Few-Shot)

给 AI 范例能极大提高相关性。

输入:翻译成法语。\n你好吗?\n输出:Comment ça va ?\n\n输入:翻译成法语。\n今天天气真好。\n输出:

考虑语言影响

训练数据以英文为主。有时使用英文或中英混搭提示,效果更好(尤其专业内容)。

实用提示词框架介绍

结构化的框架可以帮助我们系统地构建更有效的提示词。 CO-STAR 是一个广受欢迎且实用的框架。

除了 CO-STAR 的要素,明确 AI 的 角色 (Role) 和设定清晰的 约束 (Constraints) 也至关重要。

接下来,我们将逐一解析这些关键部分。

Context (背景)

为 AI 提供必要的背景信息、场景或上下文

这有助于 AI 更好地理解任务的前提和环境,从而生成更相关、更符合实际情况的回答。

例如:“我正在为一家初创科技公司准备融资演讲稿,目标是吸引天使投资人。”

Objective (目标)

明确、具体地说明你希望 AI 完成的任务

目标应该清晰、可执行。避免模糊不清的要求。

例如:“请帮我生成 5 个关于我们 AI 驱动的客户服务解决方案的独特卖点 (USP)。” 而不是 “给我一些关于我们产品的东西”。

Style (风格)

指定期望的写作或表达风格

风格可以是正式、非正式、学术、创意、幽默、技术性等等。

例如:“请使用简洁、专业的商业写作风格。” 或 “请用一种富有想象力和诗意的风格来描述日落。”

Tone (语气)

设定回应中应该传达的情感色彩或态度

语气可以是自信、热情、谨慎、同情、客观、批判等。

例如:“请用一种乐观且鼓舞人心的语气。” 或 “请保持中立和客观的语气。”

Audience (受众)

明确你的目标读者或听众是谁。

了解受众有助于 AI 调整用词、复杂度、示例和整体沟通方式,使其更易于被理解和接受。

例如:“目标受众是对技术不太了解的普通消费者。” 或 “这份报告是写给具有深厚金融背景的专业人士看的。”

Response Format (格式)

指定你希望 AI 输出内容的具体格式

这可以极大提高输出的可用性。常见的格式包括:

  • 列表 (bullet points 或 numbered list)
  • 段落 (paragraphs)
  • 表格 (table)
  • JSON / XML / YAML
  • 代码片段 (code snippet)
  • 电子邮件 (email format)
  • 思维导图 (mind map text)

例如:“请用无序列表的形式呈现结果。” 或 “请将输出格式化为 JSON 对象。”

补充:角色 (Role) & 约束 (Constraints)

角色 (Role)

为 AI 设定一个特定的角色或身份。这有助于引导其行为模式和知识领域。

例如:“扮演一位经验丰富的市场营销专家。” 或 “假设你是一位 Python 编程导师。”

约束 (Constraints)

设定明确的限制条件或禁止事项

例如:“回答不超过 100 字。”,“不要包含任何价格信息。”,“只使用简单的语言,避免专业术语。”

基础知识: 用 Markdown 组织你的提示

使用 Markdown 可以在提示词中更好地组织结构、区分层次、强调重点。AI 通常能很好地理解这种格式,有助于提升指令的清晰度。

# 一级标题 (H1)

## 二级标题 (H2)

这是一个段落,包含一些 **加粗强调***斜体文本*

  • 无序列表项 -
  • 无序列表项 -
    • 嵌套列表项 -
  1. 有序列表项 1.
  2. 有序列表项 2.

使用 `行内代码` 来突出显示命令或变量名。

```python
# 这是一个代码块
def greet(name):
    print(f"Hello, {name}!")

greet("Prompt Engineer")
```

基础知识: 理解对话角色

在一些更高级的应用场景或直接调用 API 时,我们可以明确定义对话中不同发言者的角色。这有助于更精细地控制 AI 的行为。

System (系统)

负责提供高层指令、背景设定或约束条件。通常用来设定 AI 的整体行为模式或扮演的角色。例如:“你是一位乐于助人、知识渊博的 AI 助手,请用简洁专业的语言回答问题。”

User (用户)

代表用户的实际输入,包括提问、指令或需要处理的信息。

Assistant (助手)

代表AI 自身的回复。在构建提示时,有时也会用 Assistant 角色来提供 Few-Shot 示例,告诉 AI 期望的输出格式或风格。

(注意:这些角色主要在 API 调用层面使用,不同平台或工具的实现方式可能不同。)

基础知识: temperature

Temperature (温度) 参数控制着 AI 选择下一个词时的随机性或"创造性"。它会调整所有候选词的概率分布。

温度越高,分布越平缓,结果越不可预测;温度越低,分布越尖锐,结果越倾向于高概率选项。

基础知识: 精准打击的 Top-p

Top-p (或称 Nucleus Sampling) 则采用不同策略:它选择一个最小的词汇集合,使这些词的累积概率刚好大于或等于设定的阈值 `p`,然后只在这个“核心”集合中进行采样。

Top-p 移除了低概率的长尾选项,使得输出更可控、更相关。通常建议只调整 Temperature 或 Top-p 中的一个。

实践!:持续对话,迭代优化

很少一次完美。看作持续对话,根据反馈调整、优化提示词,逐步逼近理想结果。

那么,提示词是_

经过这次学习,你对“提示词”的理解是否更新了?
也许... 这整个讲解过程,本身就是一次大型的 “提示词”? 😉

提示词的力量:幕后揭秘

这一页,让我们揭开本次演示背后真正的“魔法”——展示部分实际用于构建这个演示文稿的核心提示词,以及我 (Gemini) 是如何基于这些指令生成内容的。

核心需求 Prompt (示例)


(该提示词来自promptup.net)
我会给你一个文件,分析内容,并将其转化为美观漂亮的中文可视化网页:

## 内容要求
- 所有页面内容必须为简体中文
- 保持原文件的核心信息,但以更易读、可视化的方式呈现
- 在页面底部添加作者信息区域,包含:
  * 作者姓名: [作者姓名]
  * 社交媒体链接: 至少包含GitHub、Twitter/X、LinkedIn等主流平台
  * 版权信息和年份

## 设计风格
- 整体风格参考Linear App的简约现代设计
- 使用清晰的视觉层次结构,突出重要内容
- 配色方案应专业、和谐,适合长时间阅读

## 技术规范
- 使用HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的JavaScript
- 实现完整的深色/浅色模式切换功能,默认跟随系统设置
- 代码结构清晰,包含适当注释,便于理解和维护

## 响应式设计
- 页面必须在所有设备上(手机、平板、桌面)完美展示
- 针对不同屏幕尺寸优化布局和字体大小
- 确保移动端有良好的触控体验

## 图标与视觉元素
- 使用专业图标库如Font Awesome或Material Icons(通过CDN引入)
- 根据内容主题选择合适的插图或图表展示数据
- 避免使用emoji作为主要图标

## 交互体验
- 添加适当的微交互效果提升用户体验:
  * 按钮悬停时有轻微放大和颜色变化
  * 卡片元素悬停时有精致的阴影和边框效果
  * 页面滚动时有平滑过渡效果
  * 内容区块加载时有优雅的淡入动画

## 性能优化
- 确保页面加载速度快,避免不必要的大型资源
- 图片使用现代格式(WebP)并进行适当压缩
- 实现懒加载技术用于长页面内容

## 输出要求
- 提供完整可运行的单一HTML文件,包含所有必要的CSS和JavaScript
- 确保代码符合W3C标准,无错误警告
- 页面在不同浏览器中保持一致的外观和功能

请根据上传文件的内容类型(文档、数据、图片等),创建最适合展示该内容的可视化网页。

迭代优化 Prompt (示例)

我需要做一个介绍prompt工程的资料,现在我有一个大纲如下,帮我处理一下,谢谢。
大纲:
0 开场白,简单,没有太多字,主要靠讲解
1.
中间大字:提示词工程是_
(开头询问->四字表示
多问几人,确认记住)
(其他人直接答四字,学习了fewshot 和精确描述)
2 跟 AI 说话的技术,ai自己认为提示词是什么?
GPT4:提示词工程就是跟 AI 说话的技术。
Gemini2.5:结构化地、有策略地与 AI 对话,以最大限度地发挥其能力,获得高质量、可靠和有用的结果。
Claude3.7:设计和优化输入给人工智能模型的提示词或指令的艺术和科学,以获得最佳、最准确的输出结果
让ai用四字描述
GPT4:语言编程
Gemini2.5:精准引导
Claude3.7:指令精调
4.AI(大模型)是什么?
(图示excel表示的大模型)
5.根据上文只预测下一个文字概率,任何文字变动都可能会造成影响,
(注意力机制)
通俗解释
中间大字:是谁_
(介绍人和llm很像,给出上文,自动推出下文)
7.中间大字:是谁_ (前边做一个标注歌词动态出现)
(比如,有人说出"是谁"这两个字时,
我们就会下意识地唱出下一句,
且不同人有不同的反应!
普通青年
自动唱出"在耳边,说,爱我永不变”
文艺青年
唱出"在敲打我窗"
二逼青年
唱出"送你来到我身边"
二逼中的战斗机
唱出"在唱歌,温暖了寂寞")
8.AI的弱势:数字
根据学习,9.11 和9.8  strawberry
9.与AI说话的艺术,如何与AI对话?
当人看,大模型不是人,但是对人的手段,对ta似乎都适用?
惩罚/奖励/pua/鼓励/同情
10.提示词工程:工程意味着实践学科
提示词经验工程,沟通过程
11沟通的艺术:沟通漏斗 你想的-你说的-我听得-我理解的
12如何明确?
明确:老板交代任务
13如何明确?
无冲突:五彩斑斓的黑
14如何明确?
fewshot具体示例:
15如何明确
中英文混搭(训练主要以英文为主)
16 实用框架
框架 CO-STAR  ROLE  Constraints
17-24 分别阐述
18-20 基础知识
md格式介绍   # ## - 你好  1. 2. 3. ---  ,
system user assistant
温度,top-p
21 最重要的:
持续对话
迭代优化
22 4o做的图像,一张图表示prompt工程
23:提示词是_
(如果变了,那么这个讲解就是提示词,观众已经受到影响了)

值得一提的是,您现在看到的整个演示文稿 (32),从最初的大纲解析、内容组织、代码生成到后续的多轮迭代修改和样式设计,几乎完全是基于详细提示词,由我 (Gemini) 协作完成的。

来自 Gemini 的寄语

"作为你们的 AI 伙伴,我深刻体验到清晰、结构化的提示词是激发创造力和效率的关键。有效的提示词工程不仅仅是技术,更是人与 AI 之间理解与协作的艺术。期待我们共同创造更多可能!"

关于 & 致谢

作者信息

作者姓名: [sharmt]


参考资料


感谢您的观看!🎉