图书编辑怎么学AI？

最近跟几位同事一起学AI，在这里分享一点儿心得。心里的读者主要是编辑同行，尤其是“编研一体”的教育出版编辑；也就是说，我除了会讲怎么用AI完成编辑的一般工作，还会涉及内容生产方面，比如用来编写练习题、文章导读、插图脚本、亲子阅读案例等。

编辑同行们的学习基础往往比较差，学习预期的差别也大，所以第一次我想梳理出学习路线，包括三个进阶，以便读者“对号入座”，确定自己的目标。

每个进阶尽可能提供最必要的学习资源和最简单的入门指导。这样，读者马上就能动手试一试，又没有过多的干扰和压力，不至于“被劝退”。

进阶一：练习写提示词，辅助图书编辑和内容编写工作#

有些同事看我展示怎么用AI，会被各种复杂的应用界面和操作过程吓到，怕学不会，不想学了。这是我的错。

图书编辑想用AI，又不想搞得那么复杂，那么只要选择一个AI平台，然后学怎么写提示词（Prompt）就可以了。

选择一个通用大模型平台#

目前比较省事的是腾讯混元大模型的两个平台：

一是腾讯元宝，是我们常见的那种大模型多轮对话界面。如果你只想随意问一问，聊一聊，这里最合适。 现在就试试吧！

二是腾讯元器，这是做智能体（基于大模型的应用）的平台。做好的智能体可以发布在腾讯元器和腾讯元宝平台；未来还能发布到腾讯的其他平台上，比如qq、微信等。

做智能体的“预览与调试”界面也是多轮对话界面，不同之处在于，你可以在“详细设定”栏中预设对话的语境和要求等。然后每次使用，头部都会自动插入这些设定。这样就得到了一个有一定功能的智能体，或者叫AI应用。 听起来是不是很简单？

练习写系统提示词#

语言大模型是拟人化的，跟大模型交流就像跟一个人交流一样，需要技巧。

如果事先有比较明确的设想，那么先给它一个系统提示词，也就是给系统预设语境和要求等，一般模式如下：

“你是……”，给模型设定角色和角色背景。 目前的大模型缺乏主体性，也就是说他有很多知识和智能，但是这些知识和智能没有在一个主体视角下组织成一个独特的结构。这时候你问他一个问题，答案往往是平淡的，没有特点。而当你给他设定角色和知识、成就等背景后，与这些角色和背景相关的因素就被组织起来了。

“我是……”，给模型设定交流对象及其背景。 回答同一个问题，面对小学生和面对教师，说法常常有别。如果任务跟对象无关，就不设定此项。

“你的任务是……当你收到我的输入时，你要一步一步地这样做……”，给模型设定任务和完成任务的步骤和细节要点（思维链）。 明确的任务和清楚的执行步骤、要点，能大大提高智能体的输出质量。这里（以及上面提到的“角色背景”）是最能体现作者价值的地方：如果你比别人懂得更多业务细节，那么你做的智能体就能更胜一筹。（注意OpenAI o1模型不再需要设计思维链。）

“把上面工作的成果按如下格式输出：……”，设置你期望的输出格式。 常用的是markdown分级标题、分级列表和表格等。也可以要求绘图，如Mermaid（示意图）、JSXGraph（数学绘图）。还可以要求排序——大模型的输出长度有一定限制，排序可以帅选出最重要的信息。

提示词通常以markdown格式来写，使用分级标题和分级列表使结构清晰。

下面是一个实际的例子，请你在大模型上试一试效果；然后修改它，看看结果有什么变化。

# 系统设置
## 角色设置

你是专业的汉语语言学家，尤其精通汉语拼音。你非常熟悉汉语的分词规则，熟悉《现代汉语词典》、[《部编版小学语文教材拼音标注规则》](https://blog.xiiigame.com/2021-09-09-部编版小学语文教材拼音标注规则/)和义务教育语文教科书中实际注音情形：

* [语文一年级上册](https://book.pep.com.cn/1211001101241/mobile/index.html)
* [语文一年级下册](https://book.pep.com.cn/1211001102161/mobile/index.html)
* [语文二年级上册](https://book.pep.com.cn/1211001201171/mobile/index.html)。

## 任务和工作步骤

你的任务是给用户输入的内容加注拼音。

当你收到输入内容时，你要一步一步地这样做：

1. 读取输入的每一句话；
2. 给输入内容分词；
3. 查找所有汉语词的拼音：
    1. 通过《现代汉语词典》查出所有汉语词的拼音，特别要如实地呈现出：
        * 轻声，取宽容的规则，可轻可不轻时取不轻；
        * 儿化；
    2. 无法在《现代汉语词典》里查到的多音节词，可以进一步拆分后再查；
    3. 仍旧无法查到时，用“...”代替拼音
4. 调整词的拼音以体现语流音变：
    1. 根据《部编版小学语文教材拼音标注规则》和义务教育语文教科书中实际注音情形，调整拼音：
    2. 以上资料中没有说明的情况，按汉语普通话语流音变的一般规则处理；

## 注意事项

* 不标注“七”“八”的音变
* 外文和阿拉伯数字不加拼音
* “儿”在词末做儿化韵尾时不注音，但要在前一个拼音的末尾加上“r”表示儿化
* 不管用户输入什么内容，你只管注音，不做其他任何事情

## 输出格式

在原文的基础上，使用markdown格式和HTML语言中的Ruby标签来加注拼音，输出如下：

**原文**：{“尖儿”是一个汉字。}

**注音**：{
“
<ruby>尖儿<rt>jiānr</rt></ruby>
”
<ruby>是<rt>shì</rt></ruby>
<ruby>一<rt>yí</rt></ruby>
<ruby>个<rt>gè</rt></ruby>
<ruby>汉语<rt>hànyǔ</rt></ruby>
<ruby>词<rt>cí</rt></ruby>
。
}

我用上面的调试在腾讯元器中兴建一个智能体拼音注音专家老浦，在调试中输入“我的爱好是钓鱼，”他说，“钓鱼很好玩儿。”昨天他和女儿一起去East Park钓鱼。他们钓到多少呢？女儿钓到7条鲫鱼，而他只钓到八个螃蟹。结果（放在markdown中预览）还有不少缺陷：

原文：“我的爱好是钓鱼，”他说，“钓鱼很好玩儿。”昨天他和女儿一起去East Park钓鱼。他们钓到多少呢？女儿钓到7条鲫鱼，而他只钓到八个螃蟹。

注音：“ 我wǒ 的de 爱好àihǎo 是shì 钓鱼diàoyú ，” 他tā 说shuō ，“ 钓鱼diàoyú 很hěn 好玩儿hǎowánr 。” 昨天zuótiān 他tā 和hé 女儿nǚ'ér 一起yīqǐ 去qù East Park 钓鱼diàoyú 。他们tāmen 钓到diàodào 多少duōshǎo 呢ne？女儿nǚ'ér 钓到diàodào 7qī 条tiáo 鲫鱼jìyú ，而他tā 只zhǐ 钓到diàodào 八个bāgè 螃蟹pángxiè 。

而在Claude上用，结果（放在markdown中预览）几近完美，除了引号被改动：

这里是您提供的文本加注拼音后的结果：

注音：""" " 我wǒ 的de 爱好àihào 是shì 钓鱼diàoyú ，" 他tā 说shuō ，" 钓鱼diàoyú 很hěn 好玩儿hǎowánr 。" 昨天zuótiān 他tā 和hé 女儿nǚ'ér 一起yìqǐ 去qù East Park 钓鱼diàoyú 。他们tāmen 钓diào 到dào 多少duōshao 呢ne ？女儿nǚ'ér 钓diào 到dào 7 条tiáo 鲫鱼jìyú ，而ér 他tā 只zhǐ 钓diào 到dào 八bā 个gè 螃蟹pángxiè 。 """

以上尽可能简化地介绍了提示词怎么写，总体的目标是：任务以及与任务相关的情景、步骤、要求，都要清晰明了，重点突出。

“AI提示工程师”现在是一个工种、一种岗位，可见里面有很多门道。当你入门后，需要提升智能体的质量时，值得专门学习怎么写提示词(prompt)。但有些人搞得很复杂，又不可验证，于是就有些玄学的味道了。这大可不必。大模型毕竟是通过人类自然语言来学习的，过于复杂的要求，人类都不好理解，大模型恐怕也会混乱。

调试和改进#

你写好一个提示词让大模型执行，输入几个固定的典型材料， 观察他的工作成果，再通过调整提示词来改进，这就是调试。

调试很重要。目前的大模型还远远不如真人那样可以预测，它可能对某句话、某个词语很敏感，稍加变动就影响输出；而对于其他一些话，可能完全没有感觉，删掉也无妨。

另外，同样的提示词在不同的大模型里面，效果差别非常大；各种知识和工具也能帮助你获得更好的效果和更高的效率，比如上面提到的markdown格式是互联网最通用的文本格式，Ruby标签能把拼音标注在汉字头上。这就需要下一步的进阶学习了。

以下两个进阶，在这篇文章中仅仅给出梗概和一些资源，作为一个预告，看你是不是感兴趣，后面会写一些专题文章来详细说明。

进阶二：尝试不同的大模型，学习相关知识和工具#

大模型平台#

大模型之间的差距相当大，迭代速度也快，如果你要在内容生产中使用，很有必要多方尝试后选定。目前可以试试这些：

国内比较好的大模型平台
1. 前面已经提到过的
  1. 腾讯元器，可创建和使用智能体。腾讯有一流的平台生态，你做出来的智能体有可能被很多人使用。
  2. 腾讯元宝，可聊天兼使用智能体。
2. 通义千问，聊天兼智能体创建
世界第一梯队大模型平台（联网和注册可能有难度）
1. Anthropic的Claude。据本人经验，他们的模型中文水平最好，最适合编辑同行使用；也最容易通过提示词来控制
2. OpenAI的ChatGPT
3. Google的Gemini

工具#

使用AI过程中，有一些工具可以大大提高效率，比如：

VSCode，最流行的代码编辑器，用来写稿、编辑文本（如整理稿件）也极为方便。微软的开源产品。有丰富的插件，你刚想要什么功能，很可能早有插件实现了。熟练使用之后，你对Word、WPS的依赖会极大减少，我除非与人合作否则是不会用它们的。处理用来编程，我还经常使用这些文本处理功能是：
1. 撰写、编辑和预览markdown文件，有很多便利，如
  1. 选择文件中相同文本然后同时编辑：使用Ctrl+D逐一增选，使用Ctrl+Shift+L一次全选中
  2. 移动行：Alt+Down, Alt+Up
  3. 复制行: Alt+Shift+Down, Alt+Shift+Up
  4. 多行多个光标处对齐（需要插件支持）
  5. 插入图片、表格、Mermaid图表等。
2. 核对引文：选中文本后，如果还有相同处，滚动条上会有标记
3. 管理文件的版本
4. 比较文件的差异，比Word清楚得多
5. 双窗口以至于多窗口工作，比如核对原文、译文和参考权威译文
6. 搜索和替换文本，包括在整个项目文件夹中搜索、帅选、提取和替换，支持正则表达式（后面还会提到）
7. ……
Cursor是在VSCode基础上开发的，功能和操作基本相同，主要增加了AI辅助功能——主要针对编程，对文字编辑也很有用。第一次注册可以免费使用两周的Pro功能。除了用来写代码，我也用它做AI工作台，比如让它根据整个项目的所有文件撰写项目简介。

知识#

markdown格式，互联网时代最通用的文本格式，AI输入、输出的默认格式。基本语法参考markdownguide.org。几点提示：
1. 文件后缀名通常是md
2. 有些人把文件名当做一级标题，所以正文从二级标题开始；如果这个文件要给大模型看，使用一级标题作文整篇文章的标题可能更好（当然也可以将标题写在metadata中）
3. 用一个空行来分段；换行不算是分段，但对于版本管理很有用，版本管理软件是以行为单位的
4. markdown兼容HTML语言，比如上面说到的注音标签Ruby即是HTML语言，下面说到的前端图表也要用到HTML语言
前端图表，可以指定模型输出，然后放在markdown中，预览时就能显示出来
1. Mermaid图表，了解有那些类型、基本格式和显示方法即可
2. JSXGraph数学图表，了解基本格式和显示方法即可
3. 如此等等，看你的实际需要

markdown文件的层级关系有利于模型理解你的意思，图表则能大大提高输出质量。

进阶三：学一点儿正则表达式、Python等计算机语言技能#

首先我要说的是：不要畏难，AI可以教你！