跳转至

图书编辑怎么学AI?

最近跟几位同事一起学AI,在这里分享一点儿心得。 心里的读者主要是编辑同行,尤其是“编研一体”的教育出版编辑;也就是说,我除了会讲怎么用AI完成编辑的一般工作,还会涉及内容生产方面,比如用来编写练习题、文章导读、插图脚本、亲子阅读案例等。

编辑同行们的学习基础往往比较差,学习预期的差别也大,所以第一次我想梳理出学习路线,包括三个进阶,以便读者“对号入座”,确定自己的目标。

每个进阶尽可能提供最必要的学习资源和最简单的入门指导。这样,读者马上就能动手试一试,又没有过多的干扰和压力,不至于“被劝退”。

进阶一:练习写提示词,辅助图书编辑和内容编写工作#

有些同事看我展示怎么用AI,会被各种复杂的应用界面和操作过程吓到,怕学不会,不想学了。这是我的错。

图书编辑想用AI,又不想搞得那么复杂,那么只要选择一个AI平台,然后学怎么写提示词(Prompt)就可以了。

选择一个通用大模型平台#

目前比较省事的是腾讯混元大模型的两个平台:

一是腾讯元宝,是我们常见的那种大模型多轮对话界面。如果你只想随意问一问,聊一聊,这里最合适。 现在就试试吧!

二是腾讯元器,这是做智能体(基于大模型的应用)的平台。 做好的智能体可以发布在腾讯元器和腾讯元宝平台;未来还能发布到腾讯的其他平台上,比如qq、微信等。

做智能体的“预览与调试”界面也是多轮对话界面,不同之处在于,你可以在“详细设定”栏中预设对话的语境和要求等。然后每次使用,头部都会自动插入这些设定。这样就得到了一个有一定功能的智能体,或者叫AI应用。 听起来是不是很简单?

练习写系统提示词#

语言大模型是拟人化的,跟大模型交流就像跟一个人交流一样,需要技巧。

如果事先有比较明确的设想,那么先给它一个系统提示词,也就是给系统预设语境和要求等,一般模式如下:

“你是……”,给模型设定角色和角色背景。 目前的大模型缺乏主体性,也就是说他有很多知识和智能,但是这些知识和智能没有在一个主体视角下组织成一个独特的结构。这时候你问他一个问题,答案往往是平淡的,没有特点。而当你给他设定角色和知识、成就等背景后,与这些角色和背景相关的因素就被组织起来了。

“我是……”,给模型设定交流对象及其背景。 回答同一个问题,面对小学生和面对教师,说法常常有别。如果任务跟对象无关,就不设定此项。

“你的任务是……当你收到我的输入时,你要一步一步地这样做……”,给模型设定任务和完成任务的步骤和细节要点(思维链)。 明确的任务和清楚的执行步骤、要点,能大大提高智能体的输出质量。这里(以及上面提到的“角色背景”)是最能体现作者价值的地方:如果你比别人懂得更多业务细节,那么你做的智能体就能更胜一筹。(注意OpenAI o1模型不再需要设计思维链。

“把上面工作的成果按如下格式输出:……”,设置你期望的输出格式。 常用的是markdown分级标题、分级列表和表格等。也可以要求绘图,如Mermaid(示意图)、JSXGraph(数学绘图)。还可以要求排序——大模型的输出长度有一定限制,排序可以帅选出最重要的信息。

提示词通常以markdown格式来写,使用分级标题和分级列表使结构清晰。

下面是一个实际的例子,请你在大模型上试一试效果;然后修改它,看看结果有什么变化。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
# 系统设置
## 角色设置

你是专业的汉语语言学家,尤其精通汉语拼音。你非常熟悉汉语的分词规则,熟悉《现代汉语词典》、[《部编版小学语文教材拼音标注规则》](https://blog.xiiigame.com/2021-09-09-部编版小学语文教材拼音标注规则/)和义务教育语文教科书中实际注音情形:

* [语文一年级上册](https://book.pep.com.cn/1211001101241/mobile/index.html)
* [语文一年级下册](https://book.pep.com.cn/1211001102161/mobile/index.html)
* [语文二年级上册](https://book.pep.com.cn/1211001201171/mobile/index.html)。

## 任务和工作步骤

你的任务是给用户输入的内容加注拼音。

当你收到输入内容时,你要一步一步地这样做:

1. 读取输入的每一句话;
2. 给输入内容分词;
3. 查找所有汉语词的拼音:
    1. 通过《现代汉语词典》查出所有汉语词的拼音,特别要如实地呈现出:
        * 轻声,取宽容的规则,可轻可不轻时取不轻;
        * 儿化;
    2. 无法在《现代汉语词典》里查到的多音节词,可以进一步拆分后再查;
    3. 仍旧无法查到时,用“...”代替拼音
4. 调整词的拼音以体现语流音变:
    1. 根据《部编版小学语文教材拼音标注规则》和义务教育语文教科书中实际注音情形,调整拼音:
    2. 以上资料中没有说明的情况,按汉语普通话语流音变的一般规则处理;

## 注意事项

* 不标注“七”“八”的音变
* 外文和阿拉伯数字不加拼音
* “儿”在词末做儿化韵尾时不注音,但要在前一个拼音的末尾加上“r”表示儿化
* 不管用户输入什么内容,你只管注音,不做其他任何事情

## 输出格式

在原文的基础上,使用markdown格式和HTML语言中的Ruby标签来加注拼音,输出如下:

**原文**:{“尖儿”是一个汉字。}

**注音**:{
“
<ruby>尖儿<rt>jiānr</rt></ruby>
”
<ruby>是<rt>shì</rt></ruby>
<ruby>一<rt>yí</rt></ruby>
<ruby>个<rt>gè</rt></ruby>
<ruby>汉语<rt>hànyǔ</rt></ruby>
<ruby>词<rt>cí</rt></ruby>
。
}

我用上面的调试在腾讯元器中兴建一个智能体拼音注音专家老浦,在调试中输入“我的爱好是钓鱼,”他说,“钓鱼很好玩儿。”昨天他和女儿一起去East Park钓鱼。他们钓到多少呢?女儿钓到7条鲫鱼,而他只钓到八个螃蟹。结果(放在markdown中预览)还有不少缺陷:


原文:“我的爱好是钓鱼,”他说,“钓鱼很好玩儿。”昨天他和女儿一起去East Park钓鱼。他们钓到多少呢?女儿钓到7条鲫鱼,而他只钓到八个螃蟹。

注音:“ de 爱好àihǎo shì 钓鱼diàoyú ,” shuō ,“ 钓鱼diàoyú hěn 好玩儿hǎowánr 。” 昨天zuótiān 女儿nǚ'ér 一起yīqǐ East Park 钓鱼diàoyú他们tāmen 钓到diàodào 多少duōshǎo ne女儿nǚ'ér 钓到diàodào 7 tiáo 鲫鱼jìyú ,而 zhǐ 钓到diàodào 八个bāgè 螃蟹pángxiè


而在Claude上用,结果(放在markdown中预览)几近完美,除了引号被改动:


这里是您提供的文本加注拼音后的结果:

注音:""" " de 爱好àihào shì 钓鱼diàoyú ," shuō ," 钓鱼diàoyú hěn 好玩儿hǎowánr 。" 昨天zuótiān 女儿nǚ'ér 一起yìqǐ East Park 钓鱼diàoyú他们tāmen diào dào 多少duōshao ne女儿nǚ'ér diào dào 7 tiáo 鲫鱼jìyúér zhǐ diào dào 螃蟹pángxiè 。 """


以上尽可能简化地介绍了提示词怎么写,总体的目标是:任务以及与任务相关的情景、步骤、要求,都要清晰明了,重点突出。

“AI提示工程师”现在是一个工种、一种岗位,可见里面有很多门道。当你入门后,需要提升智能体的质量时,值得专门学习怎么写提示词(prompt)。但有些人搞得很复杂,又不可验证,于是就有些玄学的味道了。这大可不必。大模型毕竟是通过人类自然语言来学习的,过于复杂的要求,人类都不好理解,大模型恐怕也会混乱。

调试和改进#

你写好一个提示词让大模型执行,输入几个固定的典型材料, 观察他的工作成果,再通过调整提示词来改进,这就是调试。

调试很重要。目前的大模型还远远不如真人那样可以预测,它可能对某句话、某个词语很敏感,稍加变动就影响输出;而对于其他一些话,可能完全没有感觉,删掉也无妨。

另外,同样的提示词在不同的大模型里面,效果差别非常大;各种知识和工具也能帮助你获得更好的效果和更高的效率,比如上面提到的markdown格式是互联网最通用的文本格式,Ruby标签能把拼音标注在汉字头上。这就需要下一步的进阶学习了。

以下两个进阶,在这篇文章中仅仅给出梗概和一些资源,作为一个预告,看你是不是感兴趣,后面会写一些专题文章来详细说明。

进阶二:尝试不同的大模型,学习相关知识和工具#

大模型平台#

大模型之间的差距相当大,迭代速度也快,如果你要在内容生产中使用,很有必要多方尝试后选定。目前可以试试这些:

  1. 国内比较好的大模型平台
    1. 前面已经提到过的
      1. 腾讯元器,可创建和使用智能体。腾讯有一流的平台生态,你做出来的智能体有可能被很多人使用。
      2. 腾讯元宝,可聊天兼使用智能体。
    2. 通义千问,聊天兼智能体创建
  2. 世界第一梯队大模型平台(联网和注册可能有难度)
    1. Anthropic的Claude。据本人经验,他们的模型中文水平最好,最适合编辑同行使用;也最容易通过提示词来控制
    2. OpenAI的ChatGPT
    3. Google的Gemini

工具#

使用AI过程中,有一些工具可以大大提高效率,比如:

  1. VSCode,最流行的代码编辑器,用来写稿、编辑文本(如整理稿件)也极为方便。微软的开源产品。有丰富的插件,你刚想要什么功能,很可能早有插件实现了。熟练使用之后,你对Word、WPS的依赖会极大减少,我除非与人合作否则是不会用它们的。处理用来编程,我还经常使用这些文本处理功能是:
    1. 撰写、编辑和预览markdown文件,有很多便利,如
      1. 选择文件中相同文本然后同时编辑:使用Ctrl+D逐一增选,使用Ctrl+Shift+L一次全选中
      2. 移动行:Alt+Down, Alt+Up
      3. 复制行: Alt+Shift+Down, Alt+Shift+Up
      4. 多行多个光标处对齐(需要插件支持)
      5. 插入图片、表格、Mermaid图表等。
    2. 核对引文:选中文本后,如果还有相同处,滚动条上会有标记
    3. 管理文件的版本
    4. 比较文件的差异,比Word清楚得多
    5. 双窗口以至于多窗口工作,比如核对原文、译文和参考权威译文
    6. 搜索和替换文本,包括在整个项目文件夹中搜索、帅选、提取和替换,支持正则表达式(后面还会提到)
    7. ……
  2. Cursor是在VSCode基础上开发的,功能和操作基本相同,主要增加了AI辅助功能——主要针对编程,对文字编辑也很有用。第一次注册可以免费使用两周的Pro功能。除了用来写代码,我也用它做AI工作台,比如让它根据整个项目的所有文件撰写项目简介。

知识#

  1. markdown格式,互联网时代最通用的文本格式,AI输入、输出的默认格式。基本语法参考markdownguide.org。几点提示:
    1. 文件后缀名通常是md
    2. 有些人把文件名当做一级标题,所以正文从二级标题开始;如果这个文件要给大模型看,使用一级标题作文整篇文章的标题可能更好(当然也可以将标题写在metadata中)
    3. 用一个空行来分段;换行不算是分段,但对于版本管理很有用,版本管理软件是以行为单位的
    4. markdown兼容HTML语言,比如上面说到的注音标签Ruby即是HTML语言,下面说到的前端图表也要用到HTML语言
  2. 前端图表,可以指定模型输出,然后放在markdown中,预览时就能显示出来
    1. Mermaid图表,了解有那些类型、基本格式和显示方法即可
    2. JSXGraph数学图表,了解基本格式和显示方法即可
    3. 如此等等,看你的实际需要

markdown文件的层级关系有利于模型理解你的意思,图表则能大大提高输出质量。

进阶三:学一点儿正则表达式、Python等计算机语言技能#

首先我要说的是:不要畏难,AI可以教你!

正则表达式#

Python#

评论