图书编辑怎么学AI?
最近跟几位同事一起学AI,在这里分享一点儿心得。 心里的读者主要是编辑同行,尤其是“编研一体”的教育出版编辑;也就是说,我除了会讲怎么用AI完成编辑的一般工作,还会涉及内容生产方面,比如用来编写练习题、文章导读、插图脚本、亲子阅读案例等。
编辑同行们的学习基础往往比较差,学习预期的差别也大,所以第一次我想梳理出学习路线,包括三个进阶,以便读者“对号入座”,确定自己的目标。
每个进阶尽可能提供最必要的学习资源和最简单的入门指导。这样,读者马上就能动手试一试,又没有过多的干扰和压力,不至于“被劝退”。
进阶一:练习写提示词,辅助图书编辑和内容编写工作#
有些同事看我展示怎么用AI,会被各种复杂的应用界面和操作过程吓到,怕学不会,不想学了。这是我的错。
图书编辑想用AI,又不想搞得那么复杂,那么只要选择一个AI平台,然后学怎么写提示词(Prompt)就可以了。
选择一个通用大模型平台#
目前比较省事的是腾讯混元大模型的两个平台:
一是腾讯元宝,是我们常见的那种大模型多轮对话界面。如果你只想随意问一问,聊一聊,这里最合适。 现在就试试吧!
二是腾讯元器,这是做智能体(基于大模型的应用)的平台。 做好的智能体可以发布在腾讯元器和腾讯元宝平台;未来还能发布到腾讯的其他平台上,比如qq、微信等。
做智能体的“预览与调试”界面也是多轮对话界面,不同之处在于,你可以在“详细设定”栏中预设对话的语境和要求等。然后每次使用,头部都会自动插入这些设定。这样就得到了一个有一定功能的智能体,或者叫AI应用。 听起来是不是很简单?
练习写系统提示词#
语言大模型是拟人化的,跟大模型交流就像跟一个人交流一样,需要技巧。
如果事先有比较明确的设想,那么先给它一个系统提示词,也就是给系统预设语境和要求等,一般模式如下:
“你是……”,给模型设定角色和角色背景。 目前的大模型缺乏主体性,也就是说他有很多知识和智能,但是这些知识和智能没有在一个主体视角下组织成一个独特的结构。这时候你问他一个问题,答案往往是平淡的,没有特点。而当你给他设定角色和知识、成就等背景后,与这些角色和背景相关的因素就被组织起来了。
“我是……”,给模型设定交流对象及其背景。 回答同一个问题,面对小学生和面对教师,说法常常有别。如果任务跟对象无关,就不设定此项。
“你的任务是……当你收到我的输入时,你要一步一步地这样做……”,给模型设定任务和完成任务的步骤和细节要点(思维链)。 明确的任务和清楚的执行步骤、要点,能大大提高智能体的输出质量。这里(以及上面提到的“角色背景”)是最能体现作者价值的地方:如果你比别人懂得更多业务细节,那么你做的智能体就能更胜一筹。(注意OpenAI o1模型不再需要设计思维链。)
“把上面工作的成果按如下格式输出:……”,设置你期望的输出格式。 常用的是markdown分级标题、分级列表和表格等。也可以要求绘图,如Mermaid(示意图)、JSXGraph(数学绘图)。还可以要求排序——大模型的输出长度有一定限制,排序可以帅选出最重要的信息。
提示词通常以markdown格式来写,使用分级标题和分级列表使结构清晰。
下面是一个实际的例子,请你在大模型上试一试效果;然后修改它,看看结果有什么变化。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 |
|
我用上面的调试在腾讯元器中兴建一个智能体拼音注音专家老浦,在调试中输入“我的爱好是钓鱼,”他说,“钓鱼很好玩儿。”昨天他和女儿一起去East Park钓鱼。他们钓到多少呢?女儿钓到7条鲫鱼,而他只钓到八个螃蟹。
结果(放在markdown中预览)还有不少缺陷:
原文:“我的爱好是钓鱼,”他说,“钓鱼很好玩儿。”昨天他和女儿一起去East Park钓鱼。他们钓到多少呢?女儿钓到7条鲫鱼,而他只钓到八个螃蟹。
注音:“ 我 的 爱好 是 钓鱼 ,” 他 说 ,“ 钓鱼 很 好玩儿 。” 昨天 他 和 女儿 一起 去 East Park 钓鱼 。他们 钓到 多少 呢? 女儿 钓到 7 条 鲫鱼 ,而 他 只 钓到 八个 螃蟹 。
而在Claude上用,结果(放在markdown中预览)几近完美,除了引号被改动:
这里是您提供的文本加注拼音后的结果:
注音:""" " 我 的 爱好 是 钓鱼 ," 他 说 ," 钓鱼 很 好玩儿 。" 昨天 他 和 女儿 一起 去 East Park 钓鱼 。 他们 钓 到 多少 呢 ? 女儿 钓 到 7 条 鲫鱼 , 而 他 只 钓 到 八 个 螃蟹 。 """
以上尽可能简化地介绍了提示词怎么写,总体的目标是:任务以及与任务相关的情景、步骤、要求,都要清晰明了,重点突出。
“AI提示工程师”现在是一个工种、一种岗位,可见里面有很多门道。当你入门后,需要提升智能体的质量时,值得专门学习怎么写提示词(prompt)。但有些人搞得很复杂,又不可验证,于是就有些玄学的味道了。这大可不必。大模型毕竟是通过人类自然语言来学习的,过于复杂的要求,人类都不好理解,大模型恐怕也会混乱。
调试和改进#
你写好一个提示词让大模型执行,输入几个固定的典型材料, 观察他的工作成果,再通过调整提示词来改进,这就是调试。
调试很重要。目前的大模型还远远不如真人那样可以预测,它可能对某句话、某个词语很敏感,稍加变动就影响输出;而对于其他一些话,可能完全没有感觉,删掉也无妨。
另外,同样的提示词在不同的大模型里面,效果差别非常大;各种知识和工具也能帮助你获得更好的效果和更高的效率,比如上面提到的markdown格式是互联网最通用的文本格式,Ruby标签能把拼音标注在汉字头上。这就需要下一步的进阶学习了。
以下两个进阶,在这篇文章中仅仅给出梗概和一些资源,作为一个预告,看你是不是感兴趣,后面会写一些专题文章来详细说明。
进阶二:尝试不同的大模型,学习相关知识和工具#
大模型平台#
大模型之间的差距相当大,迭代速度也快,如果你要在内容生产中使用,很有必要多方尝试后选定。目前可以试试这些:
- 国内比较好的大模型平台
- 世界第一梯队大模型平台(联网和注册可能有难度)
工具#
使用AI过程中,有一些工具可以大大提高效率,比如:
- VSCode,最流行的代码编辑器,用来写稿、编辑文本(如整理稿件)也极为方便。微软的开源产品。有丰富的插件,你刚想要什么功能,很可能早有插件实现了。熟练使用之后,你对Word、WPS的依赖会极大减少,我除非与人合作否则是不会用它们的。处理用来编程,我还经常使用这些文本处理功能是:
- 撰写、编辑和预览markdown文件,有很多便利,如
- 选择文件中相同文本然后同时编辑:使用Ctrl+D逐一增选,使用Ctrl+Shift+L一次全选中
- 移动行:Alt+Down, Alt+Up
- 复制行: Alt+Shift+Down, Alt+Shift+Up
- 多行多个光标处对齐(需要插件支持)
- 插入图片、表格、Mermaid图表等。
- 核对引文:选中文本后,如果还有相同处,滚动条上会有标记
- 管理文件的版本
- 比较文件的差异,比Word清楚得多
- 双窗口以至于多窗口工作,比如核对原文、译文和参考权威译文
- 搜索和替换文本,包括在整个项目文件夹中搜索、帅选、提取和替换,支持正则表达式(后面还会提到)
- ……
- 撰写、编辑和预览markdown文件,有很多便利,如
- Cursor是在VSCode基础上开发的,功能和操作基本相同,主要增加了AI辅助功能——主要针对编程,对文字编辑也很有用。第一次注册可以免费使用两周的Pro功能。除了用来写代码,我也用它做AI工作台,比如让它根据整个项目的所有文件撰写项目简介。
知识#
- markdown格式,互联网时代最通用的文本格式,AI输入、输出的默认格式。基本语法参考markdownguide.org。几点提示:
- 文件后缀名通常是
md
- 有些人把文件名当做一级标题,所以正文从二级标题开始;如果这个文件要给大模型看,使用一级标题作文整篇文章的标题可能更好(当然也可以将标题写在metadata中)
- 用一个空行来分段;换行不算是分段,但对于版本管理很有用,版本管理软件是以行为单位的
- markdown兼容HTML语言,比如上面说到的注音标签Ruby即是HTML语言,下面说到的前端图表也要用到HTML语言
- 文件后缀名通常是
- 前端图表,可以指定模型输出,然后放在markdown中,预览时就能显示出来
- Mermaid图表,了解有那些类型、基本格式和显示方法即可
- JSXGraph数学图表,了解基本格式和显示方法即可
- 如此等等,看你的实际需要
markdown文件的层级关系有利于模型理解你的意思,图表则能大大提高输出质量。
进阶三:学一点儿正则表达式、Python等计算机语言技能#
首先我要说的是:不要畏难,AI可以教你!