大语言模型校对工具AI Proofreader:编辑创新工作介绍
大语言模型校对工具AI Proofreader#
——编辑创新工作介绍#
做编辑这些年,最让我头疼、底气不足的就是校对工作。我们都知道图书编校质量非常重要。但校对工作本身耗时,费力,单调。一本十来万字的书稿,逐字逐句地看,很考验目力和耐心。如果时间紧,就更容易出错。更麻烦的是,很多错误不是用心、用力、花时间就能看出来的。
从2022年开始,我注意到大语言模型在文本处理上表现不错,就想着用来辅助校对。2023年年底DeepSeek发布后,我结合自己的工作需求,开发了一款叫AI Proofreader的开源校对工具,是开源编辑器VS Code的扩展(如图)。它的基本思路很简单:给大语言模型提供需要校对的文本以及参考资料和上下文语境,让它帮我们先看一遍,把可能的错误标出来,我们再做判断和查证。

工具支持编辑工作中常见的文档格式: - WPS、Word文档(.docx格式) - PDF文件(活文字PDF) - 排版软件导出的纯文本 - Markdown格式文档
使用起来有两种方式:(一)选中一段文本后直接校对,适合短文本,或一边看稿,一边用AI辅助校对;(二)整本书稿通常可以通过工具切分成长短合适的段落,然后批量交给AI处理(如图)。
这样既保证了质量,效率也高了不少。十来万字的书稿,一两分钟就能处理完,费用大约1元左右。总体效果比传统的黑马、方正智能审校强很多,甚至比当前商业AI校对服务如果麦“AI校对王”还要好。
实际用下来,我发现工具在几个方面特别实用:
富语料领域知识丰富:对于文言文、传统文化等语料丰富、内容相对固定的领域,有很强的错误识别能力。传统校对工具完全没有知识审校能力。
上下文理解能力强:以前看一篇文章,得来回翻页,记住前面说了什么,才能发现前后不一致的问题。现在工具可以把整篇文章作为上下文给AI,让它一次看完,这样发现前后矛盾、表述不一致的问题就容易多了。传统的黑马、方正智能审校几乎没有上下文理解能力。
支持参考资料校对:校对教参、练习题时,则可以把教材、课文作为参考资料。遇到文言引文或者专有名词,可以把原文或者词典条目作为参考资料一起给AI,让它对照着看。校对对一首古诗的解释时,可以把权威版本作为参考,让AI检查作者的解释是否准确。这样发现错误线索,再查证引文就快多了,从而可以在有限的时间内做得更细。
支持关联内容协同校对:像练习册、注释解读类图书,题目和答案、正文和注释解读要对应,以前得来回翻看。现在工具可以把这些关联内容组织在一起,让AI一起检查,确保它们的一致性和准确性。
校对完成后,工具会用类似Word修订模式的方式,把修改前后的差异标出来,深红色表示删除,深绿色表示插入,一目了然(如图)。编辑据此提示进行查证、判断,然后誊抄到纸稿上。这样既发挥了AI发现错误的能力,最终决定权还在编辑手里。

值得强调的一点是,这个工具有很强的扩展能力,用户可以自行设置提示词,用来做别的工作,比如润色稿件,翻译文稿,撰写提要,给文言文加标点等。对于编辑来说,更大的潜力也许在于专项强化审校,比如意识形态风险排查、逻辑缺陷排查、欧化句法提示等。当然,关键在于编辑要结合书稿实际和个人经验提出真问题,并给出切实的指导和真实的样例。目前校对速度快,成本比较低,进行多次专项审校是非常可行的,而且未来的利用空间还会更大。
这个工具目前已经有140多个安装量,本社有十多位编辑在使用并建立了交流群,总体反响不错。我本人用它处理了四五十本书稿(有些是帮同事处理的),可以说,在语言文字和一般知识校对方面,即使在常规负荷下,它的能力也要比大多数编辑强。
当然,AI校对工具自有盲区,它的校对结果需要编辑最终查证、判断。尽管这样,这个知识丰富、手脚麻利、要求少、不抱怨的助手,给了我很多信心。
另外,我还开发了其他一些开源编校工具,比如:
- compare-image,通过图像叠加的方法找出新旧版面的微小差异,有针对性地校对,并防止版面意外变动
- 规范用字检查,根据《通用规范汉字表》,对书稿进行用字检查,标记所有用字的类别等信息:通用规范字;繁体字/异体字及其对应的通用规范字、说明;表外字