跳转至

如何确保书稿批量替换或转换不出错

写作中

最近中华书局、上海古籍两家大社的书被网友说有错别字,自查说明中提到OCR再版、繁简转换、批量替换等问题,我们可以称之为效率工具转换致误。

使用效率工具导致图书文字错误,这样的事例很多。但抛弃效率工具不用,用广西老乡的话说,“这是不可能的。”这里我梳理几条防范、补强策略,介绍一些工具,做一些提示,供同行参考。

先界定一个概念。我把使用效率工具批量处理称作效率转换,把没有人工逐一审核的效率转换称作未审核的效率转换。

无疑,未审核的效率转换是不可靠的,效率转换之后必须逐一审核。这是最重要的原则。请注意,这里说的是逐一审核,抽审和没有针对性的全面审校不能代替逐一审核。

有人可能以为,在整理稿件阶段进行效率转换,后面还有正常的审校流程,不会有问题。其实这样做没有保障,全面审校要比逐一审核针对性差得多。转换结果跟语境相关,重复三五次以上的错误比较容易发现,而只重复一两处的错误就很危险。

那么怎样才能方便、可靠地实现逐一审核呢?

使用Word等字处理软件时备份文档,比较文档#

使用Word等字处理软件进行查找替换前最好备份文档,做好标记。替换后(可以是多次替换后)使用比较文档功能比较替换前后的两个文档,就能通过修订标记逐一审核了。

使用VSCode管理稿件版本,查看每一处改动#

如果操作次数比较多,改动比较大,字处理软件的比较功能和修订标记就不大方便。我推荐用VSCode软件 + Markdown文档格式 + Git版本管理扩展的工作方式。对于VSCode软件 + Markdown文档格式,我有专文介绍:给文字工作者的VSCode+Markdown入门教程。对于VSCode中的Git管理扩展,以后也会写一篇,以下只讲工作流程,不讲操作细节。

在VSCode的Source Control(Ctrl+Shift+G)窗口,可以初始化库(指程序员的代码库,编辑可以理解为一个文件夹),可以把每一次改动暂存或加标签提交,还可以清晰地看到每一次、每一处改动的痕迹。

逐一替换兼审核有陷阱#

逐一替换,并且每替换一处都审核一遍是不是简单可靠?不是的。你在按动确认按钮的过程中,如果大多数都是正确,那么你的手就会越来越快,眼睛越来越放松,错误溜走是很正常的,甚至看了一部分之后就换成了“全部替换”按钮。这是人之常情。

先复制所有预备替换内容到新文件审核,可以避免一些低级错误#

在效率工具中,批量转换通常可以分成批量查找 + 批量替换两步。先批量查找,复制所有查找到的内容,粘贴到一个新文件中检查,能快速验证查找模式是否正确。

其一,确保每一处转换都有记录,有审核,可回溯#

纸张工作流通过改稿、核红、存档等保证可核对可回溯。电子稿怎么办?

评论