有道词典笔2.0之童书实测
Summary: 有道词典笔2.0版在童书上的实测,即主要针对学龄前儿童使用情景。本文会不断更新。
2020-07-28更新:
后来系统软件更新了,功能又有些提升,主要是:
- 整段可识别(把各行连在一起);
- 竖排文字可识别;
- 在原文朗读基础上增加了译文朗读;
- 语音效果大有改善;
- 可以连接蓝牙耳机;
- 增加了一些专业词典。
现在又出了新版(硬件),我没有用过。
2019-11-25原文
三四天前,一位邻居妈妈来家里,带了一支点读笔,让我帮更新。这种点读笔是配合几套英语阅读入门书使用的。笔是三四百块钱一支,书是特殊印刷的,比普通书要贵不少,而且品种有限,有些书的品质看起来还相当可疑。
我以前编小学语文教材,十多年前就有商家跟我们合作,做点读版的,所以对点读笔不算陌生。从家长、孩子的角度看,点读笔的主要问题就是太贵,一支笔配几套书甚至只配一套书,就要三四百甚至七八百块钱。从我个人的偏见讲,这种不能通用、功能单一、设计往往非常粗糙甚至丑陋、看似附件的东西,却比主件——图书贵那么多,实在不能接受。
想起来,最近看到关注了很久的有道词典笔出了2.0版,于是看了看些网上的评论,就给孩子买了一件。孩子最近爱认字,可能用得着。
基本信息#
简单的盒子
里面三件东西
我买的是黑色款,看起来屏幕与外壳连成一片了。
说明书有些正文太浅了,想搞格调,让有点老花的想爸眼睛吃不消。
主机背面如下:
英文童书实测#
关于以下实测:
- 每处至少扫描三次,有错时多试几次。
- 尽可能以句子为单位扫描。15日升级到1.1.0版系统(大约是9日发布的)后,可以多行扫描了。新版还增加了5种常见英美考试的专用词典/词表。
英文童书,我选的是兰登书屋的step into reading套书step 3组中的一本,Johnny Appleseed。
封面#
封面往往字体多,底色、底图复杂,对OCR识别能力有较高的考验。为说明方便,要识别的部分都已标号。
各部分识别情况是:
- 全部正确;
- 全部正确,文字排列成圆弧形和背景图案不影响识别,翻译为“独自阅读”;
- 四次正确一次,前三次分别识别“CTEDINTO READIN5”"STEPINTO READING""STFPINTO READING",第四次正确,翻译为“进入阅读”。实际观察到,正在识别时的结果往往是正确的,包括字母和空格,错误是后期自动调整造成的。可能是因为一句中间的INTO字号小,这种情况比较少见,导致人工智能识别的错误。
- 标题高度超过扫描口的宽度,无法识别。
- 副标题高度有点点超高,如果扫描时小心调整笔的走向,可以正确识别;否则两个y可能识别为u或g。
- 全部识别正确,但翻译完全混乱,显然是无法把中圆点“·”处理成句子分隔符号,勉强解释成一句话,所以造成错误。如果分成前后两句扫描,第一句误译为“……说过”“正如……所说”,第二句有一半几率译为“由……绘制”,一半误译为“由……解释”。可见在语境不全的情况下,不能处理词语的特殊用法。
正文#
这一页文字下有简单的底色、背景图。
所有行连续扫描三遍:
- 文字识别方面,只有一次“coming”误作“comino”,其余全部正确。
-
翻译方面,因始终无法把“Will”处理成人名(但单扫“Will”能正确处理),人工智能引擎勉强调整前后的字词,用力过猛,导致莫名其妙的脱漏问题:
有一个“有人来了!”贝思(喊/叫)道。那是一个精廋结实的男人,迈着(轻快/矫健)的步伐,(“妈妈!爸爸!”“哭”约翰尼!/“妈妈!爸爸!”“哭了。”/“哭。”约翰尼!)是约翰尼·苹果籽!
单扫一个单词时,识别往往是正确的,但对于孩子来说,显然在义项选择上困难,比如:
- 单扫lean,释义为:v. 倾斜;倚靠;向一侧歪斜 n. (肉)瘦的,无脂肪的
- 单扫wiry,释义为:adj. 金属线制的;金属丝般的;坚硬的;瘦长结实的;(噪音)尖细的
而整句识别时就没有这个问题,比如“It was a lean, wiry man”这一句,能正确翻译为“那是一个精廋结实的男人”,且相当典雅。根据语境使用词语的恰当义项,是整句翻译的意义所在。
目前译文不能朗读,对一二年级以前还不怎么识字的孩子来说不方便。
汉字童书实测#
《兔先生的巧克力工厂》是一本很有趣的公民教育绘本,讲斗争与妥协的宪政常识,英国的埃利斯·多兰著,由我译成汉语。
封面#
- 全部正确。
- 有一次多出一个数字:“巧5克力蛋……”。
- 全部正确识别,但“著”始终误读为“zhe”,大概因语境不完整,随便选了个音凑数。
- 字体略超高,“更多”二字无法识别,“假期”二字全部正确。
- “美术”二字,分别识别为“实研、美闭、美师”,其余全部正确。
斗争页#
- 略有底色干扰,全部正确。
- 手写体,反白,正确率约25%。
- 手写体,有底色干扰,正确率约30%。
- 全部识别正确,“干”全部误读为gan1。
- 全部识别正确。
- 正确率约36%。字体同第4处,可见常见正文字号要比大字更容易识别。
妥协页#
所有各处全部正确。本页都是小字,虽有三种字体,都没有干扰。
第7处的儿化音——“小人儿”读音也正确。
其他功能测试#
WiFi联网#
- 语音助手需要联网才能用;
- 多句扫描时,如果没有联网,似乎只是一句一句地独立翻译,因为可以观察到每句之间是分行的,而且同一个词,比如“trunk”,上句翻译成“箱子”,但下句却译作“树干”;如果联网,似乎改用云端翻译,没有上面说到的情况,质量更高。
语音助手#
实际上是特定资料库中的语音搜索,不过设定了一些关键词与特定使用场景关联在一起。整体上讲,还不是太成熟。
- 汉语查汉语
- 汉语单字输入困难
- 念汉语单字
- 有些音节常常和英文字母、单词搞混;
- 即使识别为汉字,也会自动选定一个字,而不是把同音字都列出来供选择。所以给出的字往往不是你要的。
- 念部件拼汉字。常见字没问题,比如“三个人”“一个宝盖头,一字子”“一个石一个开”,但很多不行,所以并不实用。
- 念汉语单字
- 念汉语多音节词语、百科词语、诗句。比较准确。只是临时组成的词语不能处理。
- 念汉语词语“…同义词/近义词/反义词”,准确。
- 汉语单字输入困难
- 汉语查英语
- 念汉语句子译英,如“我想吃点饭,英语怎么说”“欢迎来到土豆城,英语怎么说”,准确,译文只朗读一次,不能复听、点开。
- 念汉语词语译英,如“蚊子的英文”“天地的英文”,准确,智能,但查到的词条不能朗读,不能点开查看详情。
- 英语查汉语
- 念英语句子译汉,直接说就可以,准确。
- 念英语单词、字母拼写单词,对用户的发音准确性有要求,感觉准确率还算可以;但不时出错也够烦人的。
- 念英语词形变化,如“do,变化”“make,变化”,准确。
- 其他
- 念常见数学运算,如“5加8等于”“2的平方根等于”,准确。
上面的提问格式是优化过的。界面上提供的提问格式比较复杂,容易出错;也不全。
手写识别#
手写中英文,只要连笔少一些,识别准确率挺高。在语音输入还不大成熟的时候,手写识别虽然慢点,但用处很大。
历史记录/收藏夹#
- 历史记录和收藏夹里的条目不能再整句朗读,大概是个bug。
- 这些数据也不能导出,屏幕又比较小,所以不大好利用。
音频技术质量问题#
- 通过自带的扬声器播放
会听到一点噪音,但影响不大;TTS语音有些舌头不直也可以理解。
- 外接耳机播放
机器的Type-C口可以插耳机。但用耳机听的时候,不管是人声还是TTS声,高频噪音都特别大,长时间用无法忍受。 我猜是硬件问题,如果是这样,后续无法通过软件改进。这一点对于在教室、图书馆中使用,影响很大。
- 蓝牙耳机
早几天(2019-11-21)软件升级到1.2.2后,发现蓝牙耳机可以用了(官方说法是从1.1.0开始支持)。效果跟外放基本一致,但还有个问题:开头的一个字半个字的发音听不见。
竖排汉字#
软件升级到1.2.2后支持竖排汉字扫描。
改进建议#
- 强烈建议增加软键盘输入中英文,以便查词典的功能!这么简单的功能没有,是故意的吗?
- 英语句子的中文译文要能够朗读,方便小学一二年级以前还不怎么识字的孩子。
- 汉语单字的语音输入,可选择增加:
- 以词句定字,如“‘学习’的‘习’”;
- 念笔画(横竖撇点折5种)输入,或软键盘输入;
- 输入词语、句子后可以选其中一个字查询;
- 念一个音节后,列出同音字候选;
- 针对中小学语文学习进行优化:
- 字体:小学低段识字、写字都要用楷体;
- 专门优化古诗文和字词学习的辅助内容:初中以前的教材只有一套,内容稳定,完全可以基于教材做出深度的辅助内容,比如请名家把所有古诗朗读一遍;
- 收藏夹应增加复习功能,比如可以按熟悉程度评分、自动安排复习日程、自动连续播放等;增加用户数据导出功能;
- 语音助手中针对特定使用场景的提问格式,应当做成明确、稳定、简洁的“快捷表达式”,而不是完整的句子,让人费心思去猜。
音频技术质量问题能通过软件升级改进吗?如果能,那就太好啦!(见上面的更新)
目前看来,有道词典笔主要针对英语学习,而且主要针对有一定自学能力的学习者。 不过,如果能有针对性地稍加改进,对于语文学习也会很实用;并且还可以适用于年纪更小的学习者。
结论#
目前,有道词典笔2.0的主要作用有二:
其一,整句、整段地识别、朗读、翻译,语境更完整、自然,提高学习效果。#
学习语言,不管是母语还是第二语言,除了真人实境的对话,直接模仿整句、整段的自然语音,是最高效的。按理说,跟老师、家长读也不错,但是很多成人包括老师的语音都不可靠,再说父母总不能时刻在身边,跟别说带几十个孩子的老师了。
还一种方式是用磁带机、电脑、手机等播放录音,孩子跟读,可是这时没有文本和图画对照,也就是语言环境不完整,不仅效果要折扣,对于学习阅读就相当不方便;还有,不能随时按自己的需要挑着读。
有道词典笔能弥补这些不足。
其二,查字典功能。#
通常情况下,整句识别、朗读、翻译即可以代替查字典,只有想了解字词的更多细节时,才需要专门查字典。
- 查字词典最重要的是快,尽量少打断、干扰阅读,在这一点上,有道词典笔相对于纸质词典、电子词典也有很大优势。
- 另外,PC版有道词典的内容质量也很重要,是有道词典笔的基本信用保证。
- 不足之处在于,除扫描外,中英文单字的输入还有困难。
综合而言,还有以下结论:#
- 五岁孩子可以正常操作;3岁孩子,如果手劲好一点也基本能操作。
- 扫描口宽度是1cm。超高的行无法扫描。一次扫过多行时,只取中间的一行;扫描口上有中线标志,供扫描时对准。
- 能适应多种字体,对常见正文字号大小的字识别能力强,太大的字容易出错。
- 主要适用于英语学习,目前对应的汉语译文不能朗读,因此学习者大概需要有相当于小学三年以上的汉字识字量;如果不大认识汉字,则需要能大致听懂要学习的英文。
- 常用英语单词是真人语音,英语整句TTS朗读尽管算不上优秀,但大概比很多英语老师要准确;也就是说,用于语音上的模仿学习是没有问题的。
- 英语整句翻译成中文,比一般老师好也是无疑的。
- 还不认识汉字的孩子可以用来辅助读绘本、辅助识字、读练习册上的题目,但学习材料应该是句子、词语,而不是单字。
- 还有很大的改进空间(通过软件升级即可实现),如果有道动力够足、心胸宽广,那么用户还会有惊喜。