iOS 上的 OCR 软件 TextGrabber

就在我写完上一篇关于读书笔记的 Blog 之后,我迅速而及时地发现了一款 OCR 大厂的产品。

昨天我闲来无事在 App Store 里闲逛,忽然发现了 ABBYY (中文名叫做“泰比”,有兴趣可以访问 abbyy.cn )的名字,它不久前(6月2日)推出了一款名为“ABBYY TextGrabber”的软件。跟中国的汉王一样,这家总部位于莫斯科的公司拳头产品就是光学识别(OCR, Optical Character Recognition)技术。ABBYY 最有名的产品莫过于 FineReader 系列,多家海外杂志给了高分推荐。

OCR in Progress
TextGrabber正在识别

由于是海外厂商,所以我不知道是否支持中文。抱着试一试的心态,我冲进去看了看。发现这 20MB 的小软件竟然支持60余种语言,而且包括简体中文与正体中文。有了 ABBYY 这个金字招牌做保证,又明目张胆地宣称支持中文,我毫不犹豫地买下了 TextGrabber,1.99美元。

从软件的名字来看,这是一款定位于“阅读分享”的软件。读书看报的时候,遇到有趣的东西无需传照片,直接识别成可编辑的文字。这样做一来可以节省手机流量,二来可以为传播提供方便。虽然俗话说“有图有真相”,但文字总比图片更方便。

与常见的光学识别软件一样,它需要一个较为明亮的光线环境。好在 iPhone 4 有闪光灯,在外部光源不足的情况下可以使用。此外,不仅可以拍照识别,还可以识别已有的照片或截屏图片。当然,我觉得天下所有的 OCR 对于印刷文字的识别是最好的,手写体就不奢望了。

为了测试效果,我打印了一段十分应景的文字。拍出的照片如下,从上到下分别是简体中文、正体中文、英文和法文。为了验证它对手写体的识别效果,我写了一行简体中文在最末尾。请留意我们这里只讨论技术,请忽视文字本身所包含的意义。

OCR Test
我打印了四行字,并手抄了一行在末尾

识别的结果还算 OK,至少比声龙听写要好很多。标点符号不用重新校对,基本上是正确的。多语种混排的识别效果还不错,在设置里面增加语种就可以。相对于声龙听写来说,这款软件所需要的后期处理时间要少很多,而且无需联网。但是,它几乎不能识别手写体。虽然我的字很丑,但十六个汉字只识别出三个,实在是太失败了。

OCR Results
TextGrabber的识别结果

识别出文字之后,你可以通过 Email 来分享,或者是放到剪贴板里去。也许是刚刚推出,所以我没看到任何社交网站分享,估计得等到下一版更新的时候才能做进去。但支持剪贴板已经足够了,未来我在做阅读分享的时候会更方便。

综上所述,ABBYY TextGrabber 是一款很不错的OCR软件。它可以满足“阅读分享”的需求,也可以实现印刷文字数码化需求。加上价格亲民,推荐各位购买。

ps
幸亏声龙听写是免费软件,不然让大家破费多不好意思:)

注:这篇文章是为 AppsKu 的投稿,原文已于6月22日发布

One Reply to “iOS 上的 OCR 软件 TextGrabber”

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.