CNET科技资讯网5月6日国际报道 Google获得的一项技术专利显示,Google Book Search拥有其他数字图书馆所望尘莫及的优势。
Google针对书籍扫瞄碰上弯曲页面的矫正专利技术
Google已发明出一套系统,利用两台相机与红外线,来自动解决书页弯曲的问题。作法是为每个页面建立一个3D模型,然后再把书页弯曲翘起的部分弄平,如此一来即可在网络上呈现出平坦的页面,而且不必把整本书拆开,或摆到平台式扫描器上压平。
有了这项先进的技术,加上Google已扫描了超过700万本书,任何想要标榜自家数字图书馆的竞争对手,恐怕来不及迎头赶上。任何厂商都可雇用不需什么技术的劳工,把书摆在普通扫描器上,然后操作某种光学字符识别,又称文字识别(optical character recognition;OCR)功能,把扫描到的书页图像转换成文字资料。然而,要快速进行扫描并取得高清影像,又是另一回事。
以下是第7,508,978号专利对Google这套系统的描述:运用红外线可将此图案(pattern)显示在书本上;红外线相机拍照后,把它转化成书页的3D形状。
首先,书被放在平坦的表面,上方再以红外线投射器(infrared projector),在书页上面显示一个特别的迷宫式的图案。
接下来,两台红外线相机从不同的角度,把红外线图案给拍摄下来。
专利说明写道:这些图像(images)可用已知的立体成像技术(stereoscopic techniques)加以组合,以取得该图案的3D对应(three-dimensional mapping)。此图案落在书的表面上,使图案的3D图形与书页的3D表面互相对应。
下一步是,以传统相机拍摄的书页照片,弯曲的部分可以弄平(de-warped),这样不但可让光学字符识别起来更加容易,而且在关键字搜索结果旁呈现实际的书页时,也能展示品质更佳的图像。
用户评论