不该「以貌取人」,但可以「以封面取书」!

2020-06-14 浏览量:822

不该「以貌取人」,但可以「以封面取书」!

我们都知道不该「以貌取人」,当然,我们也不该只因封面设计就以为自己明白书籍的内容。

话虽如此,但还是有人尝试这幺做──而且还是严肃的科学研究机构!

根据麻省理工学院(MIT)自家的新闻平台报导,麻省理工媒体实验室(MIT Media Lab)最近和乔治亚理工学院(Georgia Tech)合作,发展出一种计算机成像(Computational photography)摄影机,能够在不翻开书的状态下就侦测到书中内容,完全做到以貌取人,呃,以封面取书的「表面工夫」!

这项研究论文发表在最新一期的《Nature Communications》杂誌上,它运用辐射及光谱分析透视纸张,先以介于微波和红外线之间的兆赫兹(terahertz)辐射测量书页间的距离,再透过书页反射回来的辐射数值判断每个面积单位中的油墨状态,最后用字迹辨识演算技术将这些状态碎片像拼图一样,拼凑成字。

话说回来,科学机构做这种研究要干嘛?

虽然兆赫兹射线仍是一种很年轻的技术,但MIT的测量法已经可以辨识九层写有单一字母的纸张了。并且,由于兆赫兹射线的能量比其他电磁波低,比较不会对测量目标造成损伤,是用于测量容易损坏物品的强大工具。举例而言,以往最常用来透视的X光只能观测到关于每张纸的状况,而无法提供我们书本的内容;但MIT的兆赫兹测量技术,能让研究者在不碰触到书本的状态下辨识出每一页上的文字,降低研究过程本身对古籍和珍本书可能造成的破坏,并获得解析度较佳的测量结果。

该篇论文的通讯作者海胥玛(Barmak Heshmat)表示,纽约大都会艺术博物馆(The Metropolitan Museum of Art)对这项技术未来的发展很有兴趣,打算将它应用在一些可能因为年代已久而完全禁不起触碰的古书上。

这套观测技术利用兆赫兹射线的部份之外,还要加上乔治亚理工学院开发出的字迹辨识演算法才能真正组合出可阅读的文字内容。但是,想像一下数十甚至数百个字母重叠后的杂乱痕迹,真有办法将它们一个一个分离开来吗?事实上,根据海胥玛表示,这套字迹演算法的準确度甚至足以通过目前大多数网站用来分辨真人和机器程式的验证码测试(CAPTCHA)。

想像一下这样的画面:也许,当MIT的技术发展成熟,能够从任何厚度的书中提取清楚的内容文稿和画面,未来的我们就能在VR或AR的环境中,毫无顾虑地读着《死海古卷》、初版《坎特伯雷故事集》或是乔治R.R.马汀的《群鸦盛宴》手稿。

而且我们只要盯着封面就好。

Popsci、Scienmag、MIT

相关文章