不久之前,我们写过一篇文章,讲述本·古里安大学的Mordechai博士和他的团队发明了从物理隔离的计算机中窃取信息的方法。在美国黑帽大会2020上,来自本古·里安大学的另一位研究人员Ben Nassi展示了相关主题下的另一研究成果,介绍了一种叫做Lamphone的视觉监听方法。
我们将在下文讨论Lamphone的工作原理,不过先让我们简单聊聊题外话,了解一下视觉监听的历史。
声音怎么可能被看见呢?
激光麦克风作为一种广为人知的远程录音技术,使用的正是所谓的视觉方法,这种技术原理并不复杂。
监听人员用一束红外激光(人眼不可见)照射在房间适当的物体表面上(通常是玻璃窗),激光束通过表面反射到接收装置。声波会导致物体表面振动,进而改变激光束的反射方向,接收装置记录下反射的变化并最终将其转化为会话录音。
该技术早在冷战时期就被使用过,你也许在电影中见过这种技术因为它是间谍影片的常客。一些公司专门生产可以用来激光窃听的成品设备,据他们声称,其设备的使用范围可以高达500米甚至1000米。也许有人会担心自己成为激光窃听的目标,但这里有两个条件:首先,激光麦克风非常昂贵;其次,厂商只对正规政府机构销售此类设备(至少他们声称如此)。
然而Nassi认为,激光麦克风的致命缺陷是其主动攻击特性,这种窃听方式的工作原理是使用激光束来照射物体表面,因此会被红外探测器发现。
若干年前,麻省理工大学的研究团队针对”视觉录音”提出了一种属于被动攻击的替代方法。他们的核心思想基本不变:声波使物体表面产生振动,而振动是可以被记录的。
这次研究人员使用每秒数千帧的高速摄像机来记录振动,他们可以通过视频中帧的序列在计算机上复原声音。然而这种方法也存在严重的缺陷,因为将高速摄像机中的海量视觉信息转化为声音的计算资源需求非常庞大。即便使用一台性能强悍的计算机,MIT的研究人员们仍然需要2-3小时来分析解码一段5秒的视频。因此这种方法显然不适合用来实时监听对话。
Lamphone的工作原理
Nassi和同事们提出了一种叫做Lamphone的”视觉窃听”新方法,其核心思想是获取灯泡表面由于声波产生的振动信息。看似普通的灯泡不会让人引起怀疑,而且它明亮发光,因此不需要浪费过过多计算资源来分析图片中细微的变化,监听者只需要使用一个强大的望远镜,然后将灯泡的光通量导入光电感应器即可。
灯泡向不同方向发出的光亮并不完全相同(有趣的是,不同种类灯泡的不均匀程度也不一样,白炽灯和LED灯泡的不均匀性很高,而荧光灯的不均匀性则低得多)。由于这种不均匀性,声波引起的灯泡振动会轻微改变光电感应器捕获的光通量强度,而这些变化足够明显所以可以被记录下来。在记录下变化之后,研究人员通过一些简单的转换,能够从被记录的光信息中复原出声音。
在研究人员的测试中,他们在房间内使用音响发出声音,并在距离窗口25米处的人行道上安装了接收装置,之后用一台望远镜对准了房间内的灯泡,最终成功记录下光通量的变化并转换成为录音。
研究人员发现其获得的录音文件十分清晰易识别,他们成功辨认出了正在播放的来自The Beatles和Coldplay乐队的经典歌曲,而谷歌的语音识别服务也正确地记录下了房间内播放的一段名人演讲。
Lamphone是否会造成实质性的威胁呢?
Nassi和同事们成功研发了有效的”视觉窃听”方法,更重要的是,这种方法完全属于被动攻击,因此无法被任何探测器发现。
同时请注意,与MIT研究人员提出的方法不同,Lamphone解码所需要的计算十分简单。由于不需要大量的计算资源来处理数据,Lamphone方法可以被用于实时监听。
不过Nassi也承认道,在实验中,房间内播放的声音音量很高,所以目前实验结果更多地是展示理论上的可能性。另一方面,我们不应低估用于将 “光记录”转化为声音这个方法的简单性和适用性。利用机器深度学习算法,这种技术未来也许可以得到进一步优化。
目前来说,研究人员认为将该技术用于实践并不是非常困难,但也绝非特别容易。根据他们的预测,如果有人可以运用更高级的算法将光电感应器搜集的信息转换为录音的话,这种技术可能将会变得更加实用。