VR 技术说白了就是个把现实世界强行塞进眼的魔法,核心逻辑就是“透过屏幕看那会儿”。 别管那些“头戴设备”要么“全向追踪”这种高大上名词,到本质上来讲,就是算出你眼球该往哪儿看,然后把对应位置的视频画面踢过来。

这就好比你在自家阳台种菜,手里拿着手机,手机通过算法算出你要看哪个菜,瞬间就从云端的服务器里抽出一块屏幕给你。手机是手持设备,但原理彻底一样,只是地盘大了,你得多在阳台多转几圈,还要把传感器卡得严严实实,哪儿有哪儿看。 最搞怪的就是那个“头显”,你没见过那种眼镜吧,里面全是复杂的镜片和光学结构。

实际上那是把现实世界的图像“折叠”了塞进去。现实世界有前后左右,眼镜里只有实像和虚像,如何把两个体积不到一厘米的物体在眼球里合成到同一个视野范围?别扯那些复杂的工程模型,好办说就是利用透镜的折射率,把远处的房子搬到眼前,近处的玩具放大几倍,最终拼凑成你肉眼能接纳的景深。眼科医生都见过这种“戴眼镜看世界”的把戏,原理跟 VR 是一模一样的,只不过眼镜是固定不动的,而 VR 得跟着头转。 你看那些 VR 眼镜,里面那层像近视老花一样的镜片,实际上是把远处的景物“拉近”了。出于眼镜上面对焦,故此远处的景物红线会散开成一个个小圆点。VR 眼镜不这样,它通过算法把焦点死死锁定在眼球中心那一点。就像你戴着一副特制眼镜看手机,手机离你只有几厘米,但外界的光线还是射向你的瞳孔,故此周围的世界还是不清楚的。 光流算法就是 VR 的眼。它不是靠摄像头拍的照片,而是靠把左右眼视角的像素点拼在一起。

比如左眼看到的是“苹果”,右眼看到的是“西瓜”,大脑会自动判断这两块像素在空间里距离多近,便把苹果西瓜的图像合成到场面上。 这背后有个庞大的计算量。目前一台一般/平平 Intel i9 的电脑,每秒能跑五千万次运算,而 VR 渲染需求的是每秒一亿次。光把几亿个像素点传到你的视网膜,每微秒传一次,就得排队坐三小时车。

故此目前的 VR 眼镜,屏幕和镜头得做得极小,像素密度极高,否则信息量大到根本跑不过时光速。 大量人认定 VR 是“画图”,实际上那是把现实画成“视频”了。电脑里存的是真世界的几何数据,比如墙壁是 2 米宽,桌子是 4 米高。

这些数字并不直接变成像素,而是告诉渲染器:“这里要出墙,那里要亮一点,那个角度要不清楚”。渲染器拿到这些指令,再根据你脑袋的坐标,把这些数字转化成视频画面。 VR 的“世界”实际上是个虚拟的矩阵。黑客帝国里的“矩阵”不是屏幕,而是你眼前那亿万像素构成的物理空间。你能够在这里步行、抓东西、就连和机器人对话,但它不归于物理世界,只归于你的视网膜。当你摘下头显,世界恢复了原样,出于你没看到啥,故此世界依然是你熟悉的物理世界。而 VR 世界里的人,你看不见他们,他们自然也不会知道你。 有时候你会想,这跟电影有啥区别?电影是二维平面,VR 是三维空间。电影里看屏幕,VR 里看“物体”。电影里的墙壁是虚的,VR 里的墙壁是实体的,你能摸到墙的纹理,能碰到墙上的灰尘。电影是用声波多普勒效应让声音“来”的,VR 是用光线“去”的。 故此,VR 技术底层没别的,就是一场视错觉的狂欢。它利用人类大脑喜爱把图像拼凑成熟悉的场景的特性,强行把物理世界的三维信息塞进二维屏幕的缝隙里。

只要人类的大脑还愿意信任,虚拟现实就一辈子存有。