注意,不是修改和优化。是从底层模型开始完完整整地重写。
老李在讲解技术对接时提到过,他们目前的核心瓶颈在于ICA和CSP这类经典算法无法处理非平稳信号。
而王贺此刻在屏幕上构建的,是一个完全不同的数学框架。他在一个所有工程师都看不太懂但又觉得似曾相识的数学架构上,搭建了一套全新的空间拓扑滤波器。
该滤波器的核心逻辑是。将微电极阵列上六万零四百个采样通道所捕获的全部脑电数据视为一个统一的高维流形。也就是把整个大脑皮层的电活动看作一个高维空间中的几何曲面。每一个时间点上的六万多个电极数据,组成了这个曲面上的一个点。
当大脑的神经元在正常放电时,这些点会沿着流形上某些特定的低维子空间运动,形成稳定的轨迹。而当肌电伪迹或运动噪声介入时,这些点会被扰动到流形之外的位置,偏离正常轨迹。王贺的算法所做的事情,就是利用持久同调来识别这些轨迹的拓扑不变量。
然后以此为标尺,将所有偏离正常拓扑结构的数据点自动判定为噪声,进行精确剥离。这种方法的妙处在于拓扑不变量与信号的幅度和频率无关,只与形状有关。所以无论脑电信号如何非平稳地跳变,只要大脑神经元的底层放电模式保持着同样的拓扑结构,滤波器就能将其和噪声区分开来。
就算看不懂上面叽里咕噜说的什么,也能用一个更直接的方式来描述,
简单来说,就是王贺在数分钟内,
彻彻底底地将他们的技术迭代翻新了一遍,而且做得比他们更优秀。
老李额头上已经沁出了细密的汗珠。
他是搞神经信号处理的博士,不是搞纯数学的。但他对拓扑数据分析这个前沿交叉领域并非完全陌生。
早在两年前,就有几篇顶刊论文提出过利用持久同调来分析神经元集群放电模式的理论可能性。
但那些论文全部停留在理论层面。因为持久同调的计算复杂度极高。对一个包含六万个采样通道的高维数据集进行实时的拓扑不变量提取,所需的算力是天文数字。
普通的工作站跑一帧数据大概需要几十分钟。而脑机接口要求的是毫秒级的实时响应。
所以那些论文的结论无一例外地写着“受限于当前算力瓶颈,该方法暂无工程化可能”。
但王贺,当着他的面,轻松把这个问题给解决了。
此时,代码仍在持续输入。
王贺在完成了拓扑滤波器的核心数学模型后,开始编写并行化的分布式执行框架。
这一段的代码量很大,
涉及大量的MPI进程通信和负载均衡调度逻辑。
但王贺的编写速度丝毫没有放慢。
他对六万颗核心的调度策略非常考究,
不像普通人一样去暴力穷举,压榨算力。
王贺对于这台超算的用法,可以说极其讲究,没有一颗核心是闲置的,也没有一颗核心被过载的。
此时。
周明辉就站在王贺身后不到两米的地方。
他的视线没放在代码上。
因为他虽然懂技术,但不可能像老李那样去实时理解每一行代码的含义。
他在观察的是老李和那群工程师的表情。
周明辉看到,老李的嘴巴从三分钟前开始就没有合拢过。一旁眼镜工程师的手指无意识地抓着自己的头发,另外几名工程师的身体也不由自主地前倾。
看着超算的状态,周明辉逐渐明白了,
王贺的确在昨晚一个人,将整台超级计算机从头到尾跑了个遍。
而且不是乱跑。
稀里糊涂榨干超算的算力,其实并不是难事,
就像你随便下载个木马病毒,也能把家用电脑搞坏。
但王贺昨晚对这台超算的使用,是一种接近极限的满载驱动。
何为极限满载?
通俗来讲就是精准卡在了超算硬件性能的天花板上。再往上多分配哪怕百分之零点零几的算力,就有可能触发热保护机制导致节点宕机。
就像是拉力赛车的车手一样,每一个优秀的车手都会将赛车的性能发挥到极致,多踩一丝油门,就会翻车,少踩一丝油门,成绩就会掉出榜单。
而王贺,精确地将负载控制在了红线以下零点零三个百分点的位置。没有造成任何硬件损伤。
这种操作水平,堪称是对超算硬件从物理层到通信层到调度层的全方位理解的结果。
想到这,周明辉的手微微颤了一下。
他深深地呼了一口气。