走在京海交大的林荫校道上,吴淡回想着刚才和周志云的过招。
吴淡这老登嘴角压都压不下来。
其实,给晨星实验室留一层楼的方案,早就在李所筹建组的规划会议上讨论过了。
今天借着周志云施压的契机抛出来,反而更凸显了李所的真诚和实在,完美实现了既定事实的利益最大化,有望把岑言牢牢地绑定在了李所的战车上。
志云啊志云,你还是嫩了点。
要不怎么你是副院长,我是副校长呢?
吴淡暗自得意。
而在晨星实验室的休息区里。
周志云靠在沙发上,端起刚才没喝完的茶水,虽然茶水都凉了,但他也没在意,依旧笑嘻嘻地看向岑言。
“怎么样?我这招激将法管用吧?”
周志云满脸得意,眼角皱纹都舒展了,就像是照到太阳的向日葵,菊花朵朵开。
他今天这番话全是提前准备好的。
临港新城的规划方案确实在筹备推进,张江用来过渡的地块也是事实,他早就在微信和岑言沟通过了。
这种事情怎么可能不实时沟通?
但他就是要在吴淡的面前故意抛出来,给他制造危机感。
“老吴这人我了解,他搞行政出身的,最讲究平衡,不逼他一把,李所那些好地方他肯定要藏着掖着,大概率就只给半层。”
周志云笑着邀功,放下茶杯。
“现在好了,一整层楼,三千两百平,国家重点实验室的底子算是完全打牢了。”
岑言看着老周那得意的模样,也跟着笑出声,顺手拿起桌上茶壶给老周添了点茶。
“那可多亏伯父神机妙算,这波配合,我们打得可是天衣无缝。”
吴淡以为自己用现成的规划赚了人情,锁死了晨星实验室。
周志云以为自己用激将法逼出了李所的底牌,帮岑言谋了福利,巩固了合作关系。
他们两个老狐狸都觉得自己赢了。
但实际上呢?
还是那句话。
三赢!
等于岑言赢三次。
周志云在晨星实验室又坐了一阵,现在倒是压力没那么紧迫了。
一切都是往好的方向发展。
对于他来说,最重要的是,这一次动用了他几乎所有的人脉。
也算得上是一场豪赌。
可机会放在眼前,像他这样宁愿从国外回来的一流学者,又怎么会放弃这种能让自己名留青史的机会?
更巧的是。
其实京海市政府也在关注这个方向,也算是一拍即合。
不过好处都落到岑言头上了。
现在。
场地有了。
算力有了。
人才也有了。
现在的底牌,厚得让人安心。
岑言舒舒服服地坐回工位,熟练地打开那个只有四个人的匿名交流群。
群里的未读消息已经攒了上百条。
利昂和卢卡斯正就着一个前向传播的节点优化问题吵得不可开交。
利昂主张用底层的C语言算子直接重写内存分配逻辑,卢卡斯则坚持要在数学模型上降维,以此减少计算步骤。
这两个人完全把对方当成了假想敌,谁也不肯在技术思路上退让半步。
往小了说,是技术之争。
往大了说,是资格之争。
在这种角斗场里,就看谁能肘赢谁。
岑言看着满屏的英文代码片段和数学推导公式,强势地介入了讨论。
“两位,停一下。”
“多头注意力机制的内存优化方案,现在开始进行阶段性验收。”
岑言手速飞快,利昂和卢卡斯还没反应过来。
“大家的时间都很宝贵,这次能拿出最优工程化落地方案的人,我将直接为他提供新算力集群的架构工程师入职优先权。”
“算力中心第一批百张GPU算力矩阵马上就位,谁先当上架构师,谁就能优先参与到我们新架构的核心开发里。”
“我将会提供完整的开发链路,你和我将会成为最先创造历史的先驱!”
听起来很嘉豪。
但这种话得看从谁嘴里说出来。
岑言的水平,他们有共同见证过,包括这段时间他们的讨论,岑言时不时地参与两句,可那两句往往就是破题的关键。
试问一句,别说计算机了,只要是搞科研的,谁不喜欢和那种能够随时随地给你来两句简单粗暴的指点迷津?
这条消息发出去,他们安静了两分钟。
他们俩来加这个群的目的是什么?
不就是为了这个吗?
原本还对于岑言的安排有所纠结的利昂和卢卡斯瞬间就被点燃了热情。
利昂在那头直接发了一个干劲十足的表情包。
卢卡斯则回了一句收到。
随后两人双双陷入隐身状态。
岑言太清楚这帮技术狂人的秉性,这两人今晚绝对要熬个大夜,把压箱底的技术全掏出来。
至于他自己呢?
那肯定是先美美的睡上一觉啊。
第二天清晨。
岑言端着一杯热牛奶坐到电脑前。
果不其然,邮箱里躺着两份极其详尽的优化方案。
利昂把动态遮罩机制和底层显存管理做到了极致,代码干净利落,运行效率极高。
卢卡斯用的是矩阵拆分法,把原本庞大的注意力权重矩阵拆解计算,从理论根源上避免了内存溢出的风险。
岑言喝了口牛奶,把两份方案同时下载到本地。
你真以为我会在里面二选一?
小孩子才做决定,大人从来不做选择,我全都要!
最近这一段时间的深入研究。
也让岑言更加清楚,如何将不同的优势融会贯通。
眼前这两份方案就是最好的例子。
岑言信心满满的动起手来,他把卢卡斯的矩阵拆分算法作为核心理论层,套进利昂写好的高效率底层算子中。
两者的结合得堪称完美。
原本容易在长文本训练时导致显存爆炸的痛点,被这套组合拳轻松化解。
前馈网络层、残差连接、层归一化机制,这些组件被岑言熟练地拼装在一起。
不过本质上也是因为利昂和卢卡斯本身就是后来合作的同事。
这样的思路并非无迹可循。
甚至本身在岑言的记忆图书馆里,就有相关的记录和方案路线。
只不过他现在不再那么依赖照搬。
而是在里面增加了自己有限的理解。
增加理解这种事,不是随便加的。
戏说不是胡说,增加不是乱加。
是要切切实实地建立于对这个项目的理解,来扩展的方向。
岑言早就不是那个只会Ctrl C加V的选手,他也在这种过程中快速进化。
等到中午十二点。
他敲下最后一行回车键。
Transformer架构的基础工程化模块,over。
这套代码现在虽然还只是个没有喂过任何数据的基础骨架,但它的底层逻辑已经可以基本跑通。
按照原本的历史轨迹,谷歌团队要摸索出这套相对完整的基础工程框架,至少还需要大半年的时间。
岑言以两肩为支点,把背紧紧地抵在椅子上,长吐出一口浊气。
基础架构的研发进度比他预期的计划提前了很久。
甚至两位工程师人都还没来,就完成了。
按照这种工作量的计算。
他们俩可能现在根本就没干谷歌那边的活,那也算是谷歌的薪水小偷了。
用谷歌的钱,养我的人。
嘿嘿嘿。
岑言忍不住笑了。
接下来,只要等算力集群一搭建完毕,马上就能启动基础并行训练。
之后再逐步进行架构优化。
胜利简直唾手可得。
下午两点。
周志云又来晨星实验室溜达了。
不过他此时满面红光,走到岑言桌前,把自己带来的文件袋拍在桌面上。
“搞定了。”
岑言眨了眨眼,抽出文件看了眼。
这是京海交大和李政道研究所的场地共建协议。
文件上明确标注,李所南楼扩建的一整层三千两百平米空间,将作为晨星实验室的专属科研基地。
“吴淡办事效率挺高,今天上午刚开完专项会议,下午就把协议弄出来了。”
周志云笑嘻嘻的。
他现在过来可不是算力集群的事,而是沃德科技的事。
没有任何意外,本身晨星实验室,他们就做的挺好的。