李秋实汇报完毕,转身正要离去,却被宋词叫住。
“李工,我对混元大模型的研发定位,一直是科研专用AI,要求它能辅助各大实验室、项目组开展技术研发。
你这开发方向,有点偏了吧?”
李秋实脚步一顿,转过身来,脸上闪过一丝懊恼:
“抱歉宋董,是我没讲清前因后果,更不该提用模型赚快钱的浑话,是我失了分寸。”
他迎着宋词的目光,神色坦然:“但我必须向您汇报清楚。
从2006年启动研发AI以来,整整8年,我们从来没有把模型往炒股方向做过一次优化。
始终按您的要求,把混元AI模型打磨为最强科研辅助工具。
这次测试,只是一次极限压力测试,目的是验证混元AI模型到底是不是成型了。
而最终测试数据,只证明一件事——混元AI模型的底层核心能力,已经完全跑通了。”
宋词闻言,眼神骤然发亮,语气里带着压抑不住的期待:
“李工,你的意思是,混元大模型正式诞生了?”
李秋实点头:“理论上是的,但还需要最后一次全参数、全量、闭环训练。”
宋词当即拍板:“既然条件成熟,那就赶紧训练。
把所有科研项目的目标函数、架构约束、芯片、自动驾驶等任务,全部放进去一起训练。
彻底把混元从能用的AI,锤炼成真正的科研专用大模型。”
“一切前置工作都已准备就绪,只要您授权,随时可以开始训练。”
李秋实顿了顿,面露犹疑,“宋董,全量训练的功耗,会比平时推理高几十倍。
东海AI、云计算、大数据三大研发中心的超算节点会瞬间拉满,电力……可能会超出控制。”
宋词语气平淡:“电力不是问题,问题是模型必须成。出任何状况,我来负责。”
说完,他重新低头批复文件,钢笔尖在纸面上沙沙作响。
一份文件签完,抬头见李秋实还站在原地,一副欲言又止的模样,便搁下笔:“还有事?有话直说便是。”
李秋实斟酌着开口:“宋董,混元AI模型迭代进化,依赖海量、高质量、多样性的训练数据。
想要它快速成长为科研专用AI模型,我建议集团启动5G研发。”
“你先坐。”宋词神色凝重起来,“说说你的理由。”
李秋实落座,详细阐述道:“5G研发产生的数据,不是普通的互联网文本,而是高价值、高密度、高专业性的技术数据。
这些数据对混元AI模型的技术智商提升,比100亿条微博评论更有价值。”
见他嘴唇有些发干,宋词起身倒了杯茶,亲自端到他面前:“先喝口茶,慢慢说。”
李秋实双手接过,心里一热,连声道谢。
李秋实轻啜一口,润了润喉咙,声音也沉稳几分:“未来,5G网络本身就是AI的基础设施。
研发5G的真实场景,可以让AI跳出实验室,学会处理复杂问题。”
他越说越是振奋:“宋董,5G和芯片一样,与AI模型是双向共生关系,可以实现飞轮效应。
芯片、5G研发的每一次试错、每一次验证、每一次成功,都在给模型喂入最顶级的训练素材。
让它快速成长为懂底层工程逻辑、懂物理规律、能做原创科研的超级大脑。
同时AI模型进化,又会加速芯片和5G研发进度。
循环往复,最终形成一个竞争对手无法复制、无法超越的正向飞轮。”
宋词陷入沉思,已然明白李秋实的意思。
混元模型给5G研发提效→研发产生独家高质量数据→数据反哺模型训练,实现垂直能力指数级跃升
→能力更强的模型进一步加速研发→产生更多、更高质量的独家数据→模型再次进化
飞轮的本质,是把腾达的硬核研发过程,变成混元模型的专属成长训练营。
但他心中仍有顾虑,5G是通信技术最前沿的领域,腾达并无任何技术储备。
他蹙起眉头:“李工,公司没有成熟的通信技术储备,想进行5G研发,恐怕不是一时半会儿就能落地的。”
李秋实立刻接话:“宋董,腾达虽然是一家互联网公司,但实时通信、网络传输、无线连接这些岗位。
早就储备了大量通信工程、电子信息背景的人才,完全可以快速转岗到5G研发。”
宋词颔首,沉吟片刻:“既然如此,为了混元大模型快速迭代进化,我个人支持公司进行5G研发。
但兹事体大,需要集团战略委员会与技术委员会充分论证后,才能决定。你先去安排模型训练吧。”
“好的,我这就去安排,马上开始。”李秋实起身,步伐轻快地朝门外走去。
......
5月23日下午13:30
东海张江科创园腾达AI研发中心。
整层楼安静得能听见空调管道的低频共振,工程师们屏息凝神盯着屏幕,指尖悬在键盘上方,严阵以待。
千里之外的北平,李秋实的声音透过专线传来,在空旷的机房回荡:
“启动——混元大模型,第一次全参数训练。”
话音未落,超算机房骤然启动。
天问1号、天问2号,连同三大研发中心超算集群,全功率开启。
上万块AI加速卡同时上电,数千台服务器核心频率瞬间拉满。
矩阵计算、梯度回传、权重更新。
亿级参数在同一秒开始迭代。
风冷系统疯狂嘶吼,像整栋楼底下停了台喷气发动机,金属风道的震颤从地板蔓延,震得桌面的水杯泛起细密涟漪。
研发中心电力负荷曲线,直接飙升至峰值。
距离大厦500米到2公里范围内,园区内巨变骤然降临。
写字楼灯光忽明忽暗,办公室日光灯发出轻微的嗡鸣声。
电脑屏幕集体暗了一瞬,又很快恢复。
几栋老办公楼灯连闪三下,走廊里有人疑惑地“哎”了一声。
园区企业员工纷纷抬头,面露慌乱:
“怎么回事?电压不稳?”
“张江也会停电?”
“刚才那一下,我还以为要跳闸了。”
没有人知道,这不是电力故障,而是一台跨时代的AI大模型,在疯狂吞噬电力。
张江园区物业总控室,电力大屏上原本平稳的负荷曲线,突然化为一根直线垂直冲天。
运维主管手里的保温杯差点脱手,盯着屏幕脸色煞白:“负荷……1分钟暴涨18.6兆瓦?怎么可能?”