顾有文坐在角落的折叠椅上,膝盖上摊着合资公司注册材料,正逐页翻看条款。他上楼之后先去听了周海的语音,又把群里的聊天记录翻了一遍,整个人还没从那组数据里缓过来。手里翻着注册材料,脑子里全是创想星球的事。
门被推开了。
许琛进来,没打招呼。
他的视线从白板上横扫过去——技术路线图,时间轴,数据指标,里程碑节点——全部扫完,用了不到五秒。
然后他径直走向实验室最大的那块白板。
那块板不完全空白。上面还残留着半幅全球化路线图的草稿,是老孟前天晚上加班时随手画的,蓝色箭头和黑色文字交错,标着各区域引擎适配的优先级排序。东亚排第一,北美第二,欧洲第三,每个区域下面挂着技术指标和人力预算。老孟为这半幅图花了一整晚,画完之后还拍了照发给林哲远确认过。
许琛拿起板架凹槽里的黑色马克笔,拔掉笔帽。
然后他抬手,一笔横划,从左到右,把整幅路线图抹了个干净。
墨迹粗重,直接盖过了所有原有内容。蓝色箭头没了。黑色文字没了。老孟花了三个小时打底的东西,一秒清空。
老孟手里的笔悬在半空。
他的头从文档上抬起来,镜片后面两只眼盯着白板。
“许琛。”
他叫了他的名字,不带“许总”的后缀。两个人共事的年头够长,这种时候不需要客套。但叫名字本身已经表达了态度——你最好给我一个解释。
许琛没回应这声叫唤。
他在白板正中央落笔。笔画压得很重,黑色墨水洇出毛边,笔尖在白板表面碾过,发出吱吱的响。
一行字。
——烛龙的核心是什么?
写完,转过身。
马克笔的笔帽朝顾有文点了一下,又朝老孟点了一下。
两个人被同时点了名。
顾有文先开口,坐直了身子:“实时渲染。”
老孟把手里的笔放下,推了推镜框:“AI图形生成。”
许琛摇头。
幅度很清楚,没有任何含糊。
顾有文和老孟对视了一眼。烛龙引擎的商业定位从第一天起就锚定在这两个关键词上。所有对外的pitch deck、融资BP、媒体通稿,写的全是这个。烛龙等于实时渲染加AI图形生成,这基本就是行业共识了。
许琛转回白板。
在第一行字的正下方,又写了一行。字号更大,笔力更重,墨迹洇出的毛边快渗到字与字的间隙里了:
——模式识别与生成算法。
他把笔帽拧上,搁回凹槽。
“烛龙能做实时渲染,能做AI图形生成,不是因为它是一个图形引擎。”
停了一拍。
“是因为底层跑的是一整套模式识别与生成的算法架构。图形只是它碰巧在处理的数据类型。”
又停了一拍。他左手撑在白板边框上,身体往前倾了倾。
“把训练数据从图像,换成文字——会怎样?”
实验室里没人出声。
空调的风从顶部格栅吹下来,格栅叶片轻轻抖着。
一秒。
两秒。
然后一支笔从老孟指间滑了出去。
笔杆弹在工作台面上,滚了半圈,撞到咖啡杯底座才停住。咖啡杯被撞得晃了一下,杯中残液泛起一个小漩涡。
老孟没去捡笔。
他盯着白板上那两行字,镜片后面的眼睛在飞速转。他在验证。把许琛这句话代入烛龙底层架构的每一个模块里,逐层校验,看有没有哪个环节在逻辑上不成立。
没有。
一个都没有。
他在烛龙的底层架构里泡了三年。那套Transformer框架的每一行代码、每一个参数、每一层网络的权重分布,他全摸过。注意力机制,多头编码,序列到序列映射——这些数学结构从来不关心输入端塞进来的是什么。
像素也好,音频也好,文字也好,对底层算法来说只是不同格式的数据序列。区别仅仅在于输入层的编码方式和输出层的解码方式。中间那一整套核心网络——
通用的。
完全通用。
老孟一把抓起工作台上另一支马克笔——红色的——椅子往后一蹬,三步冲到白板前。
他在许琛写的那行字下方落笔。
先画了四个方块:输入层、编码器、解码器、输出层。三组箭头把它们串联起来,拓扑结构和烛龙引擎现有的架构一模一样。然后他在输入层的方块旁边写了个括号,括号里先写了“像素矩阵”四个字,紧接着拉了一条删除线划掉,在上方补写:“文本序列”。
光是这一步,整个图的意义就翻过来了。
然后他开始在拓扑图旁边写注释。
第一行还算工整——“Token嵌入替换颜色空间映射。”
手速上来了。
第二行开始潦草——“位置编码对齐章节结构。”
第三行已经快认不出字了——“注意力权重绑定角色关系图谱——多头分配——主线/支线/伏笔三轨并行——”
红色马克笔在白板上拖出急促的摩擦声,老孟一边写一边嘴里蹦术语,也不是说给谁听,就是脑子转太快兜不住。
“Token嵌入层替换颜色空间映射,维度上完全对齐……位置编码本来就是处理序列顺序的,章节结构天然就是序列……注意力权重——”
他画到第三层的时候,笔尖顿住了。
红色马克笔悬在白板上方一厘米处,笔帽那头被他捏得有点变形。
他转过头。
镜片后那双眼钉在许琛脸上。
“理论上——”
嗓子干了,声音发涩。他咽了一下。
“完全可行。”
又咽了一下。
“核心算法是通用的。不是能不能的问题——是多快能做出来的问题。”
角落里,顾有文的身体前倾。
双手撑在膝盖上,视线在白板上那幅红色拓扑图和许琛之间来回跳。他不是算法出身,老孟画的那堆编码器解码器他看不透每一层的数学原理。
但他看得懂老孟的反应。
一个在算法领域干了十五年的人。平时在群里一年说不了十句话,开会的时候能用五个字结束的发言绝不用六个字。沉默,精确,不浪费劲儿。
现在这个人冲到白板前,手抖着画了满满一整板的拓扑图,嗓子干到发涩还在往外蹦术语,写到第三层笔停在半空,转过头来两只眼里的东西,顾有文从没在他脸上见过。
顾有文喉头动了一下。
“你们在说——”
他的两只手从膝盖上抬起来,十根手指悬在半空,不知道该往哪儿放。
“用烛龙的算法,去做一个能读剧本的AI?”
许琛没回答。
他转向白板,从凹槽里重新拿起那支黑色马克笔,在“模式识别与生成算法”那行字下面,画了一条长长的横线。
横线的最左端,他写了两个字:“星火。”
最右端,写了两个字:“烛龙。”
中间,一个箭头,从左指向右。
箭头上方,他写下最后一组数字——
“14,217篇投稿。全量批注。阅读行为日志。”
老孟愣住了。
这些数据——就是今晚之前许琛让周海全量备份的那些数据。
不是存档用的。
是喂给烛龙的料。
一万四千篇人类写的剧本。十二个编审三个月积累下来的每一条批注、每一处修改意见、每一次通过与退回的判断——这些东西合在一起,就是一套现成的训练语料库,带人工标注,质量极高。
别人想要这种数据,花钱都买不到。
而星火平台从上线的第一天起,就一直在替烛龙攒这笔账。