商用标准。但问题不在算法,在数据。”
他放大一张图表。
“你们用的训练数据,是公开的通用语料。但企业知识管理,需要的是行业垂直、场景特定的语料。用通用数据训练垂直模型,就像用教大学生的方法教小学生,效率低,效果差。”
赵成愣住了。
这确实是问题的核心。但团队讨论了两个月,才慢慢摸索到这个结论。林辰才看了几天材料,就一眼看穿?
“那……您的建议是?”赵成下意识用了敬语。
“换数据源。”林辰说,“我整理了星河过去五年服务过的企业客户资料——当然,是脱敏的。包括项目文档、会议纪要、客户反馈、解决方案,总共三百多万条数据。用这些数据重新训练模型,准确率能提到85%以上。够商用了。”
会议室里一片死寂。
三百多万条脱敏数据?这得是多大的工作量?而且还要清洗、标注、训练……林辰什么时候做的?
“数据我已经处理好了。”林辰像是看穿他们的心思,“训练框架也搭好了。赵成,会后你带技术团队跟我对一下,没问题的话,这周就开始训练。两周出结果,剩下六周开发产品,两个月上线,来得及。”
赵成张了张嘴,想说点什么,但一个字也说不出来。
他只能点头:“好。”
“还有什么问题吗?”林辰看向其他人。
没人吭声。
“那散会。赵成留一下,其他人可以回了。对了,”林辰补充,“刘薇,下午两点,市场部开会,讨论新业务线的推广方案。带上你的预算。”
“好的林总。”
人群陆续离开会议室。赵成坐在原位,看着林辰在平板上快速操作,心里那点不服气,慢慢变成了某种复杂的情绪。
是敬畏?还是恐惧?
他说不清。
2
下午一点半,林辰办公室。
赵成敲门进来时,林辰正在接电话。他指了指沙发,示意赵成先坐,继续对电话那头说:“对,数据安全协议必须签。我们的模型只输出结果,不保留客户原始数据。这是底线。”
电话打了五分钟。挂断后,林辰从办公桌后走出来,在赵成对面坐下。
“喝点什么?茶?咖啡?”
“不用了林总。”赵成摆摆手。
“那直接说正事。”林辰从茶几底下抽出厚厚一沓打印材料,“这是‘星链’的技术方案,我重新理了一遍。你看一下。”
赵成接过,翻了几页,越翻越心惊。
这已经不是“理了一遍”,是几乎重写。架构更清晰,技术选型更合理,难点和解决方案都标得明明白白。甚至还有详细的时间表和分工建议。
“这……您什么时候做的?”赵成忍不住问。
“昨晚。”林辰说,“看了你们原来的方案,有些地方可以优化,就顺手改了改。”
顺手?
赵成看着那至少五十页的方案,心想你这“顺手”也太可怕了。
“技术上的事,你比我懂。你看看有没有硬伤,没有的话,就按这个执行。”林辰说,“团队配置,你觉得现在的核心团队够吗?要不要加人?”
赵成想了想:“算法那边可能还需要一两个人。现在负责NLP(自然语言处理)的小陈能力强,但一个人撑不起这么大的训练量。”
“行,你提需求,我批。薪资范围按市场顶格给,我要最好的人。”林辰很干脆,“另外,项目组所有人的绩效,和‘星链’上线后的数据挂钩。做得好,奖金上不封顶。”
赵成心里一热。
这态度,这支持力度,比之前李铭管的时候强太多了。
“林总,”他犹豫了一下,还是问出口,“您为什么对‘星链’这么重视?这项目之前在公司优先级不高,李总也没怎么催。”
林辰看着他,沉默了几秒。
“赵成,你在星河六年了,对吧?”
“是。”
“那你看过星河的年报吗?去年营收十个亿,利润多少?”
“八千万左右。”
“对,八个点利润率。”林辰身体前倾,“在互联网公司,这很低。为什么?因为我们的成本太高。研发、销售、管理,三座大山。其中最大头是什么?”
赵成想了想:“人力成本?”
“没错。”林辰点头,“星河现在一千二百人,人均年薪四十万,一年光工资就五个亿。这还没算社保、福利、办公成本。如果我们继续做现在这种项目制、人力密集的生意,规模越大,利润越薄,最后就是给员工打工。”
他拿起茶杯,喝了口水。
“但‘星链’不一样。它是一个产品,一次研发,无限复制。企业客户用我们的系统,管理自己的知识库,提升效率。我们收年费,或者按用量收费。边际成本几乎为零。只要做成了,它就是公司的现金牛,利润率