第一百三十五章 赵鸣岐的数据
数据是凌晨两点到的。
林知行正在调试解释层2.0的纠错反馈功能,手机震了一下。GitHub通知——赵鸣岐给他们的开源仓库提了一个pull request。
他点开,不是代码。
是一个文件夹:《零售行业脱敏数据集》。
README里写着:中科院智能零售实验室合作项目,三家连锁零售企业历史销售数据、库存周转率、季节性波动模型。数据已脱敏处理,可自由使用。
林知行的心跳加速了一拍。
他打开文件夹,点开第一个CSV文件——三百家门店的销售数据,时间跨度三年,颗粒度到天。
每一行数据都有门店编号、日期、品类、销量、库存量、补货周期、促销标记、季节性系数。
数据量:一百七十万条。
周然第二天早上看到这个数据的时候,愣了。
"这是什么?"他问。
"赵鸣岐给的,"林知行说,"中科院的零售数据。"
周然盯着屏幕上的文件大小——1.7GB。
"三百家门店?"他问。
"三百家门店,三年数据。"
周然沉默了三秒。
"这够我们训练通用模型了。"
林知行点了点头。
"但得先清洗,"他说,"数据格式不一样。有的用Excel,有的用CSV,有的用数据库导出的JSON。"
周然已经在点开第二个文件了。
"我来。"他说。
他们花了一周分析这些数据。
不是坐在客厅里分析——是蹲在数据里分析。
周然负责数据清洗和格式统一,把一百七十万条数据整理成标准化的时间序列。林知行负责模式识别,用自己写的脚本跑聚类分析和相关性检验。
第一天,他们发现一个规律:零售企业的库存问题有70%是共性的。
季节性波动、促销期影响、供应链波动——这些因素对所有门店的影响模式几乎一样。春节前两周销售暴涨,端午节前粽子库存积压,夏天饮料周转率提升30%。
这些是模型可以学习的。
第二天,他们发现剩下的30%是个性的。
地域差异、客群特征、竞争对手策略——这些因素对每家门店的影响不同。南方城市和北方城市的饮料销售曲线完全不同,学校旁边的门店和社区旁边的门店消费结构截然不同,对面新开了一家竞争对手会直接改变客流分布。
这些需要本地化调整。
第三天,林知行在白板上画了一张架构图。
"通用模型加本地微调,"他说,一边画,"通用模型学那70%的共性规律,本地微调学那30%的个性特征。新客户接入的时候,先用通用模型跑一遍基线,再用本地数据微调。"
周然看着白板。
"这样的话,"他说,"新客户的接入成本会大幅降低。"
"对,"林知行说,"以前每接一个新客户,都要从零开始训练模型。现在用通用模型做基线,只需要本地数据微调,时间能缩短80%。"
方小满从厨房端着泡面出来,看到白板上的架构图。
"这是什么?"他问。
"通用模型,"林知行说,"70%的零售库存问题都是共性的,我们用数据训练一个通用模型,新客户接入的时候直接用。"
方小满想了想。
"那渡渡科技也能做这个?"他问。
林知行顿了一下。
"理论上能,"他说,"但他们没有这个数据。"
"赵鸣岐为什么会给你?"方小满问。
林知行没有立刻回答。
他走到阳台,点了一根烟。
第四天,他给赵鸣岐发了一条消息。
"数据收到了,非常感谢。"
赵鸣岐回得很快。
"有用就好。"
林知行犹豫了一下,打了一行字。
"我们分析出了一个规律——70%的库存问题是共性的,30%是个性的。可以做一个通用模型加本地微调的架构。"
赵鸣岐的回复来得比预想的快。
"你想到的,沈渡也想到了。"
林知行盯着这条消息。
"什么意思?"他问。
"渡渡科技在做同样的事,"赵鸣岐说,"他们的数据量比你大,资金比你多,团队比你强。通用模型的思路不新鲜,但做出来需要时间和资源。"
林知行沉默了。
"他们有这个数据?"他问。
"有,"赵鸣岐说,"他们的数据来源比你广。除了零售,还有餐饮、物流、医疗。沈渡在布局一个更大的东西——不是单个行业的通用模型,是跨行业的AI决策引擎。"
林知行的心沉了一下。
"你怎么知道?"他问。
赵鸣岐没有立刻回复。
过了五分钟,他发来一条私信。
"沈渡上周找过我,想让我做渡渡的技术顾问。"
林知行盯着这条消息。
"你答应了?"他问。
"我没答应,但也没拒绝。"
林知行的手机屏幕暗了一下,他按亮。
"为什么?"他问。
"因为我在两边下注。"赵鸣岐说。
林知行没有回复。
他盯着屏幕上赵鸣岐的头像,那个头像是一张实验室的照片——白大褂、服务器、整齐的线缆。
赵鸣岐继续发消息。
"你在做零售AI,沈渡也在做零售AI。你有数据,沈渡也有数据。你有技术,沈渡也有技术。区别是,沈渡有三千万,你有三十万。"
林知行的手指停在屏幕上。
"你想说什么?"他问。
"我想说,"赵鸣岐说,"你打不过他。但你可以做他不愿做的事。"
"什么?"
"驻场。深度服务。和客户蹲在一起。沈渡的模式是标准化SaaS,他做不了这些。但你能做。"
林知行想起133章刘总的那个电话——"要是顶不住提前说一声,数据我不想丢。"
"你在两边下注,"林知行说,"是为了什么?"
赵鸣岐的回复来得很慢。
"因为我不知道谁会赢。"
林知行盯着这行字。
"你希望谁赢?"他问。
赵鸣岐过了很久才回。
"我希望好的产品赢。"
林知行关掉手机,走到白板前面。
白板上还画着那张通用模型加本地微调的架构图。他盯着那张图,看了一会儿,拿起马克笔,在图的右边画了一个方框。
方框里写了三个字:渡渡科技。
然后他在两个方框中间画了一条线。
线上写了一个字:同。
方小满从厨房出来,看到他在白板前面站着。
"又在画什么?"他问。
"竞争格局,"林知行说,"赵鸣岐说,沈渡也在做通用模型。"
方小满走到白板前面,看着那个方框。
"那我们怎么办?"他问。
林知行没有立刻回答。
他走到窗边,看着外面的四环路。路灯亮着,车流不息。远处是中关村的高楼,玻璃幕墙在夜色中闪着冷光。
"赵鸣岐说了一句话,"林知行说,"他说:'你打不过他,但你可以做他不愿做的事。'"
方小满想了想。
"驻场?"他问。
"驻场,"林知行说,"深度服务。和客户蹲在一起。"
"但驻场做不大,"方小满说,"我们只有三个人。"
"做大不是唯一目标,"林知行说,"活下去比做大更重要。"
方小满沉默了。
他走到白板前面,拿起马克笔,在"渡渡科技"的方框下面写了一行字:标准化SaaS。
然后在"我们"的方框下面写了一行字:深度服务。
"标准化对深度,"他说,"规模对深度。"
林知行点了点头。
"那我们的深度有什么用?"方小满问,"深度能赚钱吗?"
"能,"林知行说,"深度服务的客单价比标准化高十倍。渡渡一年收三万,我们一年收十五万。"
"但客户数量呢?"方小满问,"渡渡能服务一百家,我们只能服务十家。"
"十家够了,"林知行说,"十家十五万,就是一百五十万。比我们现在好十倍。"
方小满看着白板上的数字。
"那赵鸣岐呢?"他问,"他在两边下注,对我们有什么影响?"
林知行走到窗边,看着外面的夜色。
"影响是,"他说,"他可能会把我们的数据告诉沈渡。"
方小满的脸色变了。
"那怎么办?"他问。
"没办法,"林知行说,"数据已经给他了。但赵鸣岐不是那种人。"
"你怎么知道?"
"因为他给了我们数据,"林知行说,"如果他想帮沈渡,就不会给我们这些数据。"
方小满想了想。
"那他在两边下注,是为了什么?"他问。
"为了保险,"林知行说,"他不确定谁会赢。所以他两边都不得罪。"
"那我们怎么处理他?"
林知行走到白板前面,拿起马克笔。
他在赵鸣岐的名字旁边画了一个问号。
"不处理,"他说,"继续做我们的事。数据在我们手里,技术在我们手里,客户在我们手里。赵鸣岐在不在,不影响我们的产品。"
方小满点了点头。
"但沈渡在做同样的事,"他说,"我们的时间窗口不多了。"
林知行看着白板上的架构图。
通用模型加本地微调。
70%的共性,30%的个性。
他想起赵鸣岐的话:你打不过他,但你可以做他不愿做的事。
"时间窗口不多了,"林知行说,"所以我们得快。"
他拿起马克笔,在白板上画了一个时间轴。
左边是现在,右边是三个月后。
在时间轴的中间,他画了一条线。
"三个月,"他说,"三个月内,我们要把通用模型做出来,跑通三家以上的付费客户。"
方小满看着那条线。
"三个月?"他问。
"三个月,"林知行说,"账上余额三十一万,按现在的烧钱速度,只能撑四个月。三个月后必须有新的收入来源。"
方小满沉默了。
他走到阳台上,点了一根烟。
林知行看着他的背影。
窗外的夜色很深,远处的灯光闪烁。中关村的高楼像一座座发光的巨塔,每一扇窗户后面都有人在加班,在创业,在挣扎。
他们只是其中之一。
林知行走到白板前面,拿起马克笔,在最下面写了一行字。
"目标:三个月内,通用模型跑通,付费客户三家以上。"
他放下笔,看着这行字。
然后他打开手机,给赵鸣岐回了一条消息。
"谢谢数据。我们会用好的。"
赵鸣岐回了一个字:好。
林知行关掉手机,走到自己的工位前。
屏幕上的代码还在闪烁——解释层2.0的纠错反馈功能。他敲了两行代码,然后停下来。
他想起赵鸣岐的话:你打不过他,但你可以做他不愿做的事。
他想起方小满的话:我们的深度有什么用?
他想起刘总的话:要是顶不住提前说一声,数据我不想丢。
他想起周然的话:我不想当螺丝钉。
这些话在他脑子里转。
他关掉代码编辑器,打开一个新的文档。
文档标题:《通用模型架构设计v1.0》。
他在文档里写了一行字。
"目标:基于赵鸣岐数据集,训练零售行业通用库存预测模型,支持本地化微调。"
然后他开始写技术方案。
凌晨三点,客厅里只剩下键盘敲击声。
周然已经在折叠床上睡了,方小满在阳台上抽烟。
林知行盯着屏幕上的代码。
通用模型。
70%的共性。
30%的个性。
三个月。
三十一万。
赵鸣岐在两边下注。
沈渡在做同样的事。
他敲下最后一行代码注释:
"这不是最好的算法,但这是活下去的算法。"
然后他保存文档,关掉电脑。
走到窗边,看着外面的夜色。
中关村的灯光还在亮着。
每一盏灯后面,都有人在算。
算钱,算时间,算机会。
他也一样。
只是他算的,不只是数字。
还有信任。
赵鸣岐的信任。
周然的信任。
刘总的信任。
方小满的信任。
这些信任,算法算不出来。
但他知道,它们值多少钱。
他回到自己的工位,打开手机。
赵鸣岐的最后一条消息还在屏幕上:
"我希望好的产品赢。"
林知行盯着这行字,看了很久。
然后他回了一条消息。
"我们会努力的。"
发送。
关掉手机。
上床睡觉。
折叠桌的另一边,周然翻了个身,继续睡。
阳台上,方小满掐灭了烟,回到客厅。
三个人,三台电脑,一个客厅。
这是他们的全部家当。
也是他们的全部赌注。