第七十五章算法之外

周一早上九点，林知行在工位上打开邮箱。

一封新邮件，发件人是沈渡，标题是“可信度评分模块——你来负责”。邮件正文只有三行字：

“这个模块交给你。技术方案下周三前提交评审。有问题随时找我。”

林知行盯着屏幕看了十秒。

可信度评分。他在脑子里过了一遍——给AI的每条回答附一个0-100的可信度分数，并用用户能理解的语言解释评分依据。这正是他最擅长的“解释层”。

沈渡把他在开源项目里做的东西，直接拿到了灵犀的教育AI产品线上。

他关掉邮箱，打开代码编辑器。

接下来一周，林知行几乎没离开过工位。

他画了三版架构图。第一版太复杂，可信度评分和推荐系统耦合太深，改起来要动十几个模块。第二版太简单，评分逻辑只有规则引擎，精度不够。第三版他终于找到平衡点——用轻量级的模型做基础评分，再叠加一层规则约束，最后用自然语言生成模块把评分依据翻译成用户能看懂的解释。

这套架构他在排课系统上用过。

当时给排课结果加解释，是为了让教师接受AI的安排。现在做可信度评分，是为了让学生和家长信任AI的回答。底层逻辑是一样的：打开黑箱，建立信任。

他把代码仓库建好，写了四百行核心逻辑，又花了两天写技术方案文档。文档一共十二页，从需求分析到技术选型到实现路径到风险评估，每一条都有数据支撑。

周五下午，他把方案发给沈渡。

沈渡秒回：“看过了，不错。下周三评审会上讲。”

林知行松了口气。

周三下午两点，评审会在七楼会议室。

林知行提前十分钟到，把笔记本电脑接上投影仪。会议室里陆续进来七八个人——周睿、程浩、两个产品经理、三个技术骨干。沈渡坐在长桌另一头，面前摊着笔记本，没有抬头。

两点整，周睿清了清嗓子。

“开始吧。”

林知行打开PPT，从需求背景讲起。他讲得不快，每一帧PPT都控制在两分钟以内。讲到技术架构的时候，他特意放慢了语速，把三层结构拆开讲——模型层、规则层、解释层。

“核心思路是，可信度评分不是一个独立的数字，而是一套可解释的决策链。用户看到的不只是‘可信度73分’，而是‘这个回答的可信度是73分，因为数据来源有三个，其中两个是权威机构，但时效性只覆盖到上个月’。”

他点开demo。屏幕上显示了一条AI回答，旁边附着一个蓝色的评分卡片，上面写着“可信度：78分”，下面是一行小字：“评分依据：1.引用数据来自教育部公开数据库（权威性高）；2.数据更新时间为2024年3月（时效性中等）；3.未发现矛盾信息（一致性高）。”

“用户测试反馈，”林知行说，“有解释的AI回答，用户信任度比没有解释的高40%。这个数据来自我们开源项目的十七家商户实测。”

他讲完了。

会议室安静了三秒。

周睿翻了翻手里的方案文档，抬头。

“小林，你这个方案，”他说，“技术实现部分我看了，逻辑是自洽的。但有一个问题。”

“您说。”

“理论基础。”周睿把文档合上，手指在封面上点了点，“你的方案里没有引用任何学术论文。可信度评分这个方向，学术界有很多研究——贝叶斯置信度、不确定性量化、可解释AI的评估框架。你的方案完全没有提这些。”

林知行愣了一下。

他确实没引论文。

因为他的思路不是从论文里来的，是从排课系统上踩过的坑里来的。教师为什么不信任AI排的课表？因为看不懂。怎么解决？加解释。解释怎么加？用用户能理解的语言翻译AI的决策依据。

这个思路是实践出来的，不是从论文里推导出来的。

“周总，”林知行说，“我的方案是基于实际项目经验——”

“我知道你有经验。”周睿打断他，“但在公司内部做技术评审，方案需要有学术论文支撑。这不是我个人的要求，是公司的流程规范。”

他顿了顿。

“你回去补三篇论文引用，再提交一次。”

林知行张了张嘴，又闭上了。

“好的。”他说。

回到工位，林知行打开Google Scholar。

他搜了“可信度评分”“AI解释性”“用户信任度”，出来几千篇论文。他花了两个小时筛选，找到三篇最相关的——一篇是斯坦福的贝叶斯置信度框架，一篇是MIT的不确定性量化方法，一篇是清华的可解释AI评估指标。

他把三篇论文的核心观点摘出来，塞进方案文档的第二章“理论基础”里。加了六个引用标注，改了三处措辞，把“基于实际项目经验”改成了“基于实际项目经验与相关学术研究”。

改完之后他重新读了一遍。

文档变厚了两页，看起来更“学术”了。但他知道，核心思路没有变。那三篇论文只是装饰，就像给一道家常菜摆了个米其林的盘子。

他把修改后的方案发给周睿。

周睿第二天回复：“可以了。下周再评审一次。”

第二次评审会只用了十五分钟。

周睿翻了翻文档，看到论文引用的部分，点了点头。

“理论基础补充得不错。”他说，“方案通过。你开始做吧。”

林知行说了声“谢谢周总”。

散会后他没有立刻回工位，去了洗手间。站在洗手台前，他用冷水冲了把脸。

镜子里的人眼睛有点红——昨晚改方案改到两点。他盯着镜子里的自己，忽然想笑。

排课系统上线的时候，他给每条排课结果加了解释，教师接受率从65%升到92%。当时张老板打电话来，声音里带着掩饰不住的兴奋：“小林，你知道这个功能值多少钱吗？”

他不知道值多少钱，但他知道那是他靠实力做出来的东西。

现在，在灵犀科技，同样的思路，同样的技术，他需要先补三篇论文才能通过评审。

他关上水龙头，擦了把脸，走出洗手间。

路过程浩的工位时，他看到程浩也在写技术方案。

屏幕上是一个PPT，标题是“教育AI用户画像分析方案”。林知行扫了一眼，看到PPT里密密麻麻的图表和引用标注。

“程哥，你也过评审了？”林知行随口问了一句。

程浩抬头，笑了笑。

“过了。昨天过的。”

“顺利吗？”

“还行。”程浩说，“周总提了几个问题，我补充了一下就过了。”

林知行点了点头，准备走。

“对了，”程浩叫住他，“你那个可信度评分的方案，我看了。做得不错。”

“谢谢。”

“就是……”程浩犹豫了一下，“论文引用少了点。我数了一下，你只引了三篇？”

林知行脚步顿了顿。

“周总让我补的。”他说。

“哦。”程浩点了点头，“我那个方案引了十二篇。周总说理论基础扎实。”

林知行看了一眼程浩的屏幕。PPT的最后一页是参考文献列表，十二篇论文，从《自然》子刊到《人工智能研究》杂志，排得整整齐齐。

他想起程浩的方案内容——用户画像分析，技术实现部分大概两百行代码，主要是数据清洗和统计分析。核心逻辑不复杂，但PPT做得漂亮，图表清晰，论文引用充分。

“程哥，”林知行说，“你那个方案，核心算法是自己写的吗？”

程浩愣了一下。

“用了一个开源的聚类库，”他说，“我主要做的是数据预处理和结果分析。算法部分是现成的。”

“哦。”林知行说，“明白了。”

他回到自己的工位，打开电脑。

屏幕上还开着程浩的PPT截图——他刚才路过时拍了一张。参考文献列表，十二篇论文，每一篇都标注了期刊名称、年份、影响因子。

他把自己的方案文档打开，翻到第二章“理论基础”。三篇论文，六个引用标注。

他盯着这一页看了很久。

然后他关掉了文档。

那天晚上，林知行在青旅的上铺躺了很久。

六人间里其他人都睡了，鼾声此起彼伏。他戴着耳机，听着白噪音，但脑子里还在转。

他在想程浩的方案。

两百行代码，十二篇论文，一次评审通过。

他的方案，四百行核心逻辑，三篇论文（还是后补的），两次评审才通过。

技术含量谁高谁低，他心里清楚。但在灵犀科技的评审流程里，技术含量不是唯一的评判标准。

理论基础、学术支撑、文档规范——这些是“说得通”的要素。

而“做得好”需要时间验证。需要上线，需要用户反馈，需要数据积累。

但在方案评审阶段，没有人关心你能不能“做得好”。他们只关心你的方案“说得通不通”。

说得通，就能通过。

做得好，是以后的事。

他翻了个身，面朝墙壁。

墙上那个“北京欢迎你”的笑脸还在。他盯着看了一会儿，忽然想起姜意说过的一句话——“北京AI圈子很小。”

她说这话的时候是在公司附近的咖啡馆，穿着他没见过的灰色西装外套，气场比在小城时强了一个量级。

北京AI圈子很小。

小到她会知道他拿了第一个独立模块。

他摘下耳机，掏出手机。

没有新消息。

他把手机扣在枕头旁边，闭上眼睛。

方案通过的那天晚上，林知行加完班回到青旅，已经快十点。

他洗完澡爬上上铺，刚躺下，手机震了一下。

微信消息，姜意发来的。

“听说你拿了第一个独立模块？”

林知行盯着屏幕看了几秒，打字回复：

“你怎么知道的？”

“北京AI圈子很小。”

林知行想了想，又打了一行字：

“消息挺灵通的。”

姜意没有立刻回复。过了大概一分钟，一条语音消息弹了出来。

他点开，把手机贴到耳边。

姜意的声音从听筒里传出来，带着一点笑意：

“恭喜。改天请你吃饭，这次不去食堂了。”

语音只有五秒。他听了一遍，又听了一遍。

然后他打字回复：

“好。你定时间。”

发完之后他盯着聊天界面看了几秒。姜意的头像是一张侧脸照，短发，背景是某个城市的天际线。他不知道那是上海还是北京。

他锁上屏幕，把手机放在枕头旁边。

天花板上那道裂纹在黑暗中看不见了。

但他知道它在那里。

就像他知道，自己的方案是靠补论文引用才通过的，程浩的方案是靠十二篇论文一次通过的。

他也知道，姜意发来消息，不只是因为“北京AI圈子很小”。

有些事情，他算不清。

但他不想算了。

他闭上眼睛，翻了个身。

明天还有代码要写。

（本章完）

第七十五章 算法之外 ​

第七十五章算法之外