Skip to content

第七十五章 算法之外

周一早上九点,林知行在工位上打开邮箱。

一封新邮件,发件人是沈渡,标题是“可信度评分模块——你来负责”。邮件正文只有三行字:

“这个模块交给你。技术方案下周三前提交评审。有问题随时找我。”

林知行盯着屏幕看了十秒。

可信度评分。他在脑子里过了一遍——给AI的每条回答附一个0-100的可信度分数,并用用户能理解的语言解释评分依据。这正是他最擅长的“解释层”。

沈渡把他在开源项目里做的东西,直接拿到了灵犀的教育AI产品线上。

他关掉邮箱,打开代码编辑器。


接下来一周,林知行几乎没离开过工位。

他画了三版架构图。第一版太复杂,可信度评分和推荐系统耦合太深,改起来要动十几个模块。第二版太简单,评分逻辑只有规则引擎,精度不够。第三版他终于找到平衡点——用轻量级的模型做基础评分,再叠加一层规则约束,最后用自然语言生成模块把评分依据翻译成用户能看懂的解释。

这套架构他在排课系统上用过。

当时给排课结果加解释,是为了让教师接受AI的安排。现在做可信度评分,是为了让学生和家长信任AI的回答。底层逻辑是一样的:打开黑箱,建立信任。

他把代码仓库建好,写了四百行核心逻辑,又花了两天写技术方案文档。文档一共十二页,从需求分析到技术选型到实现路径到风险评估,每一条都有数据支撑。

周五下午,他把方案发给沈渡。

沈渡秒回:“看过了,不错。下周三评审会上讲。”

林知行松了口气。


周三下午两点,评审会在七楼会议室。

林知行提前十分钟到,把笔记本电脑接上投影仪。会议室里陆续进来七八个人——周睿、程浩、两个产品经理、三个技术骨干。沈渡坐在长桌另一头,面前摊着笔记本,没有抬头。

两点整,周睿清了清嗓子。

“开始吧。”

林知行打开PPT,从需求背景讲起。他讲得不快,每一帧PPT都控制在两分钟以内。讲到技术架构的时候,他特意放慢了语速,把三层结构拆开讲——模型层、规则层、解释层。

“核心思路是,可信度评分不是一个独立的数字,而是一套可解释的决策链。用户看到的不只是‘可信度73分’,而是‘这个回答的可信度是73分,因为数据来源有三个,其中两个是权威机构,但时效性只覆盖到上个月’。”

他点开demo。屏幕上显示了一条AI回答,旁边附着一个蓝色的评分卡片,上面写着“可信度:78分”,下面是一行小字:“评分依据:1.引用数据来自教育部公开数据库(权威性高);2.数据更新时间为2024年3月(时效性中等);3.未发现矛盾信息(一致性高)。”

“用户测试反馈,”林知行说,“有解释的AI回答,用户信任度比没有解释的高40%。这个数据来自我们开源项目的十七家商户实测。”

他讲完了。

会议室安静了三秒。

周睿翻了翻手里的方案文档,抬头。

“小林,你这个方案,”他说,“技术实现部分我看了,逻辑是自洽的。但有一个问题。”

“您说。”

“理论基础。”周睿把文档合上,手指在封面上点了点,“你的方案里没有引用任何学术论文。可信度评分这个方向,学术界有很多研究——贝叶斯置信度、不确定性量化、可解释AI的评估框架。你的方案完全没有提这些。”

林知行愣了一下。

他确实没引论文。

因为他的思路不是从论文里来的,是从排课系统上踩过的坑里来的。教师为什么不信任AI排的课表?因为看不懂。怎么解决?加解释。解释怎么加?用用户能理解的语言翻译AI的决策依据。

这个思路是实践出来的,不是从论文里推导出来的。

“周总,”林知行说,“我的方案是基于实际项目经验——”

“我知道你有经验。”周睿打断他,“但在公司内部做技术评审,方案需要有学术论文支撑。这不是我个人的要求,是公司的流程规范。”

他顿了顿。

“你回去补三篇论文引用,再提交一次。”

林知行张了张嘴,又闭上了。

“好的。”他说。


回到工位,林知行打开Google Scholar。

他搜了“可信度评分”“AI解释性”“用户信任度”,出来几千篇论文。他花了两个小时筛选,找到三篇最相关的——一篇是斯坦福的贝叶斯置信度框架,一篇是MIT的不确定性量化方法,一篇是清华的可解释AI评估指标。

他把三篇论文的核心观点摘出来,塞进方案文档的第二章“理论基础”里。加了六个引用标注,改了三处措辞,把“基于实际项目经验”改成了“基于实际项目经验与相关学术研究”。

改完之后他重新读了一遍。

文档变厚了两页,看起来更“学术”了。但他知道,核心思路没有变。那三篇论文只是装饰,就像给一道家常菜摆了个米其林的盘子。

他把修改后的方案发给周睿。

周睿第二天回复:“可以了。下周再评审一次。”


第二次评审会只用了十五分钟。

周睿翻了翻文档,看到论文引用的部分,点了点头。

“理论基础补充得不错。”他说,“方案通过。你开始做吧。”

林知行说了声“谢谢周总”。

散会后他没有立刻回工位,去了洗手间。站在洗手台前,他用冷水冲了把脸。

镜子里的人眼睛有点红——昨晚改方案改到两点。他盯着镜子里的自己,忽然想笑。

排课系统上线的时候,他给每条排课结果加了解释,教师接受率从65%升到92%。当时张老板打电话来,声音里带着掩饰不住的兴奋:“小林,你知道这个功能值多少钱吗?”

他不知道值多少钱,但他知道那是他靠实力做出来的东西。

现在,在灵犀科技,同样的思路,同样的技术,他需要先补三篇论文才能通过评审。

他关上水龙头,擦了把脸,走出洗手间。


路过程浩的工位时,他看到程浩也在写技术方案。

屏幕上是一个PPT,标题是“教育AI用户画像分析方案”。林知行扫了一眼,看到PPT里密密麻麻的图表和引用标注。

“程哥,你也过评审了?”林知行随口问了一句。

程浩抬头,笑了笑。

“过了。昨天过的。”

“顺利吗?”

“还行。”程浩说,“周总提了几个问题,我补充了一下就过了。”

林知行点了点头,准备走。

“对了,”程浩叫住他,“你那个可信度评分的方案,我看了。做得不错。”

“谢谢。”

“就是……”程浩犹豫了一下,“论文引用少了点。我数了一下,你只引了三篇?”

林知行脚步顿了顿。

“周总让我补的。”他说。

“哦。”程浩点了点头,“我那个方案引了十二篇。周总说理论基础扎实。”

林知行看了一眼程浩的屏幕。PPT的最后一页是参考文献列表,十二篇论文,从《自然》子刊到《人工智能研究》杂志,排得整整齐齐。

他想起程浩的方案内容——用户画像分析,技术实现部分大概两百行代码,主要是数据清洗和统计分析。核心逻辑不复杂,但PPT做得漂亮,图表清晰,论文引用充分。

“程哥,”林知行说,“你那个方案,核心算法是自己写的吗?”

程浩愣了一下。

“用了一个开源的聚类库,”他说,“我主要做的是数据预处理和结果分析。算法部分是现成的。”

“哦。”林知行说,“明白了。”

他回到自己的工位,打开电脑。

屏幕上还开着程浩的PPT截图——他刚才路过时拍了一张。参考文献列表,十二篇论文,每一篇都标注了期刊名称、年份、影响因子。

他把自己的方案文档打开,翻到第二章“理论基础”。三篇论文,六个引用标注。

他盯着这一页看了很久。

然后他关掉了文档。


那天晚上,林知行在青旅的上铺躺了很久。

六人间里其他人都睡了,鼾声此起彼伏。他戴着耳机,听着白噪音,但脑子里还在转。

他在想程浩的方案。

两百行代码,十二篇论文,一次评审通过。

他的方案,四百行核心逻辑,三篇论文(还是后补的),两次评审才通过。

技术含量谁高谁低,他心里清楚。但在灵犀科技的评审流程里,技术含量不是唯一的评判标准。

理论基础、学术支撑、文档规范——这些是“说得通”的要素。

而“做得好”需要时间验证。需要上线,需要用户反馈,需要数据积累。

但在方案评审阶段,没有人关心你能不能“做得好”。他们只关心你的方案“说得通不通”。

说得通,就能通过。

做得好,是以后的事。

他翻了个身,面朝墙壁。

墙上那个“北京欢迎你”的笑脸还在。他盯着看了一会儿,忽然想起姜意说过的一句话——“北京AI圈子很小。”

她说这话的时候是在公司附近的咖啡馆,穿着他没见过的灰色西装外套,气场比在小城时强了一个量级。

北京AI圈子很小。

小到她会知道他拿了第一个独立模块。

他摘下耳机,掏出手机。

没有新消息。

他把手机扣在枕头旁边,闭上眼睛。


方案通过的那天晚上,林知行加完班回到青旅,已经快十点。

他洗完澡爬上上铺,刚躺下,手机震了一下。

微信消息,姜意发来的。

“听说你拿了第一个独立模块?”

林知行盯着屏幕看了几秒,打字回复:

“你怎么知道的?”

“北京AI圈子很小。”

林知行想了想,又打了一行字:

“消息挺灵通的。”

姜意没有立刻回复。过了大概一分钟,一条语音消息弹了出来。

他点开,把手机贴到耳边。

姜意的声音从听筒里传出来,带着一点笑意:

“恭喜。改天请你吃饭,这次不去食堂了。”

语音只有五秒。他听了一遍,又听了一遍。

然后他打字回复:

“好。你定时间。”

发完之后他盯着聊天界面看了几秒。姜意的头像是一张侧脸照,短发,背景是某个城市的天际线。他不知道那是上海还是北京。

他锁上屏幕,把手机放在枕头旁边。

天花板上那道裂纹在黑暗中看不见了。

但他知道它在那里。

就像他知道,自己的方案是靠补论文引用才通过的,程浩的方案是靠十二篇论文一次通过的。

他也知道,姜意发来消息,不只是因为“北京AI圈子很小”。

有些事情,他算不清。

但他不想算了。

他闭上眼睛,翻了个身。

明天还有代码要写。

(本章完)