第四十八章 可解释
白板上那两条线还没擦。
林知行站在白板前,盯着右边那条线的终点——"更可用的工具"。昨天他写下这四个字的时候,觉得方向已经够清楚了。但今天早上醒来,他发现一个问题。
"可用"是一个形容词,不是一个功能。
他在白板上画了一个框,框里写了三个字:决策日志。
方小满从上铺探头看了一眼:"什么东西?"
"一个功能。"林知行说,"用户点了AI的建议之后,能看到AI为什么这么建议。"
"不就是解释功能吗?"方小满打了个哈欠,"我们排课系统做过。"
"排课系统是附带的。"林知行说,"这次我要把它做成核心。"
方小满没听懂,但他也没问。他翻了个身,继续睡。
上午的线上会议,林知行把"决策日志"的方案投到了群里。
方案写了三页。第一页是功能描述:用户看到AI给出建议时,每条建议下面附带一段文字,说明这条建议是基于哪些数据生成的。第二页是技术架构:数据采集层从商户的销售记录、库存变动、客流统计中提取关键指标,解释生成层把这些指标转化成人类可读的文本。第三页是交互设计:建议卡片右侧有一个小图标,点击展开决策日志。
"看完了。"陈一鸣说,"这有什么用?"
林知行早料到他会问这个。
"什么有什么用?"
"解释功能。"陈一鸣的声音从耳机里传来,语速比平时快,"市面上的AI产品都有解释功能。推荐系统说'因为你看过这个所以推荐给你',搜索引擎说'基于你的历史搜索',银行的风控系统说'你的综合评分低于阈值'。这些都是解释,有什么稀奇的?"
林知行没急着反驳。他问:"你觉得这些解释,用户信吗?"
陈一鸣停顿了一下。
"信不信是一回事,有没有是另一回事。"他说,"我的意思是,你不能把一个大家都有功能当成核心卖点。这就像你开餐馆,把'我们有筷子'写在招牌上。"
方小满在上铺笑了一声。
林知行走到白板前,擦掉了昨天画的那两条路线图,重新画了一个方框。他在方框里写了一行字:
他们的解释是事后装饰。我们的解释是核心功能。
"区别在哪?"他转过身。
陈一鸣没说话。
苏雨晴的声音从群里传来,很轻:"我不太懂。"
"我举个例子。"林知行说,"假设你是一家奶茶店老板,你的AI系统建议你今天多备二十杯珍珠。陈一鸣说的那种解释,会告诉你'因为过去七天珍珠销量增长了20%'。你觉得这种解释有用吗?"
"有点用。"苏雨晴说。
"没用。"林知行说,"因为你真正想知道的不是'销量增长了20%'——这个数据你自己看报表也能看到。你想知道的是:AI是怎么判断'多备二十杯'这个数字的?为什么不是十杯?为什么不是三十杯?它的计算逻辑是什么?它考虑了哪些因素?哪些因素被它忽略了?"
他在白板上画了两条平行线。左边写"数据",右边写"决策"。
"从数据到决策之间有一个黑箱。"林知行说,"市面上的AI产品只解释数据——'因为你的销量增长了20%'。但不解释决策——'所以我建议你多备二十杯'。中间那个黑箱,没人打开。"
陈一鸣在群里发了一条消息:"那你的意思是,我们要打开这个黑箱?"
"对。"
"怎么打开?"
"把AI的思考过程写出来。"林知行说,"不是'因为销量增长了20%',而是'过去七天珍珠日均销量从120杯增长到144杯,增幅20%。考虑到周末客流通常比工作日高30%,周六预计销量约187杯。当前珍珠库存可支持160杯,缺口27杯。按每杯珍珠用量30克计算,需额外备料810克,折合约20杯。'"
他说完,群里安静了三秒。
"这也太长了吧。"方小满说。
"长不重要。"林知行说,"重要的是——老板能看懂。他能看懂AI在想什么,能判断AI想得对不对,能在AI想错的时候纠正它。"
"你怎么知道老板能看懂?"陈一鸣问。
"我不知道。"林知行说,"所以我让苏雨晴去问。"
苏雨晴花了一天跑了十七家商户。
她没有发问卷,也没有打电话。她一家一家地去,坐在店里,跟老板聊天。她问的问题很简单:"如果AI给你一个建议,比如让你多备点货,你更想要哪种结果——一个是AI很准,但你不知道它为什么这么建议;一个是AI没那么准,但你能看懂它在想什么,觉得不对还能自己改。"
第一家是奶茶店的周老板。苏雨晴去的时候他正在调配方,手上全是糖浆。
"当然是后面那种。"周老板头也没抬,"我做了十年奶茶,什么卖得好我心里有数。AI再准,我不知道它怎么算的,我也不敢全信。"
第二家是五金店的苏叔。苏雨晴的亲叔叔。
"你问我?"苏叔把扳手放下,想了想,"我宁可它没那么准,但我能看懂。万一它建议我进一批卖不动的货,我亏的可是真金白银。"
第三家是水果店的王老板。他正在理一箱橙子,听了苏雨晴的问题,放下橙子,认真想了一会儿。
"丫头,我这么跟你说。"王老板说,"上次你们那个系统建议我进十箱苹果,我照做了。结果那周天气热,苹果坏了一半。我不知道它为什么建议我进十箱,也许它觉得销量好,但它没考虑天气。如果我能看到它的想法,我就能提前告诉它——下周要下雨,别进那么多。"
苏雨晴把这些话都记在了Excel表里。
跑完十七家,她做了一个统计:选"更准但看不懂"的有五家,选"没那么准但看得懂"的有十二家。
她把结果发到群里的时候,是晚上八点。
林知行看着那个数字——十二比五。
陈一鸣没说话。
方小满说:"十二家。"
"十二家选了后者。"苏雨晴补了一句,"而且选后者的人,都是生意做了五年以上的老商户。选前者的基本是开店不到两年的新商户。"
林知行盯着屏幕,脑子里在跑一个模型。
老商户选"看得懂",新商户选"更准"。这个分布说明什么?
说明信任不是一次性建立的。新商户对AI没有经验,所以默认信任——你说准我就信。老商户踩过太多坑,知道任何系统都可能犯错,所以他们要的是纠错能力,不是准确率。
他把这个发现写在笔记本上:
信任 = 准确率 × 可解释性。
准确率决定下限,可解释性决定上限。
那天晚上,林知行把"决策日志"的技术方案重新改了一版。
他把方案从三页扩到五页,加了苏雨晴的调研数据、王老板的苹果案例、以及他自己的分析——为什么可解释性比准确率更重要。他写到凌晨一点,改了三遍,最后把终版发到了姜意的微信上。
"帮我看看。"他附了一句话。
发完之后他去洗了个澡。回来的时候手机亮了,是姜意的回复——一段语音,时长四分十二秒。
他点开听。
姜意的声音从手机里传出来,语速比平时快,像在赶时间:
"方案我看了。方向没问题——可解释性作为核心卖点,这个思路是对的。你比大多数技术团队聪明,因为他们都在卷准确率,你在卷信任。信任比准确率难做,但壁垒也更高。"
她停顿了一秒。
"但你做错了一件事。"
林知行的手指停在屏幕上。
"你在用工程师的语言解释AI决策。你的方案里写的是'置信度0.73'、'特征权重排序'、'决策边界可视化'——这些东西商户看不懂。你让一个卖水果的老板去看'置信度0.73',他只会觉得你在糊弄他。"
姜意的声音里带着一点笑意,但笑意后面是认真的:
"商户需要的不是技术参数,是他们自己的故事。你告诉他们'这个建议是因为上周三你的矿泉水卖了48瓶,而平时只卖20瓶',他们立刻就懂了。因为那是他们自己的数据,他们自己的店,他们自己的周三。你用他们的语言解释,不是用你的语言。"
语音的最后,姜意说:
"你在排课系统上做过AI解释,那次是对的——因为排课系统的解释对象是老师,老师能看懂'张老师周二上午没有其他课且距离校区最近'这种话。但你现在的对象是商户,商户的语言跟老师不一样。你得重新学一遍。"
语音播完了。
林知行盯着手机屏幕,沉默了三十秒。
姜意说得对。他确实在用工程师的语言写方案。他以为自己在做可解释AI,但他解释的对象是自己,不是商户。
他想起苏雨晴跑完十七家商户后说的那句话——王老板说"如果我能看到它的想法,我就能提前告诉它"。
王老板说的"想法",不是置信度,不是特征权重。是"为什么让我进十箱苹果"。
林知行拿起手机,按住语音键:
"姜意。"
他顿了一下。
"你来做我们的产品评审吧。"
发出去之后他等了两分钟。姜意回了一条文字消息:
"产品评审?什么意思?"
"每三天一次,你审我们的产品设计和方案。"林知行打字,"你看到的问题比我们多。我需要一双不一样的眼睛。"
"我有工作,白天没时间。"
"晚上就行。"
"多晚?"
"随时。你定时间。"
姜意没立刻回复。林知行等了五分钟,手机亮了。
"行。但我有个条件。"
"说。"
"我不挂名,不出现在你们的团队名单里。我只是旁观者,看完了给你反馈,你接不接是你的事。"
"为什么?"
"因为我不希望评委觉得你是靠人脉。"姜意的消息一条接一条,"你的产品应该自己说话,不是借别人的声音。"
林知行看着这段话,想了很久。
他回了两个字:
"明白。"
然后他又打了一行字:
"谢谢。"
姜意回了一个句号。
方小满不知道什么时候从上铺探下头来,盯着林知行的手机屏幕。
"你跟姜意说什么呢?"他问。
"产品的事。"林知行把手机扣在桌上。
"产品的事你跟她说了什么?"
"让她帮我们看方案。"
方小满的眼睛亮了一下:"她答应了?"
"答应了。每三天审一次,晚上。"
"晚上?"方小满的嘴角翘起来,"你们晚上聊?"
林知行看了他一眼:"你想说什么?"
"没什么。"方小满缩回上铺,但声音从上面飘下来,"我是说,你挺有眼光的。"
"什么眼光?"
"产品评审的眼光。"方小满说,"姜意姐比我们都懂用户。她来看,比我们自己琢磨强。"
林知行没接话。他知道方小满在打趣他,但现在他没心情开玩笑。他打开笔记本,在新的一页上写了一行字:
决策日志v2.0——用商户的语言解释AI。
然后他在下面列了一个清单:
- 把所有技术参数翻译成商户能看懂的话
- 每条解释必须包含商户自己的数据(日期、数量、对比)
- 解释长度不超过三行
- 不能出现任何技术术语
他看着这个清单,忽然想起一件事。
他打开代码仓库,找到排课系统的AI解释模块。那个模块是他半年前写的,当时只是为了给老师看排课理由。他翻了一遍代码,发现一个有趣的事情——排课系统的解释逻辑,和他现在要做的决策日志,底层结构是一样的。
都是:输入数据 → 提取关键指标 → 转化成人类可读的文本。
区别只在输出对象不同。排课系统输出给老师,决策日志输出给商户。
他不是在做新东西。他是在把旧经验升级。
但升级需要一个前提——他得学会商户的语言。
而他不会。
林知行关掉代码仓库,打开手机,翻到苏雨晴的Excel表。表里记着十七家商户的需求,每一条都是商户的原话。
"天热了珍珠卖得好得多备点但别太多怕放坏了。"
"这周鸡蛋涨价了,我进货价多了三毛,你帮我看看要不要跟着涨。"
"我老婆说店里太乱了让我少进点货,但我觉得能卖完。你帮我算算。"
他看着这些句子,忽然笑了。
这不是技术问题。这是语言问题。
他需要一个翻译。
而姜意,就是那个翻译。
第二天早上,林知行在群里发了一条消息:
"决策日志的功能方向确认了。核心原则只有一条:用商户的语言,不用我们的语言。具体怎么写解释文本,我们每三天跟姜意过一次方案。"
陈一鸣回了一个字:"行。"
苏雨晴回了一个字:"好。"
方小满没回,但他从上铺跳下来,走到白板前,把林知行昨天写的"更简单的输入→更透明的决策→更可用的工具"擦掉了一半。
"你干嘛?"林知行问。
"改一下。"方小满拿起笔,在"更透明的决策"下面加了一行字:商户看得懂的决策。
林知行看着那行字,没说话。
方小满把笔放下,转过身,说:
"知行,我虽然不懂技术,但我知道一件事——商户看不懂的东西,就等于不存在。"
他拍了拍白板。
"你做的这个决策日志,如果商户看不懂,那它跟没有一样。"
林知行点了点头。
"所以姜意很重要。"他说。
"嗯。"方小满说,"她是翻译。"
林知行愣了一下。
方小满笑了:"怎么?你以为只有你能想到?"
林知行没笑,但他的嘴角动了一下。
"那赵鸣岐那边呢?"方小满问,"你还没回他邮件。"
林知行看了一眼邮箱。赵鸣岐的邮件还在收件箱里,没有被打开过。
"不回了。"他说。
"为什么?"
"因为没什么好说的。"林知行说,"他的路线是让AI更聪明,我们的路线是让AI更透明。这是两条不同的路。交流可以,但现在不是时候。"
"那什么时候是时候?"
"等我们做出东西来再说。"
方小满点了点头,没再问。
晚上七点,林知行收到了姜意的第一条产品评审反馈。
不是语音,是一段文字:
"你那个决策日志的交互方案我看了。建议卡片右侧的小图标不要用问号,用'为什么'三个字。商户看到问号会以为系统出bug了,看到'为什么'会知道这是解释功能。另外,展开决策日志的动效不要太花哨,淡入就行。商户没时间看你做动画。"
林知行看完,打开设计文件,把问号图标改成了"为什么"三个字。
然后他回了一条消息:
"收到。改了。"
姜意回了一个"👍"。
林知行盯着那个表情看了两秒,然后关掉手机,打开代码编辑器。
决策日志的功能,今晚开始写第一行代码。
他不知道这个功能能不能帮他们赢过赵鸣岐。但他知道一件事——如果商户看不懂AI在想什么,再好的技术也没有意义。
而他现在,终于知道怎么让商户看懂了。
不是用他的语言。
是用商户的语言。
(本章完)