第一百二十七章 解释层2.0
林知行盯着白板上的数字看了一个早上。
58%。
准确率58%,比扔硬币好不了多少。刘总给了三个月窗口,已经过去了两周。剩下的时间里,他们要把这个数字提到85%——或者至少接近85%——否则长沙的试点就是白干。
但他今天早上想的不是准确率。
准确率是技术问题,技术问题有解法。加数据、调参数、优化模型,这些东西周然在做,他也在做。
他想的是另一个问题。
昨天刘总在电话里说的那句话:"你们的东西虽然准确率还不高,但每条建议都告诉我为什么。我能看到你们在想什么。"
这句话在他脑子里转了一整夜。
他打开笔记本,翻到之前写的那行字:信任是渡渡科技花三千万也买不到的东西。
然后他在下面画了一个问号。
信任是什么?
信任是出了问题能找到人。信任是苏雨晴蹲在王老板店里帮他理需求。信任是方小满在商会群里一条条回复商户的问题。
但信任还有一个东西——
透明。
"周然。"
林知行转过头,叫了一声。
周然正在工位上写代码,听到声音抬起头。
"怎么了?"
"你用过我们的产品吗?"林知行问。
周然愣了一下。
"用过啊,"他说,"我测试的时候用的。"
"不是测试,"林知行说,"是像用户一样用。"
周然想了想,摇头。
"没有,"他说,"我只是跑数据,看结果,改bug。"
"那你用过渡渡科技的工具吗?"
"没有。"周然说,"我不用库存管理。"
林知行点了点头。
"好,"他说,"你现在去注册一个渡渡科技的免费账号,用他们的工具跑一遍长沙门店的数据。"
周然愣住了。
"用竞品?"他说,"这不太好吧?"
"有什么不好?"林知行说,"知己知彼。我需要知道他们的产品和我们的有什么区别。"
周然犹豫了一下,然后点了点头。
"好,"他说,"我下午做。"
"不,"林知行说,"现在就做。"
方小满从外面回来的时候,林知行正站在白板前面发呆。
"干嘛呢?"方小满把买回来的早餐放在桌上,"想什么呢?"
"想解释层。"林知行说。
"解释层?"方小满愣了一下,"我们的决策日志?"
"对,"林知行说,"我在想怎么升级它。"
方小满走过来,看了看白板。
白板上画着一个流程图——左边是"数据输入",中间是"AI分析",右边是"建议输出"。在"建议输出"的下面,林知行加了一个框:解释层。
"这个我们不是已经有了吗?"方小满说,"每条建议都告诉用户为什么。"
"有了,但不够。"林知行说。
"怎么不够?"
林知行拿起记号笔,在流程图上画了几条线。
"现在的解释层,"他说,"只告诉用户AI做了什么建议。比如'建议进货100箱苹果',下面写'因为过去7天苹果销量上升30%'。"
"对,"方小满说,"这不挺好吗?"
"好,但不够好。"林知行说,"用户看到这个解释,知道AI用了什么数据,但不知道AI是怎么分析的。"
方小满皱了皱眉。
"用户需要知道AI怎么分析吗?"他说,"他们只关心结果吧?"
"不一定。"林知行说,"刘总昨天说了一句话——'我能看到你们在想什么'。这句话的重点不是'看到',是'想什么'。"
方小满没说话。
"现在的解释层,"林知行继续说,"只展示了一层——数据来源。但AI的'想'不是一层,是多层。数据是一层,分析逻辑是一层,置信区间是一层。用户看不到后面两层,就看不到AI在想什么的全貌。"
"你的意思是……"
"我的意思是,"林知行说,"我要做解释层2.0。"
周然在旁边听了一会儿,插了一句话。
"解释层2.0?"他说,"你要加什么?"
林知行走回白板前面,拿起记号笔,在流程图上画了三个框。
"第一层,"他说,"数据来源。这个我们已经有了。"
"第二层,"他在第一个框下面画了第二个框,"分析过程。AI用了什么模型,考虑了哪些变量,权重是怎么分配的。"
"第三层,"他在第二个框下面画了第三个框,"置信区间。AI对自己的建议有多大把握。比如'建议进货100箱苹果',置信度是73%,意思是AI只有73%的把握这个建议是对的。"
周然盯着白板看了几秒。
"这个技术上不难,"他说,"分析过程可以写成日志,置信区间模型里本来就有,只是没有暴露给用户。"
"对,"林知行说,"技术上不难,但产品上很难。"
"怎么难?"
"难在用户愿不愿意看。"林知行说,"如果我把这三层都展示出来,用户会不会觉得太复杂了?"
方小满在旁边点了点头。
"有道理,"他说,"用户是老板,不是程序员。他们每天忙着进货、算账、看店,哪有时间看什么'置信区间'?"
林知行没说话。
他盯着白板上的三个框,想了很久。
"所以,"他说,"我不用技术语言。"
"不用技术语言?"方小满问。
"对,"林知行说,"我用商户的语言。"
他走回折叠桌前,打开笔记本电脑,新建了一个文档。
标题写:解释层2.0——文案模板。
然后他开始写。
【第一层:数据来源】
这个建议基于以下数据:
- 过去7天,您的苹果销量从每天30箱上升到每天42箱(↑40%)
- 下周气温预计下降5℃,苹果更耐储存
- 周末客流预计增加20%
【第二层:分析过程】
AI的分析逻辑:
- 销量上升是主要信号,说明需求在增加
- 气温下降是次要信号,说明储存风险降低
- 客流增加是补充信号,说明有机会卖出更多
三个信号综合判断:建议增加进货量。
【第三层:置信区间】
AI的信心:73%
意思是:AI有73%的把握这个建议是对的。剩下的27%可能是意外情况(比如突然下暴雨、竞争对手促销等)。
建议:您可以结合自己的经验做最终决定。
林知行写完,把屏幕转向方小满和周然。
"你们看看,"他说,"这样写,用户能看懂吗?"
方小满凑过去,一行一行地读。
"这个可以,"他说,"'过去7天销量上升40%',这个看得懂。"
"第二层呢?"林知行问。
"第二层……"方小满想了想,"AI的分析逻辑……销量上升是主要信号……这个也能看懂,但有点啰嗦。"
"第三层呢?"
"73%的把握……"方小满念了一遍,"这个'置信区间'是什么意思?"
"就是AI对自己的信心。"林知行说。
"那为什么不直接写'信心'?"方小满说,"写'置信区间'用户看不懂。"
林知行愣了一下,然后笑了。
"对,"他说,"写'信心',不写'置信区间'。"
周然在旁边看了一会儿,说了一句话。
"林知行,"他说,"你这个解释层2.0,有一个问题。"
"什么问题?"
"你只展示了AI的建议是对的,"周然说,"但万一AI的建议是错的呢?"
林知行转过头,看着周然。
"你的意思是……"
"我的意思是,"周然说,"你的解释层2.0,只告诉用户'AI为什么这么建议',但没有告诉用户'AI可能是错的'。如果AI的建议错了,用户看了你的解释,会觉得AI很厉害,然后直接照做。结果出了问题,用户会觉得被AI骗了。"
林知行沉默了几秒。
周然说得对。
解释层2.0的目的是让用户信任AI,但信任的前提是诚实。如果AI只展示自己是对的,不展示自己可能是错的,那这种信任是虚假的。
"那你觉得怎么办?"林知行问。
周然想了想。
"加一个功能,"他说,"让用户可以反馈'这个建议不对'。"
林知行愣住了。
"让用户反馈'不对'?"他说。
"对,"周然说,"在每条建议旁边加一个按钮,用户可以点'不对',然后写一句为什么不对。系统把这些反馈收集起来,下一轮训练的时候用。"
林知行盯着周然看了几秒。
"你知道这意味着什么吗?"他说。
"意味着什么?"
"意味着我们承认AI会犯错。"林知行说。
周然点了点头。
"对,"他说,"AI本来就会犯错。58%的准确率,接近一半是错的。与其让用户自己发现AI错了,不如我们主动告诉用户'AI可能是错的,你可以纠正我们'。"
林知行没说话。
他站起来,走到白板前面,想了很久。
周然的建议是一个赌注。
承认AI会犯错,用户可能因此不信任产品。
但反过来想——如果AI不承认自己会犯错,用户发现AI错了之后,会更加不信任。
两种不信任,哪一种更致命?
方小满在旁边听了一会儿,说了一句话。
"知行,"他说,"我觉得周然说得对。"
林知行转过头。
"为什么?"他问。
"因为刘总昨天说了一句话,"方小满说,"他说'免费的东西,我不信'。为什么不信?因为免费的东西出了问题找不到人。但我们的东西如果出了问题,用户能找到人吗?"
"能找到,"林知行说,"我们有苏雨晴,有你,有周然。"
"对,"方小满说,"但用户找到我们之后呢?我们告诉用户'AI没问题,是你数据有问题'?还是告诉用户'AI确实可能错了,你反馈一下,我们改'?"
林知行沉默了。
方小满继续说。
"知行,"他说,"你之前说信任是出了问题能找到人。但找到人不是终点,找到人之后怎么处理问题才是终点。如果用户反馈了问题,我们不承认,不改正,那用户下次就不会再反馈了。"
"你的意思是……"
"我的意思是,"方小满说,"纠错反馈不只是一个功能,是一种态度。我们告诉用户'AI可能是错的,但我们愿意听你的反馈,愿意改'。这种态度,比任何技术都值钱。"
林知行盯着方小满看了几秒。
然后他笑了。
"小满,"他说,"你什么时候变得这么会说了?"
方小满也笑了。
"我在商会群里混了三个月,"他说,"天天跟商户吵架,吵出来的。"
当天下午,林知行开始设计纠错反馈的功能。
他在笔记本上画了一个原型:
【纠错反馈按钮】
在每条AI建议的右下角,加一个小图标:👎
用户点击后,弹出一个输入框:
这条建议哪里不对?
[输入框]
提交反馈
【反馈收集】
用户的反馈会进入数据库,标记为"纠错记录"。
每条纠错记录包含:
- 建议内容
- 用户反馈
- 反馈时间
- 用户ID
【反馈应用】
每周,系统会自动分析纠错记录,找出高频错误模式。
如果某个类型的错误反馈超过阈值,系统会自动调整模型参数,减少这类错误的发生。
林知行写完,把原型发给周然。
"你看看,"他说,"技术上能做吗?"
周然看了几分钟。
"能做,"他说,"反馈按钮前端实现,反馈收集后端实现,反馈应用需要写一个自动调参的脚本。大概一周。"
"一周太久,"林知行说,"三天。"
周然愣了一下。
"三天?"他说,"有点紧。"
"我知道,"林知行说,"但我们没有更多时间了。刘总的三个月窗口已经过去两周,剩下的时间里,我们必须让产品有质的变化。"
周然沉默了几秒,然后点了点头。
"好,"他说,"三天。"
晚上,林知行一个人坐在折叠桌前面,盯着笔记本屏幕。
屏幕上是解释层2.0的完整设计文档,从数据来源到分析过程到置信区间,再到纠错反馈。
他把这些东西串在一起,发现一件事——
解释层2.0的核心,不是技术,不是功能,是一种态度。
我们不装。
AI可能对,也可能错。我们把判断依据展示出来,让用户自己决定信不信。用户觉得不对,可以反馈,我们会改。
这种态度,渡渡科技给不了。
因为渡渡科技的工具是标准化的,注册就能用,不需要人上门蹲点,不需要一条条解释。他们的产品是"黑箱"——用户输入数据,输出结果,中间发生了什么,用户不知道。
而他们的产品是"白箱"——用户能看到AI在想什么,能纠正AI的错误,能参与到AI的训练过程中。
黑箱和白箱,哪一种更让人信任?
答案很明显。
林知行关掉文档,打开微信。
他想给苏雨晴发一条消息,问她五金店那边的情况。
刚打开对话框,就看到苏雨晴发来的新消息。
时间是十分钟前。
"林知行,跟你说个事。"
林知行点开消息。
"我叔的朋友们,最近在用另一款AI工具——渡渡科技的。"
林知行的心跳快了一拍。
"我叔说,免费的先试试。"
他继续往下看。
"但用了两周,我叔又回来了。"
林知行盯着屏幕。
苏雨晴的消息继续弹出来。
"我叔说:'那个免费的不告诉我为什么推荐这个。你们那个虽然贵,但每条建议都告诉我为什么。我还是信你们。'"
林知行握着手机,没说话。
苏雨晴又发了一条消息。
"林知行,这算好消息还是坏消息?"
林知行想了很久。
好消息,还是坏消息?
好消息是——用户回来了。
坏消息是——准确率还是58%。
他打了一行字,又删了。
又打了一行字,又删了。
最后他发了一条消息:
"好消息。"
苏雨晴秒回:
"为什么?"
林知行打字:
"因为我们找到了对的方向。"
苏雨晴回了一个问号。
林知行继续打字:
"渡渡科技有三千万,我们有一万七。他们免费,我们收费。但用户还是选了我们。为什么?"
苏雨晴回:
"因为解释?"
林知行打字:
"对。因为解释。因为信任。因为用户能看到我们在想什么。"
苏雨晴沉默了一会儿,然后回了一条消息:
"那你们加油。我叔说,他可以帮你们介绍几个朋友。"
林知行看着这条消息,笑了。
他打字:
"谢谢。"
然后他关掉手机,看着窗外。
四环外的路灯亮着,远处是中关村的灯光。
他想起昨天在笔记本上写的那行字:信任是渡渡科技花三千万也买不到的东西。
现在他要在这行字下面加一句:
解释层2.0,是我们打信任战的武器。
他拿起笔,在笔记本上写下了这行字。
然后他合上笔记本,关掉灯,躺在折叠床上。
方小满在旁边的地铺上已经睡着了,呼噜声很有节奏。
林知行闭上眼睛。
明天,周然要开始做解释层2.0的开发。
三天后,这个功能就要上线。
他不知道上线之后会发生什么。
但他知道,这是他们唯一能打的仗。
不打价格战,打信任战。
用解释,换信任。
用透明,换忠诚。
(本章完)