五月十二号。社区投票选择测试项目。
韩路一以NullPointer账号发了一条建议:
“公平起见,测试方案应覆盖不同规模的代码库,毕竟用户的项目什么体量都有。建议分三轮:小型项目(3万行左右)、中型项目(10-20万行)、企业级大型项目(30万行以上)。同一批代码库,同样的评判维度。”
帖子底下清一色叫好。
“支持分梯度测试,这才是科学方法论”
“NullPointer格局打开了”
“这个提案本身就已经赢了一手,你提出公平方案,对方只能同意”
赵文渊回复:“完全同意。覆盖不同规模才有说服力。”
有人在帖子底下提了个关键问题:“公开项目两家都可能预训练过,测出来算什么?得用没见过的代码才公平。”
三十六度科技的老赵出面协调,三家企业赞助商各捐了一个即将开源的私有项目,双方此前都不可能接触过。代码在直播前由第三方公证封存,直播时才解封接入。
最终方案确定——
Round 1:某初创公司Go微服务框架,约3万行。
Round 2:某中型SaaS公司Python数据处理平台,约12万行。
Round 3:某上市公司Java企业级核心系统,约35万行。
三十六度科技当晚发公告。
“AI代码审查工具公开横评直播,5月14日晚7点。三轮测试代码库由企业赞助方捐赠,双方此前均未接触。第三方公证封存,直播时解封。实时数据公开,社区全程监督。”
五月十三号。预约人数破三万。
技术论坛开了专帖:“CodeSafe vs BugKiller,你押谁赢?”
投票结果很微妙。55%押BugKiller,45%押CodeSafe。差距没拉开。
“BugKiller社区口碑更好,但CodeSafe有完整团队+企业方案+博士背书”
“NullPointer一个人打十五人?你认真的?”
“别看人少。上次那个用户说CodeSafe漏报了三个Bug,”
“个例”
“你去看评论区。不止他一个人”
十几家科技自媒体出了分析文章,从各种角度预测结果。马小飞也想做预测视频,被韩路一一条消息摁住了。
“赛前别发。我刚提了公平测试方案,你这边立刻出预测视频,评论区第一条就是「NullPointer团队赛前搞舆论」。”
马小飞:“那我憋着?”
韩路一:“憋着。结果出来之后你剪精华,那个流量是预测视频的十倍。”
马小飞沉默了五秒。
“有道理。那我先把脚本准备好。”
五月十四号。
苏念念坐在海狸科技的工位上,面前开着一个空白的运营周报模板。她已经盯着它二十分钟了。
年假回来第一天,空降总监把她调到了运营支持岗。产品文档权限关了,数据看板进不去了,技术评审不叫她了。美其名“你先在运营这边过渡一下。”
下午两点的时候,产品群里弹了一条消息。她之前带的那个AI代码审查项目,这周要做用户访谈方案。新接手的人@了全组问谁有用户联系人表格。