逢泽 FengZ - 用自己喜欢的方式过这一生

测试为什么总是被跳过

大多数开发者知道应该写测试。但很多时候测试被跳过了。

不是因为懒。是因为成本。

写测试需要切换思维模式。从"让它工作"切换到"证明它工作"。这个切换有摩擦。

写测试需要额外的代码。Mock依赖、构造数据、断言结果。代码量可能比实现本身还多。

写测试需要维护。需求变了,测试也要改。重构代码,测试也要跟着重构。

这些成本是真实的。在时间紧张时,测试往往被牺牲。

Claude Code改变了什么

Claude Code不是测试框架。它是AI辅助的代码编辑器。

但它改变了测试的成本结构。

思维切换的成本降低了

你不需要自己从"实现"切换到"测试"。你只需要说:"给这个函数写测试。"

Claude Code会完成切换。它会分析函数的行为,识别边界条件,构造测试用例。

你可以专注于验证:这些测试覆盖了我关心的场景吗?

代码量的成本降低了

Mock、fixture、断言——这些样板代码Claude Code可以生成。

你不需要记住测试框架的API。不需要查文档看toEqual和toBe有什么区别。不需要手写Mock函数。

Claude Code知道你的测试框架。它会用正确的语法,生成正确的断言。

💡 Click the maximize icon to view in fullscreen

维护的成本降低了

需求变了?告诉Claude Code:"需求改成这样了,更新测试。"

重构代码?Claude Code会识别哪些测试需要同步更新。

测试失败?Claude Code可以分析失败原因,提出修复建议。

如何简单高效地写测试

不是所有代码都需要测试

测试有成本。即使Claude Code降低了成本,成本仍然存在。

哪些代码值得测试?

核心逻辑值得测试。 算法、业务规则、状态转换——这些是系统的核心。它们出错的代价高。

边界条件值得测试。 空数组、null值、极端数值——这些是bug的高发区。

复杂的集成值得测试。 多个模块交互的地方,容易出现意外行为。

哪些代码不需要测试?

显而易见的代码不需要测试。 function add(a, b) { return a + b } 不需要测试。

胶水代码不需要测试。 只是转发调用,没有逻辑的代码。

UI布局代码不需要测试。 测试"按钮在左边还是右边"没有意义。

测试行为,不是实现

好的测试关注"做了什么",不是"怎么做的"。

假设你有一个函数:

function processOrders(orders: Order[]) {
  const sorted = orders.sort((a, b) => a.date - b.date)
  const filtered = sorted.filter(o => o.status === 'pending')
  return filtered.map(o => ({ id: o.id, total: o.total }))
}

糟糕的测试会检查:

是否调用了sort
是否调用了filter
是否调用了map

这种测试很脆弱。重构成orders.filter(...).sort(...).map(...)就会失败。

好的测试关注输入和输出:

test('processOrders returns pending orders sorted by date', () => {
  const orders = [
    { id: 1, date: new Date('2025-01-02'), status: 'pending', total: 100 },
    { id: 2, date: new Date('2025-01-01'), status: 'pending', total: 200 },
    { id: 3, date: new Date('2025-01-03'), status: 'completed', total: 300 }
  ]

  const result = processOrders(orders)

  expect(result).toEqual([
    { id: 2, total: 200 },
    { id: 1, total: 100 }
  ])
})

这个测试说的是:"给定这些订单,应该返回这个结果。" 具体怎么实现,不关心。

让Claude Code帮你发现边界

你可能想到了常见的测试用例。但总有些边界你没想到。

Claude Code可以帮你发现。

告诉它:"分析这个函数,列出所有可能的边界条件。"

Claude Code会扫描代码,识别:

数组为空的情况
参数为null的情况
数值溢出的可能
字符串编码的问题
并发访问的风险

它不一定找全。但它能补充你的思考。

失败时先跑测试

代码写完了,测试也生成了。现在怎么办?

不是立即提交。而是:先让测试失败。

故意修改代码,让它返回错误的结果。然后跑测试。

如果测试没有失败,说明测试有问题。测试没有真正验证行为。

这个技巧听起来反直觉,但很有效。它确保测试是有意义的。

传统的TDD(测试驱动开发)流程是:

写测试(红色)
写实现(绿色)
重构(重构)

这个流程严格,但学习曲线陡峭。

Claude Code提供了简化版本:

写实现
生成测试
验证测试有效(让测试失败)
确认测试通过

关键是第3步。它保证了测试的有效性,而不需要完整的TDD流程。

测试的真正价值

测试不是为了证明代码正确。

代码正确性是个光谱,不是二元状态。测试只能证明"在这些场景下表现符合预期"。它不能证明"在所有场景下都正确"。

测试的价值在于:让你知道代码做了什么。

当你读测试,你看到的是:

这个函数接受什么输入
它返回什么输出
它如何处理边界情况
它的假设是什么

测试是文档。而且是会更新的文档。代码改了,测试跟着改。文档永远是最新的。

测试还是安全网。重构时,测试告诉你:"这个改动破坏了原有的行为。" 没有测试,你只能靠手动验证,或者等用户发现bug。

Claude Code让测试成为日常

测试不再是额外的负担。它变成了开发流程的一部分。

写完一个函数?让Claude Code生成测试。

修改一个模块?让Claude Code更新相关测试。

发现bug?让Claude Code添加回归测试。

这不是测试驱动开发。这是AI辅助的测试。

测试的成本降低了,测试的价值没有降低。这个平衡改变了测试的经济学。

以前,测试是"如果有时间就做"的事情。现在,测试是"几乎没有理由不做"的事情。

测试回归了本质:验证行为,记录假设,提供安全网。

不是为了覆盖率。不是为了流程。是为了让你更清楚代码在做什么。

什么类型的测试最适合AI生成?单元测试、集成测试还是端到端测试?

Claude Code生成的测试是否会过度依赖实现细节?如何避免?

测试覆盖率是否仍然是一个有意义的指标?还是应该用其他方式衡量测试质量?

如何在团队中推广AI辅助测试?如何说服习惯手写测试的开发者?

AI生成的测试是否足够好?还是需要人工审查每一个测试用例?

当测试失败时,是应该先看代码还是先看测试?AI可以如何帮助定位问题?

使用Jest或Vitest作为测试框架有什么区别?

在Claude Code中写单元测试:简单高效的实践

测试为什么总是被跳过

Claude Code改变了什么

思维切换的成本降低了

代码量的成本降低了

维护的成本降低了

如何简单高效地写测试

不是所有代码都需要测试

测试行为,不是实现

让Claude Code帮你发现边界

失败时先跑测试

测试的真正价值

Claude Code让测试成为日常

相关文章

参考资源

Related Posts

用 AI Agents 加速测试环境配置

使用Jest或Vitest作为测试框架有什么区别?

缺少Jest依赖时的测试选择

API 测试各种边界情况

诊断 Supabase 连接失败：借助 MCP 工具链

端到端 Postback 模拟测试

Git Hooks 驱动的文档同步

分层修复

用 MCP 让 Claude Code 执行 Prisma 迁移

查询先于假设