与CLAUDE构建软件
从头脑风暴到规范的工作流程、工具链,以及AI无法做出的决策。来自HostList.io、gautamkhorana.com和Seahawk客户产品的实战经验。
本指南存在的原因
2026年以Claude作为主要工程协作者来构建软件改变了成本曲线和团队结构,但没有改变底层的工艺。软件中需要大量判断的部分(构建什么、为什么构建、它在失败时应该如何表现)仍然需要人工关注。执行部分(编写代码、重构、生成样板代码、运行迁移)戏剧性地压缩了。知道哪个是哪个就是2026年的全部技能。
本指南是我在Seahawk Media实际使用的工作流程,用于交付定制产品,以及个人项目如HostList.io、gautamkhorana.com和Deluxe Astrology。不是Claude教程,不是提示词工程手册。这是能够以Claude作为承重工程师生产可交付软件的流程纪律。
从头脑风暴到规范的工作流程
第1阶段:结构化头脑风暴
在编写任何代码之前,我会与Claude进行结构化的头脑风暴。我的提示是:用平白的语言描述问题,让Claude提出五个问题,这些问题的答案会改变设计,回答这些问题,然后让Claude用200字总结最终的产品规格说明。这个阶段需要30到60分钟,产生一份书面规格说明,作为其余工作的基础。
第2阶段:技术决策
有了规格说明后,我让Claude识别出在下游工作中杠杆作用最大的架构选择。数据库结构、API接口、渲染策略、部署模型。对于每一个,Claude提出两到三个选项和权衡取舍。我做出选择。这些决策被记录在同一份文档中,这样构建阶段就有了唯一的信息源。
第3阶段:规格驱动的实现
代码生成是最后一个阶段,也是最快的,因为规格说明已经完成。Claude按照大致的顺序编写模式、查询、组件、路由和测试。我审查每一次提交。大多数审查会发现一个小的重构或一个遗漏的边界情况;当规格说明清晰时,完全重写是很少见的。
Claude擅长什么和不擅长什么
擅长的方面
绿地项目代码,遵循众所周知的模式:REST API、CRUD管理面板、身份验证流程、博客引擎、营销网站。重构现有代码,其中目标形态清晰陈述。为具有明确输入和输出的代码生成测试。当模式差异明确时编写迁移脚本。起草文档。调试代码,其中症状可重现,追踪在上下文中。
不太擅长的方面
陌生领域中的架构决策。第三方API文档不完善或最近更改的集成代码。瓶颈不明显的性能优化。不常见的编程语言或框架中的代码生成,其中训练数据稀少。任何需求不明确的情况,LLM会填入听起来合理但对你的具体情况错误的默认值。
判断力差距
Claude 在编写代码的下一行时,表现始终优于中位数工程师。但在判断是否应该写下一行代码时,Claude 始终逊于资深工程师。资深工程师带来的是判断力。Claude 带来的是执行速度。两者结合的效果超过任何一方单独的表现。
我实际使用的工具链
Claude Code 作为主要界面
Claude Code 是 AI 辅助开发的 IDE。项目上下文一次性加载,拥有终端访问权限、文件系统访问权限、MCP 工具集成。这是我在 2025 年添加到技术栈中杠杆作用最高的工具。现在大多数工程工作在 Claude Code 中进行,而不是直接在 VS Code 或 Cursor 中进行。
Cursor 用于直接的编辑器内编辑
Cursor 仍然是在单个文件上与 AI 协作的最佳编辑体验。制表符补全、内联编辑、并排对比。当工作集中在一两个文件时,我使用 Cursor;当工作跨越整个项目时,我切换到 Claude Code。
通过 API 使用 Claude Sonnet 进行批量工作
当我需要以编程方式生成或重写数百页内容时(自动博客管道、内容人性化、schema 生成),我直接通过 Sonnet 调用 Claude API。相比聊天界面延迟更低、成本可预测、可脚本化。对内容管道来说是合适的工具。
用 OpenAI GPT-4o 进行提示词工程
我在2025年末发现,为Kimi、Minimax或任何其他agent编写提示词,最好由Claude或GPT完成,而不是手工编写。我描述目标,让GPT-4o生成提示词,然后用该提示词运行executor。输出质量明显优于手工提示词。
Kimi Researcher和Minimax Agent
分别进行深度研究和完整应用设计mockups。/blog/kimi-minimax-deep-research-design-mockups/ 这篇文章涵盖了完整的工作流程。这两个工具都是Seahawk用于客户研究和快速原型制作的关键工具。
在AI辅助开发中保持代码库规范
小粒度提交,描述性信息
AI辅助开发往往会产生大量diff,因为在一次提交中容易包含800行生成代码。约束自己进行更小粒度的提交。提交信息应该说明发生了什么变化以及为什么变化,这是未来的你用来调试回归问题的唯一工件。让它易于阅读。
测试作为约定
Claude能编写编译和运行的代码,但可能悄悄违反规范中隐含的约束。将这些约束编码为可执行契约的测试能捕捉到这些违规。在AI辅助时代,测试优先的规范比人工编写每一行代码的时代更重要。
代码审查目前仅限人工进行
我不允许Claude批准自己的pull请求。审查把关是仅存的最重要的人工质量控制,将其外包给编写代码的同一个模型会违背其目的。Anthropic SDK和Claude Code工作流使AI辅助审查变得容易,但最终批准权在我手中。
版本化依赖和锁文件
锁定每个依赖。使用锁文件。在每次构建时运行 npm audit。供应链攻击面是真实存在的,而且 AI 辅助开发往往比人工编写的代码添加更多依赖,因为添加包很快。锁文件纪律使这个面保持可审计状态。
AI 无法做出的产品决策
Claude 不适合的五类决策:
完全不构建什么。产品决策需要大量判断,取决于 Claude 没有的用户背景信息,是任何产品中最重要的决策。创始人和 PM 拥有这个决策权;AI 最多只能辅助。
要发布什么和要删除什么。构建期间的范围决策总是归结为模型看不到的约束条件。时间压力、团队士气、合作伙伴关系、市场定位。作为人类做出决策,记录推理过程,然后让 Claude 执行既定的范围。
故障模式设计。系统在出现问题时应该如何表现很少在前期指定,大多数生产事故都源于此。在故障模式上花费不成比例的时间;它们不会从快乐路径代码生成中自然而然地出现。
伦理层。你构建的东西有其含义。隐私、数据驻留、可访问性、环保成本。这些是人类决策,不是优化输出。在设计时明确提出这个问题。
长期可维护性。未来的自己阅读未来的 Claude 阅读现在 Claude 的代码是最深层的技术债。优化现有代码以便人类首先可读,其次 AI 可读。
我以这种方式推出的具体项目
过去十二个月 Seahawk 和个人层面的具体例子:
HostList.io(28,000 个 Next.js + Supabase 上的程序化页面):用 Claude Code 在五天内搭建框架,内容管道由 Claude 编写并集成 Tavily 研究,英雄图通过 FAL 生成,schema 标记自动生成。总工程时间大约是我三年前估计的三分之一。
gautamkhorana.com(这个网站,基于 Astro + Supabase):在一个周末的 24 小时内与 Claude Code 作为主要协作者重建。网站编辑界面、博客系统、schema 层、i18n,全部生成、审查、重构。构建这个质量的个人网站的成本降到了专注工作的一个周末。
Deluxe Astrology 自动博客和翻译管道:Tavily 研究到 Claude 草稿到 Winston 检查到 FAL 英雄图到 Supabase 发布的循环每天运行,跨越 30 种语言的 91,000+ 页面。管道本身大约 800 行代码,Claude 在大约 12 小时的专注工作中编写,其中大部分在纯人工团队中需要一周时间。
Seahawk 内部管理仪表板:Minimax Agent 从一个六行的描述生成第一个原型,Claude 完善它,结果在一小时内可交付。从"我们需要一个内部工具"到"我们正在使用这个内部工具"的时间从几天压缩到不到一个工作日。
最后的话
在 2026 年构建定制软件是一项工艺,在执行速度上压缩了一个数量级,在判断复杂性上大致保持不变。适应的团队是那些带来更多判断(更好的规范、更好的架构选择、更好的失败模式设计)并将更多执行委托给 AI 的团队。不适应的团队以竞争性速度生产软件但在质量上失利,或反之。
你不需要使用本指南中的每个工具。你确实需要知道哪些决定是你的,哪些可以委托。技能是边界,不是工具链。
如果你想要帮助以这个成本曲线交付定制软件项目,我们在 Seahawk Media 运行产品构建。对话是免费的;项目定价反映 AI 辅助的成本现实,而不是 2018 年的小时成本现实。