guides/custom-software.html

与CLAUDE构建软件

从头脑风暴到规范的工作流程、工具链，以及AI无法做出的决策。来自HostList.io、gautamkhorana.com和Seahawk客户产品的实战经验。

本指南存在的原因

2026年以Claude作为主要工程协作者来构建软件改变了成本曲线和团队结构，但没有改变底层的工艺。软件中需要大量判断的部分（构建什么、为什么构建、它在失败时应该如何表现）仍然需要人工关注。执行部分（编写代码、重构、生成样板代码、运行迁移）戏剧性地压缩了。知道哪个是哪个就是2026年的全部技能。

本指南是我在Seahawk Media实际使用的工作流程，用于交付定制产品，以及个人项目如HostList.io、gautamkhorana.com和Deluxe Astrology。不是Claude教程，不是提示词工程手册。这是能够以Claude作为承重工程师生产可交付软件的流程纪律。

从头脑风暴到规范的工作流程

第1阶段：结构化头脑风暴

在编写任何代码之前，我会与Claude进行结构化的头脑风暴。我的提示是：用平白的语言描述问题，让Claude提出五个问题，这些问题的答案会改变设计，回答这些问题，然后让Claude用200字总结最终的产品规格说明。这个阶段需要30到60分钟，产生一份书面规格说明，作为其余工作的基础。

第2阶段：技术决策

有了规格说明后，我让Claude识别出在下游工作中杠杆作用最大的架构选择。数据库结构、API接口、渲染策略、部署模型。对于每一个，Claude提出两到三个选项和权衡取舍。我做出选择。这些决策被记录在同一份文档中，这样构建阶段就有了唯一的信息源。

第3阶段：规格驱动的实现

代码生成是最后一个阶段，也是最快的，因为规格说明已经完成。Claude按照大致的顺序编写模式、查询、组件、路由和测试。我审查每一次提交。大多数审查会发现一个小的重构或一个遗漏的边界情况；当规格说明清晰时，完全重写是很少见的。

Claude擅长什么和不擅长什么

擅长的方面

绿地项目代码，遵循众所周知的模式：REST API、CRUD管理面板、身份验证流程、博客引擎、营销网站。重构现有代码，其中目标形态清晰陈述。为具有明确输入和输出的代码生成测试。当模式差异明确时编写迁移脚本。起草文档。调试代码，其中症状可重现，追踪在上下文中。

不太擅长的方面

陌生领域中的架构决策。第三方API文档不完善或最近更改的集成代码。瓶颈不明显的性能优化。不常见的编程语言或框架中的代码生成，其中训练数据稀少。任何需求不明确的情况，LLM会填入听起来合理但对你的具体情况错误的默认值。

判断力差距

Claude 在编写代码的下一行时，表现始终优于中位数工程师。但在判断是否应该写下一行代码时，Claude 始终逊于资深工程师。资深工程师带来的是判断力。Claude 带来的是执行速度。两者结合的效果超过任何一方单独的表现。

我实际使用的工具链

Claude Code 作为主要界面

Claude Code 是 AI 辅助开发的 IDE。项目上下文一次性加载，拥有终端访问权限、文件系统访问权限、MCP 工具集成。这是我在 2025 年添加到技术栈中杠杆作用最高的工具。现在大多数工程工作在 Claude Code 中进行，而不是直接在 VS Code 或 Cursor 中进行。

Cursor 用于直接的编辑器内编辑

Cursor 仍然是在单个文件上与 AI 协作的最佳编辑体验。制表符补全、内联编辑、并排对比。当工作集中在一两个文件时，我使用 Cursor；当工作跨越整个项目时，我切换到 Claude Code。

通过 API 使用 Claude Sonnet 进行批量工作

当我需要以编程方式生成或重写数百页内容时（自动博客管道、内容人性化、schema 生成），我直接通过 Sonnet 调用 Claude API。相比聊天界面延迟更低、成本可预测、可脚本化。对内容管道来说是合适的工具。

用 OpenAI GPT-4o 进行提示词工程

我在2025年末发现，为Kimi、Minimax或任何其他agent编写提示词，最好由Claude或GPT完成，而不是手工编写。我描述目标，让GPT-4o生成提示词，然后用该提示词运行executor。输出质量明显优于手工提示词。

Kimi Researcher和Minimax Agent

分别进行深度研究和完整应用设计mockups。/blog/kimi-minimax-deep-research-design-mockups/ 这篇文章涵盖了完整的工作流程。这两个工具都是Seahawk用于客户研究和快速原型制作的关键工具。

在AI辅助开发中保持代码库规范

小粒度提交，描述性信息

AI辅助开发往往会产生大量diff，因为在一次提交中容易包含800行生成代码。约束自己进行更小粒度的提交。提交信息应该说明发生了什么变化以及为什么变化，这是未来的你用来调试回归问题的唯一工件。让它易于阅读。

测试作为约定

Claude能编写编译和运行的代码，但可能悄悄违反规范中隐含的约束。将这些约束编码为可执行契约的测试能捕捉到这些违规。在AI辅助时代，测试优先的规范比人工编写每一行代码的时代更重要。

代码审查目前仅限人工进行

我不允许Claude批准自己的pull请求。审查把关是仅存的最重要的人工质量控制，将其外包给编写代码的同一个模型会违背其目的。Anthropic SDK和Claude Code工作流使AI辅助审查变得容易，但最终批准权在我手中。

版本化依赖和锁文件

锁定每个依赖。使用锁文件。在每次构建时运行 npm audit。供应链攻击面是真实存在的，而且 AI 辅助开发往往比人工编写的代码添加更多依赖，因为添加包很快。锁文件纪律使这个面保持可审计状态。

AI 无法做出的产品决策

Claude 不适合的五类决策：

完全不构建什么。产品决策需要大量判断，取决于 Claude 没有的用户背景信息，是任何产品中最重要的决策。创始人和 PM 拥有这个决策权；AI 最多只能辅助。

要发布什么和要删除什么。构建期间的范围决策总是归结为模型看不到的约束条件。时间压力、团队士气、合作伙伴关系、市场定位。作为人类做出决策，记录推理过程，然后让 Claude 执行既定的范围。

故障模式设计。系统在出现问题时应该如何表现很少在前期指定，大多数生产事故都源于此。在故障模式上花费不成比例的时间；它们不会从快乐路径代码生成中自然而然地出现。

伦理层。你构建的东西有其含义。隐私、数据驻留、可访问性、环保成本。这些是人类决策，不是优化输出。在设计时明确提出这个问题。

长期可维护性。未来的自己阅读未来的 Claude 阅读现在 Claude 的代码是最深层的技术债。优化现有代码以便人类首先可读，其次 AI 可读。

我以这种方式推出的具体项目

过去十二个月 Seahawk 和个人层面的具体例子：

HostList.io（28,000 个 Next.js + Supabase 上的程序化页面）：用 Claude Code 在五天内搭建框架，内容管道由 Claude 编写并集成 Tavily 研究，英雄图通过 FAL 生成，schema 标记自动生成。总工程时间大约是我三年前估计的三分之一。

gautamkhorana.com（这个网站，基于 Astro + Supabase）：在一个周末的 24 小时内与 Claude Code 作为主要协作者重建。网站编辑界面、博客系统、schema 层、i18n，全部生成、审查、重构。构建这个质量的个人网站的成本降到了专注工作的一个周末。

Deluxe Astrology 自动博客和翻译管道：Tavily 研究到 Claude 草稿到 Winston 检查到 FAL 英雄图到 Supabase 发布的循环每天运行，跨越 30 种语言的 91,000+ 页面。管道本身大约 800 行代码，Claude 在大约 12 小时的专注工作中编写，其中大部分在纯人工团队中需要一周时间。

Seahawk 内部管理仪表板：Minimax Agent 从一个六行的描述生成第一个原型，Claude 完善它，结果在一小时内可交付。从"我们需要一个内部工具"到"我们正在使用这个内部工具"的时间从几天压缩到不到一个工作日。

最后的话

在 2026 年构建定制软件是一项工艺，在执行速度上压缩了一个数量级，在判断复杂性上大致保持不变。适应的团队是那些带来更多判断（更好的规范、更好的架构选择、更好的失败模式设计）并将更多执行委托给 AI 的团队。不适应的团队以竞争性速度生产软件但在质量上失利，或反之。

你不需要使用本指南中的每个工具。你确实需要知道哪些决定是你的，哪些可以委托。技能是边界，不是工具链。

如果你想要帮助以这个成本曲线交付定制软件项目，我们在 Seahawk Media 运行产品构建。对话是免费的；项目定价反映 AI 辅助的成本现实，而不是 2018 年的小时成本现实。

WHEN YOU ARE READY TO TALK

BOOK YOUR 30-MIN CALL