我看到 GitHub Copilot 在 JetBrains 相关更新里支持全局自定义 Agent,可以把 .agent.md 放到 ~/.copilot/agents 下面,让多个工作区复用。第一反应是:这东西对个人开发者很方便。第二反应是:它也很容易变成新的配置债。 开发工具一旦支持“全局规则”,就会诱惑我们把所有个人偏好都写进去。短期确实省事…
很多人期待长任务编程 Agent,是因为它看起来能把“我想要一个功能”直接变成 PR。我对这个期待比较谨慎。Agent 能跑更久,能自己读文件、改代码、跑测试,当然是进步。但它越能自主执行,越暴露一个老问题:需求如果写得像聊天,最后就会得到一个像聊天一样含糊的实现。 OpenAI 在 Codex 相关技术文章里讲过 agent loop、工具调用、…
我对代码审查 Agent 的态度有点矛盾。一方面,它确实适合做很多人不愿意认真做的事:检查边界条件、扫一遍 diff、找明显的空指针、提醒测试没覆盖。另一方面,如果团队把它当成“自动 reviewer”,很快就会遇到一个更麻烦的问题:它可以发现问题,但不应该替你决定取舍。 Anthropic 在 Claude Code 相关更新里提到过专门的 re…
我最近看 AI 编程工具的更新,越来越少关注“它又支持了什么模型”,反而更关注一个不太显眼的方向:它们开始认真处理上下文成本了。 GitHub Copilot 在 2026 年春季的一些更新里提到语义搜索、跨仓库 grep、prompt caching、deferred tool loading、面向 Agent 的专用工具。这些词听起来像产品细节…
我原本以为 MCP 发展到 2026 年,主要矛盾会是“大家到底接不接这个协议”。现在看,这个阶段已经过去了。真正值得个人开发者关心的,不是再多接几个 MCP server,而是:当工具调用开始跨进程、跨服务、跨账号以后,状态放在哪里,权限怎么收口,失败怎么恢复。 这不是一个很性感的话题,但它决定了 MCP 能不能从演示项目变成可维护的生产组件。 …
过去大家和 AI 交互,核心还是“问一句,回一段”。现在越来越多产品在往另一个方向走:不是让模型只回答你,而是让它去执行、去调用工具、去推进一个任务。这当然是个重要变化,但我对它的判断并不狂热。因为“执行”变成接口,不等于所有应用都该立刻变成 Agent 产品。为什么这是一个真实变化当工具调用、文件读取、网页搜索、远程服务和运行时开始被统一到同一条…
每次有更强的编码模型发布,讨论总会很快滑向排行榜、分数和“谁又第一了”。这些信息当然有参考价值,但我越来越觉得,对个人开发者来说,真正重要的问题不是模型又涨了多少分,而是你的工作流有没有跟着升级。如果工作流没变,模型再强,很多收益最后也只会停留在“写得更快一点”。这不是没用,但远远没有到值得大惊小怪的程度。为什么我现在不太执着 benchmark因…
看到“Copilot for Eclipse 开源”,很多人的第一反应可能是:我又不用 Eclipse,这跟我有什么关系?但我觉得这件事真正有价值的地方,恰恰不在 Eclipse,而在于它把一部分 AI 编程工具最不透明、最让人不放心的东西,往台面上拉了一步。为什么这件事值得写AI 编程工具这两年最常见的焦虑之一,就是“我看到了结果,但看不到它怎么…
“让 Agent 自己打开网页、点按钮、抓内容、完成流程”,这件事听起来太对了。谁不想把那些烦人的后台操作、表单填写、网页查找全自动外包出去?但我这段时间看下来,越发觉得给 Agent 一个浏览器当然值得关注,可它真正难的从来不是“能不能操作页面”,而是失败率、等待时间、环境稳定性和成本会不会把收益吃掉。为什么这个方向会热原因很简单。很多系统并没有…
本地 MCP 好理解:工具跑在你机器上,权限、上下文、失败影响范围都相对直观。远程 MCP 一旦开始普及,事情就没那么简单了。很多演示会把注意力放在“终于能连远程服务了”,但我现在更在意的是另一件事:远程连接让工具更好用了,也让权限、身份、租户边界这些老问题重新变成主角。为什么这个变化值得注意远程 MCP 的意义当然很大。它让工具不必都本地安装,也…