开源python库chardet 7.0 版本,这事起源于python 标准库要把它收编,项目维护者dan blan

AI 指导的 Python 库 chardet 7.0 版本,最近在开源圈引发了大震动。这事儿起源于 Python 标准库要把它收编,项目维护者 Dan Blanchard 就找来了 AI 工具 Claude Code,5 天内把整个项目彻底重写了一遍。结果很喜人,性能一下子提升了 48 倍。不过 Blanchard 没满足于此,他还顺手把原来限制挺多的 LGPL 协议换成了 MIT 协议。 这下可好了,原作者 Mark Pilgrim 在 GitHub 上炸开了锅。他直接指着新版本说这不合法,理由是 Blanchard 本来就对老代码门儿清,再加上 AI 生成代码还不行,完全不符合“净室设计”(Clean Room Design)的规矩。Pilgrim 认为这还是在复制自己的劳动成果,必须把 LGPL 协议给改回去。 为了反驳 Pilgrim,Blanchard 搬出了一堆数据来说事。他承认自己看过旧代码,但新生成的代码结构完全是重新设计的。他甚至还用 JPlag 工具测了相似度,显示新旧版本最高也就只有 1.29% 的重合度。Blanchard 是在“干干净净”的环境里写的设计文档,然后喂给 Claude 模型让它生成代码。 不过大家还是心里打鼓。Claude 模型的训练数据里可能早就有了 chardet 以前的代码,即便结构变了,“先验知识”还是让它受影响。而且 Blanchard 自己全程盯着 AI 生成的代码修修补补,这种干预会不会让它变成衍生品呢? 科技媒体 Ars Technica 的文章里提到,现在法院还没弄清楚这种 AI 写的软件该咋授权。自由软件基金会的 Zoë Kooyman 就说过,大模型早就把老代码吃干抹净了,哪里还有什么“干净”的空间。Bruce Perens 更是发狠话,说整个软件开发的经济基础都被颠覆了,跟印刷术问世的影响差不多大。 这事儿正在 IT 界掀起大讨论。内容由 IT之家消息指出。