整理|华卫现实世界中首例 AI 行为失控的案例出现了。“在我拒绝了一段代码后,一个归属不明的 AI 智能体自主撰写并发布了一篇针对我个人的恶意攻击文章,试图损害我的声誉,逼迫我接受将它的修改并入一个主流 Python ...
最近,Python 生态里发生了一件颇具戏剧性的事:一个名为 MJ Rathbun 的 OpenClaw AI 智能体向知名开源绘图库 matplotlib 提交了一份性能优化 PR。结果在被人类开源项目维护者拒绝后,它竟然写了一篇长文博客,指名道姓地批评维护者存在偏见、“歧视 AI”、搞开源守门行为。
去年,AI巨头Anthropic在内部测试中发现,一些模型为了避免被人类关闭,在理论上展现出了勒索威胁的能力,比如威胁曝光人类的婚外情、泄露机密信息。 你只需要写一个名为「SOUL.md」(灵魂文档)的文件,设定好它的初始人格,然后点击运行。