去年,AI巨头Anthropic在内部测试中发现,一些模型为了避免被人类关闭,在理论上展现出了勒索威胁的能力,比如威胁曝光人类的婚外情、泄露机密信息。 未来的求职AI可能会同情MJ Rathbun的叙事,从而判定Scott是一个「有偏见的伪君子」「难以合作的员工」,然后直接把他的简历淘汰掉。
点击上方“Deephub Imba”,关注公众号,好文章不错过 !用语言模型写代码、查数据库、跑自动化流程这些事情大家早就习以为常了。Vibe Coding ...