这个观察员系统使用了一种叫做"事后最优推理长度"的概念。简单来说,就是回过头来看,AI模型最少需要思考多长时间才能得出同样质量的答案。研究团队通过大量的案例分析,为每个推理过程标记出了这个最优停止点。