当我们在视频通话时,屏幕对面的人能够实时地对我们的话语做出反应——点头、微笑、皱眉,这些看似简单的互动其实蕴含着极其复杂的技术挑战。如今,字节跳动的研究团队向我们展示了一个令人惊叹的成果:他们创造出了一个名为FlowAct-R1的系统,能够让虚拟数字人像真人一样与我们进行自然、流畅的实时对话。