Grounded-SAM把SAM和BLIP、Stable Diffusion集成在一起,将图片「分割」、「检测」和「生成」三种能力合一,成为最强Zero-Shot视觉应用。 该模型可以在统一的框架prompt encoder内,指定一个点、一个边界框、一句话,直接一键分割出任何物体。
点击上方“Deephub Imba”,关注公众号,好文章不错过 !用语言模型写代码、查数据库、跑自动化流程这些事情大家早就习以为常了。Vibe Coding ...