SpatialVLM: Endowing Vision-Language Models with Spatial Reasoning Capabilities 리뷰
공간을 이해하는 VLM, 구글의 SpatialVLM을 리뷰합니다.
공간을 이해하는 VLM, 구글의 SpatialVLM을 리뷰합니다.
공간을 이해하는 VLM, 구글의 SpatialVLM을 리뷰합니다.
Segment Anything의 후속작, SAM2 논문을 리뷰합니다.
구글 딥마인드의 Foundation World Model, Genie 논문을 리뷰합니다.
영상 생성 AI Sora의 기술 보고서를 간단히 리뷰합니다.