안녕하세요. ECCV 메인 컨퍼런스도 이제 이틀차에 접어 들었습니다.

어제 오프닝에서 다른 학회들과 마찬가지로 각종 시상식 코너가 있었는데, PAMI Everingham Prize를 받은 Johannes Schönberger가 눈에 확들어 와서 한번 소개를 드려도 좋겠다 싶어서.. 학회 쉬는 시간을 이용하여 또 글을 써봅니다.

이분의 대표 작품은 바로 COLMAP이라는 오픈소스 SfM (Structure From Motion) 소프트웨어 인데요,

여기서 SfM이란? 우리가 흔히 쓰는 카메라를 단안 카메라 (Monocular) 라고 부르는데요, 우리가 한쪽 눈을 가렸을 때 원근감이 없어지는 것처럼 카메라 하나만 가지고는 3차원 공간상의 구조 정보를 얻을 수가 없습니다. 하지만, 카메라를 이동 시키면 같은 장면을 여러각도에서 보게 되는 효과를 얻게 되죠.. 한쪽 눈 감고 좌우로 움직이면 가까이 있는 물체는 많이 움직이고 멀리있는 물체는 조금만 움직이는 것 처럼.. 카메라를 움직이면서 각 픽셀들이 어찌 이동하는 지를 이용하여 깊이 정보 (Disparity map또는 depth map)을 얻어내고 그걸 계속 차곡차곡 잘 합쳐서 공간이나 물체를 3D로 만들어 내는 기술입니다.

다시 본론으로 들어와서.. COLMAP은 그런 SfM방법 중 가장 오픈소스로서 문서화도 잘 되어있으면서 성능도 좋은 녀석이라, 요즘 2D 이미지로 3D 로 뭔가를 하고자하는 수 많은 연구에서 베이스라인으로도 쓰이고, weak-supervision이나 self-supervision값을 만들어 내는 용도로 활발하게 사용이 되고 있습니다. 궁금하신 분은 핸드폰으로 자기 책상을 여러각도로 찍어보고 프로그램을 돌려보면 오.. 이런게 있구나.. 하실 수도 있을 것 같네요 ㅎㅎ (https://github.com/colmap/colmap) 바이너리도 배포가 되고 있고, 리눅스(우분투)에 익숙하시다면 컴파일 난이도가 높지는 않습니다.

비전 분야에선 워낙 유명하신 ETH의 Marc Pollefeys의 제자로 교수님과 마찬가지로 현재는 MS에서 일을 하시고 있네요. 이분 박사 학위 논문을 읽어보면.. 정말 최신 SfM의 역사가 담겨있는 교과서 느낌이 들었는데.. 연구나 프로그래밍 실력이 정말 대단한 것 같음을 느꼈습니다.

혹시 로봇에 단안 카메라를 장착하고 이것저것 해보고 계시다면, SfM을 이용해서 로봇의 인지능력을 3D공간으로 끌어 올리시는 것도 좋은 시도가 되지 않을까 생각합니다.

P.S: 앞으로도 이렇게 과학계 샛별같은 사람 또는 대가님들을 소개하는 글을 종종 올릴까하는데 그룹 분들의 의견도 함 들어보고 싶네요!

Posted by uniqueone
,