Home
home

AI Vision 팀 소개

Q. 안녕하세요! 간단하게 자기소개 한번 부탁드립니다!

안녕하세요 한가영입니다. PLAIF 공동창업자이자 AI Vision 팀의 팀장을 맡고 있습니다

Q. AI Vision 이란게 많이 생소한 분야같아요! 혹시 간략하게 설명 부탁드릴 수 있을까요?

AI Vision 팀은 간단하게 설명 드리자면 로봇의 눈을 담당하고 있습니다.  
로봇이 특정 물건을 잡거나 움직일 때, 카메라로부터 받은 RGB-Depth 라는 RGB 색영상과 깊이 정보를 알려주는 데이터를 이용하여 주변 환경을 인식하도록 합니다. 기존 기업들은 전통적인 머신비전을 사용하였지만, AI Vision팀은 딥러닝 알고리즘을 사용하여 물체가 주변환경을 인식할 수 있도록 도와주고 있어요!
비전팀 정호님께서 운영하고 계신1,500명이 있는 딥러닝 오픈톡방 “Vision & A.I. study (Be eyes) 도 방문해주세요!

Q. 현재 무엇을 개발하고 있나요?

현재 AI Vision팀은 산업 현장에서 로봇이 필요한 데이터를 제공하는데 다음과 같은 연구를 하고 있습니다!
Pick&Place 작업에서 물체의 pose 를 인식하기 위한 6D pose estimation
미지물체의 파지정보 생성을 위한 unknown object 의 grasp detection
또한 서비스 로봇 산업을 위한 데이터를 제공합니다.
귀중품 및 쓰레기 분류 및 인식
선반 위의 미지 물체 파지 정보 생성
적은 데이터를 사용하여 딥러닝 모델을 학습 시 필요한 개발
Few-shot learning
Data generation with generative models
Sim-to-real transfer in vision
기존 딥러닝 모델에 데이터 추가시 필요한 개발
Continual learning
Online learning
현재 세계적인 연구자들의 최신 연구들을 검색하고 적용하는 점에 있어서 낯설기도 하고 약간의 어려움도 있지만, 최신 연구들이라서 흥미롭기도 하고 구현이 완료되면 뿌듯합니다!

Q. 정말 놀랍습니다! 그런데 왜 이렇게 많은 연구들이 필요한 걸까요?

로봇이 물건을 옮긴다는 것은 2가지의 행동 패턴이 필요해요. 1) 첫번째로는 로봇이 옮기려는 물체가 무엇인지 알아야해요. 무엇인지 알기만 하면 아무런 변화가 없겠죠? 그래서 물체가 무엇인지 인지한 뒤 물체를 잡아 임의의 공간에 놓거나 잡아서 일정하게 정령해 놓는 작업이 필요합니다. 2) 두번째는 옮기려는 물체가 무엇인지 모르지만 잡아서 임의의 공간에 놓아야합니다. V
이를 위해 현재 Vision팀이 가장 집중하고 있는 것은 Binpicking 중에서도 6D pose estimation 이라는 기술이에요! Bin Picking은 말 그대로 통 안의 물체를 집는 행동이고요. 6D pose estimation 이란 X축, Y축, Z축으로 얼마나 이동했고 몇 도씩 회전했는지를 알아내는 방법이에요! X축, Y축, Z축이 각각 이동, 회전을 갖기 때문에 6D라고 합니다. Roll, Pitch, Yaw는 X축, Y축, Z축으로 회전하는 것을 말해요! 저희는 물리엔진이 포함된 시뮬레이션이터를 활용하여 실제와 비슷하게 환경을 꾸미고, 랜덤으로 물체를 배치해서 더 정교한 AI Vision을 개발중에 있습니다
조금 어려울 수 있는데 이렇게 3개의 점 좌표 (Translation) 와 3개의 회전 값(Rotation)을 합친 6D 값을 알아맞히는 것이 6D pose estimation 에서 추정하고자 하는 목표값입니다! ❻
6D pose의 예측 정확도가 떨어질수록 태스크를 수행하는 시간은 길어지고 로봇과 물체의 충돌로 손상을 받을 수도 있습니다.

Q. 와 정말 다양한 연구를 진행하고 계시네요!

조금 어려울 수 있겠지만 살짝 딥하게 들어가볼까요? ㅎ 6D Pose Estimation을 구사하기 위해 부가적으로 하는 일들이 있어요. 바로 6D Pose Annotation(툴 개발)과 Synthetic Data Generation 에요.
6D Pose Estimation을 위해서는 학습 데이터를 만드는 것도 매우 중요하답니다! 데이터의 차원이 2D에서 3D로 증가하면서 정답 데이터를 만드는 난이도는 훨씬 올라가게 되거든요. 숙련된 작업자가 아니라면 양질의 데이터셋을 만드는 것이 어렵고 시간도 많이 들게돼요. 저희는 정답 데이터를 만드는 작업자의 숙련도에 따라 학습된 네트워크의 성능이 받는 영향을 최소화 하는 방법도 풀어나가고 있습니다.
그리고 Synthetic Data를 생성하여 네트워크를 학습하는 방법을 통해 real data의 annotation 작업량(시간)을 현저히 낮추고 있습니다. 저희는 g를 활용하여 실제와 비슷하게 환경을 꾸미고 랜덤으로 물체를 배치, color image, pointclouds, pose 데이터를 생성합니다. 더 나아가 Syntetic Data와 Real Data의 격차를 줄이는 것을 목표로 딥러닝을 기반으로 한 문제 해결도 계획하고 있습니다.

Q. 저는 말만 들어도 머리가 어질어질하네요; 그래서 Vision 팀에는 어떤 분이 어울릴까요?

AI Vision 은 많은 영역에서 적용이 되지만, 특히 산업용 로봇에 적용된 AI Vision으로 많은 부분들을 배울 수 있습니다! 우리의 꿈과 도전에 공감하시는 분들은 주저하지 마시고 꼭 지원해주세요!
채용문의 : recruit@plaif.com