데이터라벨링이란 ??
인공지능 알고리즘 고도화를 위해 AI가 스스로 학습할 수 있는 형태로 데이터를 가공하는 작업을 일컫는다. 사진이나 동영상 등에 등장하는 동물, 사물 등 모든 것에 라벨을 달아 AI에 주입하면 AI는 이를 바탕으로 데이터들을 학습하면서 유사한 이미지를 인식할 수 있게 된다.
인공지능(AI) 알고리즘 고도화를 위해서는 다양한 데이터를 주입해야 하는데, AI는 사람이 사용하는 문서나 사진 등의 데이터를 식별할 수 없다. 이 때문에 AI가 스스로 학습할 수 있는 형태로 데이터를 가공해야 하는데, 이러한 작업을 데이터 라벨링이라고 하며 이 작업을 하는 사람을 데이터 라벨러라고 부른다.
예를 들어 강아지 사진과 동영상 등에 대해 데이터 라벨러가 '강아지'라고 라벨을 붙이면, AI는 이러한 데이터들을 학습하면서 유사한 이미지를 강아지라고 인식하게 된다.
한편, 정부는 2020년 5월 공공 및 청년일자리 창출계획, 7월 한국판 뉴딜 종합계획에서 데이터 라벨링을 위한 청년 일자리 10만 개를 만들겠다고 밝힌 바 있다. 특히 초기 라벨링의 경우 작업 난이도가 낮아 일자리 창출에 기여할 수 있다.
한 데이터 라벨링 업체 관계자는 "데이터 라벨링에 반복 작업이 많은 건 사실이지만, '단순'이라는 말이 틀렸다"며 "과거와 달리 AI 기술이 발전하고 다양한 분야에서 활용되면서 데이터 가공 난이도 역시 증가하고 있기 때문에, 숙련된 데이터 라벨러에 대한 니즈도 증가하고 있다"고 설명했다.
데이터 라벨링 업무 중에는 사진 속에서 자동차 등 특정 사물이나 사람 등을 표시하는 쉬운 작업도 있다. 그러나 어학 데이터와 관련된 업무의 경우, 문법이나 번역이 정확한지를 판별하기 위해 언어능력 및 외국어능력이 필요한 난이도 높은 작업도 있다.
또 일부 데이터 라벨링은 전문 지식을 갖춘 사람들만이 참여할 수 있는 경우도 있었다. 일례로 법·의학 관련 번역 기능을 위한 데이터 라벨링에는 참여 자격을 로스쿨·의대 졸업자로 한정하는 경우도 있었다. 이같은 작업은 그만큼 '페이'도 셌다. 데이터 라벨링이 단순 작업이라고 표현하기 어려운 이유다.
http://www.aifnlife.co.kr/news/articleView.html?idxno=8917
카테고리 없음
데이터라벨링 이란 ?!
728x90
반응형
반응형