바로가기 메뉴
메인메뉴 바로가기
본문 바로가기
  1. 이슈
  2. 산업·IT

비디, 음성 데이터 수집·관리 시스템 오픈… 체계적 인공지능 데이터 구축 기반 마련

"이미지, 영상 등 여러 분야의 데이터 구축에도 수집·관리 시스템을 활용할 수 있도록 확장해 나갈 것"

글  김명규 기자

  • 페이스북
  • 트위터
  • 카카오톡
  • 네이버 블로그
  • sns 공유
    • 메일보내기
  • 글자 크게
  • 글자 작게
원본보기
비디는 인공지능 학습용 데이터 구축 사업에 2년째 선정돼 참여하고 있으며, 올해는 화자 인식용 음성 데이터와 아동 음성 데이터 구축 과제에서 음성 데이터 수집·관리 시스템을 적용해 설계에 따라 편향 없이 데이터가 수집되도록 활용하고 있다.

정보통신기술(ICT) 서비스 및 플랫폼 개발 전문 기업 비디가 최근 ‘인공지능 학습용 데이터 구축 사업’에 선정돼 음성 데이터의 효율적인 수집·가공 및 관리를 위한 시스템을 오픈했다고 밝혔다.
 
과학기술정보통신부, 한국지능정보사회진흥원(NIA)이 주관하는 인공지능 학습용 데이터 구축 사업은 디지털 뉴딜 ‘데이터 댐’의 핵심 사업으로, 산업 전반에 걸친 지능화 혁신과 일자리 창출에 목적을 둔다.
 
비디는 인공지능 학습용 데이터 구축 사업에 2년째 선정돼 참여하고 있으며, 올해는 화자 인식용 음성 데이터와 아동 음성 데이터 구축 과제에서 음성 데이터 수집·관리 시스템을 적용해 설계에 따라 편향 없이 데이터가 수집되도록 활용하고 있다.
 
이번 사업은 크라우드 소싱 방식으로 데이터를 수집·검수해 개인차에 따라 다를 수 있는 데이터 품질을 일정 수준으로 유지하고, 많은 양의 데이터를 짧은 기간에 구축하며 발생할 수 있는 휴먼 에러를 최소화하기 위해 시스템을 통한 공정 관리의 필요성이 대두되면서 추진됐다.
 
비디의 기술력과 지난해 2개 과제를 수행하면서 도출한 개선 사항을 반영해 음성 데이터 수집·관리 시스템을 구축, 과거 수동으로 처리했던 업무 대부분을 자동화해 업무량을 큰 폭으로 줄이고, 구축 시간을 줄이는 데 크게 이바지할 것으로 기대된다.
 
비디의 음성 데이터 수집·관리 시스템은 크라우드 소싱 플랫폼 ‘메트웍스’와 연동해 참여자들에게 포인트 지급 등 보상 시스템을 제공한다. 아울러 대시보드를 통해 개인 진척 상황을 쉽게 확인하고, 미션 수행을 독려하기 위한 기능도 제공한다.
 
데이터 수집 시에는 대상과 녹음 환경이 설계에 따라 진행되는지 검증할 수 있는 녹음 적합도 테스트 기능이 제공되며, 수집된 데이터는 즉시 검수 담당자에게 배정돼 실시간 검수가 가능하도록 개발돼 필요 없는 대기 시간을 최소화했다.
 
비디 독고세준 대표는 “이번에 개발된 음성 데이터 수집·관리 시스템을 통해 높은 품질의 데이터 구축에 이바지할 수 있기를 바란다"며 “앞으로 음성뿐만 아니라 이미지, 영상 등 여러 분야의 데이터 구축에도 수집·관리 시스템을 활용할 수 있도록 확장해 나가겠다"고 말했다.
 
 

[입력 : 2021-09-08]   김명규 기자 more article

  • 페이스북
  • 트위터
  • 카카오톡
  • 네이버 블로그
  • sns 공유
    • 메일보내기
Copyright ⓒ 서울스트리트저널. 무단전재 및 재배포 금지
독자댓글
스팸방지 [필수입력] 왼쪽의 영문, 숫자를 입력하세요.

포토뉴스

Future Society & Special Section

  • 미래희망전략
  • 핫뉴스브리핑
  • 생명이 미래다
  • 정책정보뉴스
  • 지역이 희망이다
  • 미래환경전략
  • 클릭 한 컷
  • 경제산업전략
  • 한반도정세
뉴시스
TOP