과기정통부, 3000억 규모 'AI 데이터 댐' 구축 본격화

입력 2020-06-21 12:00수정 2020-06-21 14:42

  • 작게보기

  • 기본크기

  • 크게보기

▲AI 학습용 데이터구축개방 현황 (과기정통부 제공)
▲데이터댐 구상 에시, 추경 정부안 기준 (과기정통부 제공)

정부가 디지털 뉴딜 '데이터 댐' 구축 사업을 본격화한다. 이를 위해 3차 추경으로 확정되는 150여 사업 가운데 390억 원에 달하는 'AI 학습용 데이터' 사업을 우선적으로 진행한다.

과학기술정보통신부는 인공지능(AI) 개발에 필수적인 양질의 데이터를 대규모로 구축·개방하는 'AI 학습용 데이터 구축 사업' 20개 과제를 확정했다고 21일 밝혔다.

2017년부터 시작된 AI 학습용 데이터 구축 사업은 △한영 번역 말뭉치 △한국어 음성 △이상 행동 영상 등 텍스트 △이미지 및 영상 분야 인공지능 서비스 개발 등을 위한 기계학습용 데이터 21종 4650만건을 구축해 AI통합지원 플랫폼인 'AI허브'를 통해 공개 중이다.

올해는 작년보다 예산 및 과제가 2배 늘어난 20개 과제(10개 지정공모, 10개 자유공모)를 390억 원 규모로 추진하고 있으며, 총 92개 사업자가 참여해 평균 4.6대 1의 경쟁률을 보였다.

주요 사업 과제는 △사람 감성과 문맥을 이해할 수 있는 자연어 처리분야 △자동차, 드론 등 자율주행기술 분야 △음성, 시각, 언어 등 융합 분야 등 국가적으로 산업적으로 활용가치가 높고 데이터 확보 필요성이 시급한 과제 △질병진단(치매, 구강질병 등) 및 운동 등 헬스케어 분야 △사람의 얼굴을 악의적으로 변조한 딥페이크 방지 기술 분야 △장애인의 삶을 향상 시킬 수 있는 분야 등이다.

▲2020년 AI학습용데이터 구축과제선정결과 (과기정통부 제공)

이와 함께 과기정통부는 크라우드소싱 방식 도입으로 AI 일자리 창출에도 나선다. 미국, 중국 등 해외에서는 누구나 참여GO 데이터를 가공할 수 있는 크라우드소싱 방식을 경쟁적으로 도입, 인력 부족 문제를 해결하면서 양질의 데이터 확보와 일자리를 창출하고 있다. 과기정통부는 지난해 2개 과제를 크라우드소싱 방식으로 추진한데 이어, 올해는 모든 과제에 전면적으로 크라우드 소싱 방식을 적용해 AI 학습용 데이터를 구축함으로써 일자리를 만들어갈 예정이다.

아울러 과기정통부는 2020년 추경예산을 통해 코로나19 이후 경기침체를 극복하기 위해 일자리 창출효과가 크고 AI모델 개발에 필수적인 AI 학습용 데이터 구축 사업을 확대 추진할 계획이다.

중소기업과 스타트업 등은 비용부담과 인력부족 때문에 필요한 AI 학습용 데이터를 직접 구축하는데 어려움이 많아 양질의 데이터 확보에 대한 수요가 큰 상황이다. 이 때문에 시장에서 필요한 양질의 AI 학습용 데이터를 많이 확보하는 것이 단기간에 우리나라 AI 경쟁력을 끌어 올릴 수 있는 해결책이 될 수 있다.

과기정통부 관계자는 "추경을 통해 AI 학습용 데이터 구축을 대규모로 확대구축해 데이터 댐에 모으고, 다양한 AI 기술연구, 상용화 서비스 개발에 활용할 수 있도록 지원하겠다"며 "이를 통해 양질의 일자리 창출과 경제성장의 새로운 원동력을 확보할 수 있을 것"이라고 말했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
댓글
0 / 300
e스튜디오
많이 본 뉴스
뉴스발전소