대교는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 ‘2023년 인공지능(AI) 학습용 데이터 구축 사업’을 성공적으로 마무리하며 우수 평가를 받았다고 29일 밝혔다.
해당 사업은 디지털 대전환의 핵심 자원인 AI 학습용 데이터를 구축하고 개방함으로써 인공지능 생태계 조성 및 일상화를 실현하기 위한 정부 주도 프로젝트다.
대교가 이번 사업을 통해 구축한 AI 학습용 데이터는 △다양한 유형의 수학 문제와 정답 △학습자의 손글씨 풀이 과정 이미지 등 약 30만 건에 달한다.
대교는 작년 7월 이번 사업에 컨소시엄 주관기관으로 참여해 수학 과목 자동 풀이 데이터, 수학 과목 문제 생성 데이터 등을 구축했다. 나아가 구축된 데이터를 활용해 총 6종의 AI 모델을 개발하고 한국정보통신기술협회(TTA) 품질 검증을 거쳐 데이터 품질 관리와 신뢰성을 높였다.
또한 디피니션, 드위치, 유니바, 크라우드웍스 등 각 분야 전문 기업과 함께 컨소시엄을 구성해 데이터 획득·수집, 정제, 가공(라벨링), AI 모델 개발 및 품질관리를 성공적으로 수행했다.
대교 관계자는 “이번 사업은 AI 학습용 데이터가 상대적으로 부족한 교육산업에 고품질의 최적화된 수학 문제 데이터 등을 제공함으로써 교육용 초거대언어모델(LLM)의 기반을 마련했다는 데 의의가 있다”며 “앞으로도 대교만의 경험과 노하우를 바탕으로 AI 기반 에듀테크 서비스의 고도화를 끌어낼 수 있도록 적극 노력하겠다”라고 밝혔다.