과기부·NIA ‘AI허브’, 8대 분야 데이터 개방

2021-06-18     권수연 기자

음성 AI(인공지능)가 지역 방언을 정확히 인식할 수 있도록 한국어 사투리 데이터가 풀린다. 버스 노선 주행 영상 등의 데이터를 공개해 자율주행차 기술 개발을 앞당기고, 암 진단 데이터까지 개방해 질병 진단 정확도를 높인다.

과학기술정보통신부와 한국지능정보사회진흥원(NIA)은 인공지능 학습용 데이터 8대 분야 170종(4억8000만건)을 ‘인공지능(AI) 허브’에 18일부터 개방한다고 밝혔다.

정부는 ‘디지털 뉴딜’ 일환으로 방대한 데이터를 비축해 필요 시 개방하는 ‘데이터 댐’ 정책을 발표한 가운데, 산업계·전문가·일반 국민 등이 참여해 구축한 데이터를 이번에 개방한다. 데이터 구축에는 국내 주요 인공지능·데이터 전문 기업은 물론 주요 대학, 병원 등 총 674개 기업·기관이 참여했다. 여기에 경력단절여성, 취업준비청년 등 4만여명의 일반 국민도 동참했다. 개방 데이터 분야 별로는 음성·자연어, 헬스케어, 자율주행, 비전, 국토환경, 농축수산, 안전 등으로 구성됐다.

이 같은 데이터들이 실제 현장에서 혁신적으로 활용될 수 있도록 과기정통부는 18일 ‘인공지능(AI) 데이터 활용협의회’ 출범식을 개최했다. 협의회는 데이터 품질관리 전문기관인 한국정보통신기술협회(TTA)와 이번 170종 데이터의 활용성 검토에 참여한 기업·기관을 중심으로 구성됐다. 주요 참여 기업은 삼성전자, 현대차, SK텔레콤, LG, KT, 네이버 등이다. 이들은 AI 허브 데이터 적극 활용 및 피드백을 통해 지속적으로 데이터 품질을 개선하고, 신규·추가 과제 기획 등 협력할 예정이다.

임혜숙 과기정통부 장관은 “정부도 고품질의 인공지능 학습용 데이터를 지속적으로 제공하고, 누구나 데이터를 쉽게 활용하고 성과를 공유할 수 있는 환경을 조성하는 데 지원을 아끼지 않겠다”고 강조했다.