AI 기반 자율주행 학습 데이터 교환·제공 플랫폼
사업기간 2025.01 ~ 2026.02
다양한 자율주행 데이터를 표준 메타데이터로 통합하고, 하이브리드 검색(BM25 + 시맨틱 검색)을 통해 필요한 데이터를 빠르게 탐색·활용할 수 있는 자율주행 학습데이터 교환·제공 플랫폼
본 플랫폼은 자율주행 학습데이터를 자동으로 메타화하고, GPT 기반 태깅 및 의미 검색 기술을 적용해 사용자가 자연어 질의만으로도 원하는 데이터를 효율적으로 조회·활용할 수 있도록 설계된 시스템이다.
주요기능
01메타데이터 표준화 및 저장 구조 구축
02GPT 기반 자동 메타 태깅 & 질의 구조화
03하이브리드 검색 엔진 구축 (BM25 + Vector Search)
04검색 UI 프로토타입 제공 (Vue.js + Vuetify)
05데이터 수집·전처리·검색 파이프라인 자동화
시스템구성도

활용예시 및 적용사례
RAG 기반 자율주행 데이터 탐색 및 활용 고도화
주행 영상, 센서 로그, 이벤트 데이터 등 방대한 자율주행 학습데이터를 RAG 기반으로 질의·검색하여 필요한 정보를 즉시 추출하고 모델 개발에 활용.
하이브리드 검색 기반 데이터 교환 및 협업 효율화
벡터 검색 + 키워드 검색을 결합한 하이브리드 검색을 통해 다기관·다프로젝트 간 데이터 교환을 빠르고 정확하게 수행할 수 있으며, 협업 연구의 생산성 향상.
메타데이터 중심의 데이터 관리 및 품질 유지
자동 생성·정제된 메타데이터를 기반으로 데이터셋 버전 관리, 품질 검증, 기준화된 분류·태깅 등을 수행하여 대규모 자율주행 학습데이터의 안정적인 관리.

