셀렉트스타는AI 모델 성능 개선을 위한 학습 데이터를 제공하는 올인원 데이터 플랫폼입니다. 2018년 11월 창업 이후 누적 1억 7000만 건의 학습 데이터셋을 구축하며, 230개 이상 다양한 고객사와 협업했습니다. 작업자 25만 크라우드소싱 플랫폼 ‘캐시미션’과AI 솔루션 대규모 고품질 데이터셋 구축이 장점입니다.
Data-Centric AI
좋은 인공지능은 실서비스 환경에서 수집되는 다양하고 방대한 데이터와 상호작용하며 끊임없이 발전합니다. 셀렉트스타는 데이터 기획부터 선별 구축 분석 관리까지, 서비스 생애주기에 걸쳐 AI Data Flywheel을 제공합니다.
사진. 셀렉트스타AI Data Flywheel 개요
#1 크라우드소싱 플랫폼 ‘캐시미션’
캐시미션은25만 작업자가 이용하는 크라우드소싱 플랫폼입니다. 가공 데이터 유형마다 최적의 인터페이스를 개발 • 적용해 작업자의 능률을 높입니다.
*웹, iOS, 안드로이드 앱에서도 참여 가능
#2 반자동 라벨링 솔루션
최고 성능(SOTA) 오픈 소스 모델을 활용해 데이터를 효율적으로 가공합니다. 메타의 이미지 분할 인공지능 ‘SAM’을 캐시미션에 접목해 빠르고 정확한 반자동 라벨링을 지원합니다.
#3 데이터 합성-증강 기술
생성 모델을 활용해 언어 모델이 학습할 데이터를 구축합니다. AI 데이터 유사도 분석과 크라우드 작업자 전수 검수 과정을 거쳐
합리적인 자원으로 대규모 고품질 데이터를 제공합니다.
#4 데이터셋 분석 소프트웨어
다투모스코프(Datumo Scope)는 시각화 기반 데이터셋 분석 솔루션입니다. 특징 벡터(Feature vector)를 활용해 비슷한 데이터는 가까이,
상이한 데이터는 멀리 배치한 평면 그래프를 제공합니다.
비전공자도 쉽게 전체 데이터셋 커버리지를 분석하고 라벨링 효용이 높은 데이터를 찾을 수 있습니다.