AI 학습에 쓰일 수 있도록 데이터에 태그를 달아주는 데이터 라벨링((Data Labeling)은 노동 집약적이란 이미지가 붙어 있지만 스케일AI를 보면 생각을 바꾸게 된다.
스케일AI는 데이터 라벨링 기술로 그동안 AI 생태계에서 꾸준히 주목 받은 유망 테크 스타트업들중 하나로 관심을 받아왔다. 몸값도 이미 상당하다. 스케일AI는 최근 138억달러 가치에 10억달러 규모 투자를 유치했다.
데이터 라벨링은 특정 파일에 포함된 내용을 설명하는 텍스트 스니펫 등 컨텍스트 세부 정보로 학습 데이터셋 개별 파일을 보강하는 프로세스다. 이를 통해 AI 모델은 학습 중인 정보를 보다 철저하게 이해할 수 있고 더 높은 품질로 응답을 출력할 수 있다.
스케일AI는 8년 전 자율주행차 회사들에 서비스를 제공하는 것으로 시작해 최근에는 생성AI 바람을 타고 매년 두배 이상 성장세를 이어가는 모습이다. AI판에서 실제로 돈좀 버는 몇 안되는 회사들 중 하나가 아닐까 싶다.

첨단 AI 모델 개발 핵심 파트너로 부상
스케일AI 주력 상품은 SaaS 기반인 스케일 생성 AI(Scale Generative AI) 데이터 엔진이다.
회사 측에 따르면 스케일 생성AI 데이터 엔진은 시각적인 인터페이스 기반으로 사용자들에게 어떤 데이터가 어떤 작업에 필요한지 특정할 수 있도록 지원한다. AI 개발자가 AI 프로젝트에 필요한 학습 데이터를 구체적으로 지정하면 전문가들로 구성된 팀이 모델 훈련에 필요한 파일을 대신 만들어주는 구조다.
첨단 AI 모델 훈련에 필요한 데이터셋은 워낙 대규모다 보니 AI 모델 개발팀이 자체적으로 커버하기에는 엄청난 시간이 소요되는 작업이다. 스케일AI 플랫폼은 이와 관련한 프로세스 속도를 높여준다.
스케일AI 플랫폼은 여러 유형 데이터에 주석을 다는 데 사용할 수 있다. 텍스트, 이미지, 오디오는 물론 자율주행차 라이더 하드웨어 센서 로그와 같은 보다 전문적인 파일도 지원한다. 사용자는 데이터에 주석을 다는 전문가들에게 프로세스 수행 방법에 대한 지침도 제공할 수 있다.

AI 열풍 등에 업고 올해도 두배 이상 성장 예고
스케일AI는 사용자가 편리하게 플랫폼을 쓸수 있도록 하는 것 외에도 새로 개발된 신경망에 대한 취약성, 환각 및 기타 문제를 테스트하는 서비스도 갖추고 있다. 자동 및 수동 접근 방식을 결합해 고객 AI 애플리케이션에 대한 약점을 탐지할 수 있다는게 회사 측 설명이다.
이런 점을 높게 평가해 미국 국방부 최고 디지털 및 인공 지능 사무소(CDAO)는 LLM을 테스트하고 평가할 수 있는 신뢰할 수 있는 수단 확보 차원에서 스케일AI를 활용하고 있다.
스케일AI는 오픈AI와 앤트로픽 등 주요 LLM 개발사들을 모두 고객사로 확보하고 있다. 이를 기반으로 매년 매출을 빠르게 늘리는 모습이다.
스케일AI는 지난해 6억7500만달러 규모 매출을 기록했는데, 전년 대비 150% 늘어난 수치다. 포춘 보도에 따르면 스케일AI는 올해 연간 반복 매출(annual recurring revenue, ARR)이 14억달러 규모에 달하고, 이익도 낼 수 있을 것으로 보고 있다.
스케일AI는 이번 투자로 확보한 자금을 AI 개발팀이 학습 데이터에 보다 쉽게 접근할 수 있도록 하는데 투입한다. AI 위험 평가에 초점을 맞춘 이니셔티브에도 사용할 예정이다.
B2BSaaS #B2BSaaS전략 #B2BSaaS트렌드 #B2BSaaS스타트업 #스케일AI #AI스타트업
by Sasquachi