“평가 과정에서 Datalore의 UX가 개발자들에게 친숙하고 보고서 공유 기능이 사용하기 쉽다는 것을 알게 되었습니다. 엔지니어링 팀과 Datalore 개발 팀이 협력한 덕분에 워크플로 및 데이터 거버넌스 요구 사항을 충족할 수 있었습니다.”
— 천성덕, LINE Corporation 선임 관리자
제 이름은 천성덕이고 LINE Corporation에서 데이터 플랫폼 부서라는 조직을 이끄는 선임 관리자입니다. 저희의 사명은 데이터 사용을 보편화하고 사내 사용자가 데이터를 분석할 수 있는 플랫폼을 제공하는 것입니다.
저희는 전 세계에 1억 9,300만 MAU(월간 활성 사용자), 일본에 9,400만 MAU를 보유한 커뮤니케이션 애플리케이션인 'LINE'을 기반으로 미디어, 커머스, 핀테크 등 다양한 분야에서 서비스를 제공하고 있습니다.
데이터 플랫폼 부서는 LINE의 다양한 서비스에서 발생하는 데이터를 수집, 저장, 관리, 분석할 수 있는 플랫폼을 사용자에게 제공합니다. IU 또는 Information Universe라고 하는 이 플랫폼은 다양한 비즈니스 데이터를 담고 있는 전사적 데이터 인프라입니다.
최근 몇 년간 사내에서 데이터 분석에 대한 수요가 증가했습니다. 특히 데이터 과학자와 머신 러닝 엔지니어로부터 Notebook 솔루션에 대한 요청이 단순한 쿼리 실행을 넘어 크게 늘어났습니다. 저희가 사용하던 사내 Notebook 솔루션인 OASIS에는 이러한 다양한 요구를 충족할 수 있는 개발 리소스가 부족했습니다.
그래서 새로운 Notebook 솔루션을 평가하기 시작했고 Datalore는 후보 중 하나였습니다.
평가 과정에서 사내 개발자들이 Datalore의 UX를 친숙해 하고 보고서 공유 기능이 사용하기 쉽다는 것을 알게 되었습니다.
그리고 엔지니어링 팀과 Datalore 개발 팀의 협력 덕분에 워크플로 및 데이터 거버넌스 요구 사항을 충족할 수 있었습니다.
이러한 기능은 우리 회사에 매우 중요했기 때문에 데이터 과학 플랫폼으로 Datalore를 선택하기로 결정했습니다.
“또한 기쁘게도 데이터 엔지니어링 및 데이터 과학 외의 업무를 담당하는 이들까지 포함하면, 처음에 예상했던 것보다 훨씬 많은 사용자가 Datalore를 사용하고 있습니다. 궁극적으로, LINE 내 수백 명의 사용자가 Datalore를 사용하게 될 것으로 예상됩니다.”
LINE에 Datalore가 배포된 지 얼마 되지 않았음에도 불구하고, 2023년 3월 1일 현재 LINE 그룹 및 그룹사 내에서는 거의 절반의 데이터 분석 팀이 Datalore를 사용하고 있습니다. 또한 기쁘게도 데이터 엔지니어링 및 데이터 과학 외의 업무를 담당하는 이들까지 포함하면, 처음에 예상했던 것보다 훨씬 많은 사용자가 Datalore를 사용하고 있습니다. 궁극적으로, LINE 내 수백 명의 사용자가 Datalore를 사용하게 될 것으로 예상됩니다.
우선, Datalore의 도입 장벽은 높지 않았습니다. 처음에는 사용자들이 질문을 조금 했었지만, 친숙한 UI/UX 덕분에 사내 솔루션인 OASIS 및 Jupyter를 사용하던 사람들은 쉽게 시작할 수 있었습니다.
둘째, 사용자에게 제기되는 가장 큰 과제는 Spark의 클라이언트 모드에서 작업을 실행하는 것이었는데, 개발 팀과 Datalore 지원 팀의 협력을 통해 이 문제를 해결할 수 있었습니다.
셋째, 권한 관리 측면에서 Datalore 제품 콘셉트와 LINE 데이터 거버넌스 간에 격차가 있었고 이로 인한 문제가 있었습니다. 다행히 Datalore 개발 팀과의 협력하여 논의한 끝에 이러한 격차를 해소하고 Datalore를 공식적으로 채택할 수 있었습니다.
저희는 데이터 인프라를 제공하는 부서이기 때문에 데이터의 세부 내용은 알지 못합니다. IU(Information Universe)에 접근할 수 있는 사람들이 Datalore를 통해 데이터를 가져오고 분석합니다.
일반적으로 Datalore 보고서 링크를 조직 위키에 게시하여 작업 결과를 공유하는데, 이 보고 기능이 매우 유용합니다.
“Datalore가 배포된 후 사내 데이터 과학 플랫폼에서 Datalore로 전환하기로 결정하면서 내부 개발 리소스에 여유가 생겼습니다. 또한 LINE 규정 준수 정책에 매우 중요한 데이터 거버넌스 요구 사항도 충족할 수 있었습니다.”
Datalore가 배포된 지 얼마 되지 않았기 때문에 회사가 얻은 수익 가치를 아직 수치적으로 평가하지는 않았습니다. 하지만 사내 데이터 과학 플랫폼에서 Datalore로 전환하기로 결정하면서 내부 개발 리소스에 여유가 생겼습니다. 또한 LINE 규정 준수 정책에 매우 중요한 데이터 거버넌스 요구 사항도 충족할 수 있었습니다.
Datalore의 Notebook 솔루션 도입으로 LINE 그룹 내 데이터 분석 담당자들의 데이터 기반 의사결정이 촉진될 것으로 기대합니다. 데이터 분석 결과가 LINE의 다양한 사업 부문에 원활하고 신속하게 배포될 수 있다면 PDCA 주기가 더욱 빨라지고 데이터 중심의 의사결정이 가능해 비즈니스에 기여할 수 있을 것입니다.
Hunters 위협 제거 전문가, Netanel Golani
Hunters의 데이터 과학 팀은 Datalore를 사용하기 시작한 지 불과 한 달 밖에 지나지 않았지만 특히 수많은 고객의 데이터 소스를 처리하는 일상적 워크플로에서 생산성과 유용성이 개선된 것을 이미 체감하고 있습니다.
Chad Rosenberg, 기술 책임자, The Center for New Data
Datalore는 파이프라인 결과 디버깅, 웹훅 시도, 자동 플로팅 기능을 통한 빠른 데이터 시각화하는 등 Airflow에서 할 수 없는 데이터 작업 방식을 제공합니다. Datalore의 네이티브 Snowflake 커넥터와 pandas의 프로그래밍 방식 커넥터를 사용할 수 있으므로 공유 Notebook에서 작업할 때 확실히 시간을 절약할 수 있습니다.
Moreno Raimondo Vendra, TrueLayer 수석 머신러닝 엔지니어
Datalore을 이용해 보안 요구 사항을 충족하면서 인체 공학적으로 데이터에 액세스할 수 있게 되었고, 이는 획기적인 전환점이 되었습니다. 그 결과, 머신러닝 팀 내에서뿐만 아니라 다른 관련자와도 훨씬 더 쉽게 협업할 수 있었습니다.