CJ올리브영의 온·오프라인 옴니채널 비즈니스에서 발생하는 방대한 데이터를 통합하고, 비즈니스 가치를 창출하는 데이터 플랫폼을 구축합니다.
단순한 데이터 통합을 넘어, Kafka 기반 실시간 스트리밍과 대용량 배치 처리가 결합된 하이브리드 환경을 운영하며,
Apache Iceberg 중심의 레이크하우스(Lakehouse) 아키텍처를 통해 데이터 거버넌스와 성능을 동시에 확보하는 역할을 수행합니다.
1. 하이브리드 데이터 파이프라인 설계 및 고도화
Kafka 및 CDC 기술 기반의 저지연 실시간 스트리밍과 Spark 기반 대용량 배치 처리 시스템 설계/개발
Apache Airflow를 활용한 워크플로우 자동화 및 전략적 스케줄링 체계 확립
Apache Iceberg 기반 레이크하우스 구축을 통한 통합 저장 및 관리 체계 구현
2. 데이터 수집 체계 구축 및 텍소노미(Taxonomy) 표준화
대규모 고객 행동 로그 실시간 수집 및 효율적인 ETL/ELT 프로세스 설계
데이터 텍소노미 체계 수립 및 운영으로 전사 데이터의 일관성 및 거버넌스 강화
3. 데이터 품질 관리 및 성능 최적화
파이프라인 병목 구간 정의 및 컴퓨팅 리소스 최적화로 효율성 극대화
데이터 정합성 검증 루틴 구축을 통한 높은 데이터 신뢰도 유지
4. 데이터 모델링 및 분석 지원
분석 목적별 데이터 마트 설계 및 다차원 데이터 모델링 수행
비즈니스 핵심 지표(KPI) 정의 및 데이터 시각화 지원을 통한 인사이트 도출 가속화
서류전형 - 1차면접(Whiteboard Test/구술) - 온라인 인성검사 - 2차면접 - Reference Check - 처우전형/건강검진 - 합격
올리브영 채용 블로그에서 더 많은 정보를 확인해 보세요!
👉채용블로그 바로가기: https://career.oliveyoung.com
👉테크블로그 바로가기: https://oliveyoung.tech
CJ올리브영의 온·오프라인 옴니채널 비즈니스에서 발생하는 방대한 데이터를 통합하고, 비즈니스 가치를 창출하는 데이터 플랫폼을 구축합니다.
단순한 데이터 통합을 넘어, Kafka 기반 실시간 스트리밍과 대용량 배치 처리가 결합된 하이브리드 환경을 운영하며,
Apache Iceberg 중심의 레이크하우스(Lakehouse) 아키텍처를 통해 데이터 거버넌스와 성능을 동시에 확보하는 역할을 수행합니다.
1. 하이브리드 데이터 파이프라인 설계 및 고도화
Kafka 및 CDC 기술 기반의 저지연 실시간 스트리밍과 Spark 기반 대용량 배치 처리 시스템 설계/개발
Apache Airflow를 활용한 워크플로우 자동화 및 전략적 스케줄링 체계 확립
Apache Iceberg 기반 레이크하우스 구축을 통한 통합 저장 및 관리 체계 구현
2. 데이터 수집 체계 구축 및 텍소노미(Taxonomy) 표준화
대규모 고객 행동 로그 실시간 수집 및 효율적인 ETL/ELT 프로세스 설계
데이터 텍소노미 체계 수립 및 운영으로 전사 데이터의 일관성 및 거버넌스 강화
3. 데이터 품질 관리 및 성능 최적화
파이프라인 병목 구간 정의 및 컴퓨팅 리소스 최적화로 효율성 극대화
데이터 정합성 검증 루틴 구축을 통한 높은 데이터 신뢰도 유지
4. 데이터 모델링 및 분석 지원
분석 목적별 데이터 마트 설계 및 다차원 데이터 모델링 수행
비즈니스 핵심 지표(KPI) 정의 및 데이터 시각화 지원을 통한 인사이트 도출 가속화
서류전형 - 1차면접(Whiteboard Test/구술) - 온라인 인성검사 - 2차면접 - Reference Check - 처우전형/건강검진 - 합격
올리브영 채용 블로그에서 더 많은 정보를 확인해 보세요!
👉채용블로그 바로가기: https://career.oliveyoung.com
👉테크블로그 바로가기: https://oliveyoung.tech