은행의 AI 데이터 플랫폼에서 가장 먼저 표준화해야 할 것은 무엇이며, 그 이유를 운영 관점으로 설명해주세요
하나은행이 AI를 "프로젝트"가 아니라 "업무체계"로 굴릴 수 있도록, 데이터부터 모델까지 이어지는 운영 표준을 정착시키는 것입니다.
저는 이런 "증거기반 운영"이 가능한 플랫폼을 하나은행에서 만들고 싶습니다.
하나은행에서도 저는 "운영이 가능한가"를 최상 위기준으로 삼아, 데이터와 모델이 24시간 굴러가는 플랫폼을 설계하고 안정화시키겠습니다.
플랫폼 운영에서 가장 위험한 습관은 "그때그때 땜질"입니다.
가장 먼저 표준화해야 할 것은 데이터의 정의와 계약입니다.
단순히 플랫폼을 구축하는 것이 아니라, 데이터부터 모델까지의 생명주기가 표준 프로세스로 굴러가게 만드는 것입니다.
운영안정성입니다.
하나은행 AI.데이터 플랫폼 구축 및 운영(2026년 상반기 NEXTCAREER 정규직) 자기소개서와 면접
하나은행에 지원한 동기는 "AI를 해보고 싶어서 "가 아니라, 은행이라는 산업이 가진 본질적 제약과 책임 속에서 AI와 데이터 플랫폼을 제대로 운영해 보고 싶어서입니다.
하나은행이 AI를 "프로젝트"가 아니라 "업무체계"로 굴릴 수 있도록, 데이터부터 모델까지 이어지는 운영 표준을 정착시키는 것입니다.
제가 말하는 운영 표준은 문서가 아니라, 실제로 현업이 체감하는 세 가지 변화입니다.
저는 이 세 가지가 갖춰질 때 비로소 은행의 AI가 "지속가능한 생산"단계로 들어간다고 봅니다.
모델 성능만 보는 운영을 넘어, 모델리스크와 내부통제 관점까지 포함한 엔 드투엔드 운영을 갖추고, 데이터와 모델의 생명주기를 일관되게 관리하는 체계를 만들겠습니다.
저는 이런 "증거기반 운영"이 가능한 플랫폼을 하나은행에서 만들고 싶습니다.
운영을 기준으로 설계하는 능력, 복잡한 흐름을 표준으로 단순화하는 능력, 장애와 성능 문제를 구조적으로 해결하는 능력, 그리고 이해관계자를 같은 방향으로 움직이게 만드는 커뮤니케이션 능력입니다.
저는 공통지표와 경보 기준을 정리하고, 장애의 종류를 분류해 대응런북을 만들었고, 파이프라인 템플릿에 품질체크와 재처리 기능을 기본 탑재했습니다.
하나은행에서도 저는 "운영이 가능한가"를 최상 위기준으로 삼아, 데이터와 모델이 24시간 굴러가는 플랫폼을 설계하고 안정화시키겠습니다.
하나은행에서도 데이터적재, 변환, 품질점검, 권한, 라인리지, 배포, 모니터링까지 이어지는 기본 골격을 표준화하되, 현업 속도를 해치지 않는 방향으로 자동화를 설계하겠습니다.
임시 조치는 고객 영향 최소화를 위해 빠르게, 근본 조치는 운영비용과 복잡도를 줄이는 방향으로 합니다.
보안조직에는 감사와 통제의 부담을 줄이는 자동화와 추적성을, 현업에는 더 빨리 쓰고 더 안정적으로 운영되는 흐름을, 운영팀에는 장애와 야간 콜을 줄이는 표준을 제안합니다.
결과적으로 보안은 통제력을 얻었고, 현업은 더 명확한 절차로 더 빠르게 권한을 받았습니다.
모델 등록, 버전 관리, 배포 승인, 모니터링, 드 리프트 대응, 재학습 트리거, 롤백을 표준화하고 자동화해, 모델이 늘어날수록 운영이 더 어려워지는 악순환을 끊겠습니다.
사용량 기반의 비용 가시화, 과다리소스의 자동정리, 스토리지 계층화, 쿼리 최적화 등 운영형 비용 절감 체계를 만들고, 절감된 자원을 더 중요한 안정성과 보안 투자로 돌리겠습니다.
하나은행의 AI 데이터 플랫폼은 앞으로 더 많은 모델과 더 많은 현업 사용자를 품게 될 것입니다.
저는 운영을 설계하고, 표준을 정착시키고, 장애를 학습으로 바꾸고, 조직을 한 방향으로 움직이게 하는 역량으로 하나은행의 기반을 강하게 만들겠습니다.
가장 먼저 표준화해야 할 것은 데이터의 정의와 계약입니다.
저는 먼저 고객 영향과 업무 영향부터 확인해 대응 등급을 정합니다.
임시 대응은 영향 최소화를 위해 롤백 또는 안전한 대체 규칙으로 전환하고, 근본 조치는 재학습 파이프라인 개선, 드리프트 감지 기준 조정, 데이터 계약 강화로 연결합니다.
우선순위는 고객 영향 최소화가 먼저입니다.
다만 여기서 중요한 것은 근본 원인을 뒤로 미루는 것이 아니라, 대응을 두 트랙으로 분리하는 것입니다.
복구가 끝나면 사후 분석을 통해 재처리 전략, 중복처리 방지, 재시도 정책, 백프레셔 설정을 개선하고, 관측 지표를 보완합니다.
먼저 데이터는 민감도 기준으로 등급화하고, 등급별로 기본 접근 정책을 정의합니다.
두 번째로는 스케줄링과 오토스케일을 정교화해 야간과 비업무시간에 불필요한 리소스를 자동으로 줄이겠습니다.