최병현 — 도움이 되고 싶은 개발자

배경

모놀로식으로 운영되던 기존 Node 기반 hamlet1 은 복잡도가 높았고, 운영 가능 인원이 1명 뿐이었습니다.
무중단 교체 조건이 필수였고, 장기적인 발전 방향에 대한 설계도 필요했습니다.

서비스 적용 화면

서비스 적용 계획
개발부터 실 적용까지 유관 부서와 대상 기능·아키텍처·전환 일정을 맞추며 phase 단위로 진행했습니다.

서비스 적용 계획 아키텍처

Hamlet1 / Hamlet2 비교
피크 시간대 기준 20분당 15,000건, RPM 750 수준을 처리했고, duration 은 20% 개선되었습니다.

Hamlet1 Hamlet2 비교

사전 부하 테스트
Gatling 기반 부하 테스트로 목표 처리량과 인프라 스펙을 사전에 검증했습니다.

부하 테스트 결과 1

부하 테스트 결과 2

관측성 개선
AI model 호출 실패와 인프라 부하를 신규 대시보드에서 확인할 수 있도록 구성했습니다.

AI model 호출 실패 모니터링

인프라 부하 수준 1

인프라 부하 수준 2

인프라 부하 수준 3

무중단 전환
기존 서비스와 신규 서비스의 전환 구간을 나누어 실서비스 기능을 무중단으로 교체했습니다.

무중단 전환