사이오닉AI · 2024.09 — now

OpenGateway 개발/운영

  • 내부용 모델 라우팅 엔진을 OpenAI 호환 public API Gateway 상품으로 확장
  • 가용성 우선 라우팅·캐시 stickiness, 파라미터·에러 정규화 설계
  • RPM 180, Daily 250K, 10+ Provider, 100+ Model 서빙

배경

OpenGateway 는 여러 Model Provider 를 OpenAI 호환 API 형태로 제공하기 위한 AI Gateway입니다.
처음에는 내부 서비스에서만 사용하는 기능으로 개발되었지만, 모델 라우팅을 원하는 외부 고객이 생기면서 독립적인 API 상품으로 확장하는 니즈가 생겼습니다.

  • SaaS / airgap 환경에서 모델과 Provider 가 바뀌어도 파라미터 호환성과 라우팅 품질을 유지해야 했습니다
  • kr, jp 등 zone 분리와 airgap 지원을 고려해, OpenAI API spec 은 유지하면서 내부 구성을 유연하게 조립할 수 있어야 했습니다

성과

  • opengateway.ai — 현재 운영 중인 서비스
  • 기존 내부 모델 서빙 기능을 OpenAI 호환 public API Gateway 상품으로 확장하고, API Key, Authn/Authz, Billing, Logs, 프론트 화면까지 모든 흐름을 구축했습니다
  • 가용성 우선 라우팅·Prompt Cache stickiness, 파라미터·에러 정규화, 공통 호환 Mapper 위임 구조를 설계해 단일 OpenAI 스펙으로 10+ Provider 를 일관되게 확장할 수 있게 했습니다
  • RPM 180, Daily 250K 수준의 트래픽, 10+ Provider, 100+ 모델을 안정적으로 서빙하고 있습니다
  • Redeem Code, Admin 기능, Grafana 관측, 모델 smoke/CI/daily test 를 연결해 운영 관측성과 live 안정성을 함께 개선했습니다

설계 및 구현

1명의 주니어 개발자와 함께 백엔드 2개 · 프론트 1개를 동시 기획 · 개발하기 위해 AI 를 적극적으로 활용해야 했습니다.

  • 정책과 작업 기준은 Skill 로 single source of truth 로 두어, 사람과 AI 가 같은 맥락에서 작업할 수 있도록 했습니다
  • 시스템은 통제할 흐름과 동적 의사결정을 분리해, 직접 검토할 영역과 AI 에게 위임할 영역을 명확히 구분했습니다
  • 더 자세한 내용은 AI를 적극적으로 활용하는 개발에 대한 생각에 정리되어 있습니다

BE 서버 릴리즈 기록 1

BE 서버 릴리즈 기록 2

OpenGateway 전체 흐름 — 엔진과 백오피스의 분리

핵심 설계 — Facade · 라우팅 · 에러 정규화

파라미터 정규화와 투명성

핵심 설계 — Provider 확장 구조

과금 파이프라인

Front Office

OpenGateway Dashboard — API 사용량·성능 모니터링

OpenGateway Logs

OpenGateway Log Detail

Docs

OpenGateway Documentation — 문서·API 레퍼런스

운영 안정화

  • Grafana 기반으로 트래픽, 비용, 응답 시간, Provider 분포를 관측하며 운영 상태를 관리했습니다
  • 모델 추가/제거, SDK 업그레이드, 릴리즈, 주간 보고 등 반복 운영 업무를 Claude Skill 로 표준화해 운영 편의성을 높였습니다
  • 10+ Provider · 100+ 모델에 smoke test · CI test · daily job 을 적용해 live 환경 안정성을 지속 확인했습니다

OpenGateway Grafana Dashboard

OpenGateway live smoke test 결과