뤼튼 테크놀로지스 · 2024.01 — 2024.07

전사 공통 서비스 (CDS) 개발, 운영

  • 여러 서비스에서 공통으로 사용하는 기능을 API 서버로 제공 (토크나이저, 이메일 검증, 유해어 검출 등)
  • 아래는 대표 기능인 토크나이저를 중심으로 설명합니다

배경

GPT-4o 는 기존 모델과 encoding 방식이 달라 기존 토큰 계산 로직에서 오차가 발생했습니다.

  • 토큰 계산은 비용 산정과 사용량 제어에 직접 연결되는 영역이라 빠르게 대응할 필요가 있었습니다
  • OpenAI 공식 token 계산 라이브러리는 Python 기반으로 제공되고 있었기 때문에, Kotlin/JVM 서비스에 억지로 포함하기보다 CDS 내 별도 기능으로 분리했습니다

Token 계산 라이브러리 의존성

성과

  • AI 비용 최적화와 사전 사용량 검증에 필요한 계산 로직을 내부 서비스에서 안정적으로 사용할 수 있게 되었습니다
  • 사전 부하 테스트를 통해 RPS 400 수준의 요청 처리와 인프라 스펙을 검증했습니다

상세

  • OpenAI 공식 Tiktokenizer 라이브러리를 사용해 모델별 token 계산을 제공했습니다

부하 테스트 요약

부하 테스트 결과 1

부하 테스트 결과 2