뤼튼 테크놀로지스 · 2024.01 — 2024.07

전사 공통 서비스 (CDS) 개발, 운영

여러 서비스에서 공통으로 사용하는 기능을 API 서버로 제공 (토크나이저, 이메일 검증, 유해어 검출 등)
아래는 대표 기능인 토크나이저로 설명합니다

배경

GPT-4o 는 기존 모델과 encoding 방식이 달라 기존 토큰 계산 로직에서 오차가 발생했습니다.

토큰 계산은 비용 산정과 사용량 제어에 직접 연결되는 영역이라 빠르게 대응할 필요가 있었습니다
OpenAI 공식 token 계산 라이브러리는 Python 기반으로 제공되고 있었기 때문에, Kotlin/JVM 서비스에 억지로 포함하기보다 CDS 내 별도 기능으로 분리했습니다

Token 계산 라이브러리 의존성

성과

AI 비용 최적화와 사전 사용량 검증에 필요한 계산 로직을 내부 서비스에서 안정적으로 사용할 수 있게 되었습니다
사전 부하 테스트를 통해 RPS 400 수준의 요청 처리와 인프라 스펙을 검증했습니다

상세

OpenAI 공식 Tiktokenizer 라이브러리를 사용해 모델별 token 계산을 제공했습니다

부하 테스트 요약

부하 테스트 결과 1

부하 테스트 결과 2