목록으로 돌아가기공식 사이트 방문
Groq LPU
언어 모델
4.5DX 점수
핵심 기술
300+ TPS의 초저지연 실시간 인퍼런스
가격 정책 구조
입력₩797/1M
출력₩1,067/1M
무료 할당량없음
메타데이터
개요
기존 GPU가 아닌 LPU(Language Processing Unit)를 사용하여 상상을 초월하는 속도를 제공합니다. 실시간 대화나 대기 시간이 거의 없어야 하는 대화형 인터페이스에 최적화되어 있습니다.
장점
- 비교 불가능한 초저지연 속도
- 실시간 대화에 최적화된 스트리밍
- Llama 3 기반의 검증된 성능
한계 및 주의점
- 모델 선택폭의 제한 (Llama, Mixtral 등)
- 상위 모델 대비 복잡한 작업 처리력 부족
이런 분에게 추천
사용자에게 '기다림 없는' 실시간 경험을 제공해야 하는 인터랙티브 서비스
주요 활용 사례
실시간 음성 대화인스턴트 코드 리뷰즉각적인 답변이 필요한 고객 응대
AI Performance Benchmark
가성비 지수: 45
LMSYS Arena
84.2
Verified Score
지능 (논리/추론)88%
속도 (응답 지연)100%
정확도 (환각 억제)85%