클라우드 API 비용을 줄여보겠다고 로컬 LLM을 설치한 뒤 가장 먼저 마주치는 건 설치 명령이 아니라 GPU 메모리 부족입니다. 모델 파일은 받아졌는데 긴 문맥과 도구 호출을 붙이는 순간 속도가 급격히 떨어지거나 CPU로 밀려나면, 비싼 데스크탑도 기대했던 개인 AI 서버처럼 느껴지지 않습니다.
OpenClaw 자체는 Node.js 24 권장 환경에서 Windows, Linux와 WSL2에 설치할 수 있고 Ollama, LM Studio, vLLM 같은 로컬 제공자를 연결할 수 있습니다. 문제는 에이전트 루프가 단순 채팅보다 문맥과 도구 사용량이 많다는 점입니다. OpenClaw 공식 문서도 편안한 로컬 에이전트 운용에는 매우 높은 하드웨어를 요구하며, 단일 24GB GPU는 가벼운 프롬프트에서만 현실적이라고 선을 긋습니다.
그래서 이 목록은 '무조건 로컬이면 싸다'는 식으로 포장하지 않습니다. 16GB VRAM급은 양자화한 중소형 모델과 짧은 작업을 시작하는 구간이고, 24GB 이상은 더 큰 모델과 문맥을 시도할 여유가 생기지만 전기요금, 발열, 소음과 초기 비용도 크게 오릅니다. 시스템 RAM은 32GB보다 64GB가 편하고, 대형 모델을 자주 바꾸면 SSD 2TB도 빠르게 찹니다.
구매 근거와 구성 균형이 강한 5070 Ti 완제품은 1번과 2번, 5080으로 추론 속도와 시스템 여유를 올리려면 3번과 4번을 먼저 보세요. 부품 구성을 직접 확인할 수 있는 조립형은 5번과 6번, 비용보다 통합 메모리와 AI 개발 환경이 중요하면 7번 전문 장비를 비교하면 됩니다.
- RTX 5070 Ti
- RAM 64GB
- 1TB SSD
- RTX 5070 Ti
- RAM 32GB
- 1TB SSD
- RTX 5080
- RAM 32GB
- 2TB SSD
- RTX 5080
- RAM 64GB
- 2TB SSD
- RTX 5070 Ti
- 옵션 선택형
- 조립 PC
- RTX 5080 옵션
- AI 작업형
- 윈도우 선택