예전에도 한번 얘기했는데, 오래전에 사놓고 묵혀뒀던 제온 CPU랑 보드를 이번에 홈서버로 살려보려고 진행 중이다. 근데 GPU가 없으니 일단 화면부터 띄워야 해서, 그때 화면만 켜면 되겠지 싶어서 2만 원 주고 Quadro FX 4800을 따로 구입했다.
근데 막상 써보려고 AI한테 물어봤더니 해당 모델은 추천하지 않는다는 얘기를 들었다. 그래서 어쩔 수 없이 당근을 뒤지기 시작했고, 그러면서 5만 원 안팎 예산으로 살 수 있는 카드들을 이것저것 알아보게 됐다. 알아보다 보니 ZOTAC GTX 970 4GB 중고가 47,000원에 올라와 있어서 결국 그걸 구매했다.
참고로 아직 알리에서 주문한 나머지 부품들이 도착하지 않아서 실제 설치는 못 한 상태다. 설치 전에 이 카드에 대해 이것저것 알아본 내용을 정리해두면 나중에 비슷한 상황에 처한 분들한테 조금이라도 도움이 될 것 같아서 한번 글로 남겨본다.
Quadro FX 4800, 왜 포기했나
처음엔 그냥 화면만 나오면 되니까 Quadro면 충분하겠다 싶었다. 쿼드로(Quadro)가 워크스테이션용 카드니까 뭔가 더 좋을 것 같은 느낌도 있었고. 근데 실제로 따져보니 얘기가 달랐다.
FX 4800은 GDDR3(구형 그래픽 메모리) 1.5GB에 TDP(최대 전력 소비)가 150W를 넘는 완전 구형 카드다. 지금 기준으로 보면 드라이버 지원도 사실상 끝났고, CUDA(엔비디아 병렬 연산 플랫폼)도 제대로 못 쓴다. 코딩이나 AI 공부를 염두에 두고 있었던 나한테는 사실상 모니터 출력용 그 이상은 기대하기 어려운 상황이었다. 2만 원이 아까웠지만 여기서 계속 쓰는 건 맞지 않겠다 싶어서 당근을 다시 켰다.
5만 원 예산으로 고민했던 카드들
당근에서 이것저것 검색하면서 후보로 올라왔던 카드들을 정리해봤다. (아래 시세는 2026년 3월 기준 당근마켓 매물 참고 수준이며, 시기에 따라 다를 수 있다.)

| 카드 | VRAM | 메모리 버스 | TDP | 상대 성능 (970=100) | CUDA 지원 | 총평 |
|---|---|---|---|---|---|---|
| GTX 970 | 4GB GDDR5 | 256bit | 145W | 100 | ✅ | 이 예산 최선 |
| GTX 1050 Ti | 4GB GDDR5 | 128bit | 75W | 65~70 | ✅ | 저전력이지만 성능 아쉬움 |
| GTX 1060 3GB | 3GB GDDR5 | 192bit | 120W | 100 전후 | ✅ | 성능은 비슷, VRAM이 발목 |
| RX 570 4GB | 4GB GDDR5 | 256bit | 150W+ | 970과 유사 | ❌ | 게임용엔 좋지만 AI 입문 설정 복잡 |
| GT 1030 2GB | 2GB GDDR5 | 64bit | 30W | 30 | ✅ | 모니터 출력 그 이상은 무리 |
| Quadro FX 4800 | 1.5GB GDDR3 | — | 150W+ | 매우 낮음 | ❌ | 레거시, 실사용 가치 없음 |
카드별로 왜 탈락했는지
GTX 1050 Ti — 저전력이지만 성능이 아쉽다
1050 Ti는 전력 소비가 75W로 낮아서 처음엔 괜찮아 보였다. VRAM도 4GB라 용량은 동일한데, 실제 연산 성능이 970 대비 30~35% 가량 낮다. 메모리 버스(데이터가 지나가는 통로 너비)도 128bit로 970의 절반 수준이라 데이터 처리 속도에서 차이가 난다.
저전력이 필요한 미니PC 같은 환경이면 모를까, 내 상황에선 굳이 더 약한 카드를 고를 이유가 없었다.
GTX 1060 3GB — 성능은 비슷, VRAM이 발목
순수 연산 성능만 보면 970이랑 거의 비슷한 수준이다. 근데 VRAM(그래픽카드에 올라가는 전용 메모리)이 3GB라는 게 문제다. AI 공부하면서 모델 올리거나 배치(한 번에 처리하는 데이터 묶음) 돌릴 때 메모리가 생각보다 빨리 차는데, 4GB랑 3GB 차이가 생각보다 크게 느껴지는 상황이 온다. 성능은 비슷한데 VRAM에서 손해 보는 구조라 탈락했다.
RX 570 — 게임용이지만 CUDA가 없다
스펙만 보면 꽤 괜찮다. VRAM 4GB에 버스폭도 256bit, 성능도 나쁘지 않다. 근데 AMD 카드라 CUDA를 지원하지 않는다. PyTorch나 TensorFlow 같은 딥러닝 라이브러리들이 CUDA(엔비디아 전용 병렬 연산 기술) 기반으로 GPU 가속을 하기 때문에, AI 입문 환경 설정이 번거롭고 레퍼런스도 NVIDIA 대비 훨씬 적다. AMD에도 ROCm(ROCm, AMD의 CUDA 대응 오픈소스 플랫폼)이 있긴 하지만, 입문자 입장에서 설정 난이도와 자료 부족이 발목을 잡는다. 게임 위주라면 충분히 좋은 선택이지만, AI 공부 병행이 목적인 내 상황엔 맞지 않았다.
GT 1030 — 모니터 출력 그 이상은 무리
사실 비교 대상이 되기 어렵다. VRAM 2GB에 64bit 버스, 성능도 970의 30% 수준이다. 진짜 모니터 출력만 필요한 경우라면 모를까, 개발이나 AI 실습을 생각하면 처음부터 후보가 될 수 없었다.
결국 GTX 970을 선택한 이유

이 예산대에서 970이 가장 균형이 잘 맞는 카드였다. VRAM 4GB에 256bit 버스폭, CUDA 지원에 연산 성능까지 이 가격대에선 가장 높다. Maxwell 아키텍처(엔비디아 2014년 출시 GPU 설계 세대) 기반이라 오래된 카드인 건 맞는데, CUDA Compute Capability 5.2(GPU가 지원하는 CUDA 기능 수준을 나타내는 버전 번호, 높을수록 최신 기능)를 지원한다.
한 가지 더 — 중고 시장에서 GTX 1050 Ti는 과거 채굴(암호화폐 채굴) 붐 때 많이 혹사된 물건이 적지 않아서 중고 신뢰도가 낮다는 얘기가 많다. 반면 GTX 970은 채굴 시기에 이미 구형으로 취급받아서 채굴 피해가 상대적으로 적어 중고 컨디션 신뢰도가 더 높은 편이다. 5만 원 예산에서 이 부분도 970을 선택한 이유 중 하나였다.
한 가지 알아둘 점은, GTX 970의 VRAM은 사실 3.5GB + 0.5GB 분리 구조다. 3.5GB를 넘어가는 순간 나머지 0.5GB에 접근할 때 속도가 확 떨어진다. AI 입문 실습 수준에서는 크게 문제가 되지 않지만, 모델을 올리다가 VRAM이 꽉 차는 상황이 오면 이 구조 때문이라는 걸 기억해두자.
47,000원에 이 정도면 충분히 납득이 가는 선택이었다.
GTX 970으로 할 수 있는 것들

물론 한계는 분명히 있다. 알아보면서 확인한 내용을 정리하면 이렇다.
할 수 있는 것 (추론 위주)
– MNIST, CIFAR 같은 입문용 이미지 분류 실습
– 7B Q4 양자화 LLM 부분 GPU 오프로딩 추론 (Llama 2 7B, Mistral 7B 등)
– Stable Diffusion v1.5 저해상도(512×512) 이미지 생성
사실상 어려운 것
– 딥러닝 모델 학습(training) — VRAM 4GB로는 배치 크기를 극단적으로 줄여야 해서 비효율적. 학습은 Google Colab 같은 클라우드를 병행하는 게 현실적이다.
– 고해상도 이미지 생성 (512×512 이상은 VRAM 한계로 배치 1도 버거울 수 있음)
CUDA/PyTorch 버전 주의사항
여기서 중요한 함정이 하나 있다. GTX 970의 CUDA Compute Capability가 5.2인데, PyTorch 2.x부터 CC 5.2 공식 지원이 중단됐다. 즉, 최신 PyTorch 2.x를 설치하면 GTX 970이 GPU로 인식되지 않을 수 있다.
안정적으로 쓰려면 PyTorch 1.x 계열이나 TensorFlow 2.10 이하를 설치하는 것이 낫다.
# GTX 970 (CC 5.2) 호환 PyTorch 1.x 설치 예시 (CUDA 11.8)
pip install torch==1.13.1+cu116 --index-url https://download.pytorch.org/whl/cu116
cuDNN(cuDNN, 딥러닝 연산을 GPU에서 빠르게 처리해주는 엔비디아 라이브러리)도 CUDA 버전에 맞는 것으로 맞춰야 한다. NVIDIA 공식 페이지에서 버전 호환표를 꼭 확인하자.
앞으로 업그레이드 방향
지금은 GTX 970으로 시작하고, AI 공부가 본격적으로 늘어나면 VRAM 8~12GB급 RTX 카드 한 장으로 갈아타는 것이 가장 효율적이다.

| 다음 후보 | VRAM | 주요 용도 |
|---|---|---|
| RTX 3060 | 12GB | 13B 모델 풀 로딩, Stable Diffusion 고화질 |
| RTX 4060 | 8GB | 7B 모델 여유있게 + 게임 |
| RTX 4070 | 12GB | 30B 양자화 모델, 전문적 AI 실습 |
그때는 GTX 970을 서브 GPU(모니터용·보조 연산용)로 돌리고, 메인 연산은 RTX 카드에 맡기는 구조가 좋다.
마무리
완벽한 카드는 아니다. 오래된 아키텍처에 VRAM도 요즘 기준으론 빠듯한 편이고, PyTorch 2.x 지원도 끊겼다. 근데 5만 원 안팎 예산에서 코딩이랑 AI 입문 공부까지 같이 하려면 이게 현실적으로 가장 나은 선택이었다고 생각한다.
아직 알리에서 주문한 부품들이 도착하지 않아서 실제 설치와 구동 후기는 나중에 따로 올릴 예정이다. 비슷한 예산으로 중고 GPU를 고민하고 있는 분들한테 이 글이 조금이라도 도움이 됐으면 한다.


