이 포스팅에는 알리익스프레스 제휴 링크가 포함되어 있습니다. 해당 링크를 통해 구매하시면 CoderRed가 일정 수수료를 받을 수 있으며, 구매자에게 추가 비용은 발생하지 않습니다.
그래픽카드처럼 생겼는데, GPU가 아니었습니다#
알리익스프레스 추천 상품을 보다가 묘한 카드를 하나 봤어요.
겉모습은 딱 서버용 그래픽카드나 가속카드처럼 생겼습니다. PCIe 슬롯에 꽂는 카드고, 방열판도 있고, 상품명에는 “알리바바 액셀러레이터 카드”, “Xilinx FPGA PCIe 서버 클라우드 컴퓨팅 액셀러레이터 카드” 같은 단어가 붙어 있어요.
처음 보면 이런 생각이 들 수밖에 없죠.
“어? 이거 혹시 싸게 주운 AI 가속기인가?”
근데 결론부터 말하면, 이건 RTX 3060이나 Tesla V100 같은 GPU가 아닙니다. FPGA 카드예요. 더 정확히는 알리바바 클라우드 서버에서 쓰였던 것으로 알려진 AS02MC04 / R1291-F9003-02 계열의 Xilinx Kintex UltraScale+ XCKU3P 가속 카드입니다.

캡처 당시 상품 페이지에는 가격이 약 ₩178,875, 판매 수량은 14개 판매로 보였어요. 가격만 보면 꽤 솔깃합니다. 요즘 제대로 된 개발보드나 서버용 가속기를 사려면 몇십만 원은 우습게 깨지니까요.

문제는 이 카드가 “싸다”와 “쉽게 쓴다”가 절대 같은 말이 아니라는 점이에요.
AS02MC04가 뭔데요?#
커뮤니티에서 정리된 자료를 보면, AS02MC04는 예전에 알리바바 클라우드 쪽에서 사용된 것으로 알려진 FPGA 가속 보드입니다. dkozel/Alibaba-Cloud-FPGA 저장소 README에는 이 보드가 Alibaba Cloud AS02MC04 Kintex KU3P UltraScale+ board라고 정리되어 있어요.
핵심 스펙은 대략 이렇습니다.
| 항목 | 내용 |
|---|---|
| 보드명 | AS02MC04 / R1291-F9003-02 |
| FPGA | Xilinx / AMD Kintex UltraScale+ XCKU3P-FFVB676 |
| 인터페이스 | PCIe Gen3 x8 |
| 외부 포트 | 10/25GbE SFP+ 케이지 2개로 알려짐 |
| 프로그래밍 | 표준 JTAG 헤더 접근 가능 |
| 성격 | 데이터센터/서버용 FPGA 가속 카드 |
AMD 공식 Kintex UltraScale+ 제품 표 기준으로 XCKU3P는 대략 이런 리소스를 갖습니다.
| 리소스 | XCKU3P |
|---|---|
| System Logic Cells | 356K |
| CLB LUTs | 163K |
| DSP Slices | 1,368 |
| Memory | 26.2Mb |
| GTY 32.75Gb/s Transceivers | 16개 |
| I/O Pins | 304개 |
출처는 AMD 공식 Kintex UltraScale+ 페이지입니다. 숫자만 보면 장난감급 FPGA는 절대 아니에요. 입문용 보드에 흔히 들어가는 Artix-7, 작은 Cyclone 계열과는 체급이 다릅니다.
FPGA라서 생기는 가장 큰 오해#
이 카드에서 제일 조심해야 할 단어는 “가속 카드”입니다.
GPU도 가속 카드고, NPU도 가속 카드고, FPGA도 가속 카드라고 부를 수 있어요. 그런데 사용 방식은 완전히 다릅니다.
GPU는 드라이버 설치하고 CUDA나 Vulkan, ROCm 같은 런타임 위에서 프로그램을 돌리면 됩니다. 물론 GPU도 어렵지만, 최소한 Ollama, llama.cpp, PyTorch 같은 기존 생태계가 있어요.
FPGA는 다릅니다.
FPGA는 기본적으로 사용자가 회로를 직접 만들어서 올리는 칩입니다. CPU가 실행할 펌웨어를 올리는 게 아니라, FPGA 내부의 LUT, 플립플롭, 배선, DSP, BRAM 같은 리소스를 어떻게 연결할지 정의한 bitstream을 올립니다.
짧게 말하면 이거예요.
GPU = 이미 만들어진 계산기를 빠르게 사용
FPGA = 계산기 자체를 직접 설계
그래서 AS02MC04를 PC에 꽂는다고 해서 바로 AI 추론이 빨라지거나, 게임 프레임이 올라가거나, 인코딩이 빨라지는 건 아닙니다. 그런 기능을 하게 만들려면 직접 회로를 설계해야 해요.
그러면 실제로 뭘 할 수 있나?#
이런 FPGA 카드는 제대로 다룰 수만 있으면 꽤 재밌습니다.
가능성이 있는 분야는 이런 쪽이에요.
- PCIe 장치 개발 실험
- 10G/25G 네트워크 패킷 처리
- SFP+ 기반 네트워크 가속
- 초저지연 패킷 필터링
- SDR / GNU Radio 계열 신호처리
- 커스텀 암호화, 해시, 압축 파이프라인
- Verilog / SystemVerilog / VHDL 학습
- LiteX, Corundum 같은 오픈소스 FPGA 네트워크 스택 실험
특히 PCIe와 SFP+가 붙어 있다는 점이 매력적이에요. 단순히 LED 깜빡이는 개발보드가 아니라, “진짜 서버에 꽂히던 가속 카드”라는 느낌이 있거든요.
다만 이 말은 반대로, 처음부터 난이도가 높다는 뜻이기도 합니다. 버튼 몇 개 있고, LED 있고, 공식 튜토리얼이 있는 교육용 보드랑은 결이 달라요.
구매 전 제일 큰 리스크: 문서가 부족합니다#
이 보드는 일반 소비자용 개발보드가 아닙니다. 그래서 공식 매뉴얼, 회로도, 예제 프로젝트, 보드 파일이 깔끔하게 준비된 제품을 기대하면 안 돼요.
실제로 커뮤니티 자료를 보면, 이 보드를 살려 쓰려면 이런 것들을 직접 찾아야 합니다.
- FPGA 핀 매핑
- 클럭 입력
- PCIe lane 연결
- SFP+ transceiver 연결
- JTAG 체인
- Flash 구성
- Vivado constraints 파일
- 보드 revision 차이
Xilinx/AMD FPGA를 Vivado에서 쓰려면 단순히 칩 이름만 알면 끝나는 게 아니에요. 어떤 FPGA 핀이 보드의 어떤 부품에 연결되어 있는지를 알아야 합니다. 이 정보를 XDC constraints로 써야 하죠.
예를 들어 LED 하나를 켜려 해도 이런 정보가 필요합니다.
set_property PACKAGE_PIN A12 [get_ports led]
set_property IOSTANDARD LVCMOS33 [get_ports led]
그런데 서버에서 빠져나온 OEM 보드라면, 이 핀 매핑을 공식 문서로 받기 어렵습니다. 그래서 GitHub, 포럼, 다른 사용자의 bring-up 로그를 뒤져야 해요.
이게 이 카드의 진짜 난이도입니다.
Vivado 무료 버전으로 쓸 수 있다는 건 장점#
그래도 이 카드가 흥미로운 이유가 하나 있어요.
dkozel/Alibaba-Cloud-FPGA README에서는 이 보드에 들어간 XCKU3P가 2026년 초 기준 무료 Vivado 티어에서 지원되는 가장 큰 Kintex UltraScale+ 계열이라고 설명합니다.
이건 꽤 큰 장점이에요. FPGA는 칩도 비싸지만, 툴 라이선스도 골치 아픈 경우가 있거든요. 그런데 XCKU3P가 무료 Vivado 범위 안에 있다면, 개인 취미나 홈랩 입장에서는 접근성이 확 올라갑니다.
물론 “툴이 무료로 빌드된다”와 “내가 이 보드를 쉽게 쓴다”는 다른 문제입니다. 그래도 최소한 비싼 라이선스에서 막힐 가능성이 낮다는 건 좋은 포인트예요.
로컬 AI용으로는 어떨까?#
이 부분은 냉정하게 봐야 합니다.
상품명에 “액셀러레이터”가 들어가고, FPGA도 병렬 처리에 강하니까 로컬 AI용으로 쓸 수 있지 않을까 싶을 수 있어요. 그런데 일반적인 LLM 추론 관점에서는 RTX 3060 같은 GPU가 훨씬 현실적입니다.
이유는 단순합니다.
- llama.cpp, Ollama, PyTorch 생태계는 GPU 중심
- CUDA 지원이 압도적으로 편함
- FPGA에서 LLM 가속기를 직접 만드는 건 연구과제급 난이도
- 메모리 대역폭, 외부 메모리 구성, 모델 적재 방식이 모두 문제
- 이미 검증된 오픈소스 LLM 런타임을 바로 쓰기 어렵습니다
물론 FPGA로 AI 가속기를 못 만든다는 뜻은 아니에요. 만들 수 있습니다. 실제로 FPGA 기반 추론 가속 연구도 많고요. 하지만 알리에서 카드 하나 사서 주말에 Ollama처럼 돌리는 그림은 아닙니다.
이 카드는 로컬 AI “실사용 장비”라기보다는, 하드웨어 가속기를 직접 만들어보는 연구/학습 장비에 가깝습니다.
누가 사면 좋을까?#
저라면 이렇게 나눌 것 같아요.
사도 되는 사람#
- FPGA를 이미 만져본 적이 있는 사람
- Vivado, XDC, JTAG이 무섭지 않은 사람
- Verilog/SystemVerilog로 회로 설계해보고 싶은 사람
- PCIe나 SFP+ 같은 고속 인터페이스를 실험하고 싶은 사람
- “문서 없음”을 고통이 아니라 퍼즐로 받아들이는 사람
- 중고 서버 부품을 살려내는 과정 자체를 즐기는 사람
사면 후회할 가능성이 큰 사람#
- 꽂으면 바로 성능이 올라가는 가속기를 원하는 사람
- 로컬 LLM을 쉽게 돌리고 싶은 사람
- CUDA 대체품을 기대하는 사람
- FPGA가 처음인데 공식 튜토리얼이 꼭 필요한 사람
- JTAG 프로그래머, Vivado 설치, constraints 파일이 벌써 피곤한 사람
- 반품/교환이 불편한 알리 중고 하드웨어가 싫은 사람
간단히 말하면, 이건 실용성보다 손대는 재미가 큰 카드입니다.
체크리스트: 구매 전에 이것만은 확인하세요#
혹시 진짜로 살 생각이 있다면, 저는 최소한 이 정도는 확인할 것 같아요.
- 상품 사진이 실제 보드 사진인지
- 모델명이 R1291-F9003-02 / AS02MC04 계열이 맞는지
- 카드가 동작 확인된 제품인지
- 방열판과 브라켓 상태가 괜찮은지
- JTAG 헤더 접근이 가능한지
- 같은 보드를 다룬 GitHub 자료가 있는지
- 내 PC에 물리적으로 꽂을 공간이 있는지
- 서버용 풍량 대신 쓸 별도 팬을 준비할 수 있는지
- Vivado 설치와 라이선스 범위를 확인했는지
- 실패해도 “재밌는 삽질이었다”고 넘길 수 있는지
마지막이 제일 중요합니다. 이런 부품은 가성비만 보고 사면 마음이 다칠 수 있어요.
BC250과 비슷한 향이 납니다#
이 카드를 보면서 얼마 전에 정리했던 BC250 생각이 났어요.
BC250도 그렇고, AS02MC04도 그렇고, 요즘 알리에 풀리는 이상한 서버/채굴/클라우드 하드웨어들은 묘한 매력이 있습니다. 일반 소비자용 제품이 아니라서 불친절한데, 그만큼 가격이 이상하게 싸고, 커뮤니티가 뚫어놓은 길을 따라가면 꽤 재밌는 장난감이 되거든요.
다만 둘의 성격은 다릅니다.
| 구분 | BC250 | AS02MC04 FPGA 카드 |
|---|---|---|
| 성격 | 특이한 APU/채굴 보드 | FPGA 서버 가속 카드 |
| 바로 쓰기 | 리눅스 세팅하면 어느 정도 가능 | bitstream 없으면 거의 불가능 |
| 로컬 AI | Vulkan/llama.cpp 실험 가능 | 직접 가속기 설계 필요 |
| 난이도 | 높음 | 더 높음 |
| 재미 | 리눅스/드라이버 삽질 | 회로설계/PCIe/JTAG 삽질 |
BC250이 “리눅스 드라이버랑 커널 쪽 삽질”이라면, AS02MC04는 “디지털 회로 설계랑 보드 bring-up 삽질”에 가깝습니다.
둘 다 일반인에게 추천하기엔 애매하지만, 이상하게 이런 물건이 제일 재밌죠.
결론: 싸지만, 쉬운 카드는 아닙니다#
AS02MC04 XCKU3P FPGA 카드는 가격만 보면 꽤 매력적입니다. 약 18만 원 전후에 Kintex UltraScale+ FPGA와 PCIe, SFP+가 달린 서버용 가속 카드를 만질 수 있다는 건 확실히 흔한 기회는 아니에요.
하지만 이건 GPU가 아닙니다. “알리에서 싸게 산 AI 가속기”도 아닙니다. 정확히는 재구성 가능한 하드웨어 회로를 직접 설계해서 올려야 하는 FPGA 카드입니다.
그래서 제 결론은 이렇습니다.
로컬 LLM 돌릴 목적이면 RTX 3060 12GB 같은 GPU를 사는 게 맞습니다.
FPGA를 배우고 PCIe/SFP+ 실험을 해보고 싶다면 꽤 재밌는 장난감입니다.
그냥 싸 보여서 사면 높은 확률로 책상 위 장식품이 됩니다.
저도 솔직히 아직 고민 중입니다. 실용적으로 보면 안 사는 게 맞는데, 이런 물건은 원래 “쓸모”보다 “살려보고 싶다”는 마음이 먼저 움직이거든요.
혹시 이 카드 직접 만져본 분이 있다면 댓글로 경험 좀 알려주세요. JTAG 연결, Vivado 프로젝트, constraints 파일, cooling 팁 같은 게 있으면 정말 귀한 자료가 될 것 같습니다.
