운영자 · SI · DGX-SPARK(GB10)

DGX-SPARK에 풀스택 한 줄 설치

새 DGX-SPARK(GB10) 머신에 KAIDA 어플라이언스를 한 줄로 설치합니다. 완료되면 LLM·자동완성·데브포탈·GitLab이 모두 자동 기동됩니다.

사전 조건

NVIDIA DGX-SPARK(GB10), Ubuntu, NVIDIA 드라이버 설치됨
설치 시점 네트워크(이미지·모델 다운로드용) — 이후 운영은 폐쇄망 가능
root 권한, 디스크 여유(모델·이미지·GitLab repo 포함 권장 200GB+)

설치 (한 줄)

새 DGX-SPARK(GB10)에서 root로 실행:

❯curl -fsSL https://developer.kopens.ai/gb10-setup.sh | sudo bash

Docker·NVIDIA Container Toolkit 설치 → 어플라이언스 번들 다운로드 → 어플라이언스별 시크릿 자동 생성 → docker compose up → 모델 자동 다운로드.

첫 기동은 모델 로딩·GitLab 초기화로 수 분~십수 분 걸립니다.

설치되는 구성

서비스	역할	포트
devportal	설치·매뉴얼 포털	80
litellm	LLM 게이트웨이 (OpenAI/Anthropic 호환) + 관리 UI	4000
onyx	전사 코드·지식 검색 + 웹챗 (비개발자)	3002
vllm	채팅/에이전트 모델 (gpt-4o · 256K 컨텍스트)	8000
vllm-fim	인라인 자동완성 (code-completion)	내부
gitlab	소스관리 + CI	8929 (ssh 2289)
gitlab-runner	CI 실행기	—
grafana	모니터링 대시보드 (GPU·LLM·사용량)	3001
prometheus · dcgm	메트릭 수집 · GPU exporter	내부

설치 후 접속

항목	URL
데브포탈	`http://<서버-IP>/`
LLM API	`http://<서버-IP>:4000/v1`
LiteLLM 관리 UI	`http://<서버-IP>:4000/ui` (admin)
GitLab	`http://<서버-IP>:8929` (root)
Grafana 모니터링	`http://<서버-IP>:3001` (admin)
Onyx 웹챗	`http://<서버-IP>:3002`

생성된 시크릿(마스터키, UI/GitLab root 비밀번호)은 /opt/kopens-ai/.env에 저장됩니다. 안전하게 보관하세요.

프로젝트 시작하기 (설치 후)

설치가 끝나면 아래 3단계로 팀이 바로 개발을 시작합니다 — 빠르면 당일.

순서: ① 개발자별 가상키 발급 (LiteLLM) → ② GitLab 프로젝트 생성 → ③ 개발자 PC 온보딩. 각 단계는 아래에 순서대로 정리되어 있습니다.

① 개발자 가상키 발급 (LiteLLM)

관리 UI 접속: http://<서버-IP>:4000/ui — admin / UI_PASSWORD (/opt/kopens-ai/.env)

Virtual Keys → + Create New Key — 개발자마다 1개씩 발급합니다.

설정: 허용 모델 gpt-4o·code-completion, Max Budget / RPM·TPM, 메타데이터에 이름·사번(사용량 귀속·생산성 모니터링용).

생성된 키(sk-…)를 해당 개발자에게 전달. 개발 PC 설치 시 입력합니다.

마스터키는 운영자 전용입니다. 개발자에게 공유하지 말고 항상 개인 가상키를 발급하세요 — 퇴사 시 해당 키만 폐기하면 됩니다.

② GitLab 프로젝트 생성

GitLab 접속: http://<서버-IP>:8929 — root / GITLAB_ROOT_PASSWORD (.env)

그룹(팀) 생성 — 예: dev-team. 개발자 계정 생성·초대(역할 부여).

New Project — 예: 이름 demo-app (빈 저장소 또는 import). 개발자에게 Developer / Maintainer 권한 부여. → 경로 dev-team/demo-app

(CI 사용 시) Settings → CI/CD → Runners에서 gitlab-runner 등록 확인.

표준 프로젝트 템플릿 등록(1회) — gitlab-template/(Spring Boot 3.5 + PostgreSQL 17 + Maven 스켈레톤 + DevSecOps CI + AI 리뷰 + 룰)을 GitLab Custom Project Template로 등록. 이후 개발자는 New Project → Create from template → kaida-standard로 바로 시작. (절차: gitlab-template/SETUP.md)

③ 개발자 온보딩

개발 PC 사전 세팅(회사 인터넷) — 설치 스크립트는 developer.kopens.ai에서 받습니다(회사망 인터넷). 게이트웨이 주소·개인 키는 실행 시 프롬프트로 입력(가장 간편):

❯curl -fsSL https://developer.kopens.ai/install.sh | bash

실행하면 어플라이언스 게이트웨이 주소(예: http://<고객사-IP>:4000)와 개인 키를 물어봅니다. Windows: irm https://developer.kopens.ai/install.ps1 | iex

무인 설치(다수 PC 자동화) — 주소·키를 env로 주입:

❯

curl -fsSL https://developer.kopens.ai/install.sh | KAIDA_LLM_BASE=http://<고객사-IP>:4000 KAIDA_LLM_KEY=sk-개인키 bash

IntelliJ에 Continue 플러그인 설치 → 자동완성·채팅 사용. 자세히는 개발자 가이드.

개발자가 프로젝트를 클론 → 코딩 시작. 예:

❯git clone http://<서버-IP>:8929/dev-team/demo-app.git

채팅·자동완성·에이전트·소스관리 모두 사내에서 완결됩니다.

사전 세팅 시 KAIDA_OPENCODE_VER·KAIDA_CLAUDE_VER로 버전을 고정하면 현장(폐쇄망)에서 일관됩니다.

운영 명령

cd /opt/kopens-ai
docker compose ps              # 상태
docker compose logs -f vllm    # 모델 로딩 로그
docker compose restart litellm # 재시작
docker compose down            # 정지