새 DGX-SPARK(GB10) 머신에 KAIDA 어플라이언스를 한 줄로 설치합니다. 완료되면 LLM·자동완성·데브포탈·GitLab이 모두 자동 기동됩니다.
curl -fsSL https://dev.kopens.ai/gb10-setup.sh | sudo bashdocker compose up → 모델 자동 다운로드.
| 서비스 | 역할 | 포트 |
|---|---|---|
| devportal | 설치·매뉴얼 포털 | 80 |
| litellm | LLM 게이트웨이 (OpenAI/Anthropic 호환) + 관리 UI | 4000 |
| onyx | 전사 코드·지식 검색 + 웹챗 (비개발자) | 3002 |
| vllm | 채팅/에이전트 모델 (gpt-4o · 256K 컨텍스트) | 8000 |
| vllm-fim | 인라인 자동완성 (code-completion) | 내부 |
| gitlab | 소스관리 + CI | 8929 (ssh 2289) |
| gitlab-runner | CI 실행기 | — |
| grafana | 모니터링 대시보드 (GPU·LLM·사용량) | 3001 |
| prometheus · dcgm | 메트릭 수집 · GPU exporter | 내부 |
| 항목 | URL |
|---|---|
| 데브포탈 | http://<서버-IP>/ |
| LLM API | http://<서버-IP>:4000/v1 |
| LiteLLM 관리 UI | http://<서버-IP>:4000/ui (admin) |
| GitLab | http://<서버-IP>:8929 (root) |
| Grafana 모니터링 | http://<서버-IP>:3001 (admin) |
| Onyx 웹챗 | http://<서버-IP>:3002 |
/opt/kopens-ai/.env에 저장됩니다. 안전하게 보관하세요.설치가 끝나면 아래 3단계로 팀이 바로 개발을 시작합니다 — 빠르면 당일.
http://<서버-IP>:4000/ui — admin / UI_PASSWORD (/opt/kopens-ai/.env)gpt-4o·code-completion, Max Budget / RPM·TPM, 메타데이터에 이름·사번(사용량 귀속·생산성 모니터링용).sk-…)를 해당 개발자에게 전달. 개발 PC 설치 시 입력합니다.http://<서버-IP>:8929 — root / GITLAB_ROOT_PASSWORD (.env)dev-team. 개발자 계정 생성·초대(역할 부여).demo-app (빈 저장소 또는 import). 개발자에게 Developer / Maintainer 권한 부여. → 경로 dev-team/demo-appgitlab-runner 등록 확인 → 프로젝트에 .gitlab-ci.yml 추가.dev.kopens.ai에서 받습니다(회사망 인터넷). 게이트웨이 주소·개인 키는 실행 시 프롬프트로 입력(가장 간편):
curl -fsSL https://dev.kopens.ai/install.sh | bashirm https://dev.kopens.ai/install.ps1 | iex
curl -fsSL https://dev.kopens.ai/install.sh | KAIDA_LLM_BASE=http://<고객사-IP>:4000 KAIDA_LLM_KEY=sk-개인키 bashgit clone http://<서버-IP>:8929/dev-team/demo-app.gitKAIDA_OPENCODE_VER·KAIDA_CLAUDE_VER로 버전을 고정하면 현장(폐쇄망)에서 일관됩니다.cd /opt/kopens-ai
docker compose ps # 상태
docker compose logs -f vllm # 모델 로딩 로그
docker compose restart litellm # 재시작
docker compose down # 정지