매뉴얼 · 사용 가이드

로컬 LLM으로 코딩하기

로컬 LLM(사내 DGX-SPARK(GB10))을 IntelliJ·터미널에서 코딩 어시스턴트로 사용하는 방법입니다. 모든 요청은 사내 DGX-SPARK(GB10)에서 처리되며 외부로 나가지 않습니다.

1 · 개요

이 서버 한 대가 ① 로컬 LLM 서빙 ② 인라인 자동완성 모델 ③ 개발툴 배포(데브포탈)를 모두 제공합니다.

구성내용
포털https://dev.kopens.ai
LLM API (OpenAI 호환)https://api.kopens.ai/v1
LLM API (Anthropic 호환)https://api.kopens.ai/v1/messages
API 키sk-pp-master
채팅 모델gpt-4o (고성능 채팅·에이전트)
자동완성 모델code-completion (저지연 인라인 자동완성)

개발 워크플로우 (전체)

설치부터 배포까지, 코드·데이터가 사내를 벗어나지 않는 폐쇄망 개발 흐름입니다.

단계도구 / 방법
① 프로젝트 클론GitLab에서 git clone (운영자 발급 계정)
② 코딩 (AI)IntelliJ 자동완성 · Claude Code · OpenCode — 사내 모델
③ 사내 코드 검색RAG/MCP search_code (전사 의미검색) · Continue @codebase
④ 의존성 설치사내 미러에서 — npm/pip가 사내 레지스트리를 바라봄(아래)
⑤ 커밋 · MRgit push → Merge Request → AI 자동 리뷰·요약
⑥ CIGitLab Runner — 테스트·빌드, AI 리뷰 잡
⑦ 패키지·이미지 게시GitLab Package Registry(npm/pip/maven) · 컨테이너 이미지(사내 레지스트리)

의존성 설치 (폐쇄망)

외부 인터넷 없이 npm install·pip install이 되려면 사내 미러를 사용합니다(운영자/사전세팅 단계에서 설정).

# npm (사내 레지스트리/프록시)
npm config set registry http://<사내-레지스트리>/repository/npm/
# pip
pip config set global.index-url http://<사내-레지스트리>/repository/pypi/simple/

사내 패키지 게시 (GitLab Package Registry)

# 예: npm 패키지를 프로젝트 패키지 레지스트리로 publish
npm publish --registry http://<서버-IP>:8929/api/v4/projects/<ID>/packages/npm/
전 과정이 사내(GitLab·LiteLLM·레지스트리)에서 완결 — 코드·데이터·산출물이 외부로 나가지 않습니다.

2 · 설치

Windows

irm https://dev.kopens.ai/install.ps1 | iex

macOS / Linux

curl -fsSL https://dev.kopens.ai/install.sh | bash
설치 후 새 터미널을 열고, IntelliJ는 재시작하세요(환경변수/플러그인 적용).

설치 스크립트가 하는 일: Node.js 확인 → OpenCode·Claude Code 설치 → Continue·OpenCode·Claude Code 설정파일 생성(모두 이 DGX-SPARK(GB10)의 LLM을 가리킴).

3 · IntelliJ (Continue) — 자동완성 + 채팅

  1. IntelliJ → Settings → Plugins → MarketplaceContinue 설치 후 재시작
  2. 설치 스크립트가 ~/.continue/config.yaml를 이미 생성해 둠 (채팅=gpt-4o, 자동완성=code-completion)
  3. 코드 입력 중 회색 인라인 제안이 뜨면 Tab으로 수락
  4. 채팅: 우측 Continue 패널 또는 코드 선택 후 Cmd/Ctrl+L
자동완성이 안 보이면 Continue 하단 상태바에서 모델이 Kopens Autocomplete로 선택됐는지 확인하세요.

4 · OpenCode (터미널 에이전트)

opencode            # 프로젝트 폴더에서 실행 (TUI)

기본 모델이 kopens/gpt-4o로 설정되어 있습니다. 설정: ~/.config/opencode/opencode.json

5 · Claude Code

claude              # 프로젝트 폴더에서 실행

환경변수(ANTHROPIC_BASE_URL 등)로 로컬 모델에 연결됩니다. 새 터미널에서 적용됩니다.

6 · 직접 API 호출 (선택)

어떤 OpenAI 호환 도구든 아래로 연결하면 됩니다.

curl https://api.kopens.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-pp-master" \
  -H "Content-Type: application/json" \
  -d '{"model":"gpt-4o","messages":[{"role":"user","content":"hi"}],"max_tokens":2000}'
참고: 채팅 모델은 추론(Thinking)형이라 max_tokens를 넉넉히(2000+) 주세요. 너무 작으면 사고과정만 차고 본문이 안 나올 수 있습니다.

7 · 문제 해결

증상조치
명령어 not found새 터미널을 여세요(PATH/환경변수 갱신). Node.js 설치 확인.
연결 실패이 서버(https://api.kopens.ai)에 네트워크 접근 가능한지 확인.
자동완성 없음Continue 플러그인 설치/재시작, ~/.continue/config.yaml 확인.
응답이 비어있음max_tokens를 늘리세요(2000+).