매뉴얼 · 사용 가이드

로컬 LLM으로 코딩하기

로컬 LLM(사내 DGX-SPARK(GB10))을 IntelliJ·터미널에서 코딩 어시스턴트로 사용하는 방법입니다. 모든 요청은 사내 DGX-SPARK(GB10)에서 처리되며 외부로 나가지 않습니다.

1 · 개요

이 서버 한 대가 ① 로컬 LLM 서빙 ② 인라인 자동완성 모델 ③ 개발툴 배포(데브포탈)를 모두 제공합니다.

구성	내용
포털	`https://developer.kopens.ai`
LLM API (OpenAI 호환)	`https://api.kopens.ai/v1`
LLM API (Anthropic 호환)	`https://api.kopens.ai/v1/messages`
API 키	`sk-pp-master`
채팅 모델	`gpt-4o` (고성능 채팅·에이전트)
자동완성 모델	`code-completion` (저지연 인라인 자동완성)

개발 워크플로우 (전체)

설치부터 배포까지, 코드·데이터가 사내를 벗어나지 않는 폐쇄망 개발 흐름입니다.

단계	도구 / 방법
① 프로젝트 클론	GitLab에서 `git clone` (운영자 발급 계정)
② 코딩 (AI)	IntelliJ 자동완성 · Claude Code · OpenCode — 사내 모델
③ 사내 코드 검색	RAG/MCP `search_code` (전사 의미검색) · Continue `@codebase`
④ 의존성 설치	사내 미러에서 — `npm/pip`가 사내 레지스트리를 바라봄(아래)
⑤ 커밋 · MR	`git push` → Merge Request → AI 자동 리뷰·요약
⑥ CI	GitLab Runner — 테스트·빌드, AI 리뷰 잡
⑦ 패키지·이미지 게시	GitLab Package Registry(npm/pip/maven) · 컨테이너 이미지(사내 레지스트리)

의존성 설치 (폐쇄망)

외부 인터넷 없이 npm install·pip install이 되려면 사내 미러를 사용합니다(운영자/사전세팅 단계에서 설정).

# npm (사내 레지스트리/프록시)
npm config set registry http://<사내-레지스트리>/repository/npm/
# pip
pip config set global.index-url http://<사내-레지스트리>/repository/pypi/simple/

사내 패키지 게시 (GitLab Package Registry)

# 예: npm 패키지를 프로젝트 패키지 레지스트리로 publish
npm publish --registry http://<서버-IP>:8929/api/v4/projects/<ID>/packages/npm/

전 과정이 사내(GitLab·LiteLLM·레지스트리)에서 완결 — 코드·데이터·산출물이 외부로 나가지 않습니다.

2 · 설치

Windows

irm https://developer.kopens.ai/install.ps1 | iex

macOS / Linux

curl -fsSL https://developer.kopens.ai/install.sh | bash

설치 후 새 터미널을 열고, IntelliJ는 재시작하세요(환경변수/플러그인 적용).

설치 스크립트가 하는 일: Node.js 확인 → OpenCode·Claude Code 설치 → Continue·OpenCode·Claude Code 설정파일 생성(모두 이 DGX-SPARK(GB10)의 LLM을 가리킴).

3 · IntelliJ (Continue) — 자동완성 + 채팅

IntelliJ → Settings → Plugins → Marketplace → Continue 설치 후 재시작
설치 스크립트가 ~/.continue/config.yaml를 이미 생성해 둠 (채팅=gpt-4o, 자동완성=code-completion)
코드 입력 중 회색 인라인 제안이 뜨면 Tab으로 수락
채팅: 우측 Continue 패널 또는 코드 선택 후 Cmd/Ctrl+L

자동완성이 안 보이면 Continue 하단 상태바에서 모델이 Kopens Autocomplete로 선택됐는지 확인하세요.

4 · OpenCode (터미널 에이전트)

opencode            # 프로젝트 폴더에서 실행 (TUI)

기본 모델이 kopens/gpt-4o로 설정되어 있습니다. 설정: ~/.config/opencode/opencode.json

5 · Claude Code

claude              # 프로젝트 폴더에서 실행

환경변수(ANTHROPIC_BASE_URL 등)로 로컬 모델에 연결됩니다. 새 터미널에서 적용됩니다.

6 · 직접 API 호출 (선택)

어떤 OpenAI 호환 도구든 아래로 연결하면 됩니다.

curl https://api.kopens.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-pp-master" \
  -H "Content-Type: application/json" \
  -d '{"model":"gpt-4o","messages":[{"role":"user","content":"hi"}],"max_tokens":2000}'

참고: 채팅 모델은 추론(Thinking)형이라 max_tokens를 넉넉히(2000+) 주세요. 너무 작으면 사고과정만 차고 본문이 안 나올 수 있습니다.

7 · 문제 해결

증상	조치
명령어 not found	새 터미널을 여세요(PATH/환경변수 갱신). Node.js 설치 확인.
연결 실패	이 서버(`https://api.kopens.ai`)에 네트워크 접근 가능한지 확인.
자동완성 없음	Continue 플러그인 설치/재시작, `~/.continue/config.yaml` 확인.
응답이 비어있음	`max_tokens`를 늘리세요(2000+).