flower road: Mac Studio で作る完全ローカル AI 開発環境（OpenCode + Qwen 3.5）

2026年5月4日月曜日

背景: クラウド AI（OpenAI 等）にコードを投げたくない、あるいは API コストを抑えたい。
解決策: Apple Silicon (UMA) のパワーを活かし、OpenCode と llama-server でローカル完結のエージェント環境を構築する。

秀成さんが実行したコマンドをベースに、GPU をフル活用する設定を紹介します。

Bash

# Llama-server の起動例
llama-server \
  --model ~/models/Qwen3.5-9B-Q8_0.gguf \
  --ctx-size 8192 \
  --port 8080 \
  --ngl 99

ここが一番のハイライトです。UI から設定しても反映されない場合の「正解の JSON 構造」を記載します。

JSON

{
  "provider": {
    "openai": {
      "apiKey": "dummy",
      "baseUrl": "http://localhost:8080/v1"
    }
  },
  "model": "local"
}

秀成さんが成功した "Screenshot 2026-05-04 at 23.28.36.jpg" のような、具体的なコード生成例を載せます。

ターミナルを叩く手間を省くための、エンジニアらしい自動化ハックを紹介します。

flower road