手元のGPUで、どのモデルがどれだけ動くか
実機(RTX 5080+RTX 5060 Ti 各16GB)でローカルAIを実測し、VRAM・速度・電力をもとに、用途から必要スペックを引けるように整理しています。「とりあえず動く」ではなく、収まる・あふれる・遊ぶの境界まで。
VRAM
モデル別の実測VRAM使用量
tok/s
生成速度(トークン毎秒)
W
消費電力・電力効率
用途別
用途ごとのスペック目安
用途・スペックから探す
実測データのデータベース+GPU選び。4つの入口から。
テーマ別ガイド
AIコーディング
画像・動画生成(ComfyUI)
ローカルLLM
新着記事
- ローカルLLMでゲームやコードは自作できるか|完全オフライン・反復前提で27〜30B級モデルが到達できる範囲
- ComfyUI用の画像モデルGGUFをggufyで自作する|SDXL量子化のサイズ・VRAM・速度を実測
- ローカルLLMの量子化フォーマットの選び方|Q4_K_M〜Q8・QATを精度・サイズと16GB VRAMで見極める
- ComfyUIをPython不要・APIなしで自動化する方法|非エンジニアでもできる辞書式自動化入門
- ローカルVLMでデスクトップ操作を自動化|OmniParser前処理で視覚トークン負荷を抑える
- FLUX.2 Klein 9BをVRAM 16GBで実測|RTX 5080・5060 TiでQ8_0 GGUFの速度とVRAMを比較



