この記事についてClaude(Anthropic)との共同編集により作成されました。
要約
- 「Ollamaで完全無料」言説の電気代を計算したら、想像よりちゃんと払っていた。実態はベンダーが負担していた計算コストを個人が肩代わりしているだけ
- 電気代だけで月20ドル課金と比較すると、RTX 3090 は 1日 約9時間、4090 は 1日 約7時間 の稼働で損益分岐に到達する。常時付けっぱなしの想定だと普通に負ける
- Mac Studio M3 Max は消費電力が桁違いに低く、電気代単体ではほぼ常に勝つ。Max プラン(月100ドル)相手だとどの GPU でも電気代では負けない
- 性能ギャップ・工数・夏のクーラー代(冬は暖房代わり)を積むと、ライトユース帯ではベンダー課金の方が素直にコスパが良い
- ローカルの価値は「無料」ではなく、自分向けに作れる自由さと LLM 周辺の解像度が上がる勉強コストにある。そこを目当てに払うなら筋が通る
最近 SNS や技術ブログで「Ollama 入れてローカルモデル動かせばコーディングエージェントが完全無料」みたいな言説をよく見かける。 自分は読むたびに違和感があった。GPU を回す電気代、見えてますん? というやつ。
この記事は完全論破ではなく、見えないコストと月額課金を素直に突き合わせて、「何時間以下の稼働ならローカルが電気代で勝てるのか」の損益分岐を出してみる試み。比較対象は Claude Code Pro / Codex(ChatGPT Plus)/ Cursor Pro という月20ドル帯の3つと、その上の Max プラン(月100ドル相当)。
「完全無料」言説に感じる違和感
「Ollama を入れて Qwen Coder や DeepSeek Coder を載せて、Cline / Roo Code から叩けばコーディングエージェントが完全無料」。 この主張、技術的にはほぼ正しい。動く。タダで動く。少なくとも、月額の請求書は来ない。
ただ、ここで言う「無料」は 月額サブスクリプション料が発生しない という意味でしかなくて、計算コスト自体が消えたわけではない。 ベンダー課金していたときに払っていたお金で、ベンダーはデータセンターの電気代と GPU の減価償却を払っていた。それをローカルに持ってくると、電気代は自分の家のコンセントから出る。払う主体が変わっただけで、計算は同じだけ起きている。
この記事でやりたいのは:
- まず GPU の TDP と電気料金単価から、1時間あたり何円かかっているのかを出す
- ベンダーの月額(月20ドル、月100ドル相当)まで何時間動かせるかという損益分岐を出す
- 電気代以外の見えないコスト(性能ギャップ、工数)にも一応触れる
- 最後に、ローカルにする理由は「無料」ではなく別のところにある、と着地させる
1時間あたりの電気代を出す
電気料金単価は、日本の家庭用標準として 31 円/kWh を採用する。東京電力 従量電灯B 第二段階に燃料費調整額と再エネ賦課金を乗せた概算値1。契約形態や時期で変わるので、あくまで目安として読んでほしい。
GPU の消費電力は仕様上の TDP を採用。RTX 3090 が 350W2、RTX 4090 が 450W3。Mac Studio (M3 Max) は推論ワークロード時の実測ベースで 100W 前後4。
1時間あたりの電気代は TDP (kW) × 31 円/kWh × 1 時間 で出る。
| ハードウェア | TDP | 1時間あたり電気代 |
|---|---|---|
| RTX 3090 | 350 W | 約 11 円/時 |
| RTX 4090 | 450 W | 約 14 円/時 |
| Mac Studio M3 Max | 約 100 W | 約 3 円/時 |
念のためフェアに書いておくと、これは GPU 単体の話で、実際は CPU・メモリ・マザボ・ファン・モニタ等で +100W 程度のシステムオーバーヘッドが乗る。完璧に切り分けるのは難しいので、表は GPU 単体の下限値だと思って読んでほしい。
それから「TDP は仕様上の上限値」なので、推論中ずっとフルロードかと言われると常にそうではない。プロンプト処理中は張り付くが、待機中は下がる。ただ、コーディングエージェントを回している間はかなりの時間 GPU が走っているはずで、ここでは「上限に近い使い方」を前提にする。
月20ドル課金との損益分岐
比較対象は Claude Code Pro5、Codex(ChatGPT Plus)6、Cursor Pro7 の3つ。いずれも月 20 ドル。1ドル 150 円換算で 月 約 3000 円 とする。
3000 円 ÷ 1時間あたり電気代 で、月3000円ぶんの電気代に到達する稼働時間が出る。
| ハードウェア | 1時間あたり電気代 | 月3000円までの稼働時間 | 1日あたり換算 |
|---|---|---|---|
| RTX 3090 | 約 11 円 | 約 273 時間/月 | 1日 約 9 時間 |
| RTX 4090 | 約 14 円 | 約 214 時間/月 | 1日 約 7 時間 |
| Mac Studio M3 Max | 約 3 円 | 約 1000 時間/月 | 1日 約 33 時間(=常時稼働でも勝つ) |
ここで効いてくるのは「自分はコーディングエージェントを1日何時間動かしているか」という問い。 体感ベースで言うと、Claude Code に課金している自分の場合、業務日は普通に半日近く動かしているし、コードを書かない日でも何かしら走らせている。1日 9時間 という閾値は、思っているほど余裕のあるラインではない。
特にベンダー課金は「使い放題感」があるので、課金していると無意識に長時間走らせがちになる。同じ感覚でローカルを回すと、3090 / 4090 では普通に月3000円を超えていく。
一方 Mac Studio は消費電力が圧倒的に低くて、電気代単体で見ればまず負けない。Apple Silicon の Unified Memory で大きなモデルを動かせる派が「Mac ならコスパいい」と言うのは、電気代の文脈では正しい。
Max プラン(月100ドル相当)との損益分岐
Claude Code Max などの重課金プランは月 100 ドル〜5。1ドル 150 円換算で 月 約 15000 円。
| ハードウェア | 月15000円までの稼働時間 | 1日あたり換算 |
|---|---|---|
| RTX 3090 | 約 1364 時間/月 | 1日 約 45 時間(=事実上不可能、常に勝つ) |
| RTX 4090 | 約 1071 時間/月 | 1日 約 36 時間(同上) |
| Mac Studio M3 Max | 約 5000 時間/月 | 1日 約 167 時間(同上) |
1日は 24 時間しかないので、どのハードウェアでも電気代では Max プランに勝てない。 ここからは 電気代の議論ではなく、性能と工数の議論 になる。重課金しているということは、それだけのコード生成量と Opus クラスの応答品質を必要としているはず。同じ仕事をローカルでやろうとすると、次のセクションのギャップが効いてくる。
電気代だけでは語れない — 性能ギャップという見えない損益分岐
ライト勢の損益分岐表に戻る。「RTX 3090 なら 1日 9時間 までなら電気代で勝てる」というのは、同じ仕事量で比較した場合の話ではない。
実際にコーディングエージェント用途で動かすと、こういうギャップが出てくる:
- タスク完遂率:ローカルの 7B〜30B クラス(Qwen 2.5 Coder、DeepSeek Coder V2 など)と、Claude Sonnet / Opus、GPT-4 系の差。複雑なリファクタや「複数ファイルにまたがる仕様変更」になるほど差が開く
- 推論速度:エージェントが何往復もする用途では tokens/sec が効いてくる。ローカルは API より速いと感じる場面もあるが、それは「単発で短い応答」のとき。長い思考+ツール呼び出しを繰り返すとローカル側が詰まりやすい
- 失敗試行の追加コスト:ローカルでタスクが通らずやり直しになると、その間の電気代が積み上がる。ベンダー側はやり直しても料金は変わらない(定額制なので)
「同じ作業を完了するのに必要な稼働時間」がそもそも違うので、稼働時間ベースの損益分岐はもっと早く来る、というのが正直なところ。
もう一つの見えないコスト — 工数
性能だけでなく、ローカル運用には継続的に工数が乗る。
- 環境構築:Ollama 単体ならまだ楽だが、性能を出そうとして vLLM や llama.cpp の量子化チューニング、CUDA / Metal の調整に入ると沼
- モデル更新の追従:新しい Coder 系モデルが出るたびに評価・差し替え。ベンダー側はそれを向こうがやってくれる
- context window 制限の回避:ローカルだと積めるトークン数に上限があるので、長文コードベースの扱いを自分で工夫する必要がある
- ツール結線:MCP サーバや tool 呼び出しの結線。Claude Code / Codex / Cursor は最初から組まれているが、ローカル側は Cline / Roo Code 等の組み合わせを自分で面倒みる
このあたりは「楽しい」と感じる人にはコストではなく趣味になるので、必ずしもマイナスとは言わない。ただ「完全無料」を主張する文脈でこれが計上されないのは、フェアではない気がする。
夏はクーラー代、冬は暖房代わり
もうひとつ忘れてはいけないのが空調。GPU をフルロードで回すと、そのワット数ぶんはほぼそのまま熱として部屋に放出される。3090 なら 350W、4090 なら 450W ぶんの熱源が机の下に常駐している、と思った方がいい。
夏はこの熱をクーラーで打ち消す必要が出てくる。エアコンの効率(COP)を家庭用の一般値として 3.5 と仮定すると、GPU の消費電力 ÷ COP ぶんの追加電力がエアコン側で必要になる。1時間あたりの追加電気代はこうなる:
| ハードウェア | GPU 電気代 | 夏のクーラー追加 | 夏の実質 |
|---|---|---|---|
| RTX 3090 | 約 11 円/時 | +約 3 円/時 | 約 14 円/時 |
| RTX 4090 | 約 14 円/時 | +約 4 円/時 | 約 18 円/時 |
| Mac Studio M3 Max | 約 3 円/時 | +約 1 円/時 | 約 4 円/時 |
夏の損益分岐稼働時間を月3000円基準で出し直すと:
| ハードウェア | 夏の月3000円までの稼働時間 | 1日あたり換算 |
|---|---|---|
| RTX 3090 | 約 214 時間/月 | 1日 約 7 時間 |
| RTX 4090 | 約 167 時間/月 | 1日 約 5.5 時間 |
| Mac Studio M3 Max | 約 750 時間/月 | 1日 約 25 時間(=常時稼働でも勝つ) |
4090 が 1日 5.5 時間まで縮むのは、夏場の運用としてはなかなか厳しい数字。
逆に冬は GPU から出る熱がそのまま暖房代わりになる。暖房をつけている部屋なら、暖房分の電力をその場で節約できる勘定。年単位で均せば夏のマイナスを冬のプラスでいくらか相殺できるが、感覚としては夏の負担の方が重い。クーラーは熱を「捨てる」のに電力を払うのに対して、暖房は熱を「作る」のに電力を払う側で、後者は GPU が代わりにやってくれる側だから、節約できる量に上限がある。
ちなみにデータセンターはこの冷却分まで含めて電力契約しており、外気冷却や液冷で効率を稼いでいる。家庭のクーラーよりは桁違いに COP が出ているので、ベンダー側の「単位計算量あたりの電気代」は家庭より圧倒的に安い。次のセクションで触れる「計算コストの肩代わり」が効いている理由のひとつでもある。
ベンダーがやっているのは「計算コストの肩代わり」
ここで整理しておくと、構造はこう:
| ベンダー課金 | ローカル実行 | |
|---|---|---|
| 計算が走る場所 | データセンター | 自分の机 |
| 電気代を払う人 | ベンダー(月額に転嫁) | 自分(電力会社に直接) |
| ハードウェア減価償却 | ベンダー | 自分 |
| 性能 / 速度 | ベンダーが最適化 | 自分のハードに依存 |
| 環境構築・更新工数 | ベンダー | 自分 |
「ローカル=無料」と感じるのは、自分が払っている電気代と自分のハードウェアコストが、月次の請求書として可視化されないから。 ベンダーは同じものをまとめて払って、月額で按分して請求してくれている。コストが可視化されているのがベンダー課金、不可視化されているのがローカル、という構図に近い。
それでもローカルを選ぶ意味 — 「無料」ではなく「自由」と「勉強」
ここまで電気代で殴ってきたが、自分はローカル LLM 自体を否定したいわけではない。 ローカルにはローカルの価値があって、それは「無料」ではなく別軸にある、というのが本筋。
価値を雑に2つに分けるとこう:
- 自由さ:プライバシー、オフライン動作、社外秘コードを投げられる、好きなモデルやプロンプトに改造できる、API レート制限を気にしないで済む。この自由は月数千円相当の価値があると思う場面が多い
- 勉強コスト:LLM 推論の挙動、VRAM の効き方、量子化の影響、コンテキスト制限の体感を手で触れる。Ollama / vLLM / llama.cpp を素振りすると、ベンダー API の裏で何が起きているかの解像度が上がる。ここに払う電気代は授業料として筋が通る
「無料だから使う」ではなく「自由と学びに月数千円払う」と素直に認識する方が、後から「思ったよりコストかかってる」と気付くより健全だと思う。
逆に言うと、自由も学びも要らなくて純粋に「コーディングエージェントを安く回したい」だけなら、ライト勢のうちは月20ドル払うのが普通に最適解になる。ここはきれいに分かれる。
おわりに
書きたかったことを一文にすると、こうなる:
「Ollama で完全無料」は電気代を見ていないだけで、実態は計算コストの肩代わり。ライトユース帯ではベンダー課金の方が素直に安いし、ローカルを選ぶ理由は無料ではなく自由と勉強だと割り切った方が筋が通る。
電気代の数値は契約と運用次第で動くので、自分の環境に置き換えて再計算してみてほしい。TDP (kW) × 単価 (円/kWh) × 月稼働時間 を、契約している月額と比較するだけでいい。
そして比較するときには、性能ギャップと工数まで含めて、フェアにやるのが筋。
参考文献
- 東京電力エナジーパートナー 従量電灯B・C 料金単価 https://www.tepco.co.jp/ep/private/plan/old/electric.html
- NVIDIA GeForce RTX 3090 仕様 https://www.nvidia.com/en-us/geforce/graphics-cards/30-series/rtx-3090-3090ti/
- NVIDIA GeForce RTX 4090 仕様 https://www.nvidia.com/en-us/geforce/graphics-cards/40-series/rtx-4090/
- Apple Mac Studio (M3 Max) 技術仕様 https://www.apple.com/jp/mac-studio/specs/
- Claude Code 料金プラン https://www.claude.com/pricing
- ChatGPT 料金プラン https://openai.com/chatgpt/pricing/
- Cursor 料金プラン https://www.cursor.com/pricing