ローカルLLM

なんかやばい日本語特化モデルが出た(lfm2.5-1.2b-jp-202606)

1.2Bパラメータなのに318トークン/秒、日本語の文章読解もこなすLFM2.5-1.2b-JPをレビュー。Xperia 1 IIIで11t/s動作確認。エッジLLM時代が近づいてる？

2026.06.06

ローカルLLM

(2026年 12~24GB) VRAM別　おすすめローカルLLM比較ガイド

ローカルLLMはVRAMが全て。q4量子化GGUFを前提に、MoEモデルの特性をふまえながら12GB・16GB・24GB別のおすすめモデルを解説。Qwen3.6-27BでのエージェンティックコーディングからGemma4-31Bのロールプレイ性能まで、実運用ベースで比較します。

2026.06.05

ハウツーローカルLLM解説

LM StudioがMTPに対応したので使ってみる

LM StudioがMulti Token Prediction(MTP)に対応しました。24GB VRAM環境でQwen3.6シリーズを使い、トークン生成速度の向上幅やVRAM消費、Prefillへの影響を実際に検証した結果をまとめています。一般家庭のスペックではMTPの恩恵は限定的です。

2026.05.24

ローカルLLM

ローカルLLMにブラウザを操作させる(BrowserOS+LM Studio)

AIネイティブブラウザ「BrowserOS」をローカルLLM（Qwen3.6-27B）で動かしてみた。できること・遅さ・ハルシネーション・CAPTCHAの実態・プロンプトインジェクションのリスクまで正直にレビュー。

2026.05.23

ハウツーローカルLLM

ローカルLLMでコーディングエージェントを運用する(LM Studio + OpenCode)

Claude Codeの制限・従量課金に疲れたなら、ローカルLLMという選択肢があります。Qwen3.6とLM Studio、OpenCodeを組み合わせてコーディングエージェントを自前で動かすセットアップ手順を解説します。

2026.05.18

ハウツーローカルLLM

スマホでLLM：エッジデバイスAIの現在地と未来

スマホでLLMを動かす時代がやってきます。Gemma4 E2B/E4Bを例に、エッジデバイスでSLMが動くと何が嬉しいか、現状の限界はどこにあるか、そして将来本当に残り続ける制約は何かを整理します。

2026.05.17

ローカルLLM解説

小さいモデルほど量子化で劣化する｜GGUF量子化の選び方（q4_k_m・q8・UD）

GGUF量子化の最適解を探る。8bit以下の劣化傾向、K-quants/I-quants/UDの技術的違い、小規模モデルの量子化リスク、実用的なモデル選定基準をまとめました。

2026.05.05

ハウツーローカルLLM解説

ローカルLLMのキャラ付けにLoRAは不要。RAGやプロンプトで十分

ローカルLLMでキャラクター再現にLoRAファインチューニングが不向きな理由を解説。口調制御はプロンプトで十分、ドメイン知識の注入にはDoRAやRAGが有効。版権キャラを演じさせる現実的なアプローチを比較検討します。

2026.04.30

ローカルLLM解説論文紹介

Qwen3.6 VS Gemma4 ローカルLLMの使い分け完全ガイド

ローカルLLMの使い分けを実務経験から解説。Qwen3.6-35b-a3bはコーディング・長文読解・検索に、Gemma4は雑談・ロールプレイに活用。プロプライエタリモデルが必要な場面との境界線も正直に語ります。

2026.04.19

ローカルLLM

TurboQuant: KVキャッシュ圧縮の理論的限界に迫るGoogleの新手法

Google Research発のKVキャッシュ圧縮技術「TurboQuant」を解説。3ビットでほぼ無劣化の圧縮を実現する仕組み、論文では触れられていないQJLの実用上の問題点、llama.cppやvLLMへの統合状況まで、ローカルLLMユーザー視点でまとめています。

2026.04.04

ローカルLLM

ローカルLLM

なんかやばい日本語特化モデルが出た(lfm2.5-1.2b-jp-202606)

(2026年 12~24GB) VRAM別 おすすめローカルLLM比較ガイド

LM StudioがMTPに対応したので使ってみる

ローカルLLMにブラウザを操作させる(BrowserOS+LM Studio)

ローカルLLMでコーディングエージェントを運用する(LM Studio + OpenCode)

スマホでLLM：エッジデバイスAIの現在地と未来

小さいモデルほど量子化で劣化する｜GGUF量子化の選び方（q4_k_m・q8・UD）

ローカルLLMのキャラ付けにLoRAは不要。RAGやプロンプトで十分

Qwen3.6 VS Gemma4 ローカルLLMの使い分け完全ガイド

TurboQuant: KVキャッシュ圧縮の理論的限界に迫るGoogleの新手法

(2026年 12~24GB) VRAM別　おすすめローカルLLM比較ガイド