AI

AI

StableDiffusion.cppをサーバモードで使用

やりたいことStableDiffusion.cppをサーバモードで使用します。利点とできないことまずサーバモードの利点とできないことをまとめるのでサーバモードを使用するかどうか検討してください。利点サーバモードで起動した場合、モデルがキャッシュされるので2回目以降の実行が早くなります。HTMLを用意してHTMLからプロンプトなどを指定することができます。できないことリクエストで指定できるのはプロンプト、枚数、画像サイズ、画像フォーマット、圧縮率のみです。細かい設定ができません。使用するモデルの変更を行う場合はサーバの再起動が必要です。環境構築ダウンロード以下のページから自分の環境にあったZip...
AI

ローカルで画像入力ありのLLMを動かす(AMD GPU/CPU対応)

やりたいことllama.cppを使用してローカルで画像入力ありのLLM(チャットAI)を実行します。この記事ではgoogleのローカル向けのモデルであるQwen2.5-VLを使用します。AMDの GPUでもGPUのない環境( CPU)でも実行可能です。Gammaの起動は以下のページを参照してください。環境構築llama.cpp以下のページから自分の環境にあったZipファイルをダウンロードします。WindowsでAMDのGPU(もしくはGPUが乗っていない)で動かしたい場合はvulkanむけのパッケージで動作します。NvidiaのGPUを使用する場合、CUDAむけのパッケージで動作します。上記の...
AI

早くて質がいいという噂のSD3.5をコマンドラインで実行(AMD GPU/CPU対応)

やりたいことstable-diffusion.cppを使用してコマンドラインからSD3.5-midium(stable-diffusion-3.5-medium)を実行します。早くて質がいいと噂です。AMDの GPUでも CPUでも実行可能です。環境構築stable-diffusion.cpp以下のページから自分の環境にあったZipファイルをダウンロードします。AMDのGPUで動かしたい場合はvulkanとつくものかrocmとつくものです。(基本的にはvulkanでいいと思います。rocmはどうするGPUが限られるはずです。)NVidiaのGPUはcudaが付くものが対象です。avx512,a...
AI

ローカルでLLMを動かす(AMD GPU/CPU対応)

やりたいことllama.cppを使用してローカルでLLM(チャットAI)を実行します。この記事ではgoogleのローカル向けのモデルであるgemmaを使用します。AMDのGPUでもGPUのない環境(CPU)でも実行可能です。環境構築llama.cpp以下のページから自分の環境にあったZipファイルをダウンロードします。WindowsでAMDのGPU(もしくはGPUが乗っていない)で動かしたい場合はvulkanむけのパッケージで動作します。NvidiaのGPUを使用する場合、CUDAむけのパッケージで動作します。上記のバージョンで動作しない場合はCPUむけのパッケージを使用します。対象のダウンロ...
AI

コマンドラインでQwen-Imageの画像編集を実行(AMD GPU/CPU対応)

やりたいことstable-diffusion.cppを使用してコマンドラインからQwen-Imageの画像編集を実行します。この画像編集機能はGoogleのNanoBananaと比肩するらしいです。AMDのGPUでもCPUでも実行可能です。環境構築stable-diffusion.cpp以下のページから自分の環境にあったZipファイルをダウンロードします。AMDのGPUで動かしたい場合はvulkanとつくものかrocmとつくものです。(基本的にはvulkanでいいと思います。rocmはどうするGPUが限られるはずです。)NVidiaのGPUはcudaが付くものが対象です。avx512,avx2...
AI

コマンドラインでQwen-Image実行(AMD GPU/CPU対応)

やりたいことstable-diffusion.cppを使用してコマンドラインからQwen-Imageを実行します。AMDのGPUでもCPUでも実行可能です。環境構築stable-diffusion.cpp以下のページから自分の環境にあったZipファイルをダウンロードします。AMDのGPUで動かしたい場合はvulkanとつくものかrocmとつくものです。(基本的にはvulkanでいいと思います。rocmはどうするGPUが限られるはずです。)NVidiaのGPUはcudaが付くものが対象です。avx512,avx2,avx,noavxはCPU動作です。お使いのCPUで使用できるavxのバージョンを...
AI

コマンドラインでStableDiffusion実行(AMD GPU/CPU対応)

やりたいことstable-diffusion.cppを使用してコマンドラインからStableDiffusionを実行します。AMDのGPUでもCPUでも実行可能です。環境構築stable-diffusion.cpp以下のページから自分の環境にあったZipファイルをダウンロードします。AMDのGPUで動かしたい場合はvulkanとつくものかrocmとつくものです。(基本的にはvulkanでいいと思います。rocmはどうするGPUが限られるはずです。)NVidiaのGPUはcudaが付くものが対象です。avx512,avx2,avx,noavxはCPU動作です。お使いのCPUで使用できるavxのバ...
AI

CPUでZ-Image-Turboを動かしてみる

やりたいことCUDAのない環境でAlibabaで画像生成モデルであるZ-Image-Turboを使ってみます。環境構築作業用のフォルダを作成します。venv環境への移動(任意)必要であればコマンドプロンプトで以下のコマンドを実行して、Venvの環境を作成してアクティブにします。python -mvenv venvvenv\scripts\activate.batライブラリのインストール以下のコマンドを実行して必要なライブラリのインストールを行います。pip install git+pip install torch torchvisionpip install transformerspip ...
AI

最近のローカル使用できる画像生成モデル

やりたいこと最近でてきたローカル使用できる画像生成できるモデルをまとめました。試そうとしたモデルもあるのですが、うちのPCでは動作しないようでした。(おそらくモデルサイズが大きすぎる。。。)モデルFLUX.2-devFLUX.1 の後継です。ダウンロードにはhuggingfaceへのログインが必要です。 モデルサイズ:約65G ByteデモQwen-ImageAlibaba社による画像生成モデルです。モデルサイズ:約40G ByteデモQwen-Image-Edit上記Qwen-Imageの画像編集向けのモデルです。モデルサイズ:約40G Byteデモ以下のサイトの”Image Edit”で試...
AI

Gemini 2.5 Flash Image(nano-banana)の使用と比較

やりたいことGemini 2.5 Flash Image(nano-banana)を使用しGemini 2.5 Flash Imageと比較します。Gemini 2.5 Flash Image(nano-banana)は画像修正に優れていると言われています。使用方法Google AI Studioにアクセスします。画面右上赤枠の箇所がGemini 2.5 Flash Image Previewもしくはnano-bananaになっていることを確認します。別のものになっていたらクリックして変更します。あとは下のエディットボックスにプロンプトを入力して実行します。(リターンでは実行されません。右側の...