Stable Diffusion

A collection of 2 posts
Stable Diffusion (AUTOMATIC1111)のパラメータをいろいろ変えて実験してみた
AI

Stable Diffusion (AUTOMATIC1111)のパラメータをいろいろ変えて実験してみた

CFG Scaleとは 以前、「【LoRA】少ないデータで、AIモデルをチューニングする」という記事で AUTOMATIC1111 を使用しましたが、パラメータについてはあまり触れていませんでした。 そこで今回は、Stable Diffusion で重要なパラメータのひとつである CFG Scale について解説していきたいと思います。 本当は Nova Anime XL のような最近のモデルを使いたかったのですが、 RTX 2070(8GB)では VRAM 不足で、まともに動かすことができませんでした (T_T) そのため、LoRA の記事でも使用した abyssorangemix33WhiteMildCat をモデルとして使っています。 なお、画像生成で使用したプロンプトは下記の通りです。 anime style, mature and graceful young woman with long brown hair, modern
4 min read
【LoRA】少ないデータで、AIモデルをチューニングする
IT

【LoRA】少ないデータで、AIモデルをチューニングする

概要 今回は、画像生成モデルStable Diffusionを使って、当ブログの英語の記事で登場するEmiさんのイラストが簡単に生成できるようにしたいと思います。 そのために、LoRAという技術を使います。 LoRA(Low-Rank Adaptation)とは、AIモデルのファインチューニングを効率的に行うための技術です。特に大規模言語モデル(LLM)や画像生成AIの微調整に用いられ、少ない計算資源で高品質なカスタマイズを可能にします。 LoRAは、モデルの重みを直接変更するのではなく、低ランクの行列を挿入して学習することで、従来のファインチューニングよりも少ない計算コストで高い性能を維持できます。 🧠 LoRAの数学的な挿入位置 元の重み W を以下のように拡張します: W' = W + α * (BA) A:低ランクの行列(学習する) B:低ランクの行列(学習する) α:スケーリング係数(学習時や推論時に設定) この BA 部分だけが学習され、元の W は固定のままです。     📌 実行時(推論時)の仕組み LoRAで生成
7 min read