Scribble at 2026-06-18 21:02:03 Last modified: 2026-06-18 21:13:06
Enhance this image prompt for Z-Image Turbo: a unicorn
軽量で高品質な景観画像を作ってくれる Z-Image Turbo という拡散モデルは、プロンプトの作り方が自然文を基本としているので、実はキーワード(タグ)を並べるだけでプロンプトを作っていた人たちには敷居が高いモデルだ。要するにごく普通の英語の文章を書けないといけないからだ。なので、翻訳ツールを利用している人も多いのだが、或るテーマだけを設定すれば適度にプロンプトを作ってくれる生成 AI モデルというのもある。Z-Image Turbo では、この "Z-Image-Engineer" というモデルが定番であり、僕もかつて使ってみたことがある。その頃は、初期設定のようにモデルの応答をカスタマイズする「システム・プロンプト」というものが必要で、それなりの行数になっていたのだけれど、最新版の V6 を調べると、上で示した例のように使い勝手が格段に良くなっている。これだけ短い入力でよければ、もはやシステム・プロンプトというよりも「トリガー」と呼んだ方がいいだろう。
ただし、実際に使ってみたら分かるが、応答に多様性が全くない。なので、同じテーマでも多様性のある色々なプロンプトを作りたければ、やはり入力するパラメータそのものに多様性を持たせないといけないという皮肉なことになる。たとえば、
Enhance this image prompt for Z-Image Turbo: a wide shot of landscape at London.
このように打ち込むと、全く同じ入力を与えれば、応答として帰ってくるプロンプトも一字一句まで全く同じ文字列である。これはこれで予想可能な挙動となるから、用途によっては扱いやすいと言えるだろう。でも、短い入力を与えるだけで、そのつど異なるプロンプトをランダムに生成してくれる多様性が必要な方には退屈なだけだ。