Stable Diffusion - iXelszy.

Yeah, Stable Diffusion ~~again~~ ㄟ( ▔, ▔ )ㄏ

Stable Diffusion again, again, and again.

I created this blog to make a personal note of what I have learned sometimes, this blog just anticipation when I forget about what I learned in the past, but I am making it open to the public so you can read and learn from it. Because sharing is caring 😇

This blog is created using Eleventy for the Static Site Generator (SSG), Netlify to host this site, and GitHub to host the source code.

Baik, cukup dengan penggunaan English Languange.

Anyway, welcome and happy reading! ^^

Stable diffusion adalah model teks-ke-gambar. Ini terutama digunakan untuk menghasilkan gambar terperinci berdasarkan deskripsi teks. Difusi Stabil adalah alternatif yang sangat baik untuk alat seperti midjourney dan DALLE-2. Dan hal yang hebat tentang alat ini adalah Anda dapat menjalankannya secara lokal di komputer Anda atau menggunakan layanan seperti DreamStudio atau HugggingFace.

Stable Diffuusion memiliki menu seperti:

Prompt

pertama, untuk menghasilkan sebuah gambar yang bagus kita membutuhkan prompt yang tepat. Prompt adalah string yang kita submit ke sistem dan akan menghasilkan gambar sesuai dengan prompt yang kita berikan. Baik, tanpa banyak bicara langsung sja jita beralih ke tahap yang sedikit kompleks.

Untuk membuat prompt sebenarnya tidak ada batasan atau aturan khusus, tapi selama saya mencoba saya menemukan bahwa untuk membuat prompt yang akurat kita dapat memakai urutan seperti beriku:

Lokasi (seperti kamar tidur, ruangan, kamar mandi, taman, dan lainnya) -> subjek (hal yang ingin ditonjolkan sepertimanusia, hewan, alam, benda, dan lainnya) -> detail tentang subjek (penambahan detail seperti detail rambut, tubuh, pose, raut wajah, badan, dan sebagainya.) -> pakaian/aksesori -> tubuh/sudut pandang mana yang akan diambil (misalnya full body, close up, wide shot, mid shot, dan sebagainya) -> pencahayaan/komposisi yang berlaku untuk keseluruhan gambar (detail cahaya atau tekstur gambar seperti oil painting, vector, illustration, sketch draw, sketch line, dan sebagainya).

Cause	Effect
Over steps sampler	Tubuh rusak, bagian ekstra(seperti jari 6), secara keseluruhan buruk. Sebagian besar sampler (seperti Euler, DDIm, SDE 2M++, dan lainnya) hanya perlu steps 42 atau kurang. Hanya ada satu model yang telah saya uji yang membutuhkan 80-100 langkah agar hasilnya bagus yaitu Euler-a, namun sebagian besar bahkan baik-baik saja pada 25-28 steps.
Over 75 tokens	Banyak yang salah, semakin ringkas prompt/token semakin baik, setelah 75 token mengatur ulang bobot menjadi 76, secara genuin tidak memerlukan terlalu banyak token/prompt bahkan untuk hal-hal yang sangat rinci karena cukup tulis garis besar nya saja akan jauh lebih baik. Ini akan menyebabkan detail acak diambil, dan membuat hasil generate mengabaikan sisa ptoken kita. Semakin rendah jumlah token, semakin baik. Jika kita sering kehilangan detail dan kesulitan mendapatkan pose yang diinginkan, inilah sebabnya.
mixing random tokens in various order	Bad anatomy, ignoring tokens, no coherency
Overweighted tokens	Bleeding into other tokens, fried image, loss of details on other tokens, should RARELY need to go above 1.4/1.5, anything over 2 doesn't really matter, and at that point the rest of the prompt's weights will be fucked. If you're having issues with even high weights not applying a feature either the rest of your prompt has too much attention weighting, or you need to adjust your settings in general.
Too many specific details about a thing	Creates a mix of all tokens and/or doesn't give you what you want, Either format the details better,or play with step count additions and removals, Additionally it'll break it up into individual tokens like so *(apple bottom jeans)* is read like apple, bottom, jeans and tries combining them into one, but the AI will can also create an apple. Some tokens can be combined like so *blue_eyes* or *a dog AND a dog wearing a hat* will give you signficantly better odds at a dog wearing a hat rather than a dog and a hat.
Menambahkan prompt 4k/8k/hdr/rtx/etc	90% tidak akan mempengaruhi hasil generate gambar. Jika ingin menghasilkan pencahayaan yang lebih baik cukup tambahkan prompt *(natural.dark/moody lighting/soft lighting/detailed lighting)*atau photorealism/realistic yang akan membuat gambar generate jauh lebih baik jika digabungkan dengan beberapa prompt yang telah disebutkan.