Stable Diffusion süni intellekti unikal detallara və cizgilərə malik rəqəmsal təsvirlər yaratmaq üçün Stable Diffusion adlı riyazi konsepsiyadan istifadə edən süni intellekt növüdür. Bu texnologiya ən sadə formada təsadüfi kadrlardan rəqəmsal təsvirlər yaratmaq, redaktə etmək, təkmilləşdirmək, olmayan hissələrini əlavə etmək kimi maraqlı və mürəkkəb nümunələr yarada bilmə imkanı verməkdədir.
Stable Diffusion texnologiyasının necə işlədiyini başa düşmək üçün bir nümunə verək. Təsəvvür edin ki, sizin meşə rəsminiz var və siz onun unikal üslublu yeni versiyasını yaratmaq istəyirsiniz. Stable Diffusion texnologiyası süni intellekti, orijinal təsvirdəki müxtəlif rəng və formaları təhlil edərək həmin təhlil əsasında yeni nümunələr yaradıb istədiyinizə nail olmağa kömək edə bilər.
Bu texnologiyanın alqoritmləri təsvirdə müəyyən təsadüfi addımlar yaratmaqla işləyir. Hər bir addım təsadüfi seçilir, lakin alqoritm addımların ümumi toplusunun müəyyən riyazi qaydaya əməl etməsini təmin edir. Yəni, şəkil üzərində dəyişiklik üçün müəyyən bir istiqamət, dəyişiklik üzrə bir nöqtədən digərinə (bir pikseldən-digərinə) təsadüfi hərəkət edən hissəcik obyektin ümumi görünüşü modelləşdirən riyazi konsepsiya əsasında dəyişir. Həmin konsepsiyası Stable Diffusion süni intellektinin əsasıdır.
Stabil diffuziya alqoritmləri şəkildəki başlanğıc nöqtəsini seçməklə sonrakı müxtəlif istiqamətlərdə yaradılacaq görüntüləri şəkil boyunca təsadüfi formada tekstura və rəng nümunələrinə əsasən yenidən yaradır. Alqoritmin son nəticəsi unikal üslub və fakturaya malik yeni təsvirdir.
Stable Diffusion texnologiyası haralarda və necə istifadə oluna bilər?
Rəqəmsal incəsənət sektoru çox sürətlə inkişaf edən bir sahədir. Vizual məzmun yaratmaq isə Stable Diffusion üçün süni intellekt kimi yeni texnologiyaların köməyi ilə hər şeydən fərqlənən unikal və valehedici sənət əsərləri heçnədir. Alqoritm təsvirdə təklifləri təhlil edərək analiz əsasında yeni nümunələr yaradaraq işləyir. Rəssamlar hər bir elementi əl ilə yaratmaq üçün saatlar sərf edir. Bu texnologiya isə varlığı heç vaxt təxmin edilməyən mücərrəd sənət əsərləri yaratmaq üçün çox güclüdür. Alqoritmin parametrlərini dəyişdirməklə insanlar eyni təsvirin hər birinin özünəməxsus üsluba və teksturaya malik bir neçə versiyasını yarada bilərlər.
Stable Diffusion sənətinin sirləri nələrdir?
Süni intellekt çox sürətlə və limitsiz bucaqlarda inkişaf etsə də, Stable Diffusion hələ də fikrinx“izi oxuma bacarığına malik deyil. Şəkilinizi mümkün qədər ətraflı təsvir etməlisiniz. Tutaq ki, siz “küçə səhnəsində qadın” şəklini yaratmaq istəyirsiniz:
Qarşınıza bu görüntü çıxdığı təqdirdə süni intellekt öz işini doğru görmüş olur. Nəticə etibarilə istəyinizə uyğun küçədə bir qadın əks olunub. Lakin sizin zehninizdə başqa bir şey varsa, detalları düzgün izah etməlisiniz. Ona görə nümunəni “gənc xanım, qəhvəyi gözlər, saçda diqqət çəkən məqamlar, gülümsəmək, qəşəng işgüzar geyim geyinmək, çöldə oturmaq, sakit şəhər küçəsi, gün batımında kənar işıqlandırma” deyə versəniz sizə tamamilə fərqli nəticə verəcək.
Açarsözlər çox vacibdir. İstədiyiniz əsərin növündən, hətta rəssamın stilinə və öz üslubuna qədər verəcəyi detallar nəticəyə təsir edəcək. İlk dəfədən mükəmməl şəkil əldə etmək mümkünsüzdür. Xüsusilə süni intellektlə tez-tez insan görüntüləri yaradanlar bilir ki, insan üzü süni intellektin ən böyük çətinliklə üzləşdiyi hissədir. Ona görə sizlərə xüsusilə təkmilləşdirilmiş CodeFormer kimi modellər lazım ola bilər. Digər bir tərəfdən v1.4 və v1.5 modelləri üzləri işləməkdə daha tövsiyə ediləndir.
Digər bir tərəfdən Stable Diffusion süni intellekt modeli olaraq bir çox fərqli alt varianta malikdir. Aşağıdakı insan görüntüləri yaradan modellər v1.4 və v.1.5 modellərindən törədilib. Lakin hər bir törəmə model də fərqli tərzlərdə inkişaf etdirilib. Ona görə törəmə modellər ana variantla oxşarlıq təşkil etsə də üslub cəhətdən xeyli fərqlənirlər.
Əsas modellərin iki əsas qrupu v1 və v2-dir. Uyğun olaraq v1 modelləri v1.4 və v1.5-dir. Daha yeni v2 modelləri v2.0 və v2.1-dir. Yeni v2 modelləri ilə başlamalı olduğunuzu düşünə bilərsiniz. Lakin bu o demək deyil ki, v2-dəki şəkillər v1-lərdən daha yaxşı olmalıdır.
Stable Diffusion daxilində bir çox fərqli işləmə prinsipləri var. Məsələn, onlardan biri image-to-image metodudur. Verdiyiniz bir şəklin girişdən alınan dataları ilə rəyləriniz hesabına fərqli bir varianta çevrilməsini xarakterizə edir. Aşağda buna aid nümunələri görə bilirsiniz. Sol tərəfdəki kompozit foto sağdakı təsvir edilən varianta çevrilir.
Fərqli bir nümunədə ControlNet metodundan danışa bilərik. Hansı ki, Stable Duffusion ilə insan duruşunu kopyalayıb başqa bir təsvir yaratmağa yarayır. İstənilən modeldən duruşu kopyalamaqla sonsuz sayda o duruşa uyğun görüntü hazırlamaq mümkündür.
Necə istifadə oluna bilər?
Aydın məsələdir ki, bu cür kompleks süni intellekt modellərinin işləməsi üçün güclü texniki avadanlıqların olması xeyli vacibdir. Stable Diffusion mətnlərdən yüksək keyfiyyətli şəkillər yaratmaq üçün böyük miqdarda hesablama tələb edən mürəkkəb neyron şəbəkəsinə malikdir. Bu, xüsusilə yüksək təsvir ölçüsünə malik şəkillər yaratdıqda və ya bir neçə təkrarlamadan sonra yüksək datalar ortaya çıxaran proses şəklində inkişaf edə bilər. Mütəxəssislər tərəfindən tövsiyə edilən sistem xüsusiyyətləri belədir:
- 6GB VRAM ilə təchiz edilmiş GPU (NVIDIA GeForce RTX seriyası tövsiyə edilir)
- 10GB yaddaş yeri
- CUDA 11.1 və üzəri
- Python 3.6 və üzəri
- PyTorch 1.8 və üzəri
- PyTorch 1.8 və üzəri
- torchvision 0.9
- PyQt5
Qrafik kartınız yoxdursa prosessorun daxili ekran kartı işinizə yaraya bilər lakin proses olduqca yavaş işləyəcək. Görüntülərin yaradılması prosesi çox ləng tamamlanacaq. Performans barədə detallara və nəyə görə NVIDIA GeForce RTX seriyası qrafik kartlarını tövsiyə etdiyimizə daha sonra baxarıq. Lakin gəlin ilk olaraq Stable Diffusion süni intellektinin necə quraşdırıla biləcəyindən qısaca bəhs edək:
- Birinci addımımız bu linkə keçid edərək qeyd olunmuş faylı yükləməkdir
- Faylları uyğun qeyd olunmuş diskin daxilinə çıxarın
- Faylı çıxardıqdan sonra C: \stable-diffusion-ui qovluğunda Start Stable Diffusion UI.cmd proqramını işə salın və bütün tələb olunan paketlərin yüklənməsini və quraşdırılmasını gözləyin. (Xəta olduğu təqdirdə təkrarlayın)
- Quraşdırma başa çatdıqda siz olaraq localhost:9000 brauzerinə yönləndiriləcəksiniz və proses bitmiş hesab olunur. Lakin sorğu daxil başlatmağa tələsməyin və Make Image düyməsini basın.
- Bir süni intellekt modelinin işləməsi üçün süni intellekt modelinin özünə ehtiyac var. Ona görə də ya modelləri manual olaraq, ya da CiviTai, Huggingface kimi resurslar üzərindən bir modeli tapıb quraşdırın.
- Quraşdırdığınız modeli bura köçürün:
C:\stable-diffusion-ui\models\stable-diffusion
- Start Stable Diffusion UI.cmd ilə neyron şəbəkəsini yenidən başladın və paneldən yüklənmiş modeli seçin.
Bundan sonra modelin quraşdırılması nəzəri olaraq tamamlanmış hesab edilir. Lakin görüntüləri yaratmaq üçün sizə ciddi performans lazım olacaq.
Stable Diffusion süni intellekti ilə hansı qrafik kartları daha ideal performans verir?
NVIDIA GeForce RTX qrafik kartı tensor nüvələri ilə Stable Diffusion performansını əhəmiyyətli dərəcədə yaxşılaşdıra bilir. Çünki, Tensor nüvələri dərin öyrənmə modellərində geniş istifadə olunan əməliyyatları sürətləndirmək üçün nəzərdə tutulmuş xüsusi emal bölməsinə sahibdir.
Tensor nüvəsi ilə sürətləndirilmiş Stable Diffusion istifadə edərkən qrafik kartınız görüntünün yaradılması zamanı əməliyyatları çox daha sürətli yerinə yetirə bilir. Tensor nüvəsinə sahib RTX qrafik kartları dərin öyrənmə modellərinin öyrədilmə müddətini də azaldır. Nəticədə eyni müddət ərzində görülən prosesin həcmi rəqiblər ilə müqayisədə əhəmiyyətli səviyyədə artır. Digər bir tərəfdən vatt başına düşən performansın artması müəssisələr üçün olduqca ciddi təkmilləşmələr gətirir.
Stable Diffusion süni intellekti üçün VRAM miqdarı çox əhəmiyyətlidir. Yüksək təsvir ölçülü görüntülər yaradılarkən hətta bəzən 8GB VRAM belə yetərsiz qalır. Bu hissədə də NVIDIA GeForce RTX seriyasına məxsus qrafik kartları yüksək həcmli VRAM dəstəyini sahib olduğu Tensor nüvələri ilə də birləşdirərək əlavə bir istfadəçi rahatlığı gətir.
Gördüyünüz sintetik testlərdə Stable Diffusion süni intellektinin RTX seriyası qrafik kartlarla göstərdiyi performans bazarda lider vəziyyətdədir. Bunun da səbəbi uyğun olaraq yuxarıda izah etdiklərimiz ilə birbaşa bağlıdır. NVIDIA qrafik kartları paralel olaraq işləyə bilən çox sayda nüvəyə malik olduğundan, əməliyyatları ənənəvi təkmlləşdirilmiş prosessorlar ilə nisbətdə daha sürətli yerinə yetirməyə də imkan verir. Bundan əlavə, qrafik kartlar proses zamanı aralıq nəticələri saxlamaq vacib olan yüksək sürətli və təsəvvür etdiyinizdən belə daha büyük “DRAM” yaddaşa da malikdir. Nəticədə Stable Diffusion üzrə peşəkarlaşmaq istəyənlər yuxarıdakı nəticələri nəzərdən keçirə bilərlər.