Son bir neçə ildə inanılmaz sürətlə böyüyən süni intellekt texnologiyası son zamanlar “sərhədə çatıb”. Məşhur milyarder Elon Musk-ın sözlərinə görə isə buna səbəb süni intellekt üzrə təlim məlumatlarının tükənməsidir.
Hər yeni çıxan texnologiyadakı inkişaflar insanları təəccübləndirsə də, son zamanlar bu vəziyyətin tərsinə çevrildiyini görürük. Təqdim olunan yeni modellər indi “inqilab” deyil, daha yaxşı “revizyon” kimi görünür. Texnologiya dünyasının öndə gedən adlarından olan Elon Musk da bu vəziyyətə diqqət çəkir. Mütəxəssislərin fikrincə, bu problem təlim məlumatlarının tükənməsi səbəbindən baş verir. Milyardlarla real dünya məlumatı (şəkillər, audio, video, mətn və s.) bu gün hər kəsin bildiyi ChatGPT və ya Gemini kimi süni intellektləri hazırlamaq üçün istifadə edilib. Muskın sözlərinə görə, avtomobilləri gücləndirən modelləri hazırlamaq üçün istifadə edilən real dünya məlumatları tükənib. “Biz indi süni intellekt üzrə təlimdə bəşəriyyətin biliklərinin məcmusunu tükəndirmişik” dedi Musk Mark Penn ilə canlı yayımda söhbət zamanı. Bu, əslində keçən il baş verdi”, Elon bildirib.
Təbii ki, onlarla şirkətin milyardlarla dollar sərmayə qoyduğu bir sənayenin istifadə ediləcək məlumatların olmaması səbəbindən çökəcəyini düşünmək yanlış olardı. Və əslində bir müddətdir danışılan bir həll yolu var. Muskın vurğuladığı həll getdikcə daha çox şirkətin qəbul etdiyi bir həlldir: sintetik məlumatlar. Bu yanaşma, real dünya məlumatlarının çatışmadığı hallarda süni intellekt modellərini öz yaradılan məlumatları ilə öyrətməyi nəzərdə tutur. Microsoft, Meta, OpenAI və Anthropic kimi nəhənglər artıq təlim proseslərində sintetik məlumatlardan istifadə edirlər. Gartner-in hesablamalarına görə, 2024-cü ildə süni intellekt və analitika layihələrində istifadə edilən məlumatların 60 faizi sintetik olaraq istehsal edilib. Məsələn, Microsoft-un Phi-4 modeli və Meta-nın Llama seriyası sintetik məlumatlar, eləcə də real dünya məlumatları üzrə təlim keçib.