The New York Times-a görə, OpenAI, müəllif hüquqlarının pozulacağını bilərəkdən, GPT-4 modelini təkmilləşdirmək və ya öyrətmək üçün YouTube videoları istifadə edib. Belə ki, süni intellekt nəhəngi platformadakı bir milyondan çox videodan istifadə edibmiş. Bildiyimiz kimi, süni intellekt modelləri daim hazırcavab olsalar da, yeni məlumatlara ehtiyac duyurlar. Məhz bu səbəbdən də şirkət dil modelini internetdə olan fərqli resurslardan istifadə etməklə təkmilləşdirir.
Bu dəfə isə OpenAI şirkəti GPT-4 dil modelini öyrətmək üçün YouTube videoları üsulunu seçib. Maraqlısı budur ki, məlumatların icazəsiz istifadəsi bəzi müəllif hüquqlarının pozulmasına səbəb ola bilər. “The New York Times”ın paylaşdığı bir xəbər də məhz bu məqama diqqət çəkir. Xəbərdə paylaşılan iddiaya görə, OpenAI süni intellekt modelini hazırlamaq üçün Google məlumatlarından istifadə edib. Mənbənin iddiası süni intellekt nəhənginin böyük miqdarda YouTube məlumatından faydalandığını ortaya açıq-aşkar ortaya çıxarıb. Süni intellekt nəhəngi Whisper adlı səs tanıma vasitəsi ilə bir milyon saatdan çox YouTube videosunu yazıya çevirməklə, ən qabaqcıl dil modeli olan GPT-4-ü təkmilləşdirib.
Həmçinin bildirilib ki, şirkət bu vəziyyətin hüquqi suallar doğura biləcəyini bilsə də, bundan istifadənin heç bir problem yaratmayacağını düşünür. Videoların toplanmasında şirkətin prezidenti vəzifəsində çalışmış Greg Brockman-ın da iştirak etdiyi iddia edilib. O cümlədən mənbə əlavə edir ki, 2021-ci ildə süni intellekt nəhəngi dil modelini təkmilləşdirmək üçün istifadə etdiyi resursları tükətib. Məhz bundan sonra şirkət YouTube məzmunlarını yazıya çevirməklə bağlı müzakirələr aparmağa başlamışdı. O vaxta qədər şirkət Github kodlarından, şahmat məlumat bazalarından və Quizlet-dən yararlanırdı. YouTube-un sahibi olan Google şirkətinin sözçüsü Matt Bryant, açıqlamasında məsələ ilə bağlı “təsdiqlənməmiş hesabatlar” gördüyünü və bu cür icazəsiz istifadənin qadağan olduğunu bildirib.