Voiceloft qısa olaraq texniki dildə desək “dataset”-lərin (verilənlər toplusu, bazası) toplanması ilə bağlı startapdır. Böyük bir ehtimalla ilk cümlədən startapın nə olduğunu çox yaxşı anlamaya bilərsiniz. Gəlin sizə elə bu mövzu ətrafında startapın necə ortaya çıxdığını izah edərək məqaləmizə başlayaq.
Belə ki, startapın təsisçisi olan Toğrul Səməd 2021-ci ildə ilk olaraq imla.az adlı layihəyə start vermişdi. Layihənin məqsədi Azərbaycan dilində mətnin səsə və səsin mətnə çevrilməsi alqoritmləri yaratmaq idi. Lakin belə bir alqoritmin yaradılması fikir irəli sürüldükdən sonra bu mümkün olmadı. Çünki, elə ilk cümlədən də gördüyünüz dataset, yəni verilənlər Azərbaycanca belə bir alqoritmin yaradılmasına imkan vermirdi. Böyük bir ehtimalla çoxlarınız artıq təxmin etdiniz ki, dataset də məhz bu işin görülməsində sözlər və səslərin yığımını əhatə edirdi.
Mətnin səsə və səsin mətnə çevrilməsini həyata keçirən süni intellekt alqoritmini yaratmaq üçün sizə hansı səsin hansı sözə qarşılıq gəldiyini göstərən datalar lazımdır. Voiceloft platformasının da təməli məhz ordan gəlir. Beləliklə, Toğrul Səməd və komandası imla.az layihəsi üzrə mətnin səsə və səsin mətnə çevrilməsi məqsədini həyata keçirmək üçün dataset yaratmağa başladı. Bunun həyata keçirilməsində bir çox çətinliklər yaşandı. Nəticədə Azərbaycan dilində səsli videoların subtitrları, o cümlədən səsləndirilmiş kitablar belə bu məqsədlə alqoritmlərin yaradılmasına kifayət etmirdi. Bütün Azərbaycanca səsli kitablar təqribi 200 saatlıq data ortaya qoyurdu. Ona görə də səslərə görə sözlər yaratmaq əvəzinə imla.az layihəsi üzrə insanlardan mətnlərin səsləndirilməsi istənildi. Bu isə uğurlu alındı və 2 ay ərzində 5000 saatlıq söz və səslərdən ibarət dataset hazırlandı.
Lakin bir problem var ki, Azərbaycan bazarında bu innovativ həll üçün yetəri qədər müştəri yox idi. Ona görə də bu layihə qloballaşdırılaraq insanların ən çox danışdığı İngilis dilində Voiceloft olaraq təkmilləşdirilməyə başladı.
Yaxşı bəs, qlobal bazarda eyni xidmət üzrə fəaliyyət göstərən rəqiblər yox idi?
Əlbəttə, səsdən yazıya və yazıdan səsə çevirmə xidməti göstərən olduqca güclü həllər mövcuddur. Lakin Voiceloft startapını gücləndirən əsas şey, datasetlərin hazırlanmasında “kütlənin” gücündən istifadə edilməsidir. Azərbaycan dilində olduğu kimi bu dəfə də “crowdsourcing” prinsipi tətbiq olunaraq kütləyə müraciət edildi və ingilis dilində danışan real insanların səsi işlədildi. Ən əsas üstünlük isə bu zaman ortaya çıxdı.
İngilis dilində danışan insanlar müxtəlif dünya ölkələrində öz dillərinə uyğun nitq ahənginə malik olurlar. Hindistan, Amerika, İngiltərə, Çində yaşayan hər bir fərqli şəxsin nitqində ingiliscə sözlər fərqli cür səslənir. Voiceloft da yüzlərlə fərqli irqdən insanın səs yazıları ilə eyni sözün bir-birindən müxtəlif ləhcədə və aksentdə səslənməsi ilə möhtəşəm bir dataset əldə etmiş oldu. Bu isə Azərbaycan startapını fərqləndirən möhtəşəm bir gücə çevirməkdədir. Hal-hazırda platforma inanılmaz da olsa 100-dən çox dildə datasetə sahibdir. Bu datasetlər isə bu gün süni intellekt sistemləri üçün mürəkkəb dil modellərinin hazırlanmasında olduqca əhəmiyyətlidir.
Belə ki, ötən ilin noyabr ayında Voiceloft startapı 3 aylıq 500 Global proqramında iştirak etmişdi. Toğrul Səməd tərəfindən verilən məlumata görə 500 Gobal proqramı çərçivəsində 100.000 dollar investisiya almağı bacarıb. Startap üçün əsas hədəflərdən biri də Microsoft, Google, Amazon kimi şirkətlərdən 500 Gobal proqramı timsalında bulud resursları əldə etməkdir. Xüsusilə süni intellekt əsaslı dil modellərinin inkişafı və yaradılmasında bulud xidmətləri əvəzsiz rola malikdir.
Startap ekosistemi xəbərlərini "İnformasiya və Rəqəmsal İnkişaf Agentliyi" ilə tərəfdaşlığımız çərçivəsində oxuyursunuz.