ავტორიზაცია
ქართულენოვანი საძიებო სისტემის მოდელის შექმნა
ავტორი: ირმა მახარაძესაკვანძო სიტყვები: ტექსტების კატეგორიზაცია, მანქანური სწავლების ალგორითმები, KNN, SVM, Bayes
ანოტაცია:
ინფორმაციის მოძიება თანამედროვე სამყაროს განუყოფელი ნაწილია. საძიებო სისტემების გაუმჯობესება კი ამისთვის აუცილებელი პირობაა. ინფორმაციული ძებნის ერთ-ერთ ამოცანას ტექსტების კატეგორიზაცია წარმოადგენს. კატეგორიზაციაში იგულისხმება დოკუმენტების ავტომატური კლასიფიცირება კონკრეტული კატეგორიების მიხედვით. ამ ამოცანის გადაწყვეტისათვის დღეისათვის საკმაოდ პოპულარულია მანქანური სწავლების ალგორითმები. როგორიცაა KNN-(უახლოესი მეზობლის), SVM (მხარდამჭერი ვექტორების) Bayes (ბაიესის) ალგორითმები. ბუნებრივ ენებზე შექმნილი ტექსტების კატეგორიზაციის ამოცანა დამოკიდებულია ტექსტის დამუშავებაზე, ტექსის დამუშავება კი თავის მხრივ ენის თავისებურებებსა და სირთულეებზე. გამომდინარე ქართული ენის თავისებურებებიდან, პროექტის ფარგლებში მოხდა ქართული ენის სიტყვიდან ფუძის ამოღების ალგორითმის დამუშავება, რომლის საფუძველზეც განხორციელდა ტექსტის ლინგვისტური დამუსავება, ხოლო შემდეგ მანქანური სწავლების ალგორითმების გამოყენებით ტექსტების კატეგორიზაცია და შედეგების შედარებითი ანალიზი.
მიმაგრებული ფაილები:
qartulenovani sadziebo sistemis modelis sheqmna [en]