ავტორიზაცია
სიტყვიდან ფუძის ამოღება ქართულ ენაში
ავტორი: ლაშა მარანელისაკვანძო სიტყვები: ინდექსირება, ფუძე, სიტყვა, ენა
ანოტაცია:
არსებული საძიებო სისტემებში ინდექსირებას დიდი მნიშვნელობა ენიჭება. სხვადასხვა საძიებო სისტემები იყენებენ სხვადასხვა ალგორითმებს ინდექსირებისთვის, მაგრამ პრინციპი მსგავსია. ინდექსირებას სემანტიკური ძებნის პროცესში მნიშვნელოვანი ადგილი უჭირავს. ინდექსირებისთვის ასევე მნიშვნელოვანია ტექსტების სემანტიკური ანალიზი, რომელიც შინაარსობრივთან ერთად გულისხმობს მათ სინტაქსურ და მორფოლოგიურ ანალიზსაც (სიტყვათა შეკავშირებას, რა სახის სიტყვები შეიძლება შეეწყოს ერთმანეთს, სიტყვების ფორმათა ცვალებადობას და თანმდევი შინაარსის ცვლას). ამ ეტაპზე გამოიკვეთება ენის თავისებურების გათვალისწინების აუცილებლობა. შესწავლილი და გაანალიზებულია ქართული ენის თავისებურებები, რომელთა გათვალისწინება მნიშვნელოვანია ინდექსირებისთვის. ის გადამწყვეტ როლს თამაშობს ინდექსირების ოპტიმიზაციისთვის, რადგან ქართულ ენაში ძალიან ხშირია სიტყვათა წარმოება, რაც გულისხმობს რომ ერთიდაიმავე ფუძისეული სიტყვისაგან შესაძლებელია იწარმოებოდეს რამდენიმე სიტყვა. სწორედ ასეთ სიტყვათა გაერთიანების საშუალება მოგვცემს ოპტიმალურ მნიშვნელობათა სიმრავლეს. ძირითადი აქცენტი გაკეთებულია სახელზე. განხილულია და ფორმალიზებულია ალგორითმები, რომლის საშუალებითაც აფიქსებისა და სხვა მაწარმოებელთა ჩამოშორებით შესაძლებელია სიტყვის ფუძის გამოყოფა სახელიდან, რომლიდანაც ხდება სიტყვის წარმოება. ასევე განხილულია კერძო შემთხვევებიც, რომელიც ახასიათებს ამა თუ იმ სახელს, რაც წარმოადგენს ენის თავისებურებას.