ქართული ბუნებრივი ენის დამუშავება & სიტყვების წარმოდგენა ვექტორების სახით

ავტორი: გიორგი ფაფაკერაშVილი
თანაავტორები: გიორგი ფაფაკერაშვილი, ანზორ გოზალიშვილი
საკვანძო სიტყვები: ენის ბუნებრივი პროცესები, ხელოვნური ინტელექტი, ნეირონული ქსელები, სიტყვების ვექტორებად წარმოდგენა, სიტყვების სემანტიკური ანალიზი
ანოტაცია:

ტექსტებისა და ბუნებრივი ენის დამუშავებისას ხშირია მდგომარეობა როდესაც გვინდა სიტყების სემანტიკური ანალიზი, მათი წარმოდგენა ვექტორების სახით, შედეარება და გარკვეული ანალიზი. ჩვენი ძირითადი მიზანია ავაგაოთ ენის სემანტიკური მოდელი, უფრო ზუსტად რომ ვთქვათ ენაში არსებული სიტყვები წარმოვადგინოთ ვექტორების სახით ისე რომ ვექტორებს შორის სიახლო, ასოცირდებოდეს სიტყვებს შორის სემანტიკურ მსგავსებას, ასე მაგალითად: თუ ორ ვექტორს შორის ევკლიდური მცირეა ან კოსინუს მსგავსება არის საკმაოდ მაღალი მაშინ ეს ორი სიტყვა სემანტიკურად მსგავსია, მსგავსი მოდელი საშუალებას მოგვცემს ენაში ავტომატური გზით აღმოვაჩინოთ განსხვავებული სახის მეტყველების ნაწილები მაგალითად თუ ვიცით რამდენიმე ნაცვალსახელი - მე, ჩვენ, ჩვენი და ა.შ ჩვენ შეგვიძლია გრაფში ძებნის მსგავსად მოვძებნოთ ამ სიტყვებთან ახლოს მდგარი სიტყვები (სიახლოვეს ვზომავთ ვექტორების დაშორებით) და ასეთი მიდგომით შევძლებთ ენაში აღმოვაჩინოთ, გავფილტროთ სხვადასხვა სახის მეტყველების ნაწილები, მაგალითად კუთვნილების სახელები, კერძო სახელები (ადამიანის, ქვეყნის), რაოდენობითი სახელები (ერთი ორი სამი, ბევრი, რამდენიმე) და ასე შემდეგ.


ინფორმაცია

თარიღი
13 ივლისი 2018