ენის კორპუსი – მეცნიერება საზღვრებს გარეშე

ნინო დობორჯგინიძე

ნინო დობორჯგინიძე

ქართული ენის კორპუსი – სანამ ამ სიტყვათშეთანხმების სემანტიკას მიაგნებთ, გეტყვით, რომ აღნიშნულ პროექტს მეცნიერები ქართული მეცნიერების ყველაზე დიდ გამოწვევად მიიჩნევენ.

მისი შექმნის აუცილებლობაზე სხვადასხვა დროის მეცნიერებს უფიქრიათ, თუმცა, მასშტაბური პროექტის პრაქტიკულად განხორციელების საშუალება ილიას უნივერსიტეტის ლინგვისტთა ჯგუფს მიეცა. მაგრამ მას შემდეგ, რაც პროექტის ხელმძღვანელმა, ჰუმანიტარულ მეცნიერებათა დოქტორმა, ენათმეცნიერმა, ქალბატონმა ნინო დობორჯგინიძემ პროექტის არა მხოლოდ მნიშვნელობა, არამედ მასშტაბი დაგვანახა, იმაშიც დაგვარწმუნა, რომ ქართული ენის კორპუსის შექმნა მეცნიერთა არაერთი ჯგუფის ერთობლივი ძალისხმევით არის შესაძლებელი.

რა არის ენის კორპუსი?

არც მეტი, არც ნაკლები, 21-ე საუკუნის დამწერლობა – ელექტრონული დამწერლობა, რომელიც ქართულ ტექსტებს, ისტორიულსა თუ თანამედროვეს, ხელმისაწვდომს გახდის იმ მკითხველისთვისაც კი, რომელმაც ქართული არ იცის. და პირიქით, ქართველი მკითხველი ნებისმიერ ენაზე დაწერილსა და შექმნილს ადვილად გაეცნობა. იოლი წარმოსადგენია, რამდენ ბარიერს გადაალახინებს ეს პროგრამა თანამედროვე ქართველ მეცნიერებს. ამას გარდა, რამდენად გაადვილდება ქართული ლიტერატურული ძეგლების მრავალმხრივი პრეზენტაცია დანარჩენი მსოფლიოსთვის. აქ მკითხველმა ქართული კორპუსი და მარტივი სათარგმნელი პროგრამები ერთმანეთს არ უნდა გაუთანაბროს.

ნინო დობორჯგინიძე: “ტექსტის დაფიქსირების სულ რამდენიმე ხერხი არსებობს. ზეპირსიტყვიერება, ხელნაწერი და ბეჭდვითი. ენის კორპუსს კი მეტყველების მეოთხე ფაქტურასაც ეძახიან. ეს არის ახალი სახეობა, რომლითაც 21-ე საუკუნეში იწერება და ვრცელდება ტექსტები. ენის კორპუსის შექმნის პროექტი – ეს არის ბრძოლა ენის არსებობისთვის და თუ ქართული მასალა, რაც ჩვენმა წინაპრებმა დაგვიტოვეს, ასევე ის, რაც დღეს იქმნება, დოკუმენტირებული არ იქნება იმ სახით, რა სახითაც 21-ე საუკუნის ბოლოს წაიკითხავს მას კაცობრიობა, ცხადია, ყველაფერი დაიკარგება. ამ თვალსაზრისით ქართული ენის ნაციონალური კორპუსის შექმნა არის 21-ე საუკუნის დიდი გამოწვევა ქართველოლოგიის წინაშე. ეს არის ყველაზე დიდი გამოწვევა, რასაც უნდა უპასუხოს ჰუმანიტარულმა მეცნიერებებმა დღეს საქართველოში, თუ ჩვენ გვსურს, რომ ენამ გააგრძელოს არსებობა…”

მაინც გაჩნდება კითხვა, თუ რატომ არის ენის ნაციონალური კორპუსის შექმნა ამდენად მნიშვნელოვანი, რის საშუალებას მოგვცემს იგი: “თუ საუკუნეების განმავლობაში ხალხები განავითარებდნენ სამწერლობო ტრადიციებს და შემდეგ ებმებოდნენ მსოფლიო კულტურულ და სამეცნიერო ცხოვრებაში, დღეს ეს ტემპები ასეთი აღარ არის. 21-ე საუკუნის ბოლოს ამ რელევანტური დამწერლობის არქონა ენებს სიკვდილით ემუქრება. თუ შენი ტექსტები არ იქნება ჩაწერილი იმ ენაზე და იმ ფაქტურით, რომელიც ჩვენს დროში არის მიმოქცევაში, რომელიც აადვილებს ინფორმაციის მიღებას, გაცვლას, კვლევას, მაშინ ის ფუნქციას დაკარგავს. ყველაზე მძიმე პროგნოზი, რითაც კომპიუტერული ტექნოლოგიები ენებს ემუქრება, ეს არის ფუნქციის დაკარგვა…

ენის კორპუსი არა მარტო რიგითი მკითხველისთვის, შეიძლება ფილოლოგებისთვისაც კი უცნაური სიტყვათშეთანხმებაა, რადგან ჩვენთან არ არის პოპულარული, არ გვაქვს არც ქართული ენის ნაციონალური კორპუსი, არც კონკრეტული ტექსტების კორპუსები. სამწუხაროა, რომ 90-იან წლებში დაწყებული ეს საქმე აღარ განვითარდა. საინფორმაციო ტექნოლოგიების განხრით გვყავდა მეცნიერი ბესარიონ გუგუშვილი, რომელიც პოლიტიკაში წავიდა და სამეცნიერო მუშაობა არ გაუგრძელებია. მაშინ არსად საბჭოთა კავშირში კორპუსის ლინგვისტიკაზე, ტექსტურ კორპუსებზე საუბარიც არ იყო. ბატონი ბესარიონი ამ თვალსაზრისით იყო ძალიან კვალიფიციური კადრი არა მარტო საბჭოთა კავშირში, არამედ ევროპის მასშტაბით. მას პირველს ჰქონდა იდეა, რომ შეექმნა ქართული ენის ნაციონალური კორპუსი, მაგრამ, სამწუხაროდ, მაშინ არ გამოვიდა. 90-იან წლებში ინფორმაციული მეცნიერებებისა და ტექნოლოგიების განვითარება და გამოყენება ზღაპარი იყო. ფანქრითა და კალმით თუ შეძლებდი მუშაობას და თან სანთლის შუქზე. ამიტომ ძალიან ჩამოვრჩით. რეალურად დღეს მსოფლიოში ყველას აქვს ენის ნაციონალური კორპუსი. არსებობს რუსული ენის კორპუსი, სომხურიც. 90-იანი წლების შემდეგ ცალკეული მეცნიერები თუ მუშაობდნენ ცალკეულ პროექტებზე ამ მიმართულებით. აუცილებლად უნდა ვახსენო მარინა ბერიძე ენათმეცნიერების ინსტიტუტიდან, რომელიც მუშაობს ქართული დიალექტების კორპუსზე, მაგრამ ქართული ენის კორპუსზე მუშაობა აქამდე არ დაწყებულა…

ჩემი სტუდენტობის დროს, ბერძენი თუ ირანელი, ფრანგი თუ ინგლისელი მეცნიერი ჩამოდიოდა საქართველოში და ამა თუ იმ საკითხის უკეთ გაცნობისთვის სწავლობდა ენასა და ტრადიციას. ახლა დროის ტემპი ისე აჩქარდა, ისინი ამას ვეღარ გააკეთებენ, თუ ჩვენ არ მივაწვდით სათანადო ფორმით. ეს ფორმაა თუნდაც პორტალი ერთი კონკრეტული ძეგლის შესახებ.

– როგორ ხდება ეს ყოველივე ტექნიკურად?

– საერთოდ, ენის კომპიუტერული თარგმანი კეთდება ორი პრინციპით. 1. მორფოლოგიური ანალიზატორით, როდესაც ენისთვის შექმნილია მისი უნიკალური მათემატიკური მოდელი, რომელიც შესაბამება ნებისმიერ ენას და რომელიც გააანალიზებს ამ ენის სიტყვა-ფორმებს, რაც გვაძლევს ენის წაკითხვისა და თარგმანის საშუალებას. 2. დაგროვების პრინციპზე დაყრდნობით. როდესაც ქართულ-ინგლისური თარგმანი ინტერნეტში იმდენი დაგროვდება, რომ სიტყვის მნიშვნელობას ამ ინფორმაციის მიხედვით თარგმნის სისტემა, თუნდაც “გუგლი”. “გუგლში” რომ ქართული სიტყვა ჩაწეროთ, ის თარგმნის სხვადასხვა საიტზე არსებული ინფორმაციის მიხედვით. ეს თარგმანი არ არის ზუსტი და მას ვერ დაეყრდნობი, მით უფრო, ვერ გამოიყენებ მეცნიერებაში. ენის კორპუსი პირველი პრინციპია. ეს ნიშნავს მორფოლოგიური ანალიზატორის ქონას, ენის მოდელის შექმნას. როდესაც ენის მორფოლოგიური და სინტაქსური მოდელი იქმნება ელექტრონულ ენაზე, ეს აღარ არის შემთხვევითი თარგმანი. ამ თვალსაზრისით იმასაც გეტყვით, რომ, ლოგიკაზე აგებული გრამატიკის გამო, ქართული მართლაც ძალიან მიმზიდველი ენაა საინფორმაციო ტექტოლოგიებისთვის. ეს იქნება შესაქმნელად რთული, მაგრამ სამაგიეროდ ძალიან სტრუქტურირებული. იმ უცხოელ მეცნიერებს, ვისაც სხვადასხვა დროს უფიქრიათ ქართული ანალიზატორის შექმნაზე, უთქვამთ, რომ ეს არის არაჩვეულებრივი ენა მოდელირებისთვის. მოდელირება კი გულისხმობს ენათა დამუშავებას კომპიუტერული ტექნოლოგიებით. მოდელისთვის ჩვენი სტრუქტურირებული, მრავალკომპონენტიანი, რთული, მაგრამ ლოგიკაზე დამყარებული გრამატიკა ძალიან კარგია…”

ქალბატონი ნინო დობორჯგინიძე აღნიშნავს, რომ ენის მორფოლოგიური ანალიზატორის საკითხზე საქართველოში რამდენიმე პროექტი არსებობს და მეტ-ნაკლები აქტივობით რამდენიმე ჯგუფი მუშაობს: თედო უთურგაიძე და მისი ჯგუფი; ლევან ჩხაიძე, ცნობილი მათემატიკოსი, რომელიც მუშაობდა ენათმცენიერების ინსტიტუტთან ერთად; არჩილ ელიაშვილის სახელობის მართვის სისტემების ინსტიტუტშიც ყოფილა ამ საკითხებით დაინტერესებული ჯგუფი, რომელიც მუშაობს ამ პრობლემებზე. მაგრამ რეალურად წარმატებული და დასრულებული პროექტი – ქართული ენის კორექტორი და მთარგმნელი ჩვენ არ გვაქვს სწორედ იმიტომ, რომ არ გვაქვს მორფოლოგიური ანალიზატორი.

ილიას უნივერსიტეტის ლინგვისტები ამ და სხვა მეცნიერების გამოცდილების გაზიარებით აპირებენ მუშაობას, თუმცა, განსაკუთრებულ იმედს ამყარებენ რუსული და სომხური ენის კორპუსების შემქმნელთან, დიმიტრი სიჭინავასთან თანამშრომლობაზე. ილიას უნივერსიტეტს მეცნიერთან მოლაპარაკება დაწყებული აქვს და, სავარაუდოდ, 2011 წლიდან დიმიტრი სიჭინავა უკვე თბილისში, კოლეგებთან ერთად დაიწყებს მუშაობას. მისი ჩამოსვლა არ იქნება ერთჯერადი, არ დასრულდება არც მითითებებით და არც კონკრეტულად ენის ანალიზატორის შექმნით. უნივერსიტეტი დაინტერესებულია, რომ ენის პროგრამული მეცნიერება საინტერესო გახადოს სტუდენტებისთვისაც. ასე რომ, დიმიტრი სიჭინავა გაუძღვება სასწავლო პროგრამას. სტუდენტების ჩართულობა მიმდინარე პროექტის საწყის ეტაპზეც ნიშანდობლივია:

“ბაკალავრიატში უკვე 60 სტუდენტი გვყავს. ისინი გადიან ენის პროგრამების კურსს. ასევე საინჟინრო კოლეჯში არის ინფორმატიკის მიმართულება, სადაც სტუდენტები საგანგებოდ სწავლობენ ამ პროგრამებს. დიმიტრი სიჭინავას ექნება ხანგრძლივი მივლინებები იმ მიზნით, რომ ეს დარგი საქართველოში განვითარდეს. ჩვენი სტუდენტები ბევრად უკეთ ითვისებენ ყველაფერს. ეს ხომ ტექნოკრატიული თაობაა. დიაპაზონი ტექნოლოგიური თვალსაზრისით ბევრად დიდია. დაკვირვებული ვარ, ფონეტიკური პროგრამების სწავლის დროს როგორ ადვილად აგნებენ იმას, რაც თეორიულად თითქოს არ იციან. იმედი გვაქვს, რომ სწორედ ისინი იქნებიან დიდი ქართული ნაციონალური კორპუსის ავტორები. მაგრამ ჩვენ ამ ყველაფერს დავიწყებთ…”

ამ ეტაპზე მთავარი ამოცანაა მორფოლოგიური ანალიზატორის შექმნა. მეორე, რაზეც ქართველი ლინგვისტები დღეს მუშაობენ, ქართული ენის ნაციონალური კორპუსის კრიტერიუმების განსაზღვრაა.

“როგორც იცით, აღმოსავლეთმცოდნეობის ინსტიტუტი ილიას უნივერსიტეტში გაერთიანდა და ჩვენ მათთან აქტიურად ვთანამშრომლობთ. წინასწარ კარგად უნდა მოვემზადოთ, რომ მალევე არ მოგვიწიოს კორპუსის გადახალისება, განახლება. ზოგი ჭირი მარგებელიაო. ამ დაგვიანებით მართლაც გვაქვს შანსი, ყველას გამოცდილება გავიაზროთ და შევქმნათ მაღალი კრიტერიუმების მქონე კორპუსი. ამისთვის ნამდვილად გახსნილი ვართ ყველასთან სათანამშრომლოდ. ენის ნაციონალურ კორპუსს ვერც ერთი ინსტიტუტი შექმნის და ვერც ერთი დაწესებულება. ეს იქნება ღია რესურსი, რომელშიც ყველას ექნება საშუალება, დამაატოს თავისი ნაწილი და შეიტანოს თავისი წვლილი…”

პირველი პროექტი, რომელზე მუშაობასაც 2011 წლიდან ილიას უნივერსიტეტში აპირებენ, “ვეფხისტყაოსნის” ქართულ-ინგლისური კორპუსი იქნება. მის ფარგლებში დამუშავდება და განთავსდება თავად ორიგინალი ტექსტი, ასევე სხვადასხვა პერიოდის სხვადასხვა ავტორის პუბლიკაციები, გამოცემები და ზოგადად ყველაფერი, რაც ამ ნაწარმოებს უკავშირდება. სათქმელი კიდევ ძალიან ბევრია, მაგრამ “ვეფხისტყაოსნის” ქართულ-ინგლისური კორპუსის შესახებ სამომავლო სტატიით ჩვენ კიდევ დავუბრუნდებით ქართული ენის კორპუსის შექმნის პროექტს, რომლის მასშტაბი ამ გაზეთშიც და, ზოგადადაც, არაერთი სტატიისა და პუბლიკაციის მიზეზი გახდება.

სოფო კილასონია
სტატიის მისამართი: http://24saati.ge/index.php/category/news/2010-12-19/12528.html

კომენტარის დატოვება

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / შეცვლა )

Twitter picture

You are commenting using your Twitter account. Log Out / შეცვლა )

Facebook photo

You are commenting using your Facebook account. Log Out / შეცვლა )

Google+ photo

You are commenting using your Google+ account. Log Out / შეცვლა )

Connecting to %s

%d bloggers like this: