“ Tabiiy tillar analitik tiplari uchun leksiko-semantik lug`at ma`lumotlar tuzilmasi”
Kamolova SHahlo
Mavzuning dolzarbligi
- Lingvistik protsessorlar (tarjimon, korpuslar, antalogiya, anatator, qidiruvchi) global informatsion fazodagi asosiy instrumentlarga aylanyapti.
- O`zbek tili formalizmi marfologiya, semantika, sintaksislarni kompyuterlashtirish uchun asosiy vazifadir.
- Hozirgi kunda kompyuter lingvistikasi fanining tobora rivojlanib borishi kompyuter bilan muloqot qilishni talab qilmoqda. Kompyuter lingvistika sun’iy intellektning markaziy muammosi – bilimning kompyuterli tasviri bilan uzviy bog’liq. Kompyuterli lingvistikaning asosiy masalasi – mantiqiy lingvistik modellarni qurish va mos algoritmlarni yaratishdir.
- Buning uchun tabiiy tillarni formal tillarga keltirish muammosi yuzaga kelmoqda. O’zbek tilini formallashtirish internetda qidiruv tizimlarida, morfologik va semantik lug’atlar ma`lumotlar tuzilmasi bilan ishlashda qo’l keladi. Tabiiy tillar analitik tiplari uchun leksik, semantik ma`lumotlar tuzilmasi bilan ishlash ko`broq tarjimon dasturlarda qo`llaniladi.
- Tadqiqot ob’yekti va predmeti: Tabiiy tillar morfologiyasi, leksikografiya.
- Ishning maqsadi va vazifalari: Tadqiqot ishining maqsadi berilgan ot yoki sifat so’z turkumiga oid so’zni qabul qilib, morfologik va semantik tahlil qiluvchi lug`at ma`lumotlar tuzilmasi.
- Tadqiqot usuli va uslubiyati: formal tillar nazariyasi, informatsion model, tabiiy tillar formalizatsiyasi.
- Olingan asosiy natijalar: Berilgan ot yoki sifat so’z turkumiga oid so’zni morfologik va semantik tahlil qiluvchi ma`lumotlar tuzilmasi bilan ishlash.
- Natijalarning ilmiy yangiligi va amaliy ahamiyati: Masalada tahlil jarayoni bo’yicha keltirilgan barcha tasdiq va teoremmalar matematik asoslangan. Qilingan ishda ma`lumotlar ilmiy jihatdan yangi hisoblanadi.
- Tadbiq etish darajasi va iqtisodiy samaradorligi. Qo`llash sohasi. Xulosa va takliflar: So’zni morfologik va semantik tahlil qiluvchi ma`lumotlardan o’zbek tilini o’qitishda (trenajor sifatida) foydalanish, wordda so’zlarni tahlil qilishda va qidiruv portallarida qo’llanishi mumkin.
So`zning morfologik tahlil algoritmi
- Tabiiy tillar grammatikasi (til qoidalari) ni formallashtirish tabiiy tillarni avtomatik qayta ishlash asosini tashkil etadi. Tabiiy tillar qoidalari kitoblarda asosan tabiiy tilda beriladi. Tabiiy til esa o`ziga xosligi (bir qiymatli ma`noga ega emasligi) uni avtomatik qayta ishlashni qo`llab quvvatlamaydi. Tabiiy til formalizmi adabiyotlarda ko`proq rus va ingliz tili uchun berilgan. Morfologik sintez – so`zning turli xil shakllarini olish maqsadida matnli axborotlarni qayta kodlash va uni insonga tushunarli shaklga keltirish.
- Morfologik tahlil va sintezning turli usullari matnli xabarlarni (bir tildan boshqa tilga) rus tilidan o`zbek tiliga, o`zbek tilidan rus tiliga avtomatik tarjima qilishni tadqiq qilish, shu jumladan, avtomatlashtirilgan axborot tizimlarini yaratilishi bilan ham aloqador.
6 .05.2019
Камола
Semantik tahlil
- Semantik tahlil maqsadi - matnli ma`lumotning informativligini aniqlash va eng muhim ma`lumotlarni qayta ishlanadigan matndan ajratib olishdir. Matnni avtomatik semantik tahlil qilish matnning mazmunini aniqlash va uni baholash masalasini yechishni taqozo etadi.
Rang
Dvigatel
tipi
Qizil
xususiyati
bor
qismi
Transport turi
Avtomabil
Matiz
bu
bu
tegishli
yoqtiradi
Inson
masalan
Kamola
Semantik tarmoq
Qulayligi
- Semantik tarmoq insonning doimiy xotirasidek tashkil etiladigan zamonaviy bilim tasviri
Kamchiligi
- Semantik tarmoqda natijani topish protsedurasining murakkab tashkil etilganligi
Chekli avtomat
- Chekli avtomat deb shunday A = (Q, , qo, F, B) beshlikni aytiladi, unda:
- Q - holatlar chekli to’plami;
- - kirish alfaviti (kirish satri simvollaridan tashkil topgan chekli to’plam);
- qo – boshlang’ich holat qo Q ;
- F - natijaviy holatlar chekli to’plami. F Q;
- B - o’tish funktsiyasi. В: Q Q ;
Chekli avtomat diagrammasi
- Misol: Yuqorida ot so’z turkumi uchun chekli avtomat diagrammasi keltirilgan.
- 1- boshlang’ich holat, 1, 2, 4, 5, 6, 7, 9 - natijaviy holatlar to’plami
- "Kitoblarimiz" so’zi quyidagicha tahlil qilinadi: "Kitob" - (1) - "lar" - (2)-(3) - "i" - (4) "m"-(5)-(8)-"iz";
Ot o’zagi berilganlar modeli
O‘zakni ajrata bilish, so‘z tarkibidagi tovush o‘zgarishlarini fahmlash so‘zni to‘g‘ri yozishga imkon beradi.
Quyida ma’lumotlar bazasida ot o’zagini aniqlash algoritmi keltirilgan:
Kiritish maydoniga kiritilgan ot so’z turkumiga oid so’zni “o`zak” jadvalidan qidiradi. O’zak topilgandan so’ng o’zakning ma’noviy ichki ko’rinishini topish talab qilinadi.
Kiritilgan o’zagga mos atributni qidirish algoritmi:
So’z yasovchi qo’shimcha berilganlar modeli
So`z o`zagi ER modeli
Xulosa
- Dissertatsiya ishida dasturlash tillari leksikasi va semantikasini asosi hisoblangan va tabiiy tilning tavsifi sifatida ishlatiladigan hosil qiluvchi grammatika tushunchasi, uning xususiy hollari va mos mexanizmlari yoritib berilgan.
- Leksik tahlil bitta simvoldan ko’p bo’lgan simvollardan tashkil topgan til elementlarini, sintaktik tahlil fazasi leksik tahlil fazasi tugagandan keyin emas, balki odatda undan oldin o’z ishini boshlashi asoslab berilgan.
- Fe’l semantikasi tarkibidagi ifoda va boshqa semalarni tekshirish alohida yirik tadqiqotlarni talab qiladi, fe’llar asosida yaratiladigan kompyuter dasturlari uchun lingvistik ta’min ishlab chiqishda hozircha ularning ko‘chma ma’nolari hisobga olinmaydi, zarur parametrlar haqida batafsil ma`lumotlar keltirilgan.
Dissertatsiya ishida erishilgan yutuqlar:
- 1) O’zbek tilidagi ot va sifat so’z turkumlari uchun so’z yasalish morfologiyasi va so’z semantikasi qoidalari o’rganildi .
- 2) Mazkur so’z turkumlari tahlil jarayoni aniqlanib , uni avtomatlashtirish prinsiplari aniqlandi.
- 3) Mazkur so’z turkumlari tahlil algoritmlari , morfologik va semantik lug’at ma`lumotlar tuzilmasi o`rganildi.
- 4) Morfologik va semantik lug’at ma`lumotlar tuzilmasininig yutuq va kamchilik tomonlari aniqlandi.
Ilmiy yangiliklar:
- 1) Ot va sifat so’z turkumi uchun information model yasaldi.
- 2)Tahlil daraxtsimon tuzilmasi yasalib , tahlil jarayoni uchun matematik aparat yaratildi.
- 3) Informatsion model, yaratilgan matematik aparat asosida o’zbek tilidagi ot va sifat so’z turkumlari uchun tahlil algoritmlari tayyorlandi.
Ushbu ma`lumotlar keyingi tadqiqotlarni olib borish uchun asos bo`ladi.
E’tiboringiz uchun rahmat !