СДЕЛАЙТЕ СВОИ УРОКИ ЕЩЁ ЭФФЕКТИВНЕЕ, А ЖИЗНЬ СВОБОДНЕЕ

Благодаря готовым учебным материалам для работы в классе и дистанционно

Скидки до 50 % на комплекты
только до 07.06.2025

Готовые ключевые этапы урока всегда будут у вас под рукой

Организационный момент

Проверка знаний

Объяснение материала

Закрепление изученного

Итоги урока

Структура лексико-семантической информации для аналитических типов естественных языков

Категория: Информатика

Нажмите, чтобы узнать подробности

uHozirgi kunda kompyuter lingvistikasi fanining tobora rivojlanib borishi kompyuter bilan muloqot qilishni talab qilmoqda. Kompyuter lingvistika sun’iy intellektning markaziy muammosi – bilimning kompyuterli tasviri bilan uzviy bog’liq. Kompyuterli lingvistikaning asosiy masalasi – mantiqiy  lingvistik modellarni qurish va mos algoritmlarni yaratishdir.

Buning uchun tabiiy tillarni formal tillarga keltirish muammosi yuzaga kelmoqda. O’zbek tilini formallashtirish internetda qidiruv tizimlarida, morfologik va semantik lug’atlar ma`lumotlar tuzilmasi bilan ishlashda qo’l keladi. Tabiiy tillar analitik tiplari uchun leksik, semantik ma`lumotlar tuzilmasi bilan ishlash ko`broq tarjimon dasturlarda  qo`llaniladi

Показать полностью

Просмотр содержимого документа
«Структура лексико-семантической информации для аналитических типов естественных языков»

 “ Tabiiy tillar analitik tiplari uchun leksiko-semantik lug`at ma`lumotlar tuzilmasi”  Kamolova SHahlo

Tabiiy tillar analitik tiplari uchun leksiko-semantik lug`at ma`lumotlar tuzilmasi”

Kamolova SHahlo

Mavzuning dolzarbligi Lingvistik protsessorlar (tarjimon, korpuslar, antalogiya, anatator, qidiruvchi) global informatsion fazodagi asosiy instrumentlarga aylanyapti. O`zbek tili formalizmi marfologiya, semantika, sintaksislarni kompyuterlashtirish uchun asosiy vazifadir.

Mavzuning dolzarbligi

  • Lingvistik protsessorlar (tarjimon, korpuslar, antalogiya, anatator, qidiruvchi) global informatsion fazodagi asosiy instrumentlarga aylanyapti.
  • O`zbek tili formalizmi marfologiya, semantika, sintaksislarni kompyuterlashtirish uchun asosiy vazifadir.
Hozirgi kunda kompyuter lingvistikasi fanining tobora rivojlanib borishi kompyuter bilan muloqot qilishni talab qilmoqda. Kompyuter lingvistika sun’iy intellektning markaziy muammosi – bilimning kompyuterli tasviri bilan uzviy bog’liq. Kompyuterli lingvistikaning asosiy masalasi – mantiqiy lingvistik modellarni qurish va mos algoritmlarni yaratishdir. Buning uchun tabiiy tillarni formal tillarga keltirish muammosi yuzaga kelmoqda. O’zbek tilini formallashtirish internetda qidiruv tizimlarida, morfologik va semantik lug’atlar ma`lumotlar tuzilmasi bilan ishlashda qo’l keladi. Tabiiy tillar analitik tiplari uchun leksik, semantik ma`lumotlar tuzilmasi bilan ishlash ko`broq tarjimon dasturlarda qo`llaniladi.
  • Hozirgi kunda kompyuter lingvistikasi fanining tobora rivojlanib borishi kompyuter bilan muloqot qilishni talab qilmoqda. Kompyuter lingvistika sun’iy intellektning markaziy muammosi – bilimning kompyuterli tasviri bilan uzviy bog’liq. Kompyuterli lingvistikaning asosiy masalasi – mantiqiy lingvistik modellarni qurish va mos algoritmlarni yaratishdir.
  • Buning uchun tabiiy tillarni formal tillarga keltirish muammosi yuzaga kelmoqda. O’zbek tilini formallashtirish internetda qidiruv tizimlarida, morfologik va semantik lug’atlar ma`lumotlar tuzilmasi bilan ishlashda qo’l keladi. Tabiiy tillar analitik tiplari uchun leksik, semantik ma`lumotlar tuzilmasi bilan ishlash ko`broq tarjimon dasturlarda qo`llaniladi.
Tadqiqot ob’yekti va predmeti: Tabiiy tillar morfologiyasi, leksikografiya. Ishning maqsadi va vazifalari: Tadqiqot ishining maqsadi berilgan ot yoki sifat so’z turkumiga oid so’zni qabul qilib, morfologik va semantik tahlil qiluvchi lug`at ma`lumotlar tuzilmasi. Tadqiqot usuli va uslubiyati: formal tillar nazariyasi, informatsion model, tabiiy tillar formalizatsiyasi.
  • Tadqiqot ob’yekti va predmeti: Tabiiy tillar morfologiyasi, leksikografiya.
  • Ishning maqsadi va vazifalari: Tadqiqot ishining maqsadi berilgan ot yoki sifat so’z turkumiga oid so’zni qabul qilib, morfologik va semantik tahlil qiluvchi lug`at ma`lumotlar tuzilmasi.
  • Tadqiqot usuli va uslubiyati: formal tillar nazariyasi, informatsion model, tabiiy tillar formalizatsiyasi.
Olingan asosiy natijalar: Berilgan ot yoki sifat so’z turkumiga oid so’zni morfologik va semantik tahlil qiluvchi ma`lumotlar tuzilmasi bilan ishlash. Natijalarning ilmiy yangiligi va amaliy ahamiyati: Masalada tahlil jarayoni bo’yicha keltirilgan barcha tasdiq va teoremmalar matematik asoslangan. Qilingan ishda ma`lumotlar ilmiy jihatdan yangi hisoblanadi. Tadbiq etish darajasi va iqtisodiy samaradorligi. Qo`llash sohasi. Xulosa va takliflar: So’zni morfologik va semantik tahlil qiluvchi ma`lumotlardan o’zbek tilini o’qitishda (trenajor sifatida) foydalanish, wordda so’zlarni tahlil qilishda va qidiruv portallarida qo’llanishi mumkin.
  • Olingan asosiy natijalar: Berilgan ot yoki sifat so’z turkumiga oid so’zni morfologik va semantik tahlil qiluvchi ma`lumotlar tuzilmasi bilan ishlash.
  • Natijalarning ilmiy yangiligi va amaliy ahamiyati: Masalada tahlil jarayoni bo’yicha keltirilgan barcha tasdiq va teoremmalar matematik asoslangan. Qilingan ishda ma`lumotlar ilmiy jihatdan yangi hisoblanadi.
  • Tadbiq etish darajasi va iqtisodiy samaradorligi. Qo`llash sohasi. Xulosa va takliflar: So’zni morfologik va semantik tahlil qiluvchi ma`lumotlardan o’zbek tilini o’qitishda (trenajor sifatida) foydalanish, wordda so’zlarni tahlil qilishda va qidiruv portallarida qo’llanishi mumkin.
So`zning morfologik tahlil algoritmi  Tabiiy tillar grammatikasi (til qoidalari) ni formallashtirish tabiiy tillarni avtomatik qayta ishlash asosini tashkil etadi. Tabiiy tillar qoidalari kitoblarda asosan tabiiy tilda beriladi. Tabiiy til esa o`ziga xosligi (bir qiymatli ma`noga ega emasligi) uni avtomatik qayta ishlashni qo`llab quvvatlamaydi. Tabiiy til formalizmi adabiyotlarda ko`proq rus va ingliz tili uchun berilgan. Morfologik sintez – so`zning turli xil shakllarini olish maqsadida matnli axborotlarni qayta kodlash va uni insonga tushunarli shaklga keltirish.

So`zning morfologik tahlil algoritmi

  • Tabiiy tillar grammatikasi (til qoidalari) ni formallashtirish tabiiy tillarni avtomatik qayta ishlash asosini tashkil etadi. Tabiiy tillar qoidalari kitoblarda asosan tabiiy tilda beriladi. Tabiiy til esa o`ziga xosligi (bir qiymatli ma`noga ega emasligi) uni avtomatik qayta ishlashni qo`llab quvvatlamaydi. Tabiiy til formalizmi adabiyotlarda ko`proq rus va ingliz tili uchun berilgan. Morfologik sintez – so`zning turli xil shakllarini olish maqsadida matnli axborotlarni qayta kodlash va uni insonga tushunarli shaklga keltirish.
Morfologik tahlil va sintezning turli usullari matnli xabarlarni (bir tildan boshqa tilga) rus tilidan o`zbek tiliga, o`zbek tilidan rus tiliga avtomatik tarjima qilishni tadqiq qilish, shu jumladan, avtomatlashtirilgan axborot tizimlarini yaratilishi bilan ham aloqador.
  • Morfologik tahlil va sintezning turli usullari matnli xabarlarni (bir tildan boshqa tilga) rus tilidan o`zbek tiliga, o`zbek tilidan rus tiliga avtomatik tarjima qilishni tadqiq qilish, shu jumladan, avtomatlashtirilgan axborot tizimlarini yaratilishi bilan ham aloqador.
6 .05.2019 Камола

6 .05.2019

Камола

Semantik tahlil   Semantik tahlil maqsadi - matnli ma`lumotning informativligini aniqlash va eng muhim ma`lumotlarni qayta ishlanadigan matndan ajratib olishdir. Matnni avtomatik semantik tahlil qilish matnning mazmunini aniqlash va uni baholash masalasini yechishni taqozo etadi.

Semantik tahlil

  • Semantik tahlil maqsadi - matnli ma`lumotning informativligini aniqlash va eng muhim ma`lumotlarni qayta ishlanadigan matndan ajratib olishdir. Matnni avtomatik semantik tahlil qilish matnning mazmunini aniqlash va uni baholash masalasini yechishni taqozo etadi.
Rang Dvigatel tipi Qizil xususiyati bor qismi Transport turi Avtomabil Matiz bu bu tegishli yoqtiradi Inson masalan Kamola Semantik tarmoq

Rang

Dvigatel

tipi

Qizil

xususiyati

bor

qismi

Transport turi

Avtomabil

Matiz

bu

bu

tegishli

yoqtiradi

Inson

masalan

Kamola

Semantik tarmoq

Qulayligi Semantik tarmoq insonning doimiy xotirasidek tashkil etiladigan zamonaviy bilim tasviri      Kamchiligi Semantik tarmoqda natijani topish protsedurasining murakkab tashkil etilganligi

Qulayligi

  • Semantik tarmoq insonning doimiy xotirasidek tashkil etiladigan zamonaviy bilim tasviri

Kamchiligi

  • Semantik tarmoqda natijani topish protsedurasining murakkab tashkil etilganligi
Chekli avtomat   Chekli avtomat deb shunday A = (Q,  , qo, F, B) beshlikni aytiladi, unda: Q - holatlar chekli to’plami;  - kirish alfaviti (kirish satri simvollaridan tashkil topgan chekli to’plam); qo – boshlang’ich holat qo  Q ; F - natijaviy holatlar chekli to’plami. F  Q; B - o’tish funktsiyasi. В: Q    Q ;

Chekli avtomat

  • Chekli avtomat deb shunday A = (Q,  , qo, F, B) beshlikni aytiladi, unda:
  • Q - holatlar chekli to’plami;
  •  - kirish alfaviti (kirish satri simvollaridan tashkil topgan chekli to’plam);
  • qo – boshlang’ich holat qo  Q ;
  • F - natijaviy holatlar chekli to’plami. F  Q;
  • B - o’tish funktsiyasi. В: Q   Q ;
Chekli avtomat diagrammasi

Chekli avtomat diagrammasi

Misol: Yuqorida ot so’z turkumi uchun chekli avtomat diagrammasi keltirilgan. 1-  boshlang’ich holat, 1, 2, 4, 5, 6, 7, 9 - natijaviy holatlar to’plami
  • Misol: Yuqorida ot so’z turkumi uchun chekli avtomat diagrammasi keltirilgan.
  • 1- boshlang’ich holat, 1, 2, 4, 5, 6, 7, 9 - natijaviy holatlar to’plami
  • "Kitoblarimiz" so’zi quyidagicha tahlil qilinadi: "Kitob" - (1) - "lar" - (2)-(3) - "i" - (4) "m"-(5)-(8)-"iz";
Ot o’zagi berilganlar modeli O‘zakni ajrata bilish, so‘z tarkibidagi tovush o‘zgarishlarini fahmlash so‘zni to‘g‘ri yozishga imkon beradi. Quyida ma’lumotlar bazasida ot o’zagini aniqlash algoritmi keltirilgan: Kiritish maydoniga kiritilgan ot so’z turkumiga oid so’zni “o`zak” jadvalidan qidiradi. O’zak topilgandan so’ng o’zakning ma’noviy ichki ko’rinishini topish talab qilinadi.

Ot o’zagi berilganlar modeli

O‘zakni ajrata bilish, so‘z tarkibidagi tovush o‘zgarishlarini fahmlash so‘zni to‘g‘ri yozishga imkon beradi.

Quyida ma’lumotlar bazasida ot o’zagini aniqlash algoritmi keltirilgan:

Kiritish maydoniga kiritilgan ot so’z turkumiga oid so’zni “o`zak” jadvalidan qidiradi. O’zak topilgandan so’ng o’zakning ma’noviy ichki ko’rinishini topish talab qilinadi.

Kiritilgan o’zagga mos atributni qidirish algoritmi:

Kiritilgan o’zagga mos atributni qidirish algoritmi:

So’z yasovchi qo’shimcha berilganlar modeli

So’z yasovchi qo’shimcha berilganlar modeli

So`z o`zagi ER modeli

So`z o`zagi ER modeli

Xulosa Dissertatsiya ishida dasturlash tillari leksikasi va semantikasini asosi hisoblangan va tabiiy tilning tavsifi sifatida ishlatiladigan hosil qiluvchi grammatika tushunchasi, uning xususiy hollari va mos mexanizmlari yoritib berilgan. Leksik tahlil bitta simvoldan ko’p bo’lgan simvollardan tashkil topgan til elementlarini, sintaktik tahlil fazasi leksik tahlil fazasi tugagandan keyin emas, balki odatda undan oldin o’z ishini boshlashi asoslab berilgan. Fe’l semantikasi tarkibidagi ifoda va boshqa semalarni tekshirish alohida yirik tadqiqotlarni talab qiladi, fe’llar asosida yaratiladigan kompyuter dasturlari uchun lingvistik ta’min ishlab chiqishda hozircha ularning ko‘chma ma’nolari hisobga olinmaydi, zarur parametrlar haqida batafsil ma`lumotlar keltirilgan.

Xulosa

  • Dissertatsiya ishida dasturlash tillari leksikasi va semantikasini asosi hisoblangan va tabiiy tilning tavsifi sifatida ishlatiladigan hosil qiluvchi grammatika tushunchasi, uning xususiy hollari va mos mexanizmlari yoritib berilgan.
  • Leksik tahlil bitta simvoldan ko’p bo’lgan simvollardan tashkil topgan til elementlarini, sintaktik tahlil fazasi leksik tahlil fazasi tugagandan keyin emas, balki odatda undan oldin o’z ishini boshlashi asoslab berilgan.
  • Fe’l semantikasi tarkibidagi ifoda va boshqa semalarni tekshirish alohida yirik tadqiqotlarni talab qiladi, fe’llar asosida yaratiladigan kompyuter dasturlari uchun lingvistik ta’min ishlab chiqishda hozircha ularning ko‘chma ma’nolari hisobga olinmaydi, zarur parametrlar haqida batafsil ma`lumotlar keltirilgan.
Dissertatsiya ishida erishilgan yutuqlar:   1) O’zbek tilidagi ot va sifat so’z turkumlari uchun so’z yasalish morfologiyasi va so’z semantikasi qoidalari o’rganildi .  2) Mazkur so’z turkumlari tahlil jarayoni aniqlanib , uni avtomatlashtirish prinsiplari aniqlandi.  3) Mazkur so’z turkumlari tahlil algoritmlari , morfologik va semantik lug’at ma`lumotlar tuzilmasi o`rganildi.  4) Morfologik va semantik lug’at ma`lumotlar tuzilmasininig yutuq va kamchilik tomonlari aniqlandi.

Dissertatsiya ishida erishilgan yutuqlar:

  • 1) O’zbek tilidagi ot va sifat so’z turkumlari uchun so’z yasalish morfologiyasi va so’z semantikasi qoidalari o’rganildi .
  • 2) Mazkur so’z turkumlari tahlil jarayoni aniqlanib , uni avtomatlashtirish prinsiplari aniqlandi.
  • 3) Mazkur so’z turkumlari tahlil algoritmlari , morfologik va semantik lug’at ma`lumotlar tuzilmasi o`rganildi.
  • 4) Morfologik va semantik lug’at ma`lumotlar tuzilmasininig yutuq va kamchilik tomonlari aniqlandi.
Ilmiy yangiliklar: 1) Ot va sifat so’z turkumi uchun information model yasaldi. 2)Tahlil daraxtsimon tuzilmasi yasalib , tahlil jarayoni uchun matematik aparat yaratildi. 3) Informatsion model, yaratilgan matematik aparat asosida o’zbek tilidagi ot va sifat so’z turkumlari uchun tahlil algoritmlari tayyorlandi. Ushbu ma`lumotlar keyingi tadqiqotlarni olib borish uchun asos bo`ladi.

Ilmiy yangiliklar:

  • 1) Ot va sifat so’z turkumi uchun information model yasaldi.
  • 2)Tahlil daraxtsimon tuzilmasi yasalib , tahlil jarayoni uchun matematik aparat yaratildi.
  • 3) Informatsion model, yaratilgan matematik aparat asosida o’zbek tilidagi ot va sifat so’z turkumlari uchun tahlil algoritmlari tayyorlandi.

Ushbu ma`lumotlar keyingi tadqiqotlarni olib borish uchun asos bo`ladi.

E’tiboringiz uchun rahmat !

E’tiboringiz uchun rahmat !


Скачать

Рекомендуем курсы ПК и ППК для учителей

Вебинар для учителей

Свидетельство об участии БЕСПЛАТНО!

Поделитесь с друзьями
ВКонтактеОдноклассникиTwitterМой МирLiveJournalGoogle PlusЯндекс