O‘zbek-ingliz tillarining teglangan parallel korpusini yaratish bosqichlari
Ключевые слова:
Korpus, teglash, tenglashtirish, parallel korpus, Pos teglash, XML kodlashАннотация
Maqolada kompyuter lingvistikasining asosiy yo‘nalishlaridan
biri va ko‘plab masalalari yechilishi lozim bo‘lgan korpus lingvistikasi,
monolingual korpuslar hamda parallel korpuslar haqida, bundan tashqari
parallel korpus sohasida jahon tajribasiga tayangan holda o‘zbek-ingliz
tillarining parallel korpusini yaratish bosqichlari haqida so‘z yuritiladi.
O‘zbek-ingliz tillari parallel korpusining dasturiy va lingvistik tamoyillarini
asoslash, tanlangan birliklarni lingvistik va ekstralingvistik teglash, parallel
korpus tuzish algoritmini ishlab chiqish kabi ustuvor vazifalar haqida
ma’lumotlar beriladi. Parallel korpusga qanday ma’lumotlar tanlanishi,
ma’lumotlarga qo‘yiladigan talablar va o‘zbek-ingliz parallel korpusining
yaratilishi tadqiqotchi va foydalanuvchilarga qanday imkoniyatlar taqdim
etishi to‘g‘risida fikrlar yuritiladi. Ushbu jarayonda material tanlash kabi
lingvistik va uslubiy muammolar bilan bir qatorda parallel korpusni
yaratishdagi dasturiy qiyinchiliklar xususida xulosalar aks etadi.
Загрузки
Опубликован
Версии
- 2023-01-03 (2)
- 2023-01-03 (1)