Tabiiy tilni qayta ishlashda bag of words algoritmidan foydalanish
Ключевые слова:
Hamming masofasi, Levenshteyin masofasi,, Kosinus o‘xshashligi, o‘xshashlik jadvali, kodlash nazariyasiАннотация
So‘zlar orasidagi masofa – so‘zlarning turli sifatlariga ko‘ra
tavsiflanishi mumkin. Ularning aynan tarkibiy qismiga ko‘ra o‘xshashligini
aniqlash uchun tabiiy tilni qayta ishlash yo‘nalishida turli algoritmlar taklif
qilinadi. Bu algoritmlar o‘zining ishlatilish o‘rinlari hamda unumdorligi
bilan bir-biridan farq qiladi. Asosan sohaning imlo tekshiruvi, nutqni
aniqlash hamda plagiatni aniqlash kabi yo‘nalishlarida foydalanish uchun
qo‘llaniladi. Ushbu maqolada birdan ortiq so‘zlarning o‘xshashlik masofasini
aniqlashda foydalaniladigan algoritmlar va ularga xos xususiyatlar tahlil
qilinadi.
Загрузки
Опубликован
2023-01-03
Как цитировать
Xudayberganov, N., & Hasanov, S. (2023). Tabiiy tilni qayta ishlashda bag of words algoritmidan foydalanish. УЗБЕКИСТАН: ЯЗЫК И КУЛЬТУРА, 5(2), 69–83. извлечено от https://aphil.tsuull.uz/index.php/language-and-culture/article/view/38
Выпуск
Раздел
PRACTICAL LEXICOGRAPHY