Tabiiy tilni qayta ishlashda bag of words algoritmidan foydalanish

Авторы

Ключевые слова:

BoW, Bag of words, soʻzlar jamlanmasi, soʻz vektori, token, BoW algoritmi, TF-IDF usuli

Аннотация

Soʻzlar sumkasi modeli - mashinali oʻrganish algoritmlari
tomonidan qayta ishlash lozim boʻlgan matnning raqamli koʻrinishi. Bag
Of Words (BoW) modellashtirish algoritmidan foydalanib, matnni raqamli
matritsalarga aylantirish va qayta ishlash mumkin. Soʻzlar sumkasi (BoW) -
soʻzning hujjatdagi statistikasini hisoblaydigan algoritm. BoW algoritmidan
hujjatlarni oʻzaro solishtirish, qidiruv tizimlarida ma’lumotlarni izlash,
hujjatlarni tasniflash va tematik modellashtirish kabi NLP ilovalarida
foydalaniladi. Ushbu maqolada oʻzbek tilidagi matnlarni BoW alrgoritmi
vositasida raqamli shaklga oʻtkazish usullari tahlil qilinadi.

Загрузки

Опубликован

2023-01-03

Как цитировать

Elov, B. ., Xudayberganov, N., & Xusainova, Z. (2023). Tabiiy tilni qayta ishlashda bag of words algoritmidan foydalanish. УЗБЕКИСТАН: ЯЗЫК И КУЛЬТУРА, 5(2), 35–50. извлечено от https://aphil.tsuull.uz/index.php/language-and-culture/article/view/32

Наиболее читаемые статьи этого автора (авторов)