Поиск по каталогу |
(строгое соответствие)
|
- Профессиональная
- Научно-популярная
- Художественная
- Публицистика
- Детская
- Искусство
- Хобби, семья, дом
- Спорт
- Путеводители
- Блокноты, тетради, открытки
Open Source Spelling Checker for Kimeru Language. Closing the gap between Resource-rich languages and Resource-scarce Languages
В наличии
Местонахождение: Алматы | Состояние экземпляра: новый |
Бумажная
версия
версия
Автор: Timothy Anondo
ISBN: 9783659593093
Год издания: 2014
Формат книги: 60×90/16 (145×215 мм)
Количество страниц: 96
Издательство: LAP LAMBERT Academic Publishing
Цена: 31747 тг
Положить в корзину
Позиции в рубрикаторе
Отрасли знаний:Код товара: 138708
Способы доставки в город Алматы * комплектация (срок до отгрузки) не более 2 рабочих дней |
Самовывоз из города Алматы (пункты самовывоза партнёра CDEK) |
Курьерская доставка CDEK из города Москва |
Доставка Почтой России из города Москва |
Аннотация: So-called ‘resource poor’ languages are largely ignored in the development of Information and Communication Technologies. K?m??r?, as a Kenyan Bantu language, can be classified as a resource scarce language (RSL) with respect to language technology resources, tools and applications. Again, K?m??r? orthography contains two diacritically marked characters (? and ?) that require extra keystrokes to generate, a situation which often makes users opt for the diacritically unmarked equivalents, resulting in non-standard K?m??r? texts. These extra characters also pose a challenge for automated corpus collection methods, such as those using optical character recognition (OCR). This book explores the development of an open source spelling checker for K?m??r? language using the Hunspell Language Tools with a view of understanding the fundamental principles and morphological composition of K?m??r? nouns and verbs. An insight into the development of a suggestion component used to generate probable suggestions of misspelled words is also highlighted.
Ключевые слова: Kenya, Computational Linguistics, morphological analysis, Human Language Technology, Bantu Language, Resource Scarce language, Open Source Spellchecker, K?m??r? Orthography, Hunspell Language tools, Suggestion Component, Affix file (.aff), Dictionary file (.dic), Accuracy rate, Precision rate, Recall rate