Глаголица — одна из двух славянских азбук. Изобретена славянским просветителем Кириллом около IX в. Алфавитный порядок букв, графонимы, а также способы, образования лигатур глаголицы почти аналогичны кириллической традиции. Существовали два основных извода глаголицы – округлый, распространенный в Болгарии и более поздний угловатый, употребляемый в Хорватии.
Необходимо выделить отличительные особенности написания текстов на болгарской глаголице и на основе результатов сформировать требования к системе распознавания.
Отличительные особенности:
- Редкое употребление линейных элементов и более широкое применение окружностей. В отличие от кириллицы буквы глаголицы более вычурны и имеют преимущественно замкнутые очертания.
- Декоративные росчерки и буквица.
- Варьируемость начертания.
- Дефекты.
- Искривления линии слова.
Требования к системе распознавания:
- Система должна уметь отсекать не значимую информацию чтобы она не мешала процессу распознавания.
- Система должна корректно распознавать текст на основе неполной информации.
- Система должна уметь самообучаться, процесс обучения системы должен быть максимально упрощен.
В основе технологии распознавания предполагается использовать нейро-сетевую модель. Это связано с тем, что с использованием нейронных сетей успешно решаются разнообразные «нечеткие» задачи распознавание образов, речи, рукописного текста, выявление закономерностей, классификация, прогнозирование. В таких задачах, где традиционные технологии бессильны, нейронные сети часто выступают как единственная эффективная методика решения.