Разработка и исследование методов распознавания болгарской глаголицы

Глаголица — одна из двух славянских азбук. Изобретена славянским просветителем Кириллом около IX в. Алфавитный порядок букв, графонимы, а также способы, образования лигатур глаголицы почти аналогичны кириллической традиции. Существовали два основных извода глаголицы – округлый, распространенный в Болгарии и более поздний угловатый, употребляемый в Хорватии.

Необходимо выделить отличительные особенности написания текстов на болгарской глаголице и на основе результатов сформировать требования к системе распознавания.

Отличительные особенности:

  1. Редкое употребление линейных элементов и более широкое применение окружностей. В отличие от кириллицы буквы глаголицы более вычурны и имеют преимущественно замкнутые очертания.
  2. Декоративные росчерки и буквица.
  3. Варьируемость начертания.
  4. Дефекты.
  5. Искривления линии слова.

Требования к системе распознавания:

  • Система должна уметь отсекать не значимую информацию чтобы она не мешала процессу распознавания.
  • Система должна корректно распознавать текст на основе неполной информации.
  • Система должна уметь самообучаться, процесс обучения системы должен быть максимально упрощен.

 

В основе технологии распознавания предполагается использовать нейро-сетевую модель. Это связано с тем, что с использованием нейронных сетей успешно решаются разнообразные «нечеткие» задачи распознавание образов, речи, рукописного текста, выявление закономерностей, классификация, прогнозирование. В таких задачах, где традиционные технологии бессильны, нейронные сети часто выступают как единственная эффективная методика решения.