Азия и Африка в меняющемся мире. XXVIII Международная научная конференция 22-24 апреля 2015 г. - page 452

В работе была проведена обработка текстов и применены алгоритмы
тематического моделирования, сделано сравнение подходов к кластеризации.
В качестве данных использовались две коллекции документов: аннотации
100 статей на арабском языке по исламским финансам и аннотации 100 статей
по «исламской науке».
Павлов В. А, Шалымов Д. С. (Матмех, СПбГУ, Санкт-Петербург)
Алгоритм автоматического определения автора
рукописного арабографического текста по почерку
Существует большое количество арабских средневековых текстов, автор-
ство которых либо не установлено, либо сомнительно. Этот факт делает
актуальной проблему создания программной системы, способной определять
авторство арабской рукописи с заданной точностью, имея определенный объем
информации о её потенциальных создателях.
Такие задачи традиционно решаются при помощи компьютерного ана-
лиза рукописей, предварительно сегментированных на строки следующего
вида (сплошной линией выделен уровень строки с наибольшей плотностью
пикселей):
Рассмотрим один из наиболее перспективных алгоритмов, основанный
на применении фильтров Габора (Gabor filters) для текстов на персидском
языке
1
. Строки текста могут быть обработаны фильтрами Габора
2
и их моди-
фикациями (XGabor) для извлечения специальных объектов/ структур данных,
характеризующих почерк — графов отношения особенностей (Feature Related
Graphs(FRG)).
Полученный по рукописи граф в данном случае содержит в себе набор
особенностей, которые делают его уникальным по сравнению с графами,
полученными на основе других рукописей. Таким образом, граф особенностей
можно воспринимать как вектор свойств, использующийся в задачах машин-
ного обучения, тем самым расширив область применения этого алгоритма.
В настоящей работе данный алгоритм был модифицирован и использован
для арабографических рукописей. Также был произведен анализ эффективно-
1
Helli B., Moghaddam M. E
. A text-independent Persian writer identification based on
feature relation graph (FRG) // Pattern Recognition, 43 (2010).
2
Shiv Naga Prasad V., Domke J.
Gabor filter visualization // Technical Report. University
of Maryland, 2005.
Секция XV
450
1...,442,443,444,445,446,447,448,449,450,451 453,454,455,456,457,458,459,460,461,462,...562
Powered by FlippingBook