Т. 2. Азия и Африка: Наследие и современность
Монголоведение, тибетология, буддология Asia and Africa: their Heritage and Modernity. Vol. 2 221 единиц языка (морфов и словоформ), рассматриваемых как дискретные еди- ницы, с другой — выполняется моделирование иерархических древовидных структур зависимостей и непосредственных составляющих, образующих син- таксический каркас текста и, в том числе, структур тибетского морфосинтаксиса, что позволило создать морфосинтаксический анализатор тибетских текстов. Разрабатываемые средства АОТ постоянно верифицируются на материале корпусов текстов, а разметка этих корпусов выполняется автоматически этими же средствами, что позволяет обнаруживать недостатки лингвистического обе- спечения непосредственно в процессе его разработки и строить компьютерную модель языка в условиях ее постоянной верификации. Этот подход позволил не только впервые создать компьютернуюмодель тибетского морфосинтакиса, под- твержденную корпусными данными, но и выявить и устранить ряд неточностей в самих корпусах текстов и привести их в строгое соответствие с оригиналами. На данный момент реализован этап, отражающий морфосинтаксические структуры в границах традиционно выделяемых в тибетском языкознании словоформ. Особо следует отметить, что в связи с неоднозначностью различ- ных подходов к членению тибетских текстов на словоформы принято решение выбрать в качестве базовых единиц синтаксического анализа не словоформы, а морфы. Другой принципиальной особенностью избранной методологии явля- ется установка на множественность версий синтаксического анализа (в отличие от одновариантных синтаксических парсеров), что с неизбежностью приводит к столкновению с проблемой синтаксической неоднозначности. В рамках проекта избыточные версии анализа неоднократно устранялись путем полной переработки модели, что позволило выбрать оптимальные решения некоторых нерешенных вопросов формализации тибетской грамма- тики, однако полноценное решение данной проблемы требует учета не только синтаксических, но и семантических ограничений. Для этого на следующем этапе проекта планируется задействовать разрабатываемую семантическую (онтологическую) подсистему, отражающую тибетскую языковую картину мира, и модель тибетской синтаксической семантики. Программные средства, разрабатываемые в рамках проектов, размещаются на Корпусном портале СПбГУ corpora.spbu.ru . ་ Жабон Ю. Ж. (ИМБТ СО РАН, Улан-Удэ) «Бхайшаджья-васту» — медицинская основа буддийской монашеской дисциплины Виная индийской буддийской школыМуласарвастивада, линии преемствен- ности которой придерживается монашеская традиция тибетского буддизма, является самой крупной из шести сохранившихся коллекций Винаи. Большое
Made with FlippingBook
RkJQdWJsaXNoZXIy MzQwMDk=