Ученые «проверили алгеброй» тувинский фольклор
Результатом исследований стали решетки формальных понятий
Ученые СФУ совместно с коллегами из Тувинского государственного университета и научно-образовательного центра «Тюркология» Республики Тыва применили алгебраический подход Рудольфа Вилле и Бернарда Гантера в исследовании тувинских фольклорных произведений и показали, как с помощью анализа формальных понятий можно определить жанр произведения, автора и пространственно-временной период его написания. Об этом сообщает пресс-служба красноярского вуза.
Объектом исследования стал национальный корпус тувинского языка, представленный собранием оцифрованных художественно-литературных произведений, относящихся к культурному наследию этноса. За характерные признаки текстов были взяты сказители, сюжеты, зачины, языковые клише и др.
В рамках подхода тексты произведений были представлены в виде контекстов — бинарных матриц, отражающих наличие или отсутствие данных признаков в соответствующих произведениях. В ходе исследований удалось выявить формальные понятия тувинского фольклора, установить между ними отношения частичного порядка и соединить их в решетку. Такая решетка — это формализованное описание концептуальной модели, благодаря которой возможно проследить зависимости между признаками и классифицировать произведения на семантическом (качественном) уровне.
«Человек познает мир через понятия, то есть определяет объекты, выделяет для них существенные признаки и на их основе классифицирует и систематизирует реалии окружающего его мира. Анализ формальных понятий представляет собой познание сути вещей при помощи математики. Однако, чтобы получить достоверные и устойчивые знания, необходимо использовать большой объем данных. И здесь математики сталкиваются с „проклятием размерности“: чтобы проанализировать необходимый объём данных, не хватит человеческой жизни. Высокая вычислительная сложность данной задачи объясняется тем, что число формальных понятий может экспоненциально зависеть от размера контекста. Например, при ста признаках для поиска формальных понятий потребуются миллионы лет. При исследовании тувинских текстов мы применили декомпозиционный приём и особым образом разделили исходный контекст на полиноминальное число частей или минимально возможных текстов, доступных для анализа и сохраняющих все потенциальные формальные понятия», — подчеркнула доктор физико-математических наук, профессор кафедры высшей и прикладной математики, руководитель исследования Валентина Быкова.
Результатом исследований стали решетки формальных понятий фольклорных произведений, хранящихся в корпусе тувинского языка. Также было разработано математическое и программное обеспечение, позволяющее выполнять предобработку больших контекстов путём их декомпозиции, создавать решётки формальных понятий и анализировать их. Интерпретацией построенных математических моделей занялись филологи и лингвисты научно-образовательного центра «Тюркология».
Ученые отмечают серьезное прикладное значение данных мультидисциплинарных исследований. Возможность «разложить по полочкам» фольклорные тексты, содержащие архетипичные понятия, поможет не только в изучении тувинского языка в национальных школах, но и станет подспорьем в работе переводчиков, и, самое главное, поспособствует изучению и сохранению этнокультурного наследия Республики Тыва.
Добавим, применение алгебраического подхода Рудольфа Вилле и Бернарда Гантера в исследовании тюркскоязычных текстов также заинтересовало математиков и лингвистов Национального университета Узбекистана им. М. Улугбека. В перспективе в рамках соответствующего договора о научном и культурном сотрудничестве планируется проведение совместных работ по концептуальному моделированию и анализу узбекских фольклорных текстов.