Молодежный инновационный форум ПФО - 2015

Четвёртый молодежный инновационный форум Приволжского федерального округа проводится
13 - 15 мая 2015 года на базе Ульяновского государственного технического университета

Номер статьи: А-1_84
УДК 004.4
Разработка программной системы автоматизированного извлечения терминологии из текстов предметной области

Виктор Клейн, студент
Ульяновский государственный технический университет (г. Ульяновск)
Вадим Мошкин, аспирант
Ульяновский государственный технический университет (г. Ульяновск)
Илья Андреев, студент
Ульяновский государственный технический университет (г. Ульяновск)

Научный руководитель:
Надежда Глебовна Ярушкина, профессор, доктор технических наук,
Ульяновский государственный технический университет (г. Ульяновск)

Принцип работы существующих алгоритмов извлечения терминологии (term extraction) в лексикографии и терминоведении основан на статистических и лингвистических методах. В основе статистических методов лежит вычисление степени терминологичности на основании числовых закономерностей, присущих термину или не термину. В основе лингвистических методов лежит отбор по определенным лексико-грамматическим шаблонам и другим лингвистическим признакам термина.
Главным недостатком использования статистических и лингвистических методов в процессе извлечения терминологии из текста является отсутствие возможности выделения из получившегося множества терминов только тех, которые относятся к рассматриваемой проблемной области.
Недостатки существующих методов могут быть устранены при использовании экспертных знаний. В настоящее время одной из наиболее универсальных методик представления экспертных знаний с точки зрения полноты семантического описания информационной единицы предметной области является онтологический подход. Разработанная программная система реализует 3 вида методов извлечения терминологии из текста, комбинируя работу каждого метода и выдавая в результате список терминов предметной области.


Проект заявлен на номинацию: Конкурс НТТМ: Лучший научно-исследовательский проект
Секция: IT блок (Информационные технологии)
 
и у вас есть свой проект
19 марта - 24 апреля регистрируетесь на сайте
для участия в форуме и размещаете информацию
25 - 27 апреля - Заочный тур конкурса.
и очного тура конкурса. Награждение!