Проекты
РАЗРАБОТКА И ИССЛЕДОВАНИЕ ТЕХНОЛОГИИ ИЗВЛЕЧЕНИЯ ФАКТОВ ИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА НА ОСНОВЕ КОНЦЕПТУАЛЬНЫХ ГРАФОВЫХ МОДЕЛЕЙ Подробнее
Грант РФФИ № 15-07-05507
В проекте предлагается новый метод извлечения фактов из текстов естественного языка, основанный на применении концептуальных графов и решеток понятий. Концептуальные графы являются элементарной концептуальной моделью текста, используемой в проекте в качестве моделей фактов. Такие модели, построенные на уровне отдельных предложений, далее обобщаются в другой концептуальной графовой модели – решетке понятий. Решетка понятий объединяет понятия в иерархическую структуру, обладающую свойствами математических решеток. Имея решетку понятий, можно выявлять связи между понятиями по принципу «общее – частное». Каждое понятие – узел решетки – интерпретируется как множество потенциальных фактов определенного уровня (тематики), которое связано с другими фактами. В проекте решается ряд задач, необходимых для осуществления целей проекта. Среди них задача кластеризации концептуальных графов, решение которой позволяет исключить из рассмотрения несущественные данные, задача построения формального контекста по кластерам, задача построения решеток понятий на контекстах, допускающих инвариантные преобразования. Проект предполагает как теоретические, так и экспериментальные исследования, для чего строится экспериментальная платформа в виде СУБД, интегрированной с системой построения концептуальных графов, разработанной авторским коллективом. Экспериментальные исследования эффективности разрабатываемой в данном проекте технологии выполняются на примере решения задачи нахождения биотопов живых организмов, описанных в текстах научных публикаций.
- Богатырев М.Ю. Алгебраические модели в технологии извлечения фактов из текстовых данных. Некоторые актуальные проблемы современной математики и математического образования. Герценовские чтения – 2015. Материалы научной конференции . – СПб.: Изд. РГПУ им. А.И. Герцена, 2015. С. 186-191.
- М.Ю. Богатырев Извлечение фактов из аннотированных корпусов методами анализа формальных понятий. Труды международной конференции «Корпусная лингвистика -2015». – СПб,: С.-Петербургский гос. университет, 2015. – С. 121-128.
- Michael Bogatyrev, Vadim Nuriahmetov Biomedical Natural Language Processing with Evolutionary Algorithms. Proceedings of the 5th International Conference on Mathematical Biology and Bioinformatics, Pushchino, Russia, 2014.
- Богатырев М. Ю., Вакурин В. С. Концептуальное моделирование в исследовании биомедицинских данных. // Математическая биология и биоинформатика. 2013. Т. 8. № 1. С.340–349.
- M. Y. Bogatyrev, A. P. Terekhov. Framework for Evolutionary Modelling in Text Mining. - Proceedings of the SENSE’09 - Conceptual Structures for Extracting Natural language Semantics. Workshop at 17th International Conference on Conceptual Structures (ICCS'09) - Moscow, Russia, July 2009, - p.p. 26-37.
РАЗРАБОТКА И ИССЛЕДОВАНИЕ ТЕХНОЛОГИИ АНАЛИЗА ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ ДЛЯ ИНФОРМАЦИОННЫХ СИСТЕМ ТЕХНИЧЕСКОЙ ПОДДЕРЖКИ
Грант РФФИ № 11-07-97542
Проект посвящен разработке новой технологии классификации текстовых данных в виде сообщений – запросов, используемых в информационных системах технической поддержки. Система поддержки получает запросы от пользователей в виде текстов на естественном языке, например, в формате сообщений электронной почты. Необходимо подготовить ответ каждому пользователю в том же формате, содержащий ответы на вопросы пользователя, рекомендации, советы или ссылки на другие тексты. В технологии используется оригинальное решение задачи классификации текстов, в котором применяются концептуальные семантические модели: концептуальные графы и решетки понятий.
- Michael Bogatyrev and Alexey Kolosoff. Using Conceptual Graphs for Text Mining in Technical Support Services. Pattern Recognition and Machine Intelligence. - Lecture Notes in Computer Science, 2011, Volume 6744/2011, p.p. 466-471. Springer-Verlag, Heidelberg, 2011.
- Колосов А.П., Богатырев М.Ю. Системам полнотекстового поиска по длинным запросам. Электронные библиотеки: перспективные методы и технологии, электронные коллекции 13-й Всероссийская научная конференция RCDL`2011: труды конференции. – Воронеж, Вор ГУ, 2011 – 408 с. – с. 151- 156.
- Колосов А.П. Алгоритм полнотекстового поиска с обучением на основе статистических данных. - Изв. Тульского государственного университета 2011. Технические науки Выпуск 6 Часть 2 -C. 462-470.
- Богатырев М.Ю., Нуриахметов В.Р., Вакурин В.С. МЕТОДЫ АНАЛИЗА ФОРМАЛЬНЫХ ПОНЯТИЙ В ИНФОРМАЦИОННЫХ СИСТЕМАХ ТЕХНИЧЕСКОЙ ПОДДЕРЖКИ. Известия Тульского государственного университета. Технические науки. 2013. № 2. С. 25-36.
- Колосов А.П. Математическое и программное обеспечение задач полнотекстового поиска в системах технической поддержки. Автореферат диссертации на соискание ученой степени кандидата технических наук. по спец. 05.13.11 – Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей. - Тула, 2012. 16 с.
ЭВОЛЮЦИОННЫЙ ПОДХОД К ЗАДАЧЕ КЛАСТЕРИЗАЦИИ НА КОНЦЕПТУАЛЬНЫХ ГРАФАХ И ЕГО ПРИМЕНЕНИЕ В СИСТЕМАХ ПОДДЕРЖКИ ЭЛЕКТРОННЫХ БИБЛИОТЕК
Грант РФФИ № 07-07-00276-а
В проекте исследовались алгоритмы построения концептуальных графов как семантических моделей текста, выполнялись вычислительные эксперименты с алгоритмами, исследовались возможности генетических алгоритмов кластеризации концептуальных графов. При исследовании алгоритмов построения концептуальных графов учитывались семантические особенности текстов различных типов. Исследования проводились на текстах аннотаций научных статей. Исследованы алгоритмы построения концептуальных графов, основанные на использовании синтаксических схем предложений текста и на применении семантических ролей, приписываемых элементам текста. По результатам исследований разработан алгоритм построения концептуальных графов, ориентированный на применение семантических ролей как основы формирования концептуальных отношений в концептуальных графах. Для выполнения вычислительных экспериментов была спроектирована и реализована информационная система поддержки хранения концептуальных графов в виде СУБД, работающей с XML – базой данных.
- Богатырев М. Ю., Латов В. Е., Столбовская И. А., Тюхтин В. В. Эволюционный подход к задаче кластеризации на концептуальных графах и его применение в системах поддержки электронных библиотек. - Математические методы распознавания образов. 13 Всероссийская конференция.. Сб.докладов. – М.: МАКС Пресс, 2007. - С. 464-468.
- Богатырев М. Ю., Латов В. Е., Столбовская И. А. Применение концептуальных графов в системах поддержки электронных библиотек. - Электронные библиотеки: перспективные методы и технологии, электронные коллекции. Труды Девятой Всероссийской научной конференции - RCDL’2007 (Переславль-Залесский, Россия, 15-18 октября 2007). - С. 104-110.
- Богатырев М.Ю., Тюхтин В.В. Решение некоторых задач Text Mining при помощи концептуальных графов. - Электронные библиотеки: перспективные методы и технологии, электронные коллекции. Труды Десятой Всероссийской научной конференции RCDL’2008 – Дубна, 2008. – 415 с. – С. 31- 36.
- Богатырев М.Ю., Тюхтин В.В. Построение концептуальных графов как элементов семантической разметки текстов. Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции «Диалог 2009» (Бекасово, 27-31 мая 2009 г.). Вып. 8 (15).– М.: РГГУ, 2009. - С. 31-37.
- M. Y. Bogatyrev, A. P. Terekhov. Framework for Evolutionary Modelling in Text Mining. - Proceedings of the SENSE’09 - Conceptual Structures for Extracting Natural language Semantics. Workshop at 17th International Conference on Conceptual Structures (ICCS'09) - Moscow, Russia, July 2009, - p.p. 26-37.
- M. Y. Bogatyrev, O. A. Mitrofanova V. V. Tuhtin. Building Conceptual Graphs for Articles Abstracts in Digital Libraries. - Proceedings of the Conceptual Structures Tool Interoperability Workshop (CS-TIW 2009) at 17th International Conference on Conceptual Structures (ICCS'09) - Moscow, Russia, July 2009, - p.p. 50-57.
СИСТЕМА ЭВОЛЮЦИОННОГО МОДЕЛИРОВАНИЯ
Авторы: М.Ю. Богатырев, В.Е. Латов, М.Н. Вендин, А.С. Требушков
Научные результаты: изложены в публикациях
Реализация: опробовано в качестве системы параметрической оптимизации двигателей внутреннего сгорания.
Преимуществом данной технологии является возможность работы с существующими моделями систем как с внешними источниками данных, существенно не меняя самих моделей.
Эволюционное моделирование перспективно при исследовании систем с параметрами, когда связь параметров с выходными величинами сложна. В этом случае применение эволюционного моделирования позволяет выполнить параметрическую оптимизации систем и исследовать свойства систем, используя эволюции их состояний.
В данной технологии принципиальное значение имеет настройка алгоритма на задачи различной природы. Исследование свойств генетических алгоритмов – в том числе и методом математического моделирования – важная часть разрабатываемой технологии.
- Богатырёв М.Ю. Эволюционный подход к многокритериальной оптимизации в системах координатно-параметрического управления. - Изв. ТулГУ. Сер. Математика. Механика. Информатика. Том 8, вып. 3 . Информатика. - Тула, 2002. – С. 76 – 85.
- Богатырев М.Ю. Групповые структуры генетических алгоритмов. – Некоторые актуальные проблемы современной математики и математического образования. Герценовские чтения – 2011. Материалы научной конференции. – Спб.: ООО «ПаркКом», 2011. – с. 179-184.
- Богатырёв М.Ю. , Авдеев К.А. К вопросу о структурно–инвариантном подходе к моделированию многоцилиндрового двигателя внутреннего сгорания. - Изв. ТулГУ. Сер. Автомобильный транспорт. Вып. 6 . – Тула, ТулГУ, 2002. – С. 82 - 90.
- Авдеев К.А., Богатырёв М.Ю. Применение метода эволюционных вычислений для оптимизации параметров современных ДВС // Материалы IX международной НПК, - Владимир: Владим. гос. ун-т, 2003. -С. 335-338.
- Агуреев И.Е., Авдеев К.А., Богатырев М.Ю. СТРУКТУРА И ПРИМЕНЕНИЕ ПРОГРАММНОГО КОМПЛЕКСА ДЛЯ МОДЕЛИРОВАНИЯ ЭНЕРГОЭФФЕКТИВНЫХ РЕЖИМОВ РАБОТЫ ПОРШНЕВЫХ ДВС. Известия Тульского государственного университета. Технические науки. 2012. № 9. С. 251-260.
- Агуреев И.Е., Авдеев К. А., Богатырев М. Ю., Власов М. Ю., Волков А. И. Формирование режима динамического поведения поршневых двигателей внутреннего сгорания в рамках нелинейного моделирования // Известия ТулГУ. Технические науки. 2012. № 3. С. 364-372.
ЭВОЛЮЦИОННЫЕ ВЫЧИСЛЕНИЯ НА РЕЛЯЦИОННЫХ БАЗАХ ДАННЫХ
Авторы: М.Ю. Богатырев, Д.А. Ковалев
Научные результаты: изложены в кандидатской диссертации Д.А. Ковалева “Эволюционная система извлечения знаний на реляционных базах данных”
Реализация: опробовано в качестве подсистемы анализа нарушений валютного законодательства в Хабаровском краевом Управлении валютного контроля Банка России.
Извлечение знаний из баз данных – это современная область исследований и разработки новых технологий СУБД. К моделям знаний относятся ассоциативные правила и классификации. Для решения задач извлечения ассоциативных правил и классификаций в данном проекте применялись эволюционные вычисления: генетические алгоритмы и генетическое программирование. Главной особенностью проекта является оригинальная реализация генетических алгоритмов на множестве SQL – запросов к реляционным базам данных, для чего была создана специальная система эволюционных вычислений. Система разработана в среде СУБД Oracle. Предназначена для использования в корпоративных системах поддержки принятия решений, в том числе в банковско-финансовой сфере.
- M. Y. Bogatyrev, D. A. Kovalev Mining Associated Rules and Classifications in Relational Databases with Genetic Algorithm – In: Interactive Systems: The Problems of Human - Computer Interaction. - Proceedings of the International Conference. - Ulyanovsk: ULSTU, 2003. p.p. 125-129.
- Богатырев М.Ю., Ковалев Д.А. Построение ассоциаций данных на реляционных базах данных методом генетического программирования. – В кн.: Управление и информационные технологии. Всероссийская научная конференция. Сборник докладов в 2-х т. – Санкт – Петербург, 2003. –Т. 1. – С. 329 - 334.
- Богатырев М.Ю., Ковалев Д.А., Евсюков В.В. Эволюционный подход к извлечению знаний из реляционных баз данных в корпоративных информационных системах – «Информационные технологии», 2004, № 9. – C. 19-27.
- Богатырев М.Ю., Ковалев Д.А., Евсюков В.В. Эволюционная система извлечения знаний из корпоративных баз данных - Банковское дело, 2004, № 10. – С. 45 – 56.