,

Институт математики и информационных технологий vk

ИМИТ

logo linux tux (c) Larry Ewing

Темы кафедры теории вероятностей и анализа данных

Бородина Александра Валентиновна, доцент каф. ТВиАД

Email:  borodina@krc.karelia.ru

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

2 курс

(ПМиИ)

Тема: Стратегии выбора оптимального времени поступления клиентов на обслуживание

Рассмотрим группу клиентов, каждому из которых необходимо самостоятельно решить, когда прибыть в учреждение, предоставляющее услугу, в течение фиксированного периода времени (дня). Высокий спрос на услуги в определенное время приводит к перегрузкам, за которые приходится платить, например, ожиданием или опозданием. Этот факт заставляет клиентов принимать стратегические решения относительно времени прибытия.

 

 

2 курс

(ПМиИ)

Тема: Социальная оптимальность в системах массовог обслуживания со стратегическим временем прибытия

Если клиенты, приходящие в систему, руководствуются индивидуальной стратегией выбора времени прихода в систему, то могут возникать так называемые социальные затраты. Они определяются как сумма затрат, понесенных отдельными участниками. Естественной задачей является поиск стратегии поведения, которая минимизирует эти затраты.

 

 

2 курс

(ПМиИ)

Тема: Цена анархии в системе обслуживания с потерями

Рассматривается система обслуживания с несколькими серверами.  Каждый сервер предлагает свою скорость и стоимость обслуживания. Каждый клиент выбирает сервер, не имея возможности наблюдать, занят ли выбранный сервер или простаивает. Клиенты по прибытии выбирают сервер, и если выбранный сервер занят обслуживанием какого-либо другого клиента, они немедленно покидают систему. Такие системы называются системами с потерями.  Для данной модели рассматриваются стратегии маршрутизации клиентов: расновесная (по Нэшу) и социально оптимальная. Соотношение между оптимальной социальной полезностью и той, которая достигается с помощью стратегии равновесия Нэша, называется ценой анархии (Price of Anarcy) и   указывает на социальные потери из-за отсутствия координации между клиентами.

 

 

 

2 курс

(ИСиТ)

Тема: Применение алгоритма RLGL для моделирования сетей большого объема

Предлагается исследовать эффективность метода RLGL (Red Light Green Light Method) - метод красного света и зеленого света для оценивания характеристик сетей с большим числом узлов. Суть алгоритма состоит в следующем: сначала каждый узел несет определенную сумму денежных средств, которая может быть положительной или отрицательной (богатство или долг), а общая сумма денежных средств в системе равна нулю. Затем на каждом этапе выбранные узлы получают зеленый свет на распределение своих денежных средств (богатства или долга) между другими узлами пропорционально вероятностям перехода.

 

 

 

2 курс

(ИСиТ)

Тема: Оценивание вероятностей редких событий для случайных графов Эрдеша-Реньи

Предлагается изучить характеристики случайных графов типа Эрдеша-Реньи и исследовать эффективность численных алгоритмов для оценки вероятности того, что граф Эрдеша-Реньи содержит чрезмерно большое количество фиксированных заданных подграфов, скажем, треуголиков.

 

2 курс

(ИСиТ)

Тема: Проблема вычисления остаточной связности случайных графов

В широком смысле понятие надежность сети связано с исследованием характеристик производительности систем, которые можно моделировать с помощью случайных графов. Предлагается исследовать задачу оценки надежности остаточной связности случайного неориентированного графа, когда узлы сети выходят из строя с равной вероятностью.

 

3 курс

(ПМиИ)

Тема: Проблема оценивания вероятности перескока в графах большой размерности

В качестве объекта исследования рассматриваются графы большой размерности.

Как правило, из-за сложности и больших размеров объекта исследования  характеристики графа (сети) невозможно рассчитать аналитически. Для модели веб-графа предлагается реализовать численные алгоритмы оценивания вероятности того, что случайное блуждание в графе, стартуя из узла a, сначала войдет в узел b, а затем вернется в начальный узел a.

 

 

3 курс

(ИсиТ)

групповой проект

Тема: Анализ надежности сети и эффективное сопротивление графа

Понятие эффективного сопротивления графа заимствовано из области анализа электрических цепей, где оно определяется как накопленное эффективное сопротивление между всеми парами вершин. Предлагается рассмотреть данную метрику для анализа надежности сети, при этом сеть рассматривается как электрическая цепь и применимы законы Ома и Кирхгофа.

 

1 студент

 

 

2 студент

 

 

3 студент

 

4 курс

(ПМиИ)

Тема: Исследование модели процесса деградации и разными типами отказов

Деградация является основным фактором выхода из строя многих технических систем и инженерных инфраструктур (изделий, конструкций, сетей связи, военной техники и многих других объектов). Износ накапливается с течением времени и, в конечном итоге, приводит к сбою или отказу. Для систем с высокой надежностью отказ является редким событием, в этом состоит основная сложность анализа. Для прогнозирования надежности используются имитационные модели процессов деградации. Предлагается рассмотреть модель деградации с двумя стадиями и оценить время жизни системы.

 

 

 

Крижановский Андрей Анатольевич, доцент

andrew.krizhanovsky@gmail.com

№ курса и Направле-ние

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента,
№ группы

4 курс, ПМиИ

Создание базы данных иллюстраций, привязанных к значениям слово в словаре

 Антон Ермошкевич, 22403

5 курс, ПМиИ

Разработка мобильного приложения с компактным хранением большого объёма словоформ карельского языка

Арсений Марков, 22503

4 курс, ПМиИ

Извлечение данных с сайтов Викисловарей

Владлен Фролов, 22403

Илья Панфилов, 22403

 курс Системное и прикладное программное обеспечение

 

2, 4 курс Разработка информ.

 

2, 3, 4 курс ПМ

Тематика работ

 

Построение словаря оценочных слов на основе Русского Викисловаря.

Построение словаря оценочных слов на основе Английского Викисловаря

 

1. Обзор работ по анализу тональности текста.

2. Извлечение словарных помет из Викисловаря, в частности оценочных помет (например, груб. — грубое, сниж. — сниженное, торж. — торжественное).

3. Построение словаря для оценки тональности текстов.

4. Написание научной статьи по результатам работы.

 

Построение и анализ корпуса цитат Викисловарей.

 

Автоматическая оценка качества (степени проработанности) словарной статьи.

 

См. список задач на странице
https://ru.wiktionary.org/wiki/User:AKA_MBG/projects

 

 

Москин Николай Дмитриевич, доцент кафедры ТВиАД, д.т.н.

Email:  moskin@petrsu.ru

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

3 курс, Программная инженерия

Тема: Графовые нейронные сети

Краткое описание: Графовые нейронные сети - это способ применения классических моделей нейронных сетей к графовым данным. Графы, не обладая регулярной структурой как изображения (каждый пиксель имеет 8 соседей) или тексты (последовательность слов), долгое время оставались вне поля зрения классических нейронных моделей, которые получили широкое распространение в области машинного обучения и искусственного интеллекта.

1. Wu L. Graph Neural Networks for Natural Language Processing: A Survey / L. Wu, Y. Chen, K. Shen, X. Guo, H. Gao, S. Li, J. Pei, B. Long // ArXiv abs/2106.06090. – 2021. – 127 p.

 

 

4 курс, Программная инженерия

Тема: Информационная система для анализа лексических спектров текстов

Краткое описание: целью работы является разработка информационной системы для анализа лексических спектров текстов. Лексические спектры на уровне словаря и на уровне текстов используются в задачах атрибуции (исследования текстовых произведений с целью определения авторства).

1. Проблема атрибуции в журналах «Время», «Эпоха» и еженедельнике «Гражданин»: [монография] / А. А. Рогов, Р. В. Абрамов, Д. Д. Бучнева, О. В. Захарова, К. А. Кулаков, А. А. Лебедев, Н. Д. Москин, А. В. Отливанчик, Е. Д. Савинов, Ю. В. Сидоров. - Петрозаводск: Издательство «Острова», 2021. - 391 с.

 

Куусела Демид Александрович, 22407

4 курс, Информационные системы и технологии

Тема: Анализ датчиков движения в шлемах виртуальной реальности

Краткое описание: целью работы является изучение различных методов и технологий работы датчиков распознавания движения в шлемах виртуальной реальности. Для этого требуется определить требования к датчикам распознавания движения в шлемах виртуальной реальности, выполнить сравнительный анализ различных датчиков и выбрать наиболее подходящие для данной задачи, изучить особенностей работы датчиков в различных сценариях виртуальной реальности, разработать систему управления движением, провести тестирование системы и анализ ее эффективности в различных условиях виртуальной реальности.

1. Смолин А. А., Жданов Д. Д., Потемин И. С., Меженин А. В., Богатырев В. А. Системы виртуальной, дополненной и смешанной реальности. Учебное пособие. Санкт-Петербург: ИТМО, 2018.

Поликарпова Валерия Викторовна, 22405

4 курс, Информационные системы и технологии

Тема: Применение методов искусственного интеллекта для анализа тональности текстов

Краткое описание: Задачей определения тональности текста (Sentiment analysis) является извлечение авторской эмоциональной оценки, выраженной в тексте, с помощью математических методов и компьютерных технологий. Классификация текстов по тональности находит применение в маркетинговых исследованиях, рекомендательных системах, поисковых системах, в человеко-машинном интерфейсе, при оценке тональности новостей и др.

1. Осокин В. В. Анализ тональности русскоязычного текста / В. В. Осокин, М. В. Шегай // Интеллектуальные системы. Теория и приложения. – 2014. – Т. 18. – № 3. – С. 163–174.

 

Горовенко Юлия Викторовна, 22405

 

Павлов Юрий Леонидович, д.ф.-м.н., професор

Email:  pavlov@krc.karelia.ru

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

2, 3 курс

математика,

прикладная математика

Тема: Моделирование сети Интернет

Краткое описание Построение и  исследование моделей сложных сетей коммуникаций, таких как Интернет, системы мобильной связи, социальные сети и т. д. Основной математический аппарат – теория случайных графов.

Рекомендуемая литература:

1.     А. М. Райгородский. Модели случайных графов. Москва, МЦНМО, 2011.

2.     Ю. Л. Павлов. Случайные графы. Петрозаводск, ПетрГУ,  2013.

3.     R. Hofstad. Random graphs and complex networks. Cambridge university press. 2017.   

 

 

 

Рогов Александр Александрович, д.т.н., зав каф. ТВиАД, профессор

Email:  rogov@petrsu.ru

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

2 курс ПМиИ

Тема: Сравнение бинарных символов

 

2 курс ПИ

Тема: Поиск лиц на архивных фотографиях

 

 

3 курс Математика

Тема: Сравнение методов поиска лиц на архивных фотографиях

 

 

 

3 курс ПМиИ

Тема: Трансформер

 

 

3 курс ПМиИ

Тема: Сверточные нейронные сети

 

 

3 курс ПМиИ

Тема: Выбор параметра градиетного спуска

 

 

3 курс ИСиТ

Тема: Визуализация работы метода к- средних

 

3 курс ИСиТ

Тема: Визуализация работы метода  деревья решений

 

3 курс ИСиТ

Тема: Визуализация работы метода иерархического кластерного анализа

 

Сидоров Юрий Владимирович, к.т.н., доцент кафедры теории вероятностей и анализа данных

Email:  yurysidorov76@gmail.com

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

2 курс, магистратура

УД

Тема: Формирование набора данных для адаптации синтаксических анализаторов для работы с языком дореволюционной России

22605 Н.В. Гальминас

2 курс, магистратура

УД

Тема: Разработка словаря для адаптации морфологических анализаторов к работе с дореволюционным русским языком

22605 Л. А. Иванов

3 курс,

01.03.02

Тема: Применение методов кластеризации при решении задачи атрибуции текстов

Краткое описание: Как правило, атрибуция текстов рассматривается как задача их классификации. Вместе с тем, для определенных текстов (публицистических, малого объема и т.п.) характерно внешнее влияние (редакторские правки и т.п.), что может приводить к противоречивым результатам классификации. Поэтому, целесообразным выглядит первоначальная кластеризация рабочего материала с целью выработки последующих решений по его исследованию. Инструментальные средства: Excel, VBA, PHP, MySQL, Python и пр.

 

1. Сидоров Ю. В. Математическая и информационная поддержка методов обработки литературный текстов на основе формально-грамматических параметров : специальность 05.13.18 «Математическое моделирование, численные методы и комплексы программ» : диссертация на соискание ученой степени кандидата технических наук / Сидоров Юрий Владимирович ; Санкт-Пет. ин-т информатики и автоматизации. — Санкт-Петербург, 2002. — 127 с.

2. Мандель И.Д. Кластерный анализ. М., «Финансы и статистика», 1988.- 176 с..

3. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Классификация и снижение размерности. — М.: Финансы и статистика, 1989. — 607 с.

 

2 курс,

09.03.02

Тема: Компьютерный анализ текстов на естественном языке для решения задачи атрибуции текстов: морфологический уровень

Краткое описание: изучение основных принципов компьютерного анализа текстов на естественном языке; практическая реализация методов атрибуции текстов, основанных на морфологических признаках, на корпусе публицистических статей. Инструментальные средства: Excel, VBA, PHP и пр.

 

1. Рогов А. А., Седов А. В., Сидоров Ю. В., Суровцова Т. Г. Математические методы атрибуции текстов. (учебное пособие). Петрозаводск: Изд-во ПетрГУ, 2012. – 48 с.

2. Боярский К. К. Введение в компьютерную лингвистику : учебное пособие. СПб. : НИУ ИТМО, 2013. 72 с

3. Сидоров Ю. В., Смирнов Н.В. Вероятностные методы анализа неструктурированной текстовой информации. (учебное пособие). Петрозаводск: Изд-во ПетрГУ, 2012. – 56 с.

4. Информационная система «СМАЛТ» : [сайт]. URL:http://smalt.karelia.ru

 

2 курс,

09.03.02

Тема: Компьютерный анализ текстов на естественном языке для решения задачи атрибуции текстов: синтаксический уровень

Краткое описание: изучение основных принципов компьютерного анализа текстов на естественном языке; практическая реализация методов атрибуции текстов, основанных на синтаксических признаках, на корпусе публицистических статей. Инструментальные средства: Excel, VBA, PHP и пр.

 

1. Рогов А. А., Седов А. В., Сидоров Ю. В., Суровцова Т. Г. Математические методы атрибуции текстов. (учебное пособие). Петрозаводск: Изд-во ПетрГУ, 2012. – 48 с.

2. Боярский К. К. Введение в компьютерную лингвистику : учебное пособие. СПб. : НИУ ИТМО, 2013. 72 с

3. Сидоров Ю. В., Смирнов Н.В. Вероятностные методы анализа неструктурированной текстовой информации. (учебное пособие). Петрозаводск: Изд-во ПетрГУ, 2012. – 56 с.

4. Информационная система «СМАЛТ» : [сайт]. URL:http://smalt.karelia.ru

 

2 курс,

09.03.02

Тема: Исследование использования расстояния между зависимыми частями речи в предложении для решения задачи атрибуции текстов

Краткое описание: исследование метрики «расстояние между зависимыми частями речи в предложении» при атрибуции публицистических статей. Инструментальные средства: Excel, VBA, PHP, MySQL, Python.

 

1. Reynolds R. Russian Natural Language Processing and Computer-assisted Language Learning : Capturing the benefits of deep morphological analysis in real-life applications : PhD thesis / Tromsø : Universitet i Tromsø. 2016. URL: https://munin.uit.no/handle/10037/9685

2. Боярский К. К. Введение в компьютерную лингвистику : учебное пособие. СПб. : НИУ ИТМО, 2013. 72 с

3. Информационная система «СМАЛТ» : [сайт]. URL:http://smalt.karelia.ru

 

2 курс, 09.03.04

Тема: Задача потокового преобразования речи в текст

Краткое описание: программное обеспечение, с помощью которого можно преобразовать речевую информацию в текстовую, уже давно существует. Однако найти приложения, которые позволяют распознавать любую слитную речь человека и отправлять полученный текст на множество устройств в режиме реального времени, становиться проблематичным.

 

1. Автоматическое распознавание речи. Учебное пособие. И.Б. Тампель, А.А. Карпов [Электронный ресурс]. URL: https://books.ifmo.ru/file/pdf/1921.pdf.

2. Синтез и распознавание речи. Современные решения. Александр Фролов, Григорий Фролов, 2003 [Электронный ресурс]. URL: http://www.frolov-lib.ru/books/hi/index.html.

3. Леонович А. А. Современные технологии распознавания речи [Электронный ресурс]. URL: http://masters.donntu.org/2012/iii/akopyan/library/article1.htm.

 

2 курс, 09.03.04

Тема: Задача сегментации речи нескольких дикторов

Краткое описание: в области анализа и обработки речи существуют задача

сегментации разговора нескольких участников на монологические составляющие. В западной литературе она также известна, как задача сегментации новостей. Существуют решения с предварительным обучением систем голосам дикторов, но для ситуации, когда заранее неизвестно количество дикторов и нет образцов их голосов, найти такое приложение становиться проблематичным.

 

1. Григорян Р. Л., Репалов С.А. Применение методов векторного квантования к задаче верификации дикторов // Материалы VI Междунар. науч.-практ. конф. «Методы и алгоритмы прикладной математики в технике, медицине и экономике». – Ч. 3. – Новочеркасск: ЮРГТУ. – 2004. – 48 с.

2. Григорян Р. Л., Репалов С.А., Коршунов С.С. Метод выделения монологических составляющих с использованием идентификации дикторов на основе векторного квантования. Научно-теоретический журнал "Искусственный интеллект" No.3'2006.

3. Репалов С. А. Разработка математических моделей и робастных алгоритмов идентификации дикторов по их речи : Дис. канд. физ.-мат. наук : 05.13.18 : Ростов н/Д, 2003 144 c. РГБ ОД, 61:04-1/242-X.

 

1 курс (магистратура)

Тема: Извлечение именованных сущностей в текстах дореформенной орфографии

Краткое описание: В области анализа естественных языков достаточно успешно реализована задача извлечения именованных сущностей для современных языков. Целью работы является изучение возможностей современных языковых моделей к извлечению именованных сущностей из текстов дореволюционной орфографии. Инструментальные средства: Python, PHP и пр.

 

1. Mozharova V., Loukachevitch N. Combining Knowledge and CRF-based Approach to Named Entity Recognition in Russian // Proc. the 5th International Conference on Analysis of Images, Social Networks, and Texts, AIST’2016. – 2016

2. Трофимов И. В. Выявление личных имен в новостных текстах на материале коллекций Persons-1000/1111-F // RCDL-2014. − 2014.

3. Ivanin, V., Artemova, E., Batura, T., Ivanov, V., Sarkisyan, V., Tutubalina, E., & Smurov, I. RuREBus-2020 Shared Task: Russian Relation Extraction for Business // Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialog”. 2020. URL:

http://www.dialog-21.ru/media/5098/ivaninvaplusetal-182.pdf

 

1 курс (магистратура)

Тема: Реализация косинусного расстояния в методе оценки парной связи грамматических классов для атрибуции литературных текстов

Краткое описание: исследование методики оценки парной связи грамматических классов, ее модификация и оценка получаемых результатов при атрибуции публицистических статей. Инструментальные средства: Excel, VBA, PHP.

1. От Нестора до Фонвизина: новые методы определения авторства // Милов Л.В., Бородкин Л.И., Иванова Т.В. и др.; Под ред. Л.В.Милова. -М.: Прогресс,1994. – 445 с.

2. Сидоров Ю. В. Математическая и информационная поддержка методов обработки литературных текстов на основе формально-грамматических параметров. Диссертация на соискание ученой степени канд. техн. наук. Петрозаводск, 2002. – 127 с.

3. Суровцова Т.Г. Использование метода «сильного графа» при анализе синтаксического разбора публицистических произведений Ф.М. Достоевского. Труды Петрозаводского государственного университета. Сер. «Прикладная математика и информатика». Вып. 12. Петрозаводск: Изд-во ПетрГУ, 2007. – C. 62-70.

4. Информационная система «СМАЛТ» : [сайт]. URL: http://smalt.karelia.ru/shower/research/sidorov.php?type=new

 

Смирнов Николай Васильевич, к.т.н., доцент

Email:  smirnovn@petrsu.ru

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

1, магистратура,

ИСИТ, Прикладная математика и информатика,

Тема: Суммаризация и реферирование текста

 

Изучение и применение методов машинного обучения, нейронных сетей для получения и краткого пересказа текста.

Для магистрантов гр. 22503, 22505

1, магистратура,

ИСИТ, Прикладная математика и информатика,

Тема: Выявление дубликатов в тексте

 

Изучение и применение методов выявления явного и неявного дублирования текста.

 

Для магистрантов гр. 22503, 22505

1, магистратура,

ИСИТ

Тема: Разработка интеллектуального ассистента

 

Семенов Н. Д., гр. 22505.


Дата обновления: 20.02.2024