Темы кафедры теории вероятностей и анализа данных
logo linux tux (c) Larry Ewing

Институт математики и информационных технологий vk

ИМИТ


Темы кафедры теории вероятностей и анализа данных

Рогов Александр Александрович, д.т.н., профессор, заф. кафедрой ТВиАД

Email: rogov@petrsu.ru

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

5 курс ИСиТ (заочники)

Тема: Применение деревьев решений для атрибуции текстов

 

5 курс ИСиТ (заочники)

Тема: Методы выделения чужеродных фрагментов в тексте

 

5 курс ИСиТ (заочники)

Тема: Методы проверки текстов на однородность

 

 

Крижановский Андрей Анатольевич, к.т.н., доцент кафедры ТВиАД

Email: andrew.krizhanovsky@gmail.com     vk.com/componavt

Полный список задач с комментариями по ссылке: https://bit.ly/3kFG8Tz

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента,
№ группы

2 или 3 курс,

ПМиИ

Разработка корпусного менеджера в виде мобильного приложения.

Написать приложение на Андроид с упрощённым интерфейсом к многоязычному словарю корпуса текстов ВепКар. Обеспечить поиск по словарю и по текстам. Корпус текстов онлайн: http://dictorpus.krc.karelia.ru/ru

Разработка с нуля или продолжение разработки проекта sanahelmi с открытым исходным кодом (https://github.com/componavt/sanahelmi)

 

2 или 3 курс,

ИСиТ

Разработка алгоритма кластеризации карельских слов по лингвистическим признакам.

Есть база данных со словами. У каждого слова есть набор признаков и географическая привязка. Нужно (1) выполнить кластеризацию слов по заданному признаку, (2) визуализировать группы слов на карте.

 

2 или 3 курс,

ПМиИ

Разработка образовательной игры в виде мобильного приложения или веб-приложения.

Разработка игрового приложения с использованием Викиданных. См. пример разработанного студентами сайта: http://artolela.krc.karelia.ru/ipatova/. И текстовое описание к игре: https://w.wiki/bJE

 

2 или 3 курс,

ПМиИ

Построение и использование базы данных иллюстраций к словарным статьям Викисловаря.

Построить базу иллюстраций. Написать программу, использующую иллюстрации и данные словарных статей Викисловаря, хранимые в базе wikokit.

См. https://github.com/componavt/wikokit/wiki/Image.py-postprocessing

 

 

Мазалов Владимир Викторович, д.ф.-м.н., профессор кафедры ТВиАД

Email: vmazalov@krc.Karelia.ru

№ курса и Направление

Социальные сети и графы.

ФИО студента, № группы

 

Тема: Моделирование социальных сетей 

 
 

Тема: Сетевые игры

 
 

Тема: Равновесие транспортных потоков

 
 

Тема: Управление динамикой мнений.

 

 

Марахтанов Алексей Георгиевич, директор Центра искусственного интеллекта

Email: marahtanov@petrsu.ru

Рогов Александр Александрович, д.т.н., проф., зав. кафедрой Теории вероятностей и анализа данных

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

3 или 4

Тема: Определение расстояния и линейных размеров движущихся объектов с помощью стереозрения

 

Проблема определения расстояния от камеры до объекта, а также линейных размеров объектов (длины, ширины, высоты) часто встречается в задачах, связанных с анализом видеоданных. Например, беспилотный транспорт

может использовать эту информацию при определении препятствий и проектирования оптимального маршрута движения. Одним из способов решения задачи является использование специального оборудования (лидаров, стереокамер, ToF камер и пр.), возвращающего дополнительные данные, позволяющие определить размеры объектов и расстояния до них. В процессе реализации работы будут проведены исследования и разработки в области применения стереозрения в различных практических областях.  

 

 

3 или 4

Тема: Определение эмоционального состояния человека методами интеллектуального анализа данных

 

Эмоциональное состояние человека может быть определено на основе анализа видеоданных (трансляций с камер видеонаблюдения), анализа текстовых

данных (сообщения в мессенджере или письма), анализа аудиоданных (звук голоса). Знание эмоционального состояния позволит выработать оптимальную стратегию человеко-машинного взаимодействия, оценить контент, с которым работает пользователь. В процессе реализации работы будет проведено исследование существующих методов определения эмоционального состояния и будет разработан прототип программного продукта.

 

 

3 или 4

Тема: Разработка сервиса рекомендаций для площадок с низкой и средней

посещаемостью

 

Сервисы рекомендаций позволяют повысить лояльность пользователей, увеличить число и объем продаж. Во многих случаях для создания сервиса необходимо обучение на больших объемах данных. Однако для площадок с низкой и средней посещаемостью (нишевые интернет-магазины, библиотеки, СМИ) собрать большой дата-сет не представляется возможным. В работе будут изучены существующие рекомендательные системы, предложены решения для обозначенной проблемы, создан сервис рекомендаций для одной из площадок со средней посещаемостью.

 

 

 

Павлов Юрий Леонидович, д.ф.-м.н., профессор кафедры ТВиАД

Email: Pavlov@krc.Karelia.ru

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

2 и 3 курсы, 01.03.01 математика, 01.03.02 прикладная математика

Тема: Моделирование сети Интернет

Краткое описание. Предполагается изучение свойств и методов моделирования сложных сетей коммуникаций, таких как Интернет, социальные сети, сети мобильной связи. В основе таких моделей лежит теория случайных графов. Используемый математический аппарат: дискретная математика (теория графов и комбинаторика), математический анализ. 

 

 

 

Сидоров Юрий Владимирович, к.т.н., доцент кафедры теории вероятностей и анализа данных

Email: yurysidorov76@gmail.com

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

09.03.04 - Программная инженерия

Тема: Адаптация синтаксического анализатора MaltParser для работы с дореформенной орфографией русского языка 

22407 Н.В. Гальминас

09.03.04 - Программная инженерия

Тема: Адаптация морфологического анализатора TreeTager для работы с дореформенной орфографией русского языка 

22407 Л. А. Иванов

 

Тема: Реализация метода оценки парной связи грамматических классов для атрибуции литературных текстов

Краткое описание: исследование методики оценки парной связи грамматических классов, ее модификация и оценка получаемых результатов при атрибуции публицистических статей. Инструментальные средства: Excel, VBA, PHP.

1. От Нестора до Фонвизина: новые методы определения авторства // Милов Л.В., Бородкин Л.И., Иванова Т.В. и др.; Под ред. Л.В.Милова. -М.: Прогресс,1994. – 445 с.

2. Сидоров Ю. В. Математическая и информационная поддержка методов обработки литературных текстов на основе формально-грамматических параметров. Диссертация на соискание ученой степени канд. техн. наук. Петрозаводск, 2002. – 127 с.

3. Суровцова Т.Г. Использование метода «сильного графа» при анализе синтаксического разбора публицистических произведений Ф.М. Достоевского. Труды Петрозаводского государственного университета. Сер. «Прикладная математика и информатика». Вып. 12. Петрозаводск: Изд-во ПетрГУ, 2007. – C. 62-70.

4. Информационная система «СМАЛТ» : [сайт]. URL:http://smalt.karelia.ru

 

 

Тема: Исследование использования расстояния между зависимыми частями речи в предложении для решения задачи атрибуции текстов

Краткое описание: исследование метрики «расстояние между зависимыми частями речи в предложении» при атрибуции публицистических статей. Инструментальные средства: Excel, VBA, PHP.

 

1. Reynolds R. Russian Natural Language Processing and Computer-assisted Language Learning : Capturing the benefits of deep morphological analysis in real-life applications : PhD thesis / Tromsø : Universitet i Tromsø. 2016. URL: https://munin.uit.no/handle/10037/9685

2. Боярский К. К. Введение в компьютерную лингвистику : учебное пособие. СПб. : НИУ ИТМО, 2013. 72 с

3. Информационная система «СМАЛТ» : [сайт]. URL:http://smalt.karelia.ru 

 

ИСиТ

Тема: Задача сегментации речи нескольких дикторов

Краткое описание: в области анализа и обработки речи существуют задача

сегментации разговора нескольких участников на монологические составляющие. В западной литературе она также известна, как задача сегментации новостей. Существуют решения с предварительным обучением систем голосам дикторов, но для ситуации, когда заранее неизвестно количество дикторов и нет образцов их голосов, найти такое приложение становиться проблематичным.

 1. Григорян Р. Л., Репалов С.А. Применение методов векторного квантования к задаче верификации дикторов // Материалы VI Междунар. науч.-практ. конф. «Методы и алгоритмы прикладной математики в технике, медицине и экономике». – Ч. 3. – Новочеркасск: ЮРГТУ. – 2004. – 48 с.

2. Григорян Р. Л., Репалов С.А., Коршунов С.С. Метод выделения монологических составляющих с использованием идентификации дикторов на основе векторного квантования. Научно-теоретический журнал "Искусственный интеллект" No.3'2006.

3. Репалов С. А. Разработка математических моделей и робастных алгоритмов идентификации дикторов по их речи : Дис. канд. физ.-мат. наук : 05.13.18 : Ростов н/Д, 2003 144 c. РГБ ОД, 61:04-1/242-X.

22505 М. П. Бровин

 

Тема: Задача потокового преобразования речи в текст

Краткое описание: программное обеспечение, с помощью которого можно преобразовать речевую информацию в текстовую, уже давно существует. Однако найти приложения, которые позволяют распознавать любую слитную речь человека и отправлять полученный текст на множество устройств в режиме реального времени, становиться проблематичным.

 1. Автоматическое распознавание речи. Учебное пособие. И.Б. Тампель, А.А. Карпов [Электронный ресурс]. URL: https://books.ifmo.ru/file/pdf/1921.pdf.

2. Синтез и распознавание речи. Современные решения. Александр Фролов, Григорий Фролов, 2003 [Электронный ресурс]. URL: http://www.frolov-lib.ru/books/hi/index.html.

3. Леонович А. А. Современные технологии распознавания речи [Электронный ресурс]. URL: http://masters.donntu.org/2012/iii/akopyan/library/article1.htm.

 

 

 

Смирнов Николай Васильевич, к.т.н., доцент каф. ТВиАД

Email: smirnovn@petrsu.ru

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

4 курс, ПИ

Тема: Машинное обучение в задаче классификации эмоций 

А. С. Чернышов, 22407

4 курс, ПИ

Тема: Классификация пользователей по курсорному подчерку

А. С. Трифонов, 22407

 

 

 


Дата обновления: 13.10.2021