Темы кафедры теории вероятностей и анализа данных
Данилова Инна Владимировна, старший преподаватель
Email: DanilovaInna1987@mail.ru
№ курса и Направление |
Тема (название темы, краткое описание и список рекомендуемой литературы) |
ФИО студента, № группы |
2 курс, 01.03.01 «Математика» |
Тема: Распределение Больцмана в задаче оптимизации численности одновидовой популяции на двух участках с учетом миграции между ними. Краткое описание: Рассматривается задача оптимизации численности популяции на двух участках с учетом миграции популяции между этими участками. Под участком понимается территория, на которой обитает популяция. Пусть p – доля численности популяции, оставшейся на рассматриваемом участке, она описывается распределением Больцмана. Нужно определить при каких значениях параметра q, входящего в распределение Больцмана, численность на обоих участках будет оптимальной. Параметр q характеризует рациональность выбора популяцией участка. |
|
2 курс, 01.03.01 «Математика» |
Тема: Распределение Больцмана в задаче миграции трудоспособного населения на территории Российской Федерации Краткое описание: Рассматривается задача миграции трудоспособного населения на территории РФ с учетом распределения Больцмана. В распределение Больцмана входит управляющий параметр, характеризующий рациональность выбора населением той или иной территории и функции полезности, характеризующие «притягательность» рассматриваемых территорий. При этом, на выбор территории влияют следующие факторы: доход, грамотность населения, продолжительность жизни. Нужно составить модель, описывающую динамику численности населения на заданных территориях с учетом распределения Больцмана и факторов, влияющих на выбор, провести численный анализ предложенной модели на языке программирования Python. На данном этапе: Сбор статистических данных, знакомство с распределением Больцмана, составление функции полезности, входящей в распределение Больцмана с учетом перечисленных факторов. Анализ ее влияния на выбор. |
|
2 курс, 01.03.01 «Математика» |
Тема: Влияние меры информированности на выбор популяцией участка с учетом искажения информации о нем Краткое описание: Рассматривается задача выбора популяцией участка. Под участком понимается территория, на которой обитает популяция. Выбор участка описывается распределением Больцмана. В распределение Больцмана входит функция полезности, которая включает в себя меру информированности о качестве участка. Ранее рассматривалась задача влияния меры информированности на оценку участка с учетом накопления информации о нем без учета искажения информации. В данной задаче искажение учитывается. Нужно проанализировать влияние этого искажения на выбор. |
|
Крижановский Андрей Анатольевич, доцент
andrew.krizhanovsky@gmail.com vk.com/componavt
Полный список задач с комментариями по ссылке: https://bit.ly/3kFG8Tz
Для тех, кому интересно решение задач, связанных с вычислительной лингвистикой или Викиданными. Кто умеет или хочет научиться программировать.
Приглашаю выполнять квалификационные и курсовые работы под моим руководством.
Вы можете предложить свою задачу
№ курса и Направление |
Тема (название темы, краткое описание и список рекомендуемой литературы) |
ФИО студента, № группы |
Любой курс (можно заочника м, можно магистрам) |
Классификация текстов по стилевым особенностям (реклама). Анализ текстов Википедии с пометой w:Шаблон:Реклама и en:w:Template:Advert (на основе словарных помет и лексикона, на основе нейронных сетей). Автоматическое определение «рекламного» стиля текста. Взять статьи Википедии о персонах. Разбить на две группы: с пометой “реклама” и без рекламы. Обучить нейронную сеть на этих двух группах. Проверить точность работы на новых статьях. Можно использовать корпус рекламы на русском языке: versusvoid/RuLanAdCor |
|
Любой курс (можно заочника м, можно магистрам) |
Сравнить уровень гениальности математиков, живших в разное время по Викиданным. Выбрать и формализовать понятие «гениальности». Вывести список математиков, рассчитать количество лет их жизни и их уровень гениальности, поделить гениальность на года, вывести результаты в виде графика. См. работы: • Кузнецова Э. Э. «Построение рейтинга математиков и анализ научных областей по Викиданным», 2017. • Трубина Е. Д. «Ранжирование отечественных |
|
Любой курс (можно заочника м, можно магистрам) |
Разработка образовательной игры в виде мобильного приложения или веб-приложения. Разработка игрового приложения с использованием Викиданных. См. пример разработанного студентами сайта: http://artolela.krc.karelia.ru/ipatova/. И текстовое описание к игре: https://w.wiki/bJE |
|
Любой курс (можно заочника м, можно магистрам) |
Разработка игры по угадыванию голоса актёра в виде мобильного приложения Создаём базу данных: голос актёра, данные актёра (с Викиданных). Программа (для Android) показывает несколько фотографий и произносит фразу (фрагмент из фильма, спектакля) голосом одного из актёров. Нужно угадать - кто это. Научная составляющая: сгруппировать актёров по характеристикам голоса. |
|
Любой курс (можно заочника м, можно магистрам) |
Построение и использование базы данных иллюстраций к словарным статьям Викисловаря. Построить базу иллюстраций. Написать программу, использующую иллюстрации и данные словарных статей Викисловаря, хранимые в базе wikokit. См. https://github.com/componavt/wikokit/wiki/Image.py- postprocessing |
|
Любой курс |
Разработка игрового приложения с помощью библиотеки wikxhibit (Mavo + Shapir). Задача по угадыванию голоса персоны. Commons:WikiVoices — проект создания общедоступного аудиобанка голосов известных людей. С помощью библиотеки Wikxhibit можно представлять Викиданные на своих сайтах. Библиотека Wikxhibit связывает, во-первых, Викиданные с HTML-расширением Mavo. Во-вторых, библиотека Shapir расширяет возможности Mavo и связывает Викиданные с другими сайтами (например, YouTube, Нью-Йорк таймс). Документация: https://wikxhibit.org/doc Демо: https://wikxhibit.org С помощью конструктора можно создать HTML-страничку с Викиданными прямо сейчас. Конструктор: https://wikxhibit.org/create Вот пример игры в угадывание страны: https://wikxhibit.org/countries/ В основе библиотеки лежит код проекта Shapir https://github.com/tarfahalrashed/Shapir |
|
Любой курс |
Генератор кроссворда и интерфейс для игры 1) Разработать алгоритм укладки слов на прямоугольник заданного размера (типа матрицы). Экспорт кроссворда. В алгоритме нужно максимизировать число слов, которые помещаются в прямоугольник. Или максимизировать число пересечений для этих слов. Есть словарь карельских слов с толкованиями (переводы на русский язык). Выбрать подмножество слов для генерации кроссворда. 2) Разработать интерфейс (Андроид) для игры в кроссворд. Импорт кроссворда. |
|
Мазалов Владимир Викторович, д.ф.-м.н., профессор
Email: vmazalov@krc.Karelia.ru
№ курса и Направление |
Тема (название темы, краткое описание и список рекомендуемой литературы) |
ФИО студента, № группы |
3 курс, ПМиИ |
Тема: Методы кооперативной теории игр для анализа текстов |
Дробная Полина, гр. 22304 |
3 курс, ПМиИ |
Тема: Транспортная задача и теория игр |
|
3 курс, ПМиИ |
Тема: Переговоры и теория игр |
|
3 курс, ПМиИ |
Тема: Социальные сети и теория игр |
|
Павлов Юрий Леонидович, д.ф.-м.н., профессор
Email: pavlov@krc.karelia.ru
№ курса и Направление |
Тема (название темы, краткое описание и список рекомендуемой литературы) |
ФИО студента, № группы |
2-3 курс 01.03.01 01.03.02 |
Тема: Случайные графы и моделирование сети Интернет Краткое описание Исследование свойств моделей случайных графов, предназначенных для описания структуры и динамики современных сложных сетей коммуникаций, таких как Интернет. Источники: Ю.Л. Павлов. Случайные графы. Петрозаводск, ПетрГУ, 2013. А.М. Райгородский. Модели случайных графов. Москва, МЦНМО, 2011. |
|
1 курс магистры 01.03.01 01.03.02 |
Тема: Конфигурационные графы и моделирование сложных сетей коммуникаций Краткое описание: Исследование свойств конфигурационных графов, предназначенных для описания структуры и динамики современных сложных сетей коммуникаций. Источники: Ю.Л. Павлов. Случайные графы. Петрозаводск, ПетрГУ, 2013. А.М. Райгородский. Модели случайных графов. Москва, МЦНМО, 2011. |
|
Рогов Александр Александрович, д.т.н., профессор, зав.каф. ТВиАД
Email: rogov@petrsu.ru
№ курса и Направление |
Тема (название темы, краткое описание и список рекомендуемой литературы) |
ФИО студента, № группы |
2 курс ПМиИ, ИСиТ |
Тема: Модель трансформера Краткое описание: Провести анализ существующих моделей трансформера, их достоинства и недостатки, реализовать одну из моделей и проверить ее работу классификации литературных текстов. |
С.А. Садиех |
2 курс ПМиИ, ИСиТ |
Тема: Закон Ципфа Краткое описание: Проверить на реальных данных гипотезу американского специалиста по биоинформатике Вэньтянь Ли[en] о том, вероятность случайного появления какого-либо слова длиной n в цепочке случайных символов уменьшается с ростом n в той же пропорции, в какой растёт при этом ранг этого слова в частотном списке (порядковой шкале). Потому произведение ранга слова на его частотность есть константа. |
|
2 курс ПМиИ, ИСиТ |
Тема: Метод сильного графа Краткое описание: разобраться в методике и проверить ее работоспособность на реальных данных. Требуется написать соответствующую компьютерную программу. |
|
2,3 курс ПМиИ, ИСиТ |
Тема: Визуализация методов кластерного анализа Краткое описание: Требуется написать компьютерную программу, которая будет визуализировать исходные данные (двухмерный случай) и работу различных методов кластерного анализа. |
|
3 курс ПМиИ, ИСиТ |
Тема: Визуализация коэффициентов корреляции Краткое описание: Требуется написать компьютерную программу, которая будет визуализировать облако рассеивания (двухмерный случай) и коэффициенты корреляции. |
|
4 курс, ПМиИ, ИСиТ |
Тема: Скрытые марковские модели Краткое описание: разобраться в модели, рассмотреть разные компьютерные реализации вычисления параметров модели, подготовить визуализацию примеров. |
|
4 курс, ПМиИ, ИСиТ |
Тема: Сравнение графовых моделей Краткое описание: рассмотреть различные методы сравнения графовых моделей реализовать их в виде компьютерной программы. Провести эксперименты.
|
|
4 курс, ПМиИ, ИСиТ |
Тема: Способы визуализации графовых моделей Краткое описание: Требуется провести анализ и написать компьютерную программу, которая будет визуализировать графы разными методами. |
|
4 курс, ПМиИ, ИСиТ |
Тема: Трансформер и его реализации Краткое описание: Провести анализ существующих моделей трансформера, их достоинства и недостатки, реализовать одну из моделей и проверить ее работу на реальных данных. |
|
Сидоров Юрий Владимирович, к.т.н., доцент кафедры ТВиАД
Email: yurysidorov76@gmail.com
№ курса и Направление |
Тема (название темы, краткое описание и список рекомендуемой литературы) |
ФИО студента, № группы |
Магистранты1 курс, УД |
Тема: Формирование набора данных для адаптации синтаксических анализаторов для работы с языком дореволюционной России |
22505 Н.В. Гальминас |
Магистранты 1 курс, УД |
Тема: Разработка словаря для адаптации морфологических анализаторов к работе с дореволюционным русским языком |
22505 Л. А. Иванов |
4 курс, Системное и прикладное программное обеспечение |
Тема: Исследование использования расстояния между зависимыми частями речи в предложении для решения задачи атрибуции текстов Краткое описание: исследование метрики «расстояние между зависимыми частями речи в предложении» при атрибуции публицистических статей. Инструментальные средства: Excel, VBA, PHP, MySQL, Python.
1. Reynolds R. Russian Natural Language Processing and Computer-assisted Language Learning : Capturing the benefits of deep morphological analysis in real-life applications : PhD thesis / Tromsø : Universitet i Tromsø. 2016. URL: https://munin.uit.no/handle/10037/9685 2. Боярский К. К. Введение в компьютерную лингвистику : учебное пособие. СПб. : НИУ ИТМО, 2013. 72 с 3. Информационная система «СМАЛТ» : [сайт]. URL:http://smalt.karelia.ru |
|
4 курс, Системное и прикладное программное обеспечение |
Тема: Применение методов кластеризации при решении задачи атрибуции текстов Краткое описание: Как правило, атрибуция текстов рассматривается как задача их классификации. Вместе с тем, для определенных текстов (публицистических, малого объема и т.п.) характерно внешнее влияние (редакторские правки и т.п.), что может приводить к противоречивым результатам классификации. Поэтому, целесообразным выглядит первоначальная кластеризация рабочего материала с целью выработки последующих решений по его исследованию. Инструментальные средства: Excel, VBA, PHP, MySQL, Python и пр.
1. Сидоров Ю. В. Математическая и информационная поддержка методов обработки литературный текстов на основе формально-грамматических параметров : специальность 05.13.18 «Математическое моделирование, численные методы и комплексы программ» : диссертация на соискание ученой степени кандидата технических наук / Сидоров Юрий Владимирович ; Санкт-Пет. ин-т информатики и автоматизации. — Санкт-Петербург, 2002. — 127 с. 2. Мандель И.Д. Кластерный анализ. М., «Финансы и статистика», 1988.- 176 с.. 3. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Классификация и снижение размерности. — М.: Финансы и статистика, 1989. — 607 с. |
|
3 курс, Системное и прикладное программное обеспечение |
Тема: Компьютерный анализ текстов на естественном языке для решения задачи атрибуции текстов: морфологический уровень Краткое описание: изучение основных принципов компьютерного анализа текстов на естественном языке; практическая реализация методов атрибуции текстов, основанных на морфологических признаках, на корпусе публицистических статей. Инструментальные средства: Excel, VBA, PHP и пр.
1. Рогов А. А., Седов А. В., Сидоров Ю. В., Суровцова Т. Г. Математические методы атрибуции текстов. (учебное пособие). Петрозаводск: Изд-во ПетрГУ, 2012. – 48 с. 2. Боярский К. К. Введение в компьютерную лингвистику : учебное пособие. СПб. : НИУ ИТМО, 2013. 72 с 3. Сидоров Ю. В., Смирнов Н.В. Вероятностные методы анализа неструктурированной текстовой информации. (учебное пособие). Петрозаводск: Изд-во ПетрГУ, 2012. – 56 с. 4. Информационная система «СМАЛТ» : [сайт]. URL:http://smalt.karelia.ru |
|
3 курс, Системное и прикладное программное обеспечение |
Тема: Компьютерный анализ текстов на естественном языке для решения задачи атрибуции текстов: синтаксический уровень Краткое описание: изучение основных принципов компьютерного анализа текстов на естественном языке; практическая реализация методов атрибуции текстов, основанных на синтаксических признаках, на корпусе публицистических статей. Инструментальные средства: Excel, VBA, PHP и пр.
1. Рогов А. А., Седов А. В., Сидоров Ю. В., Суровцова Т. Г. Математические методы атрибуции текстов. (учебное пособие). Петрозаводск: Изд-во ПетрГУ, 2012. – 48 с. 2. Боярский К. К. Введение в компьютерную лингвистику : учебное пособие. СПб. : НИУ ИТМО, 2013. 72 с 3. Сидоров Ю. В., Смирнов Н.В. Вероятностные методы анализа неструктурированной текстовой информации. (учебное пособие). Петрозаводск: Изд-во ПетрГУ, 2012. – 56 с. 4. Информационная система «СМАЛТ» : [сайт]. URL:http://smalt.karelia.ru |
|
5 курс, заочное отделение, ИСиТ |
Тема: Извлечение именованных сущностей в текстах дореформенной орфографии Краткое описание: В области анализа естественных языков достаточно успешно реализована задача извлечения именованных сущностей для современных языков. Целью работы является изучение возможностей современных языковых моделей к извлечению именованных сущностей из текстов дореволюционной орфографии. Инструментальные средства: Python, PHP и пр.
1. Mozharova V., Loukachevitch N. Combining Knowledge and CRF-based Approach to Named Entity Recognition in Russian // Proc. the 5th International Conference on Analysis of Images, Social Networks, and Texts, AIST’2016. – 2016 2. Трофимов И. В. Выявление личных имен в новостных текстах на материале коллекций Persons-1000/1111-F // RCDL-2014. − 2014. 3. Ivanin, V., Artemova, E., Batura, T., Ivanov, V., Sarkisyan, V., Tutubalina, E., & Smurov, I. RuREBus-2020 Shared Task: Russian Relation Extraction for Business // Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialog”. 2020. URL: http://www.dialog-21.ru/media/5098/ivaninvaplusetal-182.pdf |
|
5 курс, заочное отделение, ИСиТ |
Тема: Задача потокового преобразования речи в текст Краткое описание: программное обеспечение, с помощью которого можно преобразовать речевую информацию в текстовую, уже давно существует. Однако найти приложения, которые позволяют распознавать любую слитную речь человека и отправлять полученный текст на множество устройств в режиме реального времени, становиться проблематичным.
1. Автоматическое распознавание речи. Учебное пособие. И.Б. Тампель, А.А. Карпов [Электронный ресурс]. URL: https://books.ifmo.ru/file/pdf/1921.pdf. 2. Синтез и распознавание речи. Современные решения. Александр Фролов, Григорий Фролов, 2003 [Электронный ресурс]. URL: http://www.frolov-lib.ru/books/hi/index.html. 3. Леонович А. А. Современные технологии распознавания речи [Электронный ресурс]. URL: http://masters.donntu.org/2012/iii/akopyan/library/article1.htm. |
|
Смирнов Н.В., доцент
Email: smirnov_work@mail.ru
№ курса и Направление |
Тема (название темы, краткое описание и список рекомендуемой литературы) |
ФИО студента, № группы |
Магистратура, 1 курс, ИСИТ |
Тема: Задачи видеоаналитики транспортных потоков |
Воронин Вениамин Юрьевич, гр. 22505 |
Магистратура, 1 курс, ИСИТ |
Тема: Идентификация спортсменов на изображении |
Сенева Анна Константиновна, гр. 22505 |
Магистратура, 1 курс |
Тема: Разработка интеллектуального ассистента приемной кампании вуза |
Трифонов Алексей Сергеевич, гр. 22503 |
Бакалавриат, 4 курс, Программная инженерия |
Тема: Распознавание эмоционального состояния человека в шлеме дополненной реальности
|
Семенов Никита, гр. 22407 |
Дата обновления: 18.10.2022