logo linux tux (c) Larry Ewing

Институт математики и информационных технологий vk

ИМИТ


Темы кафедры теории вероятностей и анализа данных

Данилова Инна Владимировна, старший преподаватель

Email: DanilovaInna1987@mail.ru

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

2 курс, 01.03.01 «Математика»

Тема: Распределение Больцмана в задаче оптимизации численности одновидовой популяции на двух участках с учетом миграции между ними.

Краткое описание: Рассматривается задача оптимизации численности популяции на двух участках с учетом миграции популяции между этими участками. Под участком понимается территория, на которой обитает популяция. Пусть p – доля численности популяции, оставшейся на рассматриваемом участке, она описывается распределением Больцмана. Нужно определить при каких значениях параметра q, входящего в распределение Больцмана, численность на обоих участках будет оптимальной. Параметр q характеризует рациональность выбора популяцией участка.

 

2 курс, 01.03.01 «Математика»

Тема: Распределение Больцмана в задаче миграции трудоспособного населения на территории Российской Федерации

Краткое описание: Рассматривается задача миграции трудоспособного населения на территории РФ с учетом распределения Больцмана. В распределение Больцмана входит управляющий параметр, характеризующий рациональность выбора населением той или иной территории и функции полезности, характеризующие «притягательность» рассматриваемых территорий. При этом, на выбор территории влияют следующие факторы: доход, грамотность населения, продолжительность жизни. Нужно составить модель, описывающую динамику численности населения на заданных территориях с учетом распределения Больцмана и факторов, влияющих на выбор, провести численный анализ предложенной модели на языке программирования Python.

На данном этапе: Сбор статистических данных, знакомство с распределением Больцмана, составление функции полезности, входящей в распределение Больцмана с учетом перечисленных факторов. Анализ ее влияния на выбор. 

 

2 курс, 01.03.01 «Математика»

Тема: Влияние меры информированности на выбор популяцией участка с учетом искажения информации о нем

Краткое описание: Рассматривается задача выбора популяцией участка. Под участком понимается территория, на которой обитает популяция. Выбор участка описывается распределением Больцмана. В распределение Больцмана входит функция полезности, которая включает в себя меру информированности о качестве участка. Ранее рассматривалась задача влияния меры информированности на оценку участка с учетом накопления информации о нем без учета искажения информации. В данной задаче искажение учитывается. Нужно проанализировать влияние этого искажения на выбор.

 

Крижановский Андрей Анатольевич, доцент

andrew.krizhanovsky@gmail.com     vk.com/componavt

Полный список задач с комментариями по ссылке: https://bit.ly/3kFG8Tz

Для тех, кому интересно решение задач, связанных с вычислительной лингвистикой или Викиданными. Кто умеет или хочет научиться программировать.

Приглашаю выполнять квалификационные и курсовые работы под моим руководством.

Вы можете предложить свою задачу

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

Любой курс (можно заочника м, можно магистрам)

Классификация текстов по стилевым особенностям (реклама).

Анализ текстов Википедии с пометой w:Шаблон:Реклама и en:w:Template:Advert (на основе словарных помет и лексикона, на основе нейронных сетей). Автоматическое определение «рекламного» стиля текста.

Взять статьи Википедии о персонах. Разбить на две группы: с пометой “реклама” и без рекламы. Обучить нейронную сеть на этих двух группах. Проверить точность работы на новых статьях.

Можно использовать корпус рекламы на русском языке: versusvoid/RuLanAdCor

 

Любой курс (можно заочника м, можно магистрам)

Сравнить уровень гениальности математиков, живших в разное время по Викиданным.

Выбрать и формализовать понятие «гениальности». Вывести список математиков, рассчитать количество лет их жизни и их уровень гениальности, поделить гениальность на года, вывести результаты в виде графика.

См. работы:

•        Кузнецова Э. Э. «Построение рейтинга математиков и анализ научных областей по Викиданным», 2017.

•        Трубина Е. Д. «Ранжирование отечественных

математиков и научных сообществ мира», 2021.

 

Любой курс (можно заочника м, можно магистрам)

Разработка образовательной игры в виде мобильного приложения или веб-приложения.

Разработка игрового приложения с использованием

Викиданных. См. пример разработанного студентами сайта: http://artolela.krc.karelia.ru/ipatova/. И текстовое описание к игре: https://w.wiki/bJE

 

Любой курс (можно заочника м, можно магистрам)

Разработка игры по угадыванию голоса актёра в виде мобильного приложения

Создаём базу данных: голос актёра, данные актёра (с Викиданных).

Программа (для Android) показывает несколько фотографий и произносит фразу (фрагмент из фильма, спектакля) голосом одного из актёров. Нужно угадать - кто это.

Научная составляющая: сгруппировать актёров по характеристикам голоса.

 

Любой курс (можно заочника м, можно магистрам)

Построение и использование базы данных иллюстраций к словарным статьям Викисловаря.

Построить базу иллюстраций. Написать программу, использующую иллюстрации и данные словарных статей Викисловаря, хранимые в базе wikokit.

См. https://github.com/componavt/wikokit/wiki/Image.py- postprocessing

 

Любой курс

Разработка игрового приложения с помощью библиотеки wikxhibit (Mavo + Shapir). Задача по угадыванию голоса персоны.

Commons:WikiVoices — проект создания общедоступного аудиобанка голосов известных людей.

С помощью библиотеки Wikxhibit можно представлять Викиданные на своих сайтах.

Библиотека Wikxhibit связывает, во-первых, Викиданные с HTML-расширением Mavo. Во-вторых, библиотека Shapir расширяет возможности Mavo и связывает Викиданные с другими сайтами (например, YouTube, Нью-Йорк таймс).

Документация: https://wikxhibit.org/doc

Демо: https://wikxhibit.org

С помощью конструктора можно создать HTML-страничку с Викиданными прямо сейчас. Конструктор: https://wikxhibit.org/create

Вот пример игры в угадывание страны: https://wikxhibit.org/countries/

В основе библиотеки лежит код проекта Shapir https://github.com/tarfahalrashed/Shapir

 

Любой курс

Генератор кроссворда и интерфейс для игры

1) Разработать алгоритм укладки слов на прямоугольник заданного размера (типа матрицы). Экспорт кроссворда.

В алгоритме нужно максимизировать число слов, которые помещаются в прямоугольник. Или максимизировать число пересечений для этих слов.

Есть словарь карельских слов с толкованиями (переводы на русский язык). Выбрать подмножество слов для генерации кроссворда.

2)  Разработать интерфейс (Андроид) для игры в кроссворд. Импорт кроссворда.

 

Мазалов Владимир Викторович, д.ф.-м.н., профессор

Email:  vmazalov@krc.Karelia.ru

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

3 курс, ПМиИ

Тема:

Методы кооперативной теории игр для анализа текстов

Дробная Полина,

гр. 22304

3 курс, ПМиИ

Тема:

Транспортная задача и теория игр

 

3 курс, ПМиИ

Тема:

Переговоры и теория игр

 

3 курс, ПМиИ

Тема:

Социальные сети и теория игр

 

 

Павлов Юрий Леонидович, д.ф.-м.н., профессор

Email: pavlov@krc.karelia.ru

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

2-3 курс

01.03.01

01.03.02

Тема: Случайные графы и моделирование сети Интернет

Краткое описание Исследование свойств моделей случайных графов, предназначенных для описания структуры и динамики современных сложных сетей коммуникаций, таких как Интернет.

Источники:

Ю.Л. Павлов. Случайные графы. Петрозаводск, ПетрГУ, 2013.

А.М. Райгородский. Модели случайных графов. Москва, МЦНМО, 2011.

 

1 курс

магистры

01.03.01

01.03.02

Тема: Конфигурационные графы и моделирование сложных сетей коммуникаций

Краткое описание: Исследование свойств конфигурационных графов, предназначенных для описания структуры и динамики современных сложных сетей коммуникаций.

Источники:

Ю.Л. Павлов. Случайные графы. Петрозаводск, ПетрГУ, 2013.

А.М. Райгородский. Модели случайных графов. Москва, МЦНМО, 2011. 

 

Рогов Александр Александрович, д.т.н., профессор, зав.каф. ТВиАД

Email:  rogov@petrsu.ru

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

2 курс

ПМиИ, ИСиТ

Тема: Модель трансформера

Краткое описание: Провести анализ существующих моделей трансформера, их достоинства и недостатки, реализовать одну из моделей и проверить ее работу классификации литературных текстов.

С.А. Садиех

2 курс

ПМиИ, ИСиТ

Тема: Закон Ципфа

Краткое описание: Проверить на реальных данных гипотезу американского специалиста по биоинформатике Вэньтянь Ли[en] о том, вероятность случайного появления какого-либо слова длиной n в цепочке случайных символов уменьшается с ростом n в той же пропорции, в какой растёт при этом ранг этого слова в частотном списке (порядковой шкале). Потому произведение ранга слова на его частотность есть константа.

 

2 курс

ПМиИ, ИСиТ

Тема: Метод сильного графа

Краткое описание: разобраться в методике и проверить ее работоспособность на реальных данных. Требуется написать соответствующую компьютерную программу.

 

2,3 курс

ПМиИ, ИСиТ

 Тема: Визуализация методов кластерного анализа

Краткое описание: Требуется написать компьютерную программу, которая будет визуализировать исходные данные (двухмерный случай) и работу различных методов кластерного анализа.  

 

3  курс

ПМиИ, ИСиТ

Тема: Визуализация коэффициентов корреляции

Краткое описание: Требуется написать компьютерную программу, которая будет визуализировать облако рассеивания (двухмерный случай) и коэффициенты корреляции.  

 

4 курс,

ПМиИ, ИСиТ

Тема: Скрытые марковские модели

Краткое описание: разобраться в модели, рассмотреть разные компьютерные реализации вычисления параметров модели, подготовить визуализацию примеров.

 

4 курс,

ПМиИ, ИСиТ

Тема: Сравнение графовых моделей

Краткое описание: рассмотреть различные  методы сравнения графовых моделей реализовать их в виде компьютерной программы. Провести эксперименты.

 

 

4 курс,

ПМиИ, ИСиТ

Тема: Способы визуализации графовых моделей

Краткое описание: Требуется провести анализ и  написать компьютерную программу, которая будет визуализировать графы разными методами.

 

4 курс,

ПМиИ, ИСиТ

Тема: Трансформер и его реализации

Краткое описание: Провести анализ существующих моделей трансформера, их достоинства и недостатки, реализовать одну из моделей и проверить ее работу на реальных данных.  

 

Сидоров Юрий Владимирович, к.т.н., доцент кафедры ТВиАД

Email:  yurysidorov76@gmail.com

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

Магистранты1 курс,

УД

Тема: Формирование набора данных для адаптации синтаксических анализаторов для работы с языком дореволюционной России

22505 Н.В. Гальминас

Магистранты

1 курс,

УД

Тема: Разработка словаря для адаптации морфологических анализаторов к работе с дореволюционным русским языком

22505 Л. А. Иванов

4 курс,

Системное и прикладное программное обеспечение

Тема: Исследование использования расстояния между зависимыми частями речи в предложении для решения задачи атрибуции текстов

Краткое описание: исследование метрики «расстояние между зависимыми частями речи в предложении» при атрибуции публицистических статей. Инструментальные средства: Excel, VBA, PHP, MySQL, Python.

 

1. Reynolds R. Russian Natural Language Processing and Computer-assisted Language Learning : Capturing the benefits of deep morphological analysis in real-life applications : PhD thesis / Tromsø : Universitet i Tromsø. 2016. URL: https://munin.uit.no/handle/10037/9685

2. Боярский К. К. Введение в компьютерную лингвистику : учебное пособие. СПб. : НИУ ИТМО, 2013. 72 с

3. Информационная система «СМАЛТ» : [сайт]. URL:http://smalt.karelia.ru

 

4 курс,

Системное и прикладное программное обеспечение

Тема: Применение методов кластеризации при решении задачи атрибуции текстов

Краткое описание: Как правило, атрибуция текстов рассматривается как задача их классификации. Вместе с тем, для определенных текстов (публицистических, малого объема и т.п.) характерно внешнее влияние (редакторские правки и т.п.), что может приводить к противоречивым результатам классификации. Поэтому, целесообразным выглядит первоначальная кластеризация рабочего материала с целью выработки последующих решений по его исследованию. Инструментальные средства: Excel, VBA, PHP, MySQL, Python и пр.

 

1. Сидоров Ю. В. Математическая и информационная поддержка методов обработки литературный текстов на основе формально-грамматических параметров : специальность 05.13.18 «Математическое моделирование, численные методы и комплексы программ» : диссертация на соискание ученой степени кандидата технических наук / Сидоров Юрий Владимирович ; Санкт-Пет. ин-т информатики и автоматизации. — Санкт-Петербург, 2002. — 127 с.

2. Мандель И.Д. Кластерный анализ. М., «Финансы и статистика», 1988.- 176 с..

3. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Классификация и снижение размерности. — М.: Финансы и статистика, 1989. — 607 с.

 

3 курс,

Системное и прикладное программное обеспечение

Тема: Компьютерный анализ текстов на естественном языке для решения задачи атрибуции текстов: морфологический уровень

Краткое описание: изучение основных принципов компьютерного анализа текстов на естественном языке; практическая реализация методов атрибуции текстов, основанных на морфологических признаках, на корпусе публицистических статей. Инструментальные средства: Excel, VBA, PHP и пр.

 

1. Рогов А. А., Седов А. В., Сидоров Ю. В., Суровцова Т. Г. Математические методы атрибуции текстов. (учебное пособие). Петрозаводск: Изд-во ПетрГУ, 2012. – 48 с.

2. Боярский К. К. Введение в компьютерную лингвистику : учебное пособие. СПб. : НИУ ИТМО, 2013. 72 с

3. Сидоров Ю. В., Смирнов Н.В. Вероятностные методы анализа неструктурированной текстовой информации. (учебное пособие). Петрозаводск: Изд-во ПетрГУ, 2012. – 56 с.

4. Информационная система «СМАЛТ» : [сайт]. URL:http://smalt.karelia.ru

 

3 курс,

Системное и прикладное программное обеспечение

Тема: Компьютерный анализ текстов на естественном языке для решения задачи атрибуции текстов: синтаксический уровень

Краткое описание: изучение основных принципов компьютерного анализа текстов на естественном языке; практическая реализация методов атрибуции текстов, основанных на синтаксических признаках, на корпусе публицистических статей. Инструментальные средства: Excel, VBA, PHP и пр.

 

1. Рогов А. А., Седов А. В., Сидоров Ю. В., Суровцова Т. Г. Математические методы атрибуции текстов. (учебное пособие). Петрозаводск: Изд-во ПетрГУ, 2012. – 48 с.

2. Боярский К. К. Введение в компьютерную лингвистику : учебное пособие. СПб. : НИУ ИТМО, 2013. 72 с

3. Сидоров Ю. В., Смирнов Н.В. Вероятностные методы анализа неструктурированной текстовой информации. (учебное пособие). Петрозаводск: Изд-во ПетрГУ, 2012. – 56 с.

4. Информационная система «СМАЛТ» : [сайт]. URL:http://smalt.karelia.ru

 

5 курс, заочное отделение,

ИСиТ

Тема: Извлечение именованных сущностей в текстах дореформенной орфографии

Краткое описание: В области анализа естественных языков достаточно успешно реализована задача извлечения именованных сущностей для современных языков. Целью работы является изучение возможностей современных языковых моделей к извлечению именованных сущностей из текстов дореволюционной орфографии. Инструментальные средства: Python, PHP и пр.

 

1. Mozharova V., Loukachevitch N. Combining Knowledge and CRF-based Approach to Named Entity Recognition in Russian // Proc. the 5th International Conference on Analysis of Images, Social Networks, and Texts, AIST’2016. – 2016

2. Трофимов И. В. Выявление личных имен в новостных текстах на материале коллекций Persons-1000/1111-F // RCDL-2014. − 2014.

3. Ivanin, V., Artemova, E., Batura, T., Ivanov, V., Sarkisyan, V., Tutubalina, E., & Smurov, I. RuREBus-2020 Shared Task: Russian Relation Extraction for Business // Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialog”. 2020. URL:

http://www.dialog-21.ru/media/5098/ivaninvaplusetal-182.pdf

 

5 курс, заочное отделение,

ИСиТ

Тема: Задача потокового преобразования речи в текст

Краткое описание: программное обеспечение, с помощью которого можно преобразовать речевую информацию в текстовую, уже давно существует. Однако найти приложения, которые позволяют распознавать любую слитную речь человека и отправлять полученный текст на множество устройств в режиме реального времени, становиться проблематичным.

 

1. Автоматическое распознавание речи. Учебное пособие. И.Б. Тампель, А.А. Карпов [Электронный ресурс]. URL: https://books.ifmo.ru/file/pdf/1921.pdf.

2. Синтез и распознавание речи. Современные решения. Александр Фролов, Григорий Фролов, 2003 [Электронный ресурс]. URL: http://www.frolov-lib.ru/books/hi/index.html.

3. Леонович А. А. Современные технологии распознавания речи [Электронный ресурс]. URL: http://masters.donntu.org/2012/iii/akopyan/library/article1.htm.

 

Смирнов Н.В., доцент

Email:  smirnov_work@mail.ru

№ курса и Направление

Тема (название темы, краткое описание и список рекомендуемой литературы)

ФИО студента, № группы

Магистратура, 1 курс, ИСИТ

Тема:

Задачи видеоаналитики транспортных потоков

Воронин Вениамин Юрьевич,

гр. 22505

Магистратура, 1 курс, ИСИТ

Тема:

Идентификация спортсменов на изображении

Сенева Анна Константиновна,

гр. 22505

Магистратура, 1 курс

Тема:

Разработка интеллектуального ассистента приемной кампании вуза

Трифонов Алексей Сергеевич,

гр. 22503

Бакалавриат, 4 курс, Программная инженерия

Тема:

Распознавание эмоционального состояния человека в шлеме дополненной реальности

 

Семенов Никита,

гр. 22407

 

 

 

 

 


Дата обновления: 18.10.2022