ВВЕДЕНИЕ 6
1. ЗАДАЧА ФИЛЬТРАЦИИ СПАМА 8
1.1 Основные подходы к решению задачи фильтрации спама 8
1.2 Постановка задачи 9
2. НАИВНЫЙ БАЙЕСОВСКИЙ КЛАССИФИКАТОР 11
2.1 Характеристика метод, его понятие и сущность 11
2.2 Описание принципа работы наивного байесовского классификатора 12
2.3 Многомерная модель наивного байесовского классификатора 16
2.4 Мультиномиальная модель наивного байесовского классификатора 18
3. МЕТОД КЛАССИФИКАЦИИ НА ОСНОВЕ МОДЕЛИ МЕШКА СЛОВ 20
4. ПРАКТИЧЕСКИЙ ПРИМЕР ЗАДАЧИ ФИЛЬТРАЦИИ СПАМА 21
4.1 Решение практической задачи и ее результаты 21
4.2 Результаты работы программы, решающей практическую задачу многомерным наивным байесовским классификатором на тестовых письмах 22
4.3 Результаты работы программы, решающей практическую задачу мультиномиальным наивным байесовским классификатором на тестовых письмах 24
4.4 Результаты работы программы, решающей практическую задачу методом, основанным на модели «мешка слов» на тестовых письмах 25
5. СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ 30
5.1 Анализ по вычислительной сложности 30
6. ОПИСАНИЕ ПРОГРАММНОГО ПРИЛОЖЕНИЯ 32
6.1 Приложение для многомерного наивного байесовского классификатора 32
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 39
ПРИЛОЖЕНИЕ А 41
ПРИЛОЖЕНИЕ Б 52
ПРИЛОЖЕНИЕ В 62
Объектом исследования являются задача фильтрации спама.
Предметом исследования является методы и основные алгоритмы решения задачи фильтрации спама.
Целью работы является исследование и реализация основных алгоритмов решения задачи фильтрации спама. Исходя из поставленной цели, мы можем определить основные задачи исследования:
> Изучить методы фильтрации спама: байесовский классификатор на основе многомерной и мультиномиальной модели.
> Разработать метод фильтрации спама – метод классификации на основе модели мешка слов.
> Создать программное приложение, реализующее вышеперечисленные алгоритмы фильтрации спама.
> Провести вычислительные эксперименты по сравнению вычислительной сложности реализованных методов и результатов их работы.
> Решить практическую задачу фильтрации спама.
> Провести анализ результатов решения практической задачи, полученных рассматриваемыми методами.
В дипломной работе представлена постановка задачи фильтрации спама, которая является частным случаем задачи классификации данных. Рассмотрены важнейшие подходы к решению задачи фильтрации. Особое внимание уделяется одному из самых популярных методов классификации - наивному байесовскому классификатору. С помощью этого метода анализируются текстовые данные и найдено решение задачи фильтрации спама. В статье рассматриваются два типа байесовских классификаторов: на основе многомерных и полиномиальных моделей. В димломной работе предлагается новый метод фильтрации данных на основе модели word bag. Вышеупомянутые методы сравниваются с точки зрения вычислительной сложности и точности нахождения решения. Эта работа решает практическую проблему фильтрации спама - классифицирует сообщения электронной почты по их содержанию. Разработано приложение, реализующее
работу трех вышеупомянутых алгоритмов фильтрации спама.
Исследование и программная реализация алгоритмов фильтрации спама. А также похожие готовые работы: страница 12 #9105498
Артикул: 9105498
- Предмет: Программирование
- Уникальность: 70% (Антиплагиат.ВУЗ)
- Разместил(-а): 185 Рамиль в 2022 году
- Количество страниц: 76
- Формат файла: docx
- Последняя покупка: 13.11.2022
999p.
2 000p.
только 24 ноября!
1. Босовой Л. Л. Актуальные проблемы методики обучения информатике в современной школе : материалы конференции / под редакцией Л. Л. Босовой, Н. К. Нателаури. – Москва : МПГУ, 2018. – 222 с. Текст : непосредственный.
2. Дюран, Б. П. Кластерный анализ: пер. с англ. Е. З. Демиденко под ред. А.Я. Боярского / Б. Дюран, Одел. Москва: «Статистика», 1977. – 128 с. Текст : непосредственный.
3. Коломейченко, А. С. Информационные технологии : учебное пособие
для вузов / А. С. Коломейченко, Н. В. Польшакова, О. В. Чеха. – 2-е изд., перераб. – Санкт-Петербург : Лань, 2021. – 212 с. Текст : непосредственный.
4. Крипак, Е. М. Математическое моделирование процессов и систем :
учебное пособие / Е. М. Крипак. – Оренбург : ОГУ, 2018 – Часть 1 – 2018. – 198 с. Текст : непосредственный.
5. Полупанов, Д. В. Нейроинформатика : учебное пособие / Д. В. Полупанов. – Уфа : БашГУ, 2020. – 132 с. Текст : непосредственный.
6. Пролубников, А. В. Математические методы распознавания образов : учебное пособие / А. В. Пролубников. – Омск : ОмГУ, 2020. – 110 с. Текст : непосредственный.
7. Халабия, Р. Ф. Математическое и программное обеспечение информационно-поисковых систем : учебное пособие / Р. Ф. Халабия, М. Л. Халабия, Л. В. Бунина. – Москва : РТУ МИРЭА, 2020. – 132 с. Текст : непосредственный.
8. Зинюхина, Н.А. Дифференциация субъектов Российской Федерации по характеристикам сферы образовательных услуг / Н.А. Зинюхина, Т.В. Леушина, И.А. Подосенова // Интеллект. Инновации. Инвестиции. – 2016. – № 5. – С. 30-33. Текст : непосредственный.
9. Линд, Ю.Б. Вопросы афтоматического распознования каротажных диаграм / Ю.Б. Линд, Р.Х. Ишбулатова, А.Л. Хашпер // Электронный научный
2. Дюран, Б. П. Кластерный анализ: пер. с англ. Е. З. Демиденко под ред. А.Я. Боярского / Б. Дюран, Одел. Москва: «Статистика», 1977. – 128 с. Текст : непосредственный.
3. Коломейченко, А. С. Информационные технологии : учебное пособие
для вузов / А. С. Коломейченко, Н. В. Польшакова, О. В. Чеха. – 2-е изд., перераб. – Санкт-Петербург : Лань, 2021. – 212 с. Текст : непосредственный.
4. Крипак, Е. М. Математическое моделирование процессов и систем :
учебное пособие / Е. М. Крипак. – Оренбург : ОГУ, 2018 – Часть 1 – 2018. – 198 с. Текст : непосредственный.
5. Полупанов, Д. В. Нейроинформатика : учебное пособие / Д. В. Полупанов. – Уфа : БашГУ, 2020. – 132 с. Текст : непосредственный.
6. Пролубников, А. В. Математические методы распознавания образов : учебное пособие / А. В. Пролубников. – Омск : ОмГУ, 2020. – 110 с. Текст : непосредственный.
7. Халабия, Р. Ф. Математическое и программное обеспечение информационно-поисковых систем : учебное пособие / Р. Ф. Халабия, М. Л. Халабия, Л. В. Бунина. – Москва : РТУ МИРЭА, 2020. – 132 с. Текст : непосредственный.
8. Зинюхина, Н.А. Дифференциация субъектов Российской Федерации по характеристикам сферы образовательных услуг / Н.А. Зинюхина, Т.В. Леушина, И.А. Подосенова // Интеллект. Инновации. Инвестиции. – 2016. – № 5. – С. 30-33. Текст : непосредственный.
9. Линд, Ю.Б. Вопросы афтоматического распознования каротажных диаграм / Ю.Б. Линд, Р.Х. Ишбулатова, А.Л. Хашпер // Электронный научный
Материалы, размещаемые в каталоге, с согласия автора, могут использоваться только в качестве дополнительного инструмента для решения имеющихся у вас задач,
сбора информации и источников, содержащих стороннее мнение по вопросу, его оценку, но не являются готовым решением.
Пользователь вправе по собственному усмотрению перерабатывать материалы, создавать производные произведения,
соглашаться или не соглашаться с выводами, предложенными автором, с его позицией.
Тема: | Исследование и программная реализация алгоритмов фильтрации спама |
Артикул: | 9105498 |
Дата написания: | 28.06.2022 |
Тип работы: | Дипломная работа |
Предмет: | Программирование |
Оригинальность: | Антиплагиат.ВУЗ — 70% |
Количество страниц: | 76 |
Скрин проверки АП.ВУЗ приложен на последней странице.
В работе представлены только пояснительная записка и листинг программы. Самой программы нет
В работе представлены только пояснительная записка и листинг программы. Самой программы нет
Файлы артикула: Исследование и программная реализация алгоритмов фильтрации спама. А также похожие готовые работы: страница 12 по предмету программирование
Пролистайте "Исследование и программная реализация алгоритмов фильтрации спама. А также похожие готовые работы: страница 12" и убедитесь в качестве
После покупки артикул автоматически будет удален с сайта до 23.01.2025
Посмотреть остальные страницы ▼
Честный антиплагиат!
Уникальность работы — 70% (оригинальный текст + цитирования, без учета списка литературы и приложений), приведена по системе Антиплагиат.ВУЗ на момент её написания и могла со временем снизиться. Мы понимаем, что это важно для вас, поэтому сразу после оплаты вы сможете бесплатно поднять её. При этом текст и форматирование в работе останутся прежними.
Гарантируем возврат денег!
Качество каждой готовой работы, представленной в каталоге, проверено и соответствует описанию. В случае обоснованных претензий мы гарантируем возврат денег в течение 24 часов.
Утром сдавать, а работа еще не написана?
Через 30 секунд после оплаты вы скачаете эту работу!
Сегодня уже купили 55 работ. Успей и ты забрать свою пока это не сделал кто-то другой!
ПРЕДЫДУЩАЯ РАБОТА
Разработка и реализация приложения для решения задач безусловной оптимизации
СЛЕДУЮЩАЯ РАБОТА
Проектирование информационной системы для отделов ГИБДД