ВВЕДЕНИЕ 5
1. Постановка задачи 8
1.1. Процесс регистрации входящей корреспонденции 8
1.2. Техническое задание 12
1.3. Выбор технических средств реализации 15
2. Анализ предметной области 18
2.1. Обзор существующих решений по автоматизации регистрации документов 19
2.2. Сканирование документа 20
2.3. Оптическое распознавание символов 23
2.4. Классификация изображений 26
2.4.1. Задача классификации в машинном обучении 26
2.4.2. Трансферное обучение 28
2.4.3. Архитектура нейронной сети ResNet 31
2.5. Извлечение структурированной информации из текста 35
2.5.1. Задача извлечения информации из текста 35
2.5.2. Библиотека Natasha и Yargy-парсер 42
2.5.3. Структура документов судебного и исполнительного производства 51
2.6. Передача сведений и автоматическая регистрация в системе 1С: Предприятие 58
2.6.1. Структура XML-документа 58
2.6.2. Интерфейс взаимодействия для клиентских приложений с системой 1С: Предприятия 65
2.6.3. Обзор конфигурации БИТ: Управление задолженностью 67
3. Архитектура программного продукта 75
3.1. Основные модули системы 75
3.2. Структура системы хранения файлов 83
3.3. Инфологическая модель базы данных 88
4. Первичная обработка входящего документа 92
4.1. Web-приложение для загрузки входящего документа в систему 92
4.2. Сканер документов на основе технологии машинного зрения 104
4.3. Модуль распознавания текста 110
5. Классификация документов по изображению 116
5.1. Подготовка данных и инструментария для обучения 116
5.2. Обучение модели нейронной сети ResNet152 124
6. Извлечение структурированной информации из текста 129
6.1. Основные компоненты системы извлечение структурированной информации из текста 130
6.2. Группа модулей «Экстрактор» 132
6.3. Набор правил для извлечения информации из документов судебного и исполнительного производства 137
6.4. Определение обязательных реквизитов документа 140
7. Передача сведений и автоматическая регистрация в системе 1С: Предприятие 142
7.1. Основные компоненты системы в информационной базе 1С 142
7.2. Модуль «Работа с состояниями» 148
7.3. Модуль «Работа с инструментами обмена» 154
7.4. Модуль «Работа с корреспонденцией» 159
8. Тестирование и апробация рабочей системы 167
8.1. Тестирование автоматической регистрации документов 167
8.2. Оценка качества моделей классификации 169
8.3. Оценка качества автоматической регистрации 179
ЗАКЛЮЧЕНИЕ 181
СПИСОК ЛИТЕРАТУРЫ 187
СПИСОК СОКРАЩЕНИЙ И УСЛОВНЫХ ОБОЗНАЧЕНИЙ 188
ПРИЛОЖЕНИЯ 189
ПРИЛОЖЕНИЕ 1. XSD-СХЕМА ДЛЯ ДОКУМЕНТОВ СУДЕБНОГО ПРОИЗВОДСТВА 189
ПРИЛОЖЕНИЕ 2. МОДУЛЬ «ЭКСТРАКТОР» 194
ПРИЛОЖЕНИЕ 3. МОДУЛЬ «ЭКСТРАКТОР-ПОСТАНОВЛЕНИЕ» 223
ПРИЛОЖЕНИЕ 4. НАБОР ПРАВИЛ ДЛЯ YARGY-ПАРСЕРА 235
ПРИЛОЖЕНИЕ 5. МОДУЛЬ «РАБОТА С КОРРЕСПОНДЕНЦИЕЙ» 243
Таким образом, введение автоматизации регистрации документов обеспечивает сбор и хранение исчерпывающих данных обо всех документах организации, позволяет осуществлять эффективный контроль и вести информационно-справочную работу, а также автоматически составлять при необходимости внутреннюю опись в делах и описи дел постоянного хранения. Автоматизация документооборота и делопроизводства очень важный процесс, который ведет к повышению качества и скорости работы с документами, способствует экономии рабочего времени специалистов.
Вышесказанное описывает актуальность разрабатываемого инструмента для тех сфер деятельности человека, которым свойственен большой объём документооборота. Примером такой сферы деятельности может служить
сфера взыскания задолженности, осуществление которой для взыскателей непрерывно сопровождается обработкой входящей корреспонденции и извлечением из документов судебного и исполнительного производства структурированной информации, а также работой с большим объёмом документов, подлежащих в процессе обработки идентификации, типизации и регистрации.
В связи с чем от компании ООО Коллекторское агентство «Фабула» поступил заказ на реализацию программного обеспечения, решающего описанную проблему.
Целью выпускной квалификационной работы является разработка прикладного программного комплекса, позволяющего производить регистрацию скан-образов документов судебного и исполнительного производства в информационной базе «1C: Предприятие» в автоматическом режиме. Комплекс должен автоматизировать выделение необходимой структурированной информации с изображения и все процессы передачи данных с базой «1C: Предприятие».
Новизна работы состоит в разработке программного комплекса автоматической регистрации документов предметно-специфического контента – документов судебного и исполнительного производства. Данный программный комплекс адаптирован на взаимодействие и интеграцию с системами на базе 1С: Предприятие.
Для достижения поставленной цели были определены следующие задачи:
1) изучить существующие подходы и разработки, связанные с обработкой документов и обменом информацией с базой «1C: Предприятие»;
2) организовать систему хранения всех форм документов (изображение, текстовое представление, xml-схема), позволяющую нескольким пользователям работать с общими файлами;
3) разработать модуль извлечения структурированной формы документа по его изображению и содержанию;
4) разработать модуль в системе «1С: Предприятие», позволяющий осуществлять взаимодействие с внешними клиентскими приложениями;
5) разработать модуль в системе «1С: Предприятие», осуществляющий автоматическую регистрацию входящей корреспонденции на основании полученной xml-схемы документа.
' .
Разработка программного обеспечения для автоматической регистрации скан-образов документов судебного и исполнительного производства #9105444
Артикул: 9105444
- Предмет: Программирование
- Уникальность: 68% (Антиплагиат.ВУЗ)
- Разместил(-а): 185 Рамиль в 2022 году
- Количество страниц: 189
- Формат файла: docx
- Последняя покупка: 31.01.2024
2 970p.
1) Дейтел П., Дейтел Х. Python: Искусственный интеллект, большие данные и облачные вычисления / П. Дейтел, Х. Дейтел. – СПб.: Питер, 2022. – 864 с.: ил. – ISBN 978-5-4461-1432-0
2) Прикладная и компьютерная лингвистика / Под ред. Николаева И.С. и др. — М.:ЛЕНАНД, 2016.
3) Grishman R. Information Extraction. In: The Handbook of Computational Linguistics and Natural Language Processing. A. Clark, C. Fox, and S. Lappin (Eds), WileyBlackwell, 2010, pp. 515-530.
4) Автоматическая обработка текстов на естественном языке и анализ данных: учеб. пособие / Большакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н.В., Сапин А.С. — М.: Изд-во НИУ ВШЭ, 2017. — 269 с.
5) Кукушкин А. Yargy-парсер и библиотека Natasha. Извлечения структурированной информации из текстов на русском языке / А. Кукушки: Хабр — ресурс для IT-специалистов. – URL: https://habr.com/ru/post/349864/ (Дата обращения 24.04.2022) Текст: электронный.
6) 1С:Предприятие 8.3.8. Документация. Руководство разработчика: 1С:ИТС: Информационно-технологическое сопровождение: сайт. – URL: https://its.1c.ru/db/v838doc#bookmark:dev:TI000000000 (Дата обращения 10.04.2022) — Режим доступа: для авториз. пользователей.
7) Sovit R. Satellite Image Classification using PyTorch ResNet34 / R. Sovit: сайт. – URL: https://debuggercafe.com/satellite-image-classification-using- pytorch-resnet34/ (Дата обращения 20.04.2022) Текст: электронный.
8) Grishman R., Sundheim B. Message Understanding Conference — 6: A Brief History. In: Proceedings of COLING-1996, NY, 1996, pp. 466-471.
2) Прикладная и компьютерная лингвистика / Под ред. Николаева И.С. и др. — М.:ЛЕНАНД, 2016.
3) Grishman R. Information Extraction. In: The Handbook of Computational Linguistics and Natural Language Processing. A. Clark, C. Fox, and S. Lappin (Eds), WileyBlackwell, 2010, pp. 515-530.
4) Автоматическая обработка текстов на естественном языке и анализ данных: учеб. пособие / Большакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н.В., Сапин А.С. — М.: Изд-во НИУ ВШЭ, 2017. — 269 с.
5) Кукушкин А. Yargy-парсер и библиотека Natasha. Извлечения структурированной информации из текстов на русском языке / А. Кукушки: Хабр — ресурс для IT-специалистов. – URL: https://habr.com/ru/post/349864/ (Дата обращения 24.04.2022) Текст: электронный.
6) 1С:Предприятие 8.3.8. Документация. Руководство разработчика: 1С:ИТС: Информационно-технологическое сопровождение: сайт. – URL: https://its.1c.ru/db/v838doc#bookmark:dev:TI000000000 (Дата обращения 10.04.2022) — Режим доступа: для авториз. пользователей.
7) Sovit R. Satellite Image Classification using PyTorch ResNet34 / R. Sovit: сайт. – URL: https://debuggercafe.com/satellite-image-classification-using- pytorch-resnet34/ (Дата обращения 20.04.2022) Текст: электронный.
8) Grishman R., Sundheim B. Message Understanding Conference — 6: A Brief History. In: Proceedings of COLING-1996, NY, 1996, pp. 466-471.
Материалы, размещаемые в каталоге, с согласия автора, могут использоваться только в качестве дополнительного инструмента для решения имеющихся у вас задач,
сбора информации и источников, содержащих стороннее мнение по вопросу, его оценку, но не являются готовым решением.
Пользователь вправе по собственному усмотрению перерабатывать материалы, создавать производные произведения,
соглашаться или не соглашаться с выводами, предложенными автором, с его позицией.
Тема: | Разработка программного обеспечения для автоматической регистрации скан-образов документов судебного и исполнительного производства |
Артикул: | 9105444 |
Дата написания: | 19.05.2022 |
Тип работы: | Дипломная работа |
Предмет: | Программирование |
Оригинальность: | Антиплагиат.ВУЗ — 68% |
Количество страниц: | 189 |
Скрин проверки АП.ВУЗ приложен на последней странице.
В работе представлены только пояснительная записка и листинг программы. Самой программы нет
В работе представлены только пояснительная записка и листинг программы. Самой программы нет
Файлы артикула: Разработка программного обеспечения для автоматической регистрации скан-образов документов судебного и исполнительного производства по предмету программирование
Пролистайте "Разработка программного обеспечения для автоматической регистрации скан-образов документов судебного и исполнительного производства" и убедитесь в качестве
После покупки артикул автоматически будет удален с сайта до 21.02.2025
Посмотреть остальные страницы ▼
Честный антиплагиат!
Уникальность работы — 68% (оригинальный текст + цитирования, без учета списка литературы и приложений), приведена по системе Антиплагиат.ВУЗ на момент её написания и могла со временем снизиться. Мы понимаем, что это важно для вас, поэтому сразу после оплаты вы сможете бесплатно поднять её. При этом текст и форматирование в работе останутся прежними.
Гарантируем возврат денег!
Качество каждой готовой работы, представленной в каталоге, проверено и соответствует описанию. В случае обоснованных претензий мы гарантируем возврат денег в течение 24 часов.
Утром сдавать, а работа еще не написана?
Через 30 секунд после оплаты вы скачаете эту работу!
Сегодня уже купили 75 работ. Успей и ты забрать свою пока это не сделал кто-то другой!
ПРЕДЫДУЩАЯ РАБОТА
Мобильное приложение для подбора подарка с функцией выбора товара
СЛЕДУЮЩАЯ РАБОТА
Разработка клиент-серверного приложения Генератор заданий для ЕГЭ по информатике