Введение 4
1. Обзор аналогов 6
2. Предобработка и сегментация изображений 8
2.1. Подготовка изображения к сегментации 8
2.2. Реализация и сравнение существующих методов сегментации 11
2.3. Сегментация с помощью DBSCAN 16
3. Распознавание содержимого 21
3.1. Модель нейросети для распознавания рукописного текста 21
3.2. Создание датасета 22
3.3 Реализация и результаты обучения 24
4. Идентификация контекста 25
4.1. Идентификация с помощью РПД 25
4.2. Идентификация с помощью метаданных 25
5. Веб-приложение для распознавания изображений 27
Заключение 30
Список использованных источников 31
Приложение А. Код предобработки 35
Приложение Б. Код сегментации методом графиков интенсивности 37
Приложение В. Код сегментации модифицированным DBSCAN 39
Приложение Г. Код Data Augmentation 41
Приложение Д. Код модели, метода тренировки модели и декодера 43
Приложение Е. Результаты проверки модели на тестовой выборке 47
Приложение Ж. Код индексирования РПД и реализации поиска 49
Приложение З. Код фильтрации расписания по метаданным 53
Приложение И. Примеры результатов работы системы 54
Цель этой работы – разработать систему распознавания содержимого и идентификации контекста классных досок.
Для достижения цели были поставлены следующие задачи:
● изучить аналогичные решения, составить таблицу плюсов и минусов;
● сравнить существующие методы сегментации изображений, и по результатам сравнения разработать систему сегментации изображений;
● подготовить датасет русских рукописных слов;
● разработана систему распознавания русских и английских рукописных слов на изображениях;
● разработать систему идентификации контекста с использованием распознанного содержимого;
● разработать систему идентификации контекста с использованием метаданных;
Разработка системы распознавания содержимого и идентификации контекста классных досок. А также похожие готовые работы: страница 6 #9103766
Артикул: 9103766
- Предмет: Программная инженерия
- Уникальность: 68% (Антиплагиат.ВУЗ)
- Разместил(-а): 185 Рамиль в 2021 году
- Количество страниц: 57
- Формат файла: docx
1 999p.
1. Bugeja, M. An Overview of Handwritten Character Recognition Systems for Historical Documents / M. Bugeja, A. Dingli, D. Seychell // Rediscovering Heritage Through Technology. – 2020. – P. 3-23.
2. How to easily do Handwriting Recognition using Deep Learning // Nanonets. – 2021. – URL: https://nanonets.com/blog/handwritten-character-recognition/ (дата обращения: 28.05.2021).
3. J. Ignacio Toledo, Information Extraction from Historical Handwritten Document Images with a Context-aware Neural Model / J. Ignacio Toledo, M. Carbonella, A. Fornes, J. Llados // Pattern Recognition 60 – 2018. – V. 60.
4. Vision AI | Derive image insights via ML | Cloud Vision API // Google Cloud.
– 2012. – URL: https://cloud.google.com/vision (дата обращения: 28.05.2021).
5. Solutions - MyScript // MyScript. – 2012. – URL: https://www.myscript.com/en/solutions (дата обращения: 28.05.2021).
6. MyScript Webdemo // MyScript. – 2012. – URL: https://webdemo.myscript.com/ (дата обращения: 28.05.2021).
7. Tesseract Open Source OCR Engine (main repository) // GitHub. – 2007. – URL: https://github.com/tesseract-ocr/tesseract (дата обращения: 28.05.2021).
8. Rakshit, S. Recognition of Handwritten Textual Annotations using Tesseract Open Source OCR Engine for information Just In Time / S. Rakshit, S. Basu, H. Ikeda // Proc. Int. Conf. on Information Technology and Business Intelligence (2009). – 2009. – P. 117-125.
9. Hochuli, A.G. Handwritten digit segmentation: Is it still necessary? / A.G. Hochuli, L.S. Oliveira, A.S. Britto Jr, R. Sabourin // Pattern Recognition. – 2018. – V. 78 – P. 1-11.
10. About - OpenCV // OpenCV. – 1999. – URL: https://opencv.org/about/ (дата обращения: 30.05.2021)
11. Rodolfo, P. Text Line Segmentation Based on Morphology and Histogram Projection / Rodolfo P. dos Santos, Gabriela S. Clemente, Tsang Ing Ren and George D.C. Cavalcanti // 10th International Conference on Document Analysis and Recognition. – 2009. – P. 651-655.
12. Radhakrishna Achanta, SLIC Superpixels / Radhakrishna Achanta, Appu Shaji, Kevin Smith, Aurelien Lucchi,Pascal Fua, and Sabine S¨usstrunk // EPFL. – 2010. – Technical Report 149300.
13. Zhu, Y. Text segmentation using superpixel clustering / Y. Zhu, K. Zhang // IET Image Process. – 2017. – V. 11, Iss. 7. – P. 455-464.
14. Scikit-image: Image processing in Python // Scikit-image. – 2009. – URL: https://scikit-image.org/ (дата обращения: 30.05.2021).
15. Ester, M. A density-based algorithm for discovering clusters in large spatial databases with noise / Martin Ester, Hans-Peter Kriegel, Jörg Sander, Xiaowei Xu. // Proceedings of the Second International Conference on Knowledge Discovery and Data Mining (KDD-96). – 1996. – P. 226-231.
16. Scikit-learn: machine learning in Python // Scikit-learn. – 2007. – URL: https://scikit-learn.org/stable/ (дата обращения: 30.05.2021).
17. Bora, M. B. Handwritten Character Recognition from Images using CNN-ECOC / M. B. Bora, D. D. Khwairakpam, A. D. Kandar // Procedia Computer Science – 2020. – V. 167. – P. 2403-2409.
18. Graves, A. Multi-dimensional Recurrent Neural Networks / A. Graves, S. Fernández, J. Schmidhuber // International Conference on Artificial Neural Networks. – 2007. – P. 549-558.
19. Chammas, E. Handwriting Recognition of Historical Documents with Few Labeled Data / E. Chammas, C. Mokbel, L. Likforman-Sulem // 13th IAPR International Workshop on Document Analysis Systems (DAS). – 2018. – P. 43-48.
20. Graves, A. Offline Handwriting Recognition with Multidimensional Recurrent Neural Networks / A. Graves, J. Schmidhuber // Proceedings of the 21st International Conference on Neural Information Processing Systems. – 2008. – P. 545-552.
21. Bluche, T. Scan, Attend and Read: End-to-End Handwritten Paragraph Recognition with MDLSTM Attention / T. Bluche, J. Louradour R. Messina // 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). – 2017. – V. 1 – P. 1050-1055.
22. Theodore Bluche - Research Engineer | Scan, Attend and Read // Theodore Bluche. – 2017. – URL: http://www.tbluche.com/scan_attend_read.html (дата обращения: 01.06.2021)
23. Graves, A. Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks / A. Graves, S. Fernández, F. Gomez, J. Schmidhuber // Proceedings of the Twenty-Third International Conference on Machine Learning (ICML). – 2006. – P. 369-376.
24. Scheidl, H. Word Beam Search: A Connectionist Temporal Classification Decoding Algorithm / H. Scheidl, S. Fiel, R. Sablatnig // 16th International Conference on Frontiers in Handwriting Recognition (ICFHR). – 2018. – P. 253-258.
25. Marti, U. The IAM-database: An English Sentence Database for Off-line Handwriting Recognition / U. Marti and H. Bunke // Int. Journal on Document Analysis and Recognition. – 2002. – V. 5. – P. 39-46.
26. Shorten, C. A survey on Image Data Augmentation for Deep Learning / Connor Shorten, Taghi M. Khoshgoftaar // Journal of Big Data. – 2019. – URL: https://doi.org/10.1186/s40537-019-0197-0 (дата обращения: 04.05.2021).
27. Introduction to TensorFlow // TensorFlow. – 2015. – URL: https://www.tensorflow.org/learn (дата обращения: 04.05.2021).
28. SimpleHTR: Handwritten Text Recognition with TensorFlow // GitHub – 2018. – URL: https://github.com/githubharald/SimpleHTR (дата обращения: 04.05.2021).
29. MacKenzie, I. S. A character-level error analysis technique for evaluating text entry methods / I. S. MacKenzie and R. W. Soukoreff // Proceedings of the Second Nordic Conference on Human-Computer Interaction – NordiCHI. – 2002. – P. 241-244.
30. Sidorov, G. Soft Similarity and Soft Cosine Measure: Similarity of Features in Vector Space Model / G. Sidorov, A. Gelbukh, H. Gómez-Adorno and D. Pinto // Computación y Sistemas. – 2014. – V. 18, №. 3, P. 491-504.
31. Jones, K. S. A statistical interpretation of term specificity and its application in retrieval / K. S. Jones // MCB University Press Journal of Documentation. – 2004. – V. 6, № 5. – P. 493-502.
32. Manning, C. D. Introduction to Information Retrieval / C. D. Manning, P. Raghavan and H. Schütze // Cambridge University Press. – 2008. – P. 22-32.
33. Natural Language Toolkit — NLTK 3.6.2 documentation // NLTK. – 2001. – URL: https://www.nltk.org/ (дата обращения: 05.05.2021).
34. A Python wrapper of the Yandex Mystem 3.1 morphological analyzer //
GitHub. – 2018. – URL: 05.06.2021). https://github.com/nlpub/pymystem3 (дата обращения
35. Exchangeable image file format for digital still cameras: Exif Version 2.2 / Technical Standardization Committee on AV & IT Storage Systems and Equipment // Japan Electronics and Information Technology Industries Association. – 2002. – JEITA CP-3451.
36. The web framework for perfectionists with deadlines // Django. – 2005.– URL: https://www.djangoproject.com/ (дата обращения 06.06.2021).
37. Introduction Bootstrap v5.0 // Bootstrap – 2011. – URL: https://getbootstrap.com/docs/5.0/getting-started/introduction/ (дата обращения: 08.06.2021).
38. JQuery API Documentation // JQuery. – 2006. – URL: https://api.jquery.com/ (дата обращения: 09.06.2021).
39. Руководство по Canvas – Интерфейсы веб API // MDN Web Docs. – 2005.
– URL: https://developer.mozilla.org/ru/docs/Web/API/Canvas_API/Tutorial (дата обращения: 10.06.2021).
40. Крейн, Д. AJAX в действии: технология — Asynchronous JavaScript and XML / Д. Крейн, Э. Паскарелло, Д. Джеймс. // Вильямс – 2006. – С. 640.
2. How to easily do Handwriting Recognition using Deep Learning // Nanonets. – 2021. – URL: https://nanonets.com/blog/handwritten-character-recognition/ (дата обращения: 28.05.2021).
3. J. Ignacio Toledo, Information Extraction from Historical Handwritten Document Images with a Context-aware Neural Model / J. Ignacio Toledo, M. Carbonella, A. Fornes, J. Llados // Pattern Recognition 60 – 2018. – V. 60.
4. Vision AI | Derive image insights via ML | Cloud Vision API // Google Cloud.
– 2012. – URL: https://cloud.google.com/vision (дата обращения: 28.05.2021).
5. Solutions - MyScript // MyScript. – 2012. – URL: https://www.myscript.com/en/solutions (дата обращения: 28.05.2021).
6. MyScript Webdemo // MyScript. – 2012. – URL: https://webdemo.myscript.com/ (дата обращения: 28.05.2021).
7. Tesseract Open Source OCR Engine (main repository) // GitHub. – 2007. – URL: https://github.com/tesseract-ocr/tesseract (дата обращения: 28.05.2021).
8. Rakshit, S. Recognition of Handwritten Textual Annotations using Tesseract Open Source OCR Engine for information Just In Time / S. Rakshit, S. Basu, H. Ikeda // Proc. Int. Conf. on Information Technology and Business Intelligence (2009). – 2009. – P. 117-125.
9. Hochuli, A.G. Handwritten digit segmentation: Is it still necessary? / A.G. Hochuli, L.S. Oliveira, A.S. Britto Jr, R. Sabourin // Pattern Recognition. – 2018. – V. 78 – P. 1-11.
10. About - OpenCV // OpenCV. – 1999. – URL: https://opencv.org/about/ (дата обращения: 30.05.2021)
11. Rodolfo, P. Text Line Segmentation Based on Morphology and Histogram Projection / Rodolfo P. dos Santos, Gabriela S. Clemente, Tsang Ing Ren and George D.C. Cavalcanti // 10th International Conference on Document Analysis and Recognition. – 2009. – P. 651-655.
12. Radhakrishna Achanta, SLIC Superpixels / Radhakrishna Achanta, Appu Shaji, Kevin Smith, Aurelien Lucchi,Pascal Fua, and Sabine S¨usstrunk // EPFL. – 2010. – Technical Report 149300.
13. Zhu, Y. Text segmentation using superpixel clustering / Y. Zhu, K. Zhang // IET Image Process. – 2017. – V. 11, Iss. 7. – P. 455-464.
14. Scikit-image: Image processing in Python // Scikit-image. – 2009. – URL: https://scikit-image.org/ (дата обращения: 30.05.2021).
15. Ester, M. A density-based algorithm for discovering clusters in large spatial databases with noise / Martin Ester, Hans-Peter Kriegel, Jörg Sander, Xiaowei Xu. // Proceedings of the Second International Conference on Knowledge Discovery and Data Mining (KDD-96). – 1996. – P. 226-231.
16. Scikit-learn: machine learning in Python // Scikit-learn. – 2007. – URL: https://scikit-learn.org/stable/ (дата обращения: 30.05.2021).
17. Bora, M. B. Handwritten Character Recognition from Images using CNN-ECOC / M. B. Bora, D. D. Khwairakpam, A. D. Kandar // Procedia Computer Science – 2020. – V. 167. – P. 2403-2409.
18. Graves, A. Multi-dimensional Recurrent Neural Networks / A. Graves, S. Fernández, J. Schmidhuber // International Conference on Artificial Neural Networks. – 2007. – P. 549-558.
19. Chammas, E. Handwriting Recognition of Historical Documents with Few Labeled Data / E. Chammas, C. Mokbel, L. Likforman-Sulem // 13th IAPR International Workshop on Document Analysis Systems (DAS). – 2018. – P. 43-48.
20. Graves, A. Offline Handwriting Recognition with Multidimensional Recurrent Neural Networks / A. Graves, J. Schmidhuber // Proceedings of the 21st International Conference on Neural Information Processing Systems. – 2008. – P. 545-552.
21. Bluche, T. Scan, Attend and Read: End-to-End Handwritten Paragraph Recognition with MDLSTM Attention / T. Bluche, J. Louradour R. Messina // 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). – 2017. – V. 1 – P. 1050-1055.
22. Theodore Bluche - Research Engineer | Scan, Attend and Read // Theodore Bluche. – 2017. – URL: http://www.tbluche.com/scan_attend_read.html (дата обращения: 01.06.2021)
23. Graves, A. Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks / A. Graves, S. Fernández, F. Gomez, J. Schmidhuber // Proceedings of the Twenty-Third International Conference on Machine Learning (ICML). – 2006. – P. 369-376.
24. Scheidl, H. Word Beam Search: A Connectionist Temporal Classification Decoding Algorithm / H. Scheidl, S. Fiel, R. Sablatnig // 16th International Conference on Frontiers in Handwriting Recognition (ICFHR). – 2018. – P. 253-258.
25. Marti, U. The IAM-database: An English Sentence Database for Off-line Handwriting Recognition / U. Marti and H. Bunke // Int. Journal on Document Analysis and Recognition. – 2002. – V. 5. – P. 39-46.
26. Shorten, C. A survey on Image Data Augmentation for Deep Learning / Connor Shorten, Taghi M. Khoshgoftaar // Journal of Big Data. – 2019. – URL: https://doi.org/10.1186/s40537-019-0197-0 (дата обращения: 04.05.2021).
27. Introduction to TensorFlow // TensorFlow. – 2015. – URL: https://www.tensorflow.org/learn (дата обращения: 04.05.2021).
28. SimpleHTR: Handwritten Text Recognition with TensorFlow // GitHub – 2018. – URL: https://github.com/githubharald/SimpleHTR (дата обращения: 04.05.2021).
29. MacKenzie, I. S. A character-level error analysis technique for evaluating text entry methods / I. S. MacKenzie and R. W. Soukoreff // Proceedings of the Second Nordic Conference on Human-Computer Interaction – NordiCHI. – 2002. – P. 241-244.
30. Sidorov, G. Soft Similarity and Soft Cosine Measure: Similarity of Features in Vector Space Model / G. Sidorov, A. Gelbukh, H. Gómez-Adorno and D. Pinto // Computación y Sistemas. – 2014. – V. 18, №. 3, P. 491-504.
31. Jones, K. S. A statistical interpretation of term specificity and its application in retrieval / K. S. Jones // MCB University Press Journal of Documentation. – 2004. – V. 6, № 5. – P. 493-502.
32. Manning, C. D. Introduction to Information Retrieval / C. D. Manning, P. Raghavan and H. Schütze // Cambridge University Press. – 2008. – P. 22-32.
33. Natural Language Toolkit — NLTK 3.6.2 documentation // NLTK. – 2001. – URL: https://www.nltk.org/ (дата обращения: 05.05.2021).
34. A Python wrapper of the Yandex Mystem 3.1 morphological analyzer //
GitHub. – 2018. – URL: 05.06.2021). https://github.com/nlpub/pymystem3 (дата обращения
35. Exchangeable image file format for digital still cameras: Exif Version 2.2 / Technical Standardization Committee on AV & IT Storage Systems and Equipment // Japan Electronics and Information Technology Industries Association. – 2002. – JEITA CP-3451.
36. The web framework for perfectionists with deadlines // Django. – 2005.– URL: https://www.djangoproject.com/ (дата обращения 06.06.2021).
37. Introduction Bootstrap v5.0 // Bootstrap – 2011. – URL: https://getbootstrap.com/docs/5.0/getting-started/introduction/ (дата обращения: 08.06.2021).
38. JQuery API Documentation // JQuery. – 2006. – URL: https://api.jquery.com/ (дата обращения: 09.06.2021).
39. Руководство по Canvas – Интерфейсы веб API // MDN Web Docs. – 2005.
– URL: https://developer.mozilla.org/ru/docs/Web/API/Canvas_API/Tutorial (дата обращения: 10.06.2021).
40. Крейн, Д. AJAX в действии: технология — Asynchronous JavaScript and XML / Д. Крейн, Э. Паскарелло, Д. Джеймс. // Вильямс – 2006. – С. 640.
Материалы, размещаемые в каталоге, с согласия автора, могут использоваться только в качестве дополнительного инструмента для решения имеющихся у вас задач,
сбора информации и источников, содержащих стороннее мнение по вопросу, его оценку, но не являются готовым решением.
Пользователь вправе по собственному усмотрению перерабатывать материалы, создавать производные произведения,
соглашаться или не соглашаться с выводами, предложенными автором, с его позицией.
Тема: | Разработка системы распознавания содержимого и идентификации контекста классных досок |
Артикул: | 9103766 |
Дата написания: | 26.04.2021 |
Тип работы: | Дипломная работа |
Предмет: | Программная инженерия |
Оригинальность: | Антиплагиат.ВУЗ — 68% |
Количество страниц: | 57 |
Скрин проверки АП.ВУЗ приложен на последней странице.
В работе представлены только пояснительная записка и листинг программы. Самой программы нет
В работе представлены только пояснительная записка и листинг программы. Самой программы нет
Файлы артикула: Разработка системы распознавания содержимого и идентификации контекста классных досок. А также похожие готовые работы: страница 6 по предмету программная инженерия
Пролистайте "Разработка системы распознавания содержимого и идентификации контекста классных досок. А также похожие готовые работы: страница 6" и убедитесь в качестве
После покупки артикул автоматически будет удален с сайта до 22.01.2025
Посмотреть остальные страницы ▼
Честный антиплагиат!
Уникальность работы — 68% (оригинальный текст + цитирования, без учета списка литературы и приложений), приведена по системе Антиплагиат.ВУЗ на момент её написания и могла со временем снизиться. Мы понимаем, что это важно для вас, поэтому сразу после оплаты вы сможете бесплатно поднять её. При этом текст и форматирование в работе останутся прежними.
Гарантируем возврат денег!
Качество каждой готовой работы, представленной в каталоге, проверено и соответствует описанию. В случае обоснованных претензий мы гарантируем возврат денег в течение 24 часов.
Утром сдавать, а работа еще не написана?
Через 30 секунд после оплаты вы скачаете эту работу!
Сегодня уже купили 69 работ. Успей и ты забрать свою пока это не сделал кто-то другой!
ПРЕДЫДУЩАЯ РАБОТА
Разработка системы тематического поиска команд разработчиков
СЛЕДУЮЩАЯ РАБОТА
Разработка тренажера для обучения инженеров по буровым растворам с использованием виртуальной реальности