Исследование эффективности использования графовых баз данных для анализа больших данных
https://doi.org/10.21869/2223-1536-2023-13-1-171-190
Аннотация
Цель исследования. Целью настоящей работы является исследование графовых моделей баз данных и разработка методики сравнительного анализа моделей баз данных. Теоретико-методологическую основу исследования составили фундаментальные научные труды отечественных и зарубежных авторов в области базовых проблем теории баз данных, теории алгоритмов, теории графов, структур и методов обработки данных.
Методы. В работе используются методы структурного, сравнительного и контент-анализа, а также статистические методы обработки информации и методы теории графов. В результате проведенных исследований авторы обосновали особенности, преимущества и недостатки использования графовой модели данных.
Результаты. Актуальность настоящего исследования обусловлена интенсивным развитием информационных технологий, предназначенных для экономического развития страны, пандемией и геополитической ситуацией в мире. Данные предпосылки ориентируют исследователей к использованию новых методов обработки и анализа данных. Однако оптимизировать процессы обработки больших данных представляется возможным не только с помощью новых мощных алгоритмов, но и с помощью использования принципиально иных структур и моделей данных, отличных от реляционной.
В работе приведены прикладные примеры использования графовой модели баз данных в различных предметных областях. Разработана методика сравнительного анализа моделей данных применительно к анализу больших данных. Выделены основные пункты проектирования модели данных: масштабирование системы, соответствие требованиям и стандартам, способность изменять структуры модели данных, сложность языка, производительность и скорость обработки данных. Предложенная методика позволила численно оценить эффективность применения графовых моделей.
Заключение. Теоретическая значимость исследования состоит в развитии методических и технологических подходов к анализу больших данных и формированию структур и баз данных. Практические результаты исследования могут быть полезны крупным ИТ-компаниям, а также финансовому, логистическому и коммерческому секторам, где проблема анализа и исследования больших данных стоит наиболее остро.
Об авторах
Р. В. ФаткуллинРоссия
Фаткуллин Руслан Владиславович, преподаватель кафедры информационных систем и технологий,
ул. Репина, д. 15, г. Екатеринбург 620014
Е. В. Кислицын
Россия
Кислицын Евгений Витальевич, кандидат экономических наук, доцент, доцент кафедры
информационных систем и технологий,
ул. Репина, д. 15, г. Екатеринбург 620014
Список литературы
1. Рейтинг СУБД. URL: https://db-engines.com/en/ranking (дата обращения: 17.12.2022).
2. Миронов В. В., Юсупова Н. И., Шакирова Г. Р. Ситуационно-ориентированные базы данных: концепция, архитектура, XML-реализация // Вестник Уфимского государственного авиационного технического университета. 2010. Т. 14, № 2 (37). С. 233–244.
3. Салибекян С. М., Петрова С. Б. Объектно-атрибутная модель представления пространственно-временных отношений между объектами // Прикладная информатика. 2016. Т. 11, № 3 (63). С. 103–115.
4. Абрамский М. М., Тимерханов Т. И. Сравнительный анализ использования реляционных и графовых баз данных в разработке цифровых образовательных систем // Вестник Новосибирского государственного университета. Серия: Информационные технологии. 2018. Т. 16, № 4. С. 5–12.
5. Гасанов Э. Э. О сложности хранения и поиска информации // Интеллектуальные системы. 2006. Т. 10, № 1-4. С. 273–302.
6. Засядко Г. Е., Карпов А. В. Проблемы разработки графовых баз данных // Инженерный вестник Дона. 2017. № 1 (44). С. 24.
7. Плетнев А. А. Информационно-графовая модель динамических баз данных и ее применение // Интеллектуальные системы. Теория и приложения. 2014. Т. 18, № 1. С. 111–140.
8. Ломов П. А. Применение графовых СУБД в задачах анализа данных // Труды Кольского научного центра РАН. 2019. Т. 10, № 9-9. С. 137–145.
9. Дубровин А. С., Огородникова О. В. Моделирование работы графовых систем управления базами данных (СУБД) при решении задач анализа продолжительности времени обработки информации // Вестник Воронежского института ФСИН России. 2022. № 3. С. 49–54.
10. Bruggen R. V. Learning Neo4j. United Kingdom Livery Place: Birmingham B3 2PB, Published by Packt Publishing Ltd., 2014. 222 p.
11. Осипов Д. Л. Технологии проектирования баз данных. М.: ДМК Пресс, 2019. 498 с.
12. Сьоре Э. Проектирование и реализация систем управления базами данных. М.: ДМК Пресс, 2021. 466 с.
13. Прамодкумар Дж. С., Фаулер М. NoSQL: новая методология разработки нереляционных баз данных. М.: И. Д. Вильяме, 2013. 192 с.
14. Фрэнкс Б. Укрощение больших данных: как извлекать знания из массивов информации с помощью глубокой аналитики. М.: Манн, Иванов и Фербер, 2014. 352 с.
15. Jordan G. Practical Neo4j. 1st ed. United Kingdom: Published by Apress, 2015. 393 p.
16. Уорд Б. Инновации SQL Server 2019. Использование технологий больших данных и машинного обучения. М.: ДМК Пресс, 2020. 408 с.
17. Harrison G. Next Generation Databases. 1st ed. United States, CA: Published by Apress, 2015. 244 p.
18. Kemper C. Beginning Neo4j. United States: Published by Apress, 2015. 162 p.
19. Робинсон Я., Вебнер Д., Эифрем Э. Графовые базы данных. 2-е изд. М.: ДМК Пресс, 2016. 256 с.
20. Редмонд Э. Семь баз данных за семь недель. Введение в современные базы данных и идеологию NoSQL. М.: ДМК Пресс, 2018. 384 с.
21. Кравченко Ю. А. Задачи семантического поиска, классификации, структуризации и интеграции информации в контексте проблем управления знаниями // Известия Южного федерального университета. Технические науки. 2016. № 7 (180). С. 5–18.
Рецензия
Для цитирования:
Фаткуллин Р.В., Кислицын Е.В. Исследование эффективности использования графовых баз данных для анализа больших данных. Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2023;13(1):123-142. https://doi.org/10.21869/2223-1536-2023-13-1-171-190
For citation:
Fatkullin R.V., Kislitsyn E.V. Investigation of the Effectiveness of Usage of Graph Databases for Big Data Analysis. Proceedings of the Southwest State University. Series: IT Management, Computer Science, Computer Engineering. Medical Equipment Engineering. 2023;13(1):123-142. (In Russ.) https://doi.org/10.21869/2223-1536-2023-13-1-171-190