Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://elar.urfu.ru/handle/10995/140360
Название: | Построение потокового захвата изменения данных для аналитических хранилищ данных : магистерская диссертация |
Другие названия: | Building a streaming data change capture system for analytical data warehouses |
Авторы: | Голиков, А. А. Golikov, A. A. |
Научный руководитель: | Корелин, И. А. Korelin, I. A. |
Дата публикации: | 2024 |
Библиографическое описание: | Голиков А. А. Построение потокового захвата изменения данных для аналитических хранилищ данных : магистерская диссертация / А. А. Голиков ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2024. — 88 с. — Библиогр.: с. 73-78 (45 назв.). |
Аннотация: | Цель работы – анализ методов построения потокового захвата изменений данных и реализация лучшего метода, выбранного в ходе анализа. Методы исследования: теоретический анализ, тестирование, программирование. Результатом работы является успешная реализация и тестирование системы потокового захвата изменений данных на базе Kafka Connect в связке с коннектором Debezium для MySQL и ClickHouse Kafka Connect Sink для ClickHouse, решённая проблема ограничения последнего на обработку удалённых записей из источника данных, а также получение актуального состояния данных из источника. Область применения полученных результатов – инженерия данных и искусственного интеллекта. Значимость работы заключается в возможности её практической реализации по месту работы, а также в гибком подходе к решению поставленной задачи в условиях ограничений инструментария. The object of the thesis is streaming data change capture. The purpose of the work is to analyze the methods for building a streaming data change capture system and implement the best method selected during the analysis. Research methods: theoretical analysis, testing, programming. The result of the work is the successful implementation and testing of a streaming data change capture system based on Kafka Connect in conjunction with the Debezium connector for MySQL and ClickHouse Kafka Connect Sink for ClickHouse, the solved problem of the latter's limitation on processing remote records from the data source, as well as obtaining the current state of data from the source. The scope of the obtained results is data engineering and artificial intelligence. The significance of the work lies in the possibility of its practical implementation at the place of work, as well as in the flexible approach to solving the problem under the conditions of tool limitations. |
Ключевые слова: | ЗАХВАТ ИЗМЕНЕНИЙ ДАННЫХ СУБД CHANGE DATA CAPTURE DBMS KAFKA CONNECT DEBEZIUM MYSQL CLICKHOUSE |
URI: | http://elar.urfu.ru/handle/10995/140360 |
Условия доступа: | Предоставлено автором на условиях простой неисключительной лицензии |
Текст лицензии: | http://elar.urfu.ru/handle/10995/31613 |
Располагается в коллекциях: | Магистерские диссертации |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
m_th_a.a.golikov_2024.pdf | 2,75 MB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.