Please use this identifier to cite or link to this item: http://elar.urfu.ru/handle/10995/140360
Title: Построение потокового захвата изменения данных для аналитических хранилищ данных : магистерская диссертация
Other Titles: Building a streaming data change capture system for analytical data warehouses
Authors: Голиков, А. А.
Golikov, A. A.
metadata.dc.contributor.advisor: Корелин, И. А.
Korelin, I. A.
Issue Date: 2024
Citation: Голиков А. А. Построение потокового захвата изменения данных для аналитических хранилищ данных : магистерская диссертация / А. А. Голиков ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2024. — 88 с. — Библиогр.: с. 73-78 (45 назв.).
Abstract: The object of the thesis is streaming data change capture. The purpose of the work is to analyze the methods for building a streaming data change capture system and implement the best method selected during the analysis. Research methods: theoretical analysis, testing, programming. The result of the work is the successful implementation and testing of a streaming data change capture system based on Kafka Connect in conjunction with the Debezium connector for MySQL and ClickHouse Kafka Connect Sink for ClickHouse, the solved problem of the latter's limitation on processing remote records from the data source, as well as obtaining the current state of data from the source. The scope of the obtained results is data engineering and artificial intelligence. The significance of the work lies in the possibility of its practical implementation at the place of work, as well as in the flexible approach to solving the problem under the conditions of tool limitations.
Цель работы – анализ методов построения потокового захвата изменений данных и реализация лучшего метода, выбранного в ходе анализа. Методы исследования: теоретический анализ, тестирование, программирование. Результатом работы является успешная реализация и тестирование системы потокового захвата изменений данных на базе Kafka Connect в связке с коннектором Debezium для MySQL и ClickHouse Kafka Connect Sink для ClickHouse, решённая проблема ограничения последнего на обработку удалённых записей из источника данных, а также получение актуального состояния данных из источника. Область применения полученных результатов – инженерия данных и искусственного интеллекта. Значимость работы заключается в возможности её практической реализации по месту работы, а также в гибком подходе к решению поставленной задачи в условиях ограничений инструментария.
Keywords: MASTER'S THESIS
CHANGE DATA CAPTURE
DBMS
KAFKA CONNECT
DEBEZIUM
MYSQL
CLICKHOUSE
МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ
ЗАХВАТ ИЗМЕНЕНИЙ ДАННЫХ
СУБД
URI: http://elar.urfu.ru/handle/10995/140360
Access: Предоставлено автором на условиях простой неисключительной лицензии
License text: http://elar.urfu.ru/handle/10995/31613
Appears in Collections:Магистерские диссертации

Files in This Item:
File Description SizeFormat 
m_th_a.a.golikov_2024.pdf2,75 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.