Please use this identifier to cite or link to this item: http://ena.lp.edu.ua:8080/handle/ntb/12999
Title: Методи та засоби інтеграції даних у відкритих інформаційних системах
Other Titles: Методы и средства интеграции данных в открытых информационных системах
Methods and tools of the data integration in open information systems
Authors: Берко, Андрій Юліанович
Bibliographic description (Ukraine): Берко А. Ю. Методи та засоби інтеграції даних у відкритих інформаційних системах : автореферат дисертації на здобуття наукового ступеня доктора технічних наук : 01.05.03 – математичне та програмне забезпечення обчислювальних машин і систем / Андрій Юліанович Берко ; Національний університет "Львівська політехніка". – Львів, 2011. – 36 с. – Бібліографія: с. 27–33 (66 назв).
Issue Date: 2011
Publisher: Національний університет "Львівська політехніка"
Keywords: інтеграція даних
відкриті інформаційні системи
інформаційний ресурс
синтаксис даних
структура даних
семантика даних
метадані
якість даних
сервісно-орієнтована архітектура
интеграция данных
открытые информационные системы
информационный ресурс
синтаксис данных
структура данных
семантика данных
метаданные
качество данных
сервис-ориентированная архитектура
data integration
open information systems
information resource
data syntax
data structure
data semantics
metadata
data quality
service-oriented architecture
Abstract: У дисертації вирішено науково-технічну проблему розроблення уніфікованих методів та стандартизованих засобів інтеграції даних у відкритих інформаційних системах. Розроблено класифікацію інформаційних ресурсів відкритих систем шляхом аналізу особливостей і закономірностей їх побудови. Отримала подальший розвиток теоретична концепція інтеграції даних шляхом розроблення узагальненої моделі процесу інтеграції даних. Розроблено метод багаторівневої інтеграції даних шляхом розподілу процесів інтеграції їх синтаксису, структури та семантики. Розроблено метод опрацювання неповних і неточних даних на основі онтологій, що дало змогу зменшити рівень невизначеності у процесах інтеграції та структурно-семантичний метод подання інтегрованих даних на рівні користувача. Вдосконалено метод комплексного оцінювання якості даних на основі логіки антонімів. Отримала подальший розвиток концепція інтеграції даних на основі сервісно-орієнтованої архітектури, що дозволяє реалізувати засоби інтеграції як інтероперабельний сервіс відкритої інформаційної системи. Розроблено комплекс нормативно-технічних документів для виконання процедури верифікації і валідації результатів інтеграції даних у відкритих системах. Визначено загальну архітектуру та порядок функціонування сервісу інтеграції даних на основі сервісно-орієнтованого підходу. Розроблено специфікацію протоколу інтеграції даних прикладного рівня на основі сервісно-орієнтованого підходу, мовні засоби опису даних у процесах інтеграції на основі формату XML. В диссертации решена научно-техническая проблема разработки унифицированных методов и стандартизированных методов интеграции данных в открытых информационных системах. В первом разделе представлено подробное обозрение проблематики создания и использования открытых информационных систем, в частности, вопросы формирования их информационного ресурса. Определены основные закономерности и специфика процессов построения информационных ресурсов открытых систем, сформулированы основные принципы и пути решения задач, возникающих при этом. Это создало возможность сформулировать проблему исследований, состоящую в противоречии между современными методами интеграции данных, основывающимися на использовании специализированных инструментальных средств, и принципами построения, функционирования и применения открытых информационных систем. Во втором разделе построена расширенная формальная модель интеграции данных, выполнена апробация модели, путем моделирования с её помощью различных методов интеграции, и обобщение этой модели для построения унифицированного метода интеграции данных в открытых информационных системах. В качестве средства моделирования данных в процессах интеграции применена теория формальных систем. Применение модели, построенной в работе, позволило построить формальное описание основных методов интеграции данных. Модель создает возможности для разработки универсального метода интеграции данных, обобщающего достижения известных ныне методов, а также, позволяет перейти в процессах интеграции от непосредственного манипулирования, данными и их схемами к операциям над метаданными, описывающими свойства и специфику объектов интеграции. В третьем разделе разработан метод многоуровневой интеграции данных, базирующийся на расширенной формальной модели интеграции данных. Метод предполагает декомпозицию общего процесса на подпроцессы интеграции значений, синтаксиса, семантики и структуры данных. Ключевым моментом такого подхода является возможность выполнения процедур интеграции на уровне метаданных, что позволяет сократить количество обращений к самим данным, объёмы которых, в общем случае, могут быть значительными. В четвертом разделе разработан структурно-семантический метод внешнего представления интегрированных данных, базирующийся на смысловом преобразовании неопределенностей и фактологической реляционной модели. Смысловое преобразование неопределенностей предусматривает снижение уровня неполноты и неточности данных за счет спецификации, классификации и детализации природы и сути неопределенностей. Основным объектом фактологической реляционной модели является фактологическое отношение, представляющее собой множество фактов, изображаемых в виде кортежей. Сочетание способов уменьшения уровня неопределенности данных за счет использования онтологий с изображением данных в виде фактов и фактологических отношений создают основу структурно-семантического метода представления результатов интеграции данных. Особенностью метода является возможность однотипного представления как структурированных данных, так и данных, относящихся к категории слабоструктурированных либо данных без предварительно определенной структуры, а также возможность корректного изображения данных с неопределенностями, неполных и неточных данных. В пятом разделе разработан метод управления качеством данных, полученных в результате интеграции. Разработана общая схема и порядок выполнения верификации и валидации данных, базирующийся на экспертных оценках. В основу метода положена модель качества данных стандарта ISO 9126, адаптированная для оценивания качества данных, и система качественных измерений сервисного уровня, разработанная корпорацией DataFlux – Data Quality Service Level Agreement. Для формирования лингвистических качественных оценок экспертов использована логика антонимов, а для построения количественной метрики оценок качества – метод оппозиционных шкал Д. Поспелова. Сформулированы принципы качества, согласно которым результаты верификации и валидации данных считаются положительными, если каждая из итоговых экспертных оценок находится в диапазоне допустимых значений, определенном для конкретного проекта. В шестом разделе представлены средства интеграции данных в среде открытых информационных систем. Разработан проект спецификации открытого протокола сервиса интеграции данных в открытых информационных системах – Data Integration Service Protocol (DISP) являющийся протоколом прикладного уровня. Протокол определяет способы, порядок и процедуры интеграции данных в виде сервиса, предоставляемого открытой информационной системой по запросу пользователя. Разработан комплекс языковых средств описания свойств данных в процессах интеграции – Integrated Data Framework (IDF), при помощи которого строится описание базовых свойств набора данных и порядок его обработки в интеграционных процессах с использованием формата XML. Протокол сервиса интеграции данных является основанием для построения стандартизированных интероперабельных средств, реализующих метод многоуровневой интеграции данных, полностью согласующийся с концепциями и принципами открытых информационных систем. Problem of development of unified methods and standardized tools for data integration in open information systems has been solved in the presented work. Classification of open systems information resources has been developed by analysis of it's construction specifics and regularity. Further evolution of theoretical data integration conception has been obtained by means of extended model of data integration processes. Multilevel data integration method based on distribution of data syntax, structure and semantics integration has been developed. Ontology based method of incomplete and incorrect data processing has been developed for uncertainty level reduction in data integration processes. Structure-semantics method has been proposed for user-level integrated data presentation. Integrated data quality evaluation method has been perfected by means of antonyms logic. Service-oriented based data integration conception has obtained new development; this allows realizing of integration tools as interoperable service of open information system. Normative-technical document set for integrated data verifying and validation in open information systems environment has been developed. General architecture and principles of data integration service operation has been defined. Specification of application level data integration protocol based on service-oriented approach has been designed as well as XML-format linguistic tools for description of data in integration processes.
URI: http://ena.lp.edu.ua:8080/handle/ntb/12999
Content type: Autoreferat
Appears in Collections:Автореферати та дисертаційні роботи

Files in This Item:
File Description SizeFormat 
avt_01339750.pdf670,16 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.