Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Модель многомерного представления данных и методы ее анализа Висков Алексей Валерьевич

Модель многомерного представления данных и методы ее анализа
<
Модель многомерного представления данных и методы ее анализа Модель многомерного представления данных и методы ее анализа Модель многомерного представления данных и методы ее анализа Модель многомерного представления данных и методы ее анализа Модель многомерного представления данных и методы ее анализа
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Висков Алексей Валерьевич. Модель многомерного представления данных и методы ее анализа : диссертация ... кандидата физико-математических наук : 05.13.17 / Висков Алексей Валерьевич; [Место защиты: Рос. ун-т дружбы народов].- Москва, 2010.- 117 с.: ил. РГБ ОД, 61 10-1/1014

Введение к работе

Актуальность

Исследования в области анализа и представления многомерных данных стали в последнее время одним из приоритетных направлений в развитии методов проектирования информационных систем и анализа информации. Связано это с наблюдаемым с конца прошлого века лавинообразным ростом объема информации и необходимостью ее обработки с целью принятия различных управленческих решений. Одним из наиболее перспективных способов решения подобной задачи в настоящее время является применение технологий оперативного многомерного анализа данных.

Концепция оперативного многомерного анализа данных (OLAP)
была предложена Эдгаром Коддом' в 1993 году. В 1995 году на основе
требований, изложенных Коддом, был сформулирован так
называемый тест FASMI (Fast Analysis of Shared Multidimensional
Information - быстрый анализ разделяемой многомерной
информации), определяющий требования к приложениям
многомерного анализа данных. Такие приложения обеспечивают
возможность осуществлять управление, администрирование и анализ
данных с целью глубокого осмысления информации посредством
быстрого, консолидированного, интерактивного доступа к широкому
спектру различных аспектов информации, полученной
преобразованием первичных, необработанных данных, отражающих
реальную многомерность предметной области, представленной с
позиции пользователя. Функциональность таких приложений
характеризуется динамическим многомерным анализом

консолидированных данных в процессе поддержки аналитической и управленческой деятельности конечных пользователей.

1 Codd Е. F., Codd S. В., Sallcy С. Т. Providing OLAP to user-analysts: An IT mandate. - San Jose: Codd & Date, Inc., 1993.-Зір.

За последние годы было проведено много исследовательских работ в области многомерного анализа, основной направленностью которых была возможность оперативной обработки большого количества информации за счет адекватного задачам анализа определения требований к структуре этой информации и ее представлению . В результате был предложен ряд многомерных моделей, описывающих исследуемые предметные области . Как правило, все эти модели были построены в процессе решения конкретных задач, при этом их авторы использовали различную терминологию и описывали различные аспекты предметной области на разных этапах проектирования и анализа данных. В открытых источниках до сих пор не существует строгого, единого математического фундамента для систем многомерного хранения и анализа данных, подобного тому, который существует для реляционных СУБД. Для того, чтобы иметь возможность сравнивать и анализировать эти работы, надо построить единую систему классификации многомерных моделей.

Строгое математическое описание концепции многомерного представления данных и способов построения многомерных моделей позволяет получить ряд преимуществ. Прежде всего, это упрощение процесса проектирования многомерных моделей, подобно тому, как нормальные формы упрощают проектирование реляционных моделей. Также математическое описание многомерных операций позволяет строить более простые и понятные запросы на этапе анализа данных.

Таким образом, разработка математической модели многомерного представления данных и методов ее анализа является в настоящее время весьма актуальной задачей.

"Более подробно эти вопросы рассмотрены в работах Lchncr W. «Modeling Large Scale OLAP

Scenarios», Huscmann В., Lcchtcnborgcr J., Vosscn G. «Conceptual Data Warehouse Design», Li Ch.,

Wang X. «A data model for supporting on-line analytical processing»

3 Lchncr W. Modeling Large Scale OLAP Scenarios. II In Advances in Database Technology (EDBT'98).

-LNCS.-1998.-Springer.-Vol. 1377.-P. 153-167.

Trujillo J., Palomar M., Gomez J., Song I. Designing Data Warehouses with 00 Conceptual Models. II

IEEE Computer.- 2001.- V34, №12.- P. 66-75.

Цель работы

Целью данной диссертационной работы является формальное определение понятий, использующихся при многомерном анализе данных, построение на их базе математической модели многомерного представления данных; определение множества операций над многомерными кубами, структурирующими эти данные; разработка на базе этого аппарата концептуальной объектно-ориентированной модели, пригодной для реализации в программных средствах многомерного анализа информации.

Научная новизна

Научная новизна работы состоит в разработке новой математической модели многомерного представления данных, использование которой определяет комплексный подход к решению задач многомерного анализа, при этом построенная модель обеспечивает как способ, так и средства для решения таких задач.

Предложенная модель описывает известные понятия

многомерного представления данных, такие как: измерения,

показатели, многомерные кубы данных. Однако построение этой

модели основывается на использовании ряда новых идей и подходов к

описанию свойств многомерных объектов, а именно:

!. Исследование и доказательство свойств измерений и их

агрегационных иерархий основывается на анализе свойств

различных видов целого, их структуры и связей между частями

целого. Элементы измерения рассматриваются как коллекции,

измерение определяется как связный направленный граф. При этом

свойства измерения доказываются на основании теории графов и

мереологических аксиом;

  1. Многомерный куб данных определяется как функция из п-мерного пространства, определенного декартовым произведением уровней соответствующих измерений, на множество ячеек одного класса;

  2. Общеизвестные операции над многомерными кубами данных определены как композиции функций, задающих преобразования

как в области определения, так и в области значений функции куба. В работе доказывается, что эти операции составляют полное, минимальное и замкнутое множество, порождающее полугруппу; 4. На базе полученных теоретических результатов предложена новая концептуальная объектно-ориентированная модель представления многомерных данных, которая может быть использована как язык описания метаданных информационно-аналитических систем и хранилищ данных.

Практическая значимость.

Математическая модель, предложенная в диссертации, может быть использована в качестве основы при разработке методики решения задач многомерного проектирования и анализа данных, определяя основные этапы многомерного описания предметной области и обеспечивая лучшее понимание структуры и свойств используемых при этом информационных объектов. Разработанное формальное описание многомерных операций позволяет строить более простые, понятные и эффективные запросы для анализа данных конечными пользователями.

Построенная в работе концептуальная объектно-ориентированная модель соответствует разработанной консорциумом Object Management Group спецификации Common Warehouse Metamodel (CWM), описывающей обмен метаданными при использовании технологий Хранилищ данных, и может быть применена в качестве основы для построения информационно-аналитических систем и хранилищ данных, являясь для них языком описания метаданных.

Разработанная в диссертации модель была использована компанией ЛАНИТ при участии автора в процессе создания программного продукта «Корпоративный каталог показателей» («Enterprise Metadata Center»)4.

4 Свидетельство об официальной регистрации программы для ЭВМ №2004611855, выдано Федеральной службой по интеллектуальной собственности, патентам и товарным знакам.

Результаты диссертации были применены Отделением Системной Интеграции компании ЛАНИТ при выполнении ряда проектов по созданию гетерогенных информационно-аналитических систем масштаба предприятия. В частности, разработанная математическая модель применялась для описания предметной области н технических объектов при разработке информационно-аналитической системы для ЦБ РФ.

Методы л сследования

В работе использованы методы теории графов и 'теории множеств, аксиоматика мереологии и методы объектно-ориентированного проектирования и анализа.

Достоверность и обоснованность

Обоснованность результатов вытекает из использования строгих и апробированных математических методов исследования. Все полученные в диссертации теоретические результаты обоснованны строгими математическими доказательствами. Достоверность подтверждается практическим применением построенных моделей при разработке программных средств многомерного анализа информации.

Публикации

По материалам диссертации опубликовано 7 работ. Работы [1,2] опубликованы в ведущих рецензируемых научных изданиях, определенных ВАК, и содержат выносимые на защиту результаты. Список работ приведен в конце автореферата.

В работах, опубликованных в соавторстве, личный вклад автора заключается в непосредственном участии в постановке задачи и интерпретации результатов, проведении аналитических исследований. Все результаты, выносимые на защиту, получены лично автором.

Похожие диссертации на Модель многомерного представления данных и методы ее анализа