Разработка и исследование моделей данных и средств организации взаимодействия пользователей с информационными ресурсами Зыкин Сергей Владимирович

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Зыкин Сергей Владимирович. Разработка и исследование моделей данных и средств организации взаимодействия пользователей с информационными ресурсами : дис. ... д-ра техн. наук : 05.13.17 Омск, 2005 251 с. РГБ ОД, 71:06-5/531

Содержание к диссертации

Введение

1. Метод межмодельного преобразования данных для пользовательских моделей 19

1.1. Формирование схемы целевой модели 21

1.2. Разработка алгоритма построения представления целевой модели 21

1.3. Определение образов ограничений целостности 22

1.4. Формирование образов операций преобразования целевой модели 23

1.5. Формирование образов операций преобразования исходной модели , 24

2. Модель данных "Таблица соединений" 26

2.1. Логическая структура 5-таблицы 32

2.2. Формирование начального состояния 5-таблицы 33

2.3. Ограничения целостности для 5-таблицы 39

2.4. Операции преобразования 5-таблицы 40

2.4.1. Дополнение кортежа r[S] к 5-таблице s 40

2.4.2. Удаление кортежа r[S] из 5-таблицы 5 41

2.4.3. Замещение кортежа r[S] в 5-таблице 5 кортежем rf[S] 41

2.5. Образы операций преобразования РБД 42

2.5.1. Дополнение кортежей 43

2.5.2. Удаление кортежей 56

2.5.3. Модификация кортежей 59

2.5.4. Некоторые замечания по модификации 5-таблицы 62

2.6. Выводы по таблице соединений 63

Оценка мощности реализации таблицы соединений 64

3.1. Оценка мощности 5-таблицы для двух отношений и одного общего атрибута 67

3.2. Оценка мощности 5-таблицы для двух отношений и множества общих атрибутов 72

3.3. Оценка мощности 5-таблицы для множества отношений 75

3.4. Замечания по использованию таблицы соединений . 79

Выполнение реляционных запросов для специализированных моделей представления данных 81

4.1, Подход к построению схемы выполнения запроса 83

4.2, Схема реализации запросов на специализированных моделях 90

4.3, Замечания к схеме реализации запросов 91

Математическая модель графических данных пользователя и алгоритмы работы с ней 93

5.1. Описание диаграммы состояний 93

5.2. Математическая модель диаграммы состояния . 101

5.2.1. Выбор способа представления диаграмм состояния 101

5.2.2, Математическое описание диаграмм состояния . 102

5.3. Алгоритм идентификации областей 113

5.4. Алгоритм определения границы области в заданном направлении 122

5.5. Алгоритмы смешанной аппроксимации 128

5.6. Замечания к модели диаграмм состояния 139

Структурные преобразования табличного представления данных 140

6.1. Построение преобразования 1 144

6.1.1. Правило построения схемы представления . 144

6.1.2. Алгоритм построения представления г* со схемой

R* 145

6.1.3. Условия существования представления г* 146

6.1.4. Правила преобразования зависимостей 147

6.1.5. Операции преобразования представления 152

6.2. Построение преобразования 2 155

6.2.1. Правило формирования схемы образов Щ 155

6.2.2. Формирование реализации образа 155

6.2.3. Правила преобразования зависимостей 156

6.2.4. Операции манипулирования данными 159

6.3. Замечания для преобразований 161

7, Информационная система по фазовым диаграммам 162

7.1. Общая структура программного обеспечения и этапы обработки информации 165

7.2. Программы обработки исходной информации 170

7.3. Система управления файлами (СУФ) 174

7.4. Управление прикладными программами 177

7.5. Язык запросов 181

7.6. Обсуждение реализации системы 188

8. Инструментальные средства разработки приложений 191

8.1. Общие функции программного обеспечения 193

8.2. Организация интерфейса между исполняющими средами 196

8.3. Обсуждение реализации программного обеспечения . 202

Заключение 203

Список литературы

Разработка алгоритма построения представления целевой модели
Ограничения целостности для 5-таблицы
Оценка мощности 5-таблицы для двух отношений и множества общих атрибутов
Схема реализации запросов на специализированных моделях

Введение к работе

Проблема использования информационных ресурсов была сформулирована основоположником реляционной модели данных - Е, Коддом с соавторами [87]: "... обладание большой корпоративной БД имеет маленькое значение, если конечные пользователи не имеют возможностей легко синтезировать необходимую информацию из этих запасов (складов) данных". Эта ситуация обусловлена тем, что весь сервис работы с информационными ресурсами создается прикладными программистами и, как следствие, необходимая информация к моменту ее получения перестает быть актуальной.

Понимание этой проблемы вынуждает разработчиков программного обеспечения информационных систем дополнять свои продукты соответствующим инструментарием. Примером для силыюструк-турированных моделей данных могут служить разработки: Oracle Express, Info Vizor и т.д., для слабоструктурированных: Netscape, Internet Explorer и т.д. Эти системы обладают широким спектром возможностей: быстрое создание форм для просмотра и редактирования данных, создание отчетов с возможностью расчета интегральных характеристик, вплоть до построения диаграмм, и т.д. Однако создание инструментария осложняется отсутствием формализованных моделей пользовательских данных и, как следствие, необходимо программировать интерфейсы при преобразовании данных из одного представления в другое. Об оперативном предоставлении информации пользователю и этом случае не может быть и речи.

Широко известны канонические модели данных: реляционные, сетевые, иерархические, объектные, объектно-реляционные и т.д. Их использование позволяет наиболее полно реализовать принцип независимости данных при построении схемы базы данных. Над этими моделями трудилось огромное количество исследователей, в том числе Чарльз

12 Бахман и Эдгар Кодд, получившие в свое время премию Тьюринга соответственно за сетевую и реляционную модели данных. В настоящее время ведутся активные исследования в области построения моделей пользовательского представления данных (табличные, гиперкубические, темпоральные, семантическая трансформация, таблицы соединений, графические и т.д.) с использованием преобразований и интеграции неоднородных информационных ресурсов. Множество публикаций посвящено проблеме использования представления данных в формате XML, например [48, 50, 51, 76, 77] и др. В этих работах слабоструктурированное представление данных используется в качестве исходного. Поскольку XML является достаточно стандартизованным, то появляется возможность построения преобразований и интеграции данных, как это сделано в работах [51, 76, 77].

В данной работе в качестве исходной используется реляционная модель, относящаяся к сильноструктурироваипым моделям. Наиболее популярны для этого класса поликубические и гиперкубические модели, предназначенные для аналитической работы с данными [40, 47, 65, 78, 83, 89, 91, 97] и др. В большинстве работ авторы не приводят формальное описание пользовательских моделей, ограничиваясь примерами. Это затрудняет анализ этих моделей и соответствующего им инструментария. Однако, общая ситуация такова. Реляционные модели признаются наиболее универсальными (в силу своих свойств), то есть по реляционному представлению можно сформировать любое другое. Это нельзя сказать про поликубические и гиперкубические модели, например, при необходимости формирования другого гиперкуба пригодной исходной моделью будет только реляционная. Особое внимание авторы обращают на скорость работы приложений, хотя это не всегда оправдано. Можно потратить значительные усилия и время на разработку приложения, которое с течением времени может оказаться не актуальным. В этом случае эффективнее быстрое формирование приложений.

Соответствующая технология и является результатом исследований, рассмотренных в данной работе.

Результаты построения пользовательского представления информации (поликубические и гиперкубическис) в последующем могут быть использованы в рамках других моделей: регрессионных, деревьев решений, кластеризации и т.д. В данной работе рассматривается проблема преобразования информации к графическому виду на примере диаграмм состояния физико-химических соединений. Известно множество моделей описания и представления графической информации [1, 8, 27, 63] и т.д. Проблему графического представления диаграмм состояний одними из первых начали решать в МГУ [52, 98]. В последствии этой проблемой занялись и в других учреждениях, в том числе и в ИНХ СО РАН. В рамках проекта банка данных по свойствам материалов электронной техники (БнД СМЭТ) автором данной работы было получено обобщение известных результатов на случай многомерных диаграмм состояния. Эта модель в последствии использовалась при анализе и согласовании экспериментальных данных.

Сформулируем требования, которым должен удовлетворять инструментарий для формирования пользовательских приложений при работе с информационными ресурсами:

быстрое формирование приложения без привлечения языка программирования;
сформированное приложение должно содержать функции редактирования данных: дополнение, удаление и модификацию;
если представление данных, с которым работает приложение, подлежит длительному хранению, то данные должны автоматически актуализироваться, по крайней мере в момент запуска приложения, поскольку корпоративный информационный ресурс может быть изменен другими приложениями;

4) целесообразна реализация ограничений целостности на данные в

14 рамках приложения, что является актуальным в распределенных информационных системах с удаленным доступом, то есть в центральную информационную базу из приложения должны поступать корректные данные.

Таким образом, для создания инструментария необходима разработка специализированной пользовательской модели данных и, как следствие, для удовлетворения перечисленных требований к инструментарию между специализированной моделью данных и универсальной моделью данных должно быть установлено некоторое соответствие, Наилучшим способом установления этого соответствия является построение между ними межмодельного отображения, удовлетворяющего условию коммутативности. Это условие успешно было использовано в работах [15, 40]. Существенным отличием в данной работе является то, что между состояниями исходной и целевой моделей данных отсутствует взаимнооднозначное соответствие.

Построение межмодсльных отображений начинается с выбора либо с формирования некоторой универсальной модели, которая охватывает возможности по описанию и представлению наиболее широкий класс моделей. В данной работе предполагается, что универсальная модель известна и полностью определена. Далее формируется либо выбирается целевая (специализированная) модель данных, с которой и предполагается дальнейшая работа. Чаще всего целевая модель определяется посредством пользовательского описания данных. Конечной целью построения отображения является разработка программного обеспечения, поддерживающего интерфейс между исполняющей средой (программным обеспечением) для универсальной модели и исполняющей средой для целевой модели, в том числе для модели пользовательского представления. Существенной деталью построения является то, что пользователь должен иметь возможность корректно выполнять весь спектр операций с информационно выходя за рамки своего приложения.

15 Обобщая проблематику использования специализированных моделей, можно предложить схему, представленную на рисунке 1, где —* -потоки сообщений, запросов, данных и т.д.; БД - база данных, БЗ - база знаний, ТД-текстовые данные, ГД-графические данные, СПИ-сред-ства передачи информации {каналы ввода-вывода ЭВМ, общая шипа, локальные сети, региональные сети и глобальные сети), ПП - пользовательское представление (электронные таблицы, текстовые и гипертекстовые процессоры, средства мультимедиа и т.д.).

ППп

_~Т~

Рис. 1: Схема межмодельных преобразований

Необходимость появления промежуточного второго уровня для моделей описания информационных ресурсов продиктована теми же соображениями, что и необходимость второго уровня для организации работы базы данных. Модели этого уровня должны включать в себя описание интегрируемых данных, их взаимосвязи, ограничения целост-

ности и т.д. И на этой основе обеспечивается независимая эволюция информационных ресурсов,с одной стороны,и пользовательских представлений - с другой.

В общем случае проблему построения межмодельных отображений можно сформулировать в терминах алгебраических систем. Модель информационной системы (модель данных) будет иметь следующий вид:

Q=,

где М - логическая модель (схема) данных; D - совокупность допустимых состояний базы данных; F - набор операций для модели М; Р -совокупность предикатов, ограничивающих допустимые состояния D; М и D в совокупности являются носителем системы.

Модель ГЇ будем считать исходной, a Q! —< М\ D'_} F¹, Р' >- целевой (специализированной). Следовательно, необходимо построение отображения :

а => п'.

В [15] предложен следующий подход к построению преобразований: а:(М,Р)^(М',Р'),

где / - произвольное подмножество F.

Требования к отображениям:

взаимнооднозначное соответствие состояний хранимой информации (ф - биективно);
обеспечение коммутативности диаграммы отображения логических моделей информации и ограничений целостности,

(M,P) D

а ф

{М',Р') D'

где стрелки без обозначений символизируют соответствующие семантические функции языков описания данных (ЯОД);

3) обеспечение коммутативности диаграммы отображения команд обработки информации одной модели в последователыюсть команд другой модели,

/ - D^D

v| J

/' - D'->D'

где стрелки без обозначений символизируют соответствующие семантические функции языков манипулирования данными (ЯМД) и функция устанавливает соответствие переходов между состояниями.

Рассмотренный метод коммутативных отображений в данной работе использован в качестве основы для построения межмодельных отображений. Отличие состоит в том, что исходной (центральной) моделью является реляционная модель данных, а целевой моделью может быть выбрана: а) модель описания физического представления данных; б) пользовательская модель (внешняя схема); в) модель описания информационных ресурсов, являющаяся исходной для пользовательской модели данных, В последних двух случаях может отсутствовать возможность построения биективного отображения ф между состояниями исходной модели и целевой модели. Поэтому в качестве основы построения межмодульного отображения выбран алгоритм формирова-

18 пия представления целевой модели по произвольному текущему состоянию исходной модели, который позволяет решить проблему установления соответствия между состояниями исходной и целевой моделями и является основой для обоснования корректности последующих построений,

Разработка алгоритма построения представления целевой модели

После построения схемы целевой модели необходимо определиться со способом формирования представления целевой модели. Для этого предлагается разработка алгоритма построения представления целевой модели Лід, то есть основного алгоритма преобразования сформированного представления исходной модели в первоначально пустое представление целевой модели.

Разработанный алгоритм построения представления целевой модели должен стать основой для построения и обоснования корректности последующих шагов. Следствием этого являются основные требования к алгоритму: 1) наименьшая топологическая сложность алгоритма (в смысле цикломатической меры Мак-Кейба), 2) однозначность интерпретации его предложений (операторов). Требование вычислительной оптимальности для основного алгоритма должно быть отвергнуто, если оно противоречит предыдущим двум требованиям. Если требуется многократная работа этого алгоритма, например,при взаимодействии с программным обеспечением исходной модели, которое не информирует приложение об изменении состояния данных, то необходимо разработать более оптимальную версию алгоритма загрузки и доказать его эквивалентность основному. В случае, если представления исходной и целевой модели формируются одновременно и программное обеспечение для этих моделей взаимно информирует друг друга об изменении состояний, то реализация алгоритма загрузки вообще не потребуется.

Для алгоритма Alg, после его построения, необходимо определить область его существования. То есть, не все допустимые состояния исходной модели могут иметь сформиропанные алгоритмом образы в целевой модели, корректные с точки зрения приложения. Если исходная модель имеет такие состояния, то придется вернуться к первому этапу и пересмотреть схему целевой модели.

При построении Alg можно выделить два подхода. 1) d l0 — Alg(dij) - алгоритм используется только для формирования изначально пустого пользовательского представления данных. 2) d lk — Alg(dij), Vc -j Є Д, - алгоритм преобразует пользователь-скос представление независимо от его текущего состояния.

Для исходной модели данных П может быть задана совокупность ограничений: функциональные и многозначные зависимости, зависимости соединений и т.д. [15, 23, 22, 34]. Все они в совокупности определяют допустимые состояния данных и переходы между ними для исходной модели О,. Поскольку алгоритм Alg определяет образы состояний мо дели ft для модели ft , то соответствующие образы для ограничений на допустимые состояния и переходы также определяются этим алгоритмом. Образы ограничений целостности должны быть достаточными для выполнения исходных ограничений модели ft. То есть, для целевой модели ft могут быть заданы более "жесткие"ограничения, если реализация образов ограничений, являющихся необходимыми и достаточными, является невозможной. В крайнем случае ограничением целостности будет запрет на модификацию группы данных.

В процессе работы с моделью ft пользователь формирует последовательность команд fp, которая переводит модель ft из состояния cL Є D\ в состояние d lk Є D[ Исполняющая среда должна сформировать соответствующую совокупность команд Fp, которая необходима для перевода модели ft из состояния d Є Dj в состояние dik Є А. Указанные преобразования состояний должны удовлетворять условию коммутативности:

Другими словами, в состояние d l0 можно перейти двумя различными способами, но результат должен быть один и тот же. Сформулированное условие показывает, что основой для формирования / является алгоритм Alg. При этом, задача формирования / является обратной относительно Alg.

Замечания. Если изменения в ft будут противоречить ограничениям целостности в ft, то это является признаком неправильной настройки отображения, то есть неверное определение Р или / . Если целевая модель ft является моделью описания физического представления дан 24 ных, то этот этап опускается из построения отображения, так как в этом случае модель Q будет пассивной - не генерируются команды / .

Модификация состояния модели П может быть выполнена из другого приложения, что потребует изменения состояния модели О!. Для этого в первом подходе формирования алгоритма Лід должна быть определена последовательность команд F v, которая выполнит необходимые преобразования в представлении модели П . Во втором втором подходе достаточно использовать алгоритм Лід.

Ограничения целостности для 5-таблицы

Рассмотрим некоторые типы ограничений целостности. Функциональные зависимости.

Пусть для исходной модели определено множество функциональных зависимостей F С D, удовлетворяющее требованию минимальности и сохраняемое декомпозицией p(Ri,R2,...iRk) [23, 34]. Эти два свойства гарантируют для любой зависимости X —» А существование отношения Ri такого, что ХА С Щ. В этом случае достаточно потребовать выполнения X — А 6 F для соответствующих проекций ядДв) отношений Ri, которые удовлетворяют условию ХА С 7.

Ссылочная целостность данных.

Допустим, что для модели П установлено ограничение: кортеж щ[Щ является неудаляемым, если на него есть ссылка в отношении Rf. X = RiHRj 7 0 и существует кортеж щ[Я3] такой, что щ[Х) = щ\Х\, Для 5-таблицы кортеж щ[Щ неудаляем, если существует u3\R3\ Є KRAS) с указанными ограничениями.

Многозначные зависимости.

Если многозначная зависимость X — Y(Z) принадлежит множеству D и декомпозиция р содержит отношения Ri и R3 такие, что XY С Riy XZ С Rj и Щ П i2j = X, то зависимость X -ы Y(Z) принадлежит множеству D по построению.

Если многозначная зависимость X —»-» У( ) принадлежит множеству D и декомпозиция /? содержит отношение Ri\ XYZ С Rf, тогда достаточно потребовать выполнения зависимости X —»-» У ) для соответствующей проекции 7r (s) отношения ЛІ, которое удовлетворяет условию XYZ С Л;.

Поскольку S-таблица на логическом уровне является таблицей, то введем в рассмотрение традиционные табличные операции: дополнение, удаление и модификация кортежей.

Однако, непосредственные изменения в S-таблице невозможны, поскольку это может разрушить структуру S-таблицы и ограничения целостности данных. Решением данной проблемы является выделение подкортежей, соответствующих отношениям исходной модели РБД, и их "перезагрузка"в существующую S-таблицу. В данном разделе рассмотрен способ формирования этих кортежей, а их "перезагрузка"в следующем разделе, как образы операций для исходной модели.

Для кортежа г формируется совокупность кортежей щ[Щ = Г[ЛІ], і = 1,к. В кортеже г могут присутствовать как неопределенные значения, так и значения етр. Очевидными являются следующие правила: 1. Если X = Ri П Rj ф 0, г ф j, то для любого атрибута А Є X знамение г[А] не может быть неопределенным. 2. Если для какого-либо атрибута А Є Ri выполнено r[A] = етр, то кортеж щ\Щ не формируется. Если какой-либо атрибут имеет определенное значение, но не входит в объединение атрибутов для сформированных кортежей ИІ[ЯІ], то кортеж г считается недоопределенным и пользователь должен его доопределить. 3. Если для какой-либо кортеж щ[Щ ftR-(s), то этот кортеж не формируется. 4. Пусть функциональная зависимость X —» А Є D и ХА С Rim Если существует кортеж и\[Щ Є ядДв): и\[Х\ — щ[Х\ и и [А] ф щ[А], то кортеж щ[Щ должен быть отвергнут для ввода с уведомлением об этом пользователя.

Для кортежа г формируется совокупность кортежей щ[Щ = г[Щ, г = 1,к. Для этой последовательности проверяется:

5. Если li(r) = 0, то кортеж щ[Щ не формируется. G, Пусть кортежи в ядДз) являются ссылочными для TTR.(S). ЕСЛИ существует u j[Rj] Є 7TR.(S); ЇІ [Х] = щ[Х], X — Щ П Rj, тогда кортеж «і[ г] является неудаляемым. Операция отменяется с уведомлением об этом пользователя.

Для кортежа г формируется совокупность кортежей щ[Щ = r[Ri], а для кортежа г1 формируется кортежи и[[Щ = г [Щ, і = 1,к. Для последовательности щ[Щ проверяются правила 5 и 6, а для последовательности u jlRi] проверяются правила 1-4. Кроме того:

7. Если для какого-либо і выполнено щ[НЦ — u\\R , то кортежи щ[Щ и u\[Ri[ не формируются.

Введем в рассмотрение множества: Tj и Т. Множества 7) состоят из совокупности схем: т Tj = {juj2,..,jm; \Jfyv}, (2.4) v=l то есть Tj - совокупность номеров схем отношений и совокупность атрибутов из этих схем. Таким образом, Ri eTj означает, что і содержится среди номеров ji, J2, ..., jmi и X = Ri П Tj - совокупность атрибутов, принадлежащих Tj и Ri одновременно.

Алгоритм 2.3. Формирование множеств Tj для кортежа t Є 5 и кортежа u[Ri]. Шаг 0. Номер итерации j — 0. Шаг 1. j = j + 1. Выбираем Я такое, что X = Я П Ri ф 0, и[Х] = t[X] и Rm не было выбрано на предыдущих итерациях. Если такого Rm нет, то конец алгоритма. В противном случае формируется Tj = {m; Rm} и переход на шаг 2.

Шаг 2. Выбираем схему Rm такую, что Я Tj, RmHTj = 0 и, если X — Rm П Ri ф 0, то и[Х] = t[X]. Если Rm не найдено, то переход на шаг 1. В противном случае Rm присоединяется к Tj. Переход на начало шага 2. Конец алгоритма.

Оценка мощности 5-таблицы для двух отношений и множества общих атрибутов

Рассмотрим оценку мощности 5-таблицы s для двух отношений -Лі и Лг, когда множество X = R\ Г1Я2 состоит из т атрибутов, т 2. Это становится актуальным, если нет возможности получить экспертную оценку величии ki, &2 и к для X, как для обобщенного атрибута. Кроме того, при обобщении на множество отношений будет видно, что схема вычисления оценки мощности s потребует разбиения обобщенных атрибутов на подмножества. Пусть X = {Лі, А% ..., Ат}, тогда т т ki = l[ki{Aj), і = 1,2, к = 1[к(А& где h(Aj) - мощность атрибута Aj в схеме Я , k(Aj) - мощность атрибута Aj в соединении Яі м І2г, то есть количество общих значений атрибута Aj в реализациях схем R\ и .. Для формального (количественного) сохранения функциональных и многозначных зависимостей должно быть выполнено; h{Aj) Ni, k(Aj) h{Aj), і = 1,2, j = l,m. Принципиальное отличие от предыдущего случая заключается в том, что возможно к( Nj. То есть не все допустимые комбинации значений атрибутов из X будут присутствовать в каждой реализации Щ. А это значит, что в остаток попадут не только значения из множестпа специфических комбинаций мощности ki — к, но и комбинации общих значений из множества мощности к. Для произвольной схемы генерации, удовлетворяющей требованиям равномерности и независимости, и с учетом соотношений (3.7) - (3.9) имеем: \S\ = (WM -f {h - k)VxZ2 л- кУ,г 2+ +(fc2-fc)V2 + feV8Zj)/(rir2), где Z[ - количество реализаций схемы . не содержащих общую комбинацию значений атрибутов из множества мощности к. С учетом (3.10) и того, что Z{ = Tj, имеем: Выражения в скобках в формуле (3.14) будем называть коэффициентом остатка отношения.

Величина Z[ зависит от распределения выбранной комбинации значений по реализациям Я;, и для различных схем генерации реализаций величина Z\ будет различной.

Рассмотрим пример: N{ = 4, т = 2, kj(Ai) = ki(A2) 2. Схема 1: используется исходная схема для генерации значений каждого атрибута, затем для одного из атрибутов используются перестановки: Zl/Ti = 58/216. Схема 2: Генерация сочетаний с повторениями из множества значений атрибутов hi но JV; с выбором только тех генераций, для которых атрибуты принимают все значения от 1 до ki{Aj): Z jTi = 6/19.

Из примера видно, что значения Z jTi различны, хотя все остальные компоненты оценки (3.14) совпадают и выполнены ограничения па схемы генерации. Вопрос о выборе наиболее приемлемой схемы генерации остается открытым. Поэтому целесообразно принять какие-либо дополнительные предположения о характере распределения выбранной комбинации значений по реализациям. Предположить, что Z\ = 0 при формальном распространении оценки (3.11) на большее количество общих атрибутов невозможно, поскольку должно быть выполнено соотношение: то есть сумма соединения и остатка R\ не может быть меньше мощности отношения R\. Аналогичное выражение можно записать для Яг. Произведя преобразование (3.15), получим: или, в общем случае, Из содержательного смысла Z\ и 7] следует, что Z 0 -і 1. -ч Таким образом: тах{0, 1 - } . (3.16) Выражение (3.16) является верным и для одного общего атрибута: так как N{ h, то Z[ = 0 удовлетворяет неравенству.

Предположим, что Z[ - есть количество сочетаний с повторениями из к( — 1 по Ni, аТ{- количество сочетаний с повторениями из к{ элементов по N{. Это предположение не лишено здравого смысла, поскольку для Z[ рассматриваются реализации не содержащие одной выбранной комбинации значений. Следовательно: Z i_{ki + Ni-2)\(ki-l)\_ kj-1 , , ТІ (fei + JVf-1)1(-2)! h + Ni-Ґ Условие (3.16) при JV; 1 будет всегда выполнено. Таким образом, предложенная оценка (3.17) имеет простой вид, что нельзя сказать об оценках для схем генерации 1 и 2 в примере. Кроме того, оценка (3.17) дает несколько завышенный результат по сравнению со схемами в примере, то есть, она является более пессимистической. В качестве оценки не рекомендуется использовать величину 1 — Ni/ki, поскольку она выражение (3.15) превращает в строгое равенство, что достижимо только при отсутствии повторений значений общих атрибутов в реализации Я;. То есть, эта оценка дает явно заниженный результат.

Схема реализации запросов на специализированных моделях

Диаграмма состояния песет в себе значительный объем информации, используемой для решения разнообразных материаловедческих задач. Потребность специалистов в информации о фазовых равновесиях лишь частично удовлетворяется изданием многочисленных справочников по диаграммам состояния. Однако далеко не все из них равноценные. Как правило, справочники существенно различаются качеством информации; в некоторых приведены первичные данные без указания их достоверности, в других - данные, прошедшие экспертизу более или менее высокого уровня. Далеко не всегда эти данные согласованы друг с другом, а также с результатами рептгено-структурного исследования зависимости свойств от состава и т.д. Такая информация перед использованием должна пройти процедуру экспертизы и согласования, что с учетом разбросанности по периодическим изданиям, приводит к дублированию затрат на ее поиск и возможности пе квалифицированного использования,

Выходом из сложившегося положения является организация храпения информации, прошедшей квалифицированную экспертизу, в виде базы данных. В настоящее время исследовано около 10000 диаграмм состояния для бинарных и квазибинариых систем, где бинарными называются системы, состоящие из чистых компонент, п = 2, представленных в таблице Менделеева, квазибипарные - системы из двух относительно устойчивых соединений. Кроме того, известно несколько тысяч тройных и квазитройпых систем. Ведутся также работы по исследованию систем с большей компоиентностыо. Следует отметить, что имеющейся информации по диаграммам состояния недостаточно для решения разнообразных научных и практических задач, что повлияло на интенсивное развитие методов изучения диаграмм состояния. Следовательно, есть основания считать, что тенденция увеличения числа исследованных диаграмм состояния будет сохраняться в течение продолжительного времени. Это определило принцип разработки информационной системы, ориентированной на n-компопентиые системы, п 2.

Условия фазовых равновесий изображаются на диаграмме состояния в виде элементов размерности п, п-1,..., О, граничные элементы имеют размерностьп-1,71—2,..., О, гдеп-размерность диаграммы состояния. Элемент размерности п соответствует области на диаграмме состояния, 71 — 1 - границам областей, п — 2 - границам границ областей и т.д. Некоторые элементы размерности 0 (точки) являются нонвариантными равновесиями, в которой сосуществуют все соседние фазы. На рисунке 2 такая точка одна, в которой сходятся все четыре границы.

Математическое описание фазовых равновесий должно удовлетворять следующим физико-химическим принципам.

1. Элемент размерности і, і = 1,п, ограничен элементами размерности г — 1, і - 2, ,.., О, принадлежащих исходному элементу и одновременно соседним элементам той же размерности. Для реализации этого принципа введены номера элементов и для каждого элемента размерности г — 1 указываются номера элементов размерности і, которым он принадлежит.

2. Существует два класса точек: а) точки, через которые граница должна пройти точно; б) точки, для которых граница проходит в пределах погрешности измерения данных точек. Построение границы по этим классам точек осуществляется при помощи алгоритма смешанной аппроксимации.

3. Элементы (границы) размерности п—1, п 2, ,.,, 1 не должны со держать ложных экстремумов и точек перегиба. Причиной этого могут быть ошибки в данных, или заниженная величина невязки, задаваемая во входном документе. В первом случае необходимо уточнить данные, но втором - увеличить невязку, т.е. привести в соответствие невязку с реальной точностью имеющихся данных.

4. Стыковка элементов (поверхностей), аппроксимируемых раздельно, осуществляется таким образом, чтобы их продолжение принадлежало элементу большей размерности, для которого исходные элементы не являются граничными. Эта задача обычно возникает при недостатке экспериментальных данных и решается посредством добавления экспертом новых точек, полученных расчетным методом,

Описанные в данном разделе свойства данных в информационной системе являются достаточными для построения математической модели диаграммы состояния и создания на её основе соответствующей информационной системы.

Определение условий термодинамического равновесия фаз по диаграмме состояния является одной из важнейших термодинамических задач. Результаты её решения находят разнообразные практические приложения, например: 1) определение условий синтеза кристаллов и пленок из растворов и газовой фазы; 2) определение границ области существования фазы; 3) определение состава равновесных фаз; 4) моделирование процессов глубокой очистки веществ; 5) регулирование составов кристаллов методами кристаллизации растворов; 6) моделирование процессов образования зародышей новых фаз; 7) проверка совместимости материалов при изготовлении приборов и устройств; 8) определение последовательности выделения фаз при охлаждении или нагреве образца данного состава.

Разработка и исследование моделей данных и средств организации взаимодействия пользователей с информационными ресурсами Зыкин Сергей Владимирович

Разработка алгоритма построения представления целевой модели

Ограничения целостности для 5-таблицы

Оценка мощности 5-таблицы для двух отношений и множества общих атрибутов

Схема реализации запросов на специализированных моделях

Похожие диссертации на Разработка и исследование моделей данных и средств организации взаимодействия пользователей с информационными ресурсами