Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Научно-методологические основы функционирования распределенной информационно-аналитической среды сопровождения государственных программ в сфере науки и образования Артамонов Юрий Николаевич

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Артамонов Юрий Николаевич. Научно-методологические основы функционирования распределенной информационно-аналитической среды сопровождения государственных программ в сфере науки и образования: диссертация ... доктора Технических наук: 05.13.01 / Артамонов Юрий Николаевич;[Место защиты: ФГБОУ ВО «Тамбовский государственный технический университет»], 2019

Содержание к диссертации

Введение

Глава 1 Анализ исходных предпосылок совершенствования научно-методологических основ информацонно-аналитического сопровождения государственных программ 21

1.1 Анализ опыта сопровождения государственных программ в сфере науки и образования 21

1.1.1 Анализ индикативного планирования в рамках целевых программ 21

1.1.2 Анализ опыта сопровождения программ стратегического развития ВУЗов 37

1.1.3 Анализ оценки результативности научных организаций и эффективности ВУЗов 43

1.2 Анализ типового состава средств организационно-технического и информационно-аналитического сопровождения государственных программ в сфере науки и образования 51

1.3 Постановка проблемы исследования 64

Выводы по первой главе 82

Глава 2 Формирование состава аналитического обеспечения функций мониторинга и управления ходом реализации государственных программ 85

2.1 Разработка метода оценки результативности научно технических проектов 85

2.1.1 Разработка метода оценки вклада проекта в достижение планового значения индикативного показателя 85

2.1.2 Оценка качества научно-технических проектов на основе содержательного анализа получаемых результатов 99

2.2 Оценка эффективности элементов Программы и Программы в целом в отношении достижения целевых индикаторов117

2.3 Комплексная оценка целевой результативности научно-технических проектов 124

2.3.1 Постановка задачи многокритериальной оптимизации 124

2.3.2 Метод оценки результативности проектов для булевых критериальных функций 126

2.3.3 Метод оценки результативности проектов на основе сингулярного разложения критериальной матрицы 128

2.3.4 Общий подход к оценке результативности на основе матричных норм 135

2.3.5 Исследование влияния нормирования на упорядочение объектов по предпочтению 136

2.3.6 Исследование упорядочения объектов по предпочтению на основе нормирования рангами 140

2.3.7 Исследование упорядочения объектов по предпочтению на оценочной матрице с непрерывной шкалой 150

2.4 Метод анализа информационной значимости системы показателей, формирования базиса индикативных показателей 164

2.5 Метод выявления влияющих факторов при реализации государственной программы 168

Выводы по второй главе 178

Глава 3 Разработка информационного обеспечения функций мониторинга и управления ходом реализации государственных программ 180

3.1 Анализ существующих подходов к хранению и обработке больших данных 180

3.2 Логическая модель хранилища данных с динамической структурой 187

3.2.1 Концептуальное описание модели 187

3.2.2 Формальное описание модели (базовый функционал) 189

3.3 Синтез основных элементов проблемно-ориентированной системы управления хранилищем данных с динамической структурой 194

3.4 Физическая реализация хранилища данных с динамической структурой 200

3.5 Технология сортировки, сериализации и представления объектов анализа в виде размеченной иерархической структуры 203

Выводы по третьей главе 220

Глава 4 Обоснование информационно-аналитического обеспечения функций мониторинга и управления ходом реализации государственных программ 221

4.1 Обоснование и проверка адекватности методического обеспечения оценки вклада проекта в индикативный показатель 221

4.2 Обоснование и проверка адекватности методического обеспечения оценки эффективности элементов Программы и Программы в целом в отношении достижения целевых индикаторов 235

4.3 Обоснование методического обеспечения комплексной оценки результативности 240

4.3.1 Обоснование подхода оценки результативности на основе матричных норм 240

4.3.2 Обоснование комплексного подхода к оценке результативности проектов 254

4.4 Обоснование подхода к достижению целевых индикаторов Программы при выборочном отборе 265

4.5 Обоснование подхода формирования базиса индикативных показателей на основе анализа информационной значимости показателей 271

4.6 Обоснование других положений аналитического обеспечения 281

4.7 Обоснование информационного обеспечения сопровождения государственных программ 283

4.7.1 Обоснование свойств логической модели OP-model 283

4.7.2 Обоснование свойств проблемно-ориентированной системы управления OP-system 294

4.7.3 Обоснование технологии сортировки, сериализации и представления объектов анализа в виде размеченной иерархической структуры 298

Выводы по четвертой главе 301

Глава 5 Апробация разработанного обеспечения в распределенной информационно-аналитической среде 305

5.1 Состав методического обеспечения, реализованного в распределенной информационно-аналитической среде 305

5.2 Методика оценки результативности организаций и проектов по вкладу в достижение целевых индикаторов Программы 305

5.2.1 Разработка методики оценки результативности организаций и проектов по вкладу в достижение целевых индикаторов Программы 305

5.2.2 Апробация методики оценки результативности организаций и проектов по вкладу в достижение целевых индикаторов Программы 314

5.3 Методика оценки эффективности организаций и проектов Программы по вкладу в достижение целевых индикаторов 321

5.4 Методика оценки эффективности элементов Программы и Программы в целом 323

5.5 Методика оценки результативности научных и образовательных организаций 325

5.5.1 Разработка методики оценки результативности научных и образовательных организаций 325

5.5.2 Апробация методики оценки результативности научных и образовательных организаций 328

5.6 Методика выбора наиболее информативных показателей 336

5.6.1 Разработка методики выбора наиболее информативных показателей 336

5.6.2 Апробация методики выбора наиболее информативных показателей 340

5.7 Методика выявления механизмов влияния на индикативные показатели, точек роста индикативных показателей 348

5.7.1 Разработка методики выявления механизмов влияния на индикативные показатели, точек роста индикативных показателей 348

5.7.2 Апробация методики выявления механизмов влияния на индикативные показатели, точек роста индикативных показателей 350

5.8 Описание структуры и алгоритма работы разработанной информационно-аналитической среды 355

Выводы по пятой главе 363

Заключение 364

Список литературы 374

Анализ опыта сопровождения программ стратегического развития ВУЗов

Кроме целевых программ, индикативное управление осуществляется и в рамках других плановых документов, например, программ стратегического развития ВУЗов. Так в 2011 году был проведен конкурс поддержки программ стратегического развития государственных образовательных учреждений высшего профессионального образования [152]. Мероприятие проводилось в целях повышения эффективности управления вузами путём поддержки их программ стратегического развития за счёт средств федерального бюджета. В конкурсе приняли участие программы стратегического развития 248 вузов, подведомственных Ми-нобрнауки России. По результатам конкурса победителями признаны 55 ВУЗов. В качестве критериев для отбора победителей были использованы [152]:

- группа показателей образовательного, научного и инновационного потенциала (значимость группы показателей 30%);

- показатели финансовой устойчивости (значимость группы показателей 20%);

- показатели оценки программы стратегического развития, показатели оценки предлагаемых к реализации проектов в рамках программы (значимость группы показателей 30%);

- показатель объема бюджета программы стратегического развития, включая размер запрашиваемой субсидии (значимость - 20%).

В рамках критерия «Оценка образовательного, научного и инновационного потенциала» в соответствии с разработанной информационной картой (форма 5 [152]) оценивались показатели успешности образовательной деятельности (всего 12 показателей, ряд из которых представлен также в детализированной форме, например, показатель 1.1 Количество реализуемых основных образовательных программ в соответствии с лицензией на образовательную деятельность с детализацией 1.1.1 бакалавриат, специалитет; 1.1.2 магистратура; 1.1.3 аспирантура); результативности научно-исследовательского потенциала (всего 9 показателей, например, 2.2 Объем финансирования НИОКР из всех источников); успешности инновационной деятельности (всего 7 показателей, например, 3.3 Количество патентов); а также показатели финансовой устойчивости и ресурсного обеспечения (всего 9 показателей, ряд из которых также представлен в детализированной форме, например, 4.4 Средняя заработная плата ППС вуза с детализацией 4.4.1 в целом, 4.4.2 ассистентов, 4.4.3 доцентов, 4.4.4 профессоров, 4.4.5 заведующих кафедрами, 4.4.6 деканов).

В рамках критерия «Финансовая устойчивость Участника конкурса» согласно [152] было предложено повторно использовать показатель 4.2 Структура доходов (объем в млн. руб.) в детализации 4.2.1 финансирование по смете (в форме субсидий учредителя); 4.2.1.1 в том числе финансирование НИОКР по смете (в форме субсидий учредителя); 4.2.2 средства, полученные от проведения НИОКР из других источников; 4.2.3 средства, полученные за образовательные услуги; 4.2.4 другие источники.

В рамках критерия «Оценка программы стратегического развития и предлагаемых к реализации проектов в рамках субсидии» оценивались качество разработки программы стратегического развития ВУЗа, в частности раздела «Общая характеристика структуры деятельности ВУЗа, результаты анализа внешней и внутренней среды»; наличие опыта выполнения целевых программ, комплексных проектов, наличие соглашений о поддержке программ стратегического развития региональными органами власти, отраслевыми ведомствами и т.д.; качество проработки и планирования реализуемых мероприятий и проектов; наличие существующих и описание планируемых методов и инструментов управления реализацией программы стратегического развития [152].

Наконец, в рамках критерия «Объем бюджета программы стратегического развития участника из всех источников финансирования, включая размер запрашиваемой субсидии» оценивалось соотношение предложения участника по объему финансирования программы из всех источников финансирования, включая размер запрашиваемой субсидии, с максимально заявленным объемом финансирования [152].

Из представленного описания видно, что для оценки и выявления победителей был использован достаточно большой объем статистических данных каждого ВУЗа. При этом каждая заявка проходила экспертизу. Как следует из [152], результаты экспертизы носили рекомендательный характер и направлялись в конкурсную комиссию, которая окончательно с учетом значимости критериев выявляла победителей. Однако, следует отметить, что в конкурсной документации отсутствуют какие-либо методические рекомендации по статистической обработке большого объема данных для проведения экспертизы, отсутствует методика оценки результативности ВУЗа по группам выбранных показателей, в рамках которой целесообразно было бы сформулировать подход к агрегированию показателей в некоторый сводный показатель. В любом случае эксперт при оценке сталкивался с многокритериальностью и вынужден или проводить попарные сравнения, или выбирать главный показатель, или ориентироваться в оценках на некий средний результат (среднее, медиану, моду). Отсутствие прозрачности в этом вопросе приводило к возрастанию роли субъективизма при принятии окончательного решения.

Практика выполнения программ стратегического развития ВУЗов

- победителей показала необходимость ежегодного мониторинга. При этом критерии оценки хода реализации программ были наследованы из конкурсной документации: группа показателей образовательного, научного и инновационного потенциала, а также показатели финансовой устойчивости и ресурсного обеспечения. Для каждого такого показателя в программе стратегического развития каждым исполнителем устанавливался плановый уровень, который стремились достичь в ходе реализации программы. Кроме данной группы показателей, общих для всех ВУЗов, были определены и уникальные для каждого ВУЗа показатели, а также их плановые значения в соответствии с мероприятиями программы стратегического развития. Таким образом, в рамках ежегодного мониторинга также возникала необходимость сравнительной оценки программ стратегического развития ВУЗов. Например, в 2013, 2014 годах такие оценки использовались для выявления ненадлежащего выполнения программ стратегического развития ВУЗов - победителей. В отличие от рассмотренных ранее целевых индикаторов федеральных целевых программ, где плановое значение устанавливалось только на агрегированную по всем исполнителям величину целевого индикатора, в данном случае интерес представлял каждый отдельный исполнитель, и наоборот, какой-либо агрегированной величины, характеризующей всех исполнителей, выбрано не было. С одной стороны, это должно упрощать задачу оценки результативности программы стратегического развития

- например, если плановое значение достигнуто, то по данному показателю программа выполнена (результативна). Однако, с другой стороны, следует помнить, что плановое значение устанавливалось самим исполнителем. В этой ситуации возможно несколько случаев: исполнитель переоценил свои возможности и поставил себе «высокую планку»; исполнитель недооценил свои возможности и поставил себе «низкую планку»; исполнитель адекватно установил себе плановое значение показателя. Случай с «высокой планкой» всегда дает худшую оценку, чем есть на самом деле, случай с «низкой планкой» всегда дает лучшую оценку, чем есть на самом деле. Например, пусть исполнитель имеет самое наибольшее значение заданного показателя (то есть объективно является лучшим по абсолютному значению данного показателя среди всех исполнителей), однако, если он установил себе «высокую планку», он может оказаться худшим именно по этому показателю. Таким образом, на оценке отражается возможный субъективизм в определении исполнителем плановых значений.

Ниже на рисунке 1.5 представлен пример оценки результативности программ стратегического развития ВУЗов - победителей (каждой организации присваивается номер места по результативности - наиболее результативные организации имеют меньший номер) по одному из показателей. Ранжировка организаций по результативности выполнена на основе фактических данных 2012 года. Также для каждой организации показана ее плановая результативность. Это позволяет решить проблему существенного занижения или завышения плана. В частности из диаграммы видно - какое место по плану должна занять организация (насколько высоко она подняла себе «планку»), а также по фактической результативности можно увидеть, как организация эту «планку» сумела преодолеть.

Исследование упорядочения объектов по предпочтению на основе нормирования рангами

Рассмотрим вначале нормирование рангами: \/j : (atj Є {1, 2,... ,n},ii ф І2 = - 0Lixj ф a i2j) (предполагаем отсутствие связанных рангов). Это соответствует ординалистскому подходу - предпочтения к выбору объектов не могут измеряться количественно, а только сравниваться: один объект хуже или лучше другого. В этом случае каждый столбец матрицы X - это один из способов упорядочения объектов в порядке предпочтений соответствующего показателя. Тогда каждый j-й признак фактически задает свою перестановку объектов Bj. Причем в большинстве случаев такие перестановки для разных признаков не являются согласованными. Поэтому требование найти окончательное ранжирование В - это требование найти компромисс, в некотором смысле наименее противоречащий всем признакам. Определение 14. Назовем матрицы вида: в которых все столбцы одинаковы, матрицами непротиворечивого ранжирования.

Очевидно, что матрицы непротиворечивого ранжирования являются максимально согласованными, они не требуют в групповом выборе поиска компромисса между противоречащими по разным признакам ранжированиями. Заметим также, что такие матрицы имеют единичный ранг и их количество для п объектов равно п\. Предположение отсутствия связанных рангов не является принципиальным, так как для обозначения зоны безразличия можно допустить множество различных матриц С, в которых к объектов зоны безразличия переставляются к\ способами. Используя определение 14, исходная задача ранжирования объектов в порядке предпочтения сводится к нахождению для заданной матрицы X наиболее близкой к ней матрицы непротиворечивого ранжирования C. В свою очередь идея оценки близости матриц, как уже было показано, естественным образом приводит к рассмотрению различных матричных норм.

В рамках рассматриваемого ординалистского подхода разработаны различные методы группового выбора: правило Кондорсе, Борда, относительного большинства, Копленда, Симпсона и другие [129,130,187]. Большинство существующих методов группового выбора лучшей альтернативы также позволяют ранжировать объекты в порядке предпочтения. В рамках решения задачи группового выбора при ординалист-ском подходе к используемым методам априори предъявляются некоторые желательные нормативные требования: анонимность, нейтральность, монотонность, Парето-эффективность, неманипулируемость и другие [130]. Например, правило Кондорсе удовлетворяет требованиям анонимности, нейтральности, монотонности, и существуют системы предпочтений, для которых победитель, определенный любым методом на основе подсчета баллов (правило Борда, относительного большинства), никогда не совпадет с победителем по правилу Кондорсе. Однако, для правила Кондорсе существуют системы предпочтений, для которых невозможно выявить победителя (причем вероятность получения такой системы увеличивается с ростом альтернатив или признаков). В некоторых методах стремятся ослабить ряд требований (например, нейтральность) для получения состоятельности по Кондорсе (методы Копленда, Симпсона). В целом на правила построения систем группового выбора действует ряд ограничивающих теорем: например, теорема Мэя устанавливает, что одновременное удовлетворение требований анонимности, нейтральности, монотонности возможно только для правила большинства; в известной теореме Эрроу, утверждается, что не существует Парето-эффективного неманипулируемого правила группового выбора, кроме правила диктатора. Все это приводит к тому, что при принятии решений в практически важных приложениях от соблюдения некоторых требований приходится отказываться. Например, требование неманипулируемости целесообразно предъявлять в ситуациях, когда возможно стратегическое голосование. В тоже время для широкого круга задач оценки объектов по параметрам стратегическое голосование невозможно. Кроме этого, для таких задач характерно малое число повторяющихся профилей предпочтений (альтернатив много больше, чем признаков), что может создавать проблемы использования правила большинства при попарном сравнении альтернатив. Все это требует адаптации существующих методов и разработки более общих подходов. На примере 1 рассмотрим использование различных матричных норм, а также некоторых существующих методов группового выбора. Использование существующих правил дает следующие результаты:

правило Кондорсе: победитель отсутствует, ранжирование объектов по предпочтению невозможно;

относительное большинство: E CyA -B D;

правило Борда: EyB C DyA;

правило Копленда: AyB DyCyE;

правило Симпсона: B C D EyA.

Использование различных матричных норм позволяет получить следующие результаты (для получения результата перебились все возможные матрицы (из определения 14), поскольку все столбцы такой матрицы одинаковы, результат записан в виде списка, соответствующего одному столбцу такой матрицы, а также в виде интерпретации группового ранжирования):

при L2(/i(A, С)) получаем множество возможных решений: С = (1,4,3,2,5),С = (1,4,2,3,5), С = (1,3,4,2,5), С = (1,3,2,4,5), С = (1,2,4,3,5), С = (1,2,3,4,5), (имеем все возможные перестановки объектов B,C,D, что свидетельствует об их безразличии в предпочтении), все это соответствует групповому ранжированию EyB C DyA, совпадающему с правилом Борда;

при L3(/i(A, С)) получаем два возможных решения: С = (2,5,3,1,4) и С = (2,1,3,5,4), что соответствует либо групповому ранжированию ByEyCyAyD, либо ранжированию DyEyCyAyB. Полученный результат свидетельствует, что лучший и худший объекты выявить не удается - либо лучшим является выбор «Владивосток» и худшим «Дубай», либо наоборот. При этом следует заметить, что на первое место выбираются варианты, которые ни в одном из профилей предпочтения не были худшими. Расчеты показывают, что дальнейшее увеличение параметра р 3 в Lp(fi(A, С)) не меняет выбор L3(fi(A, С));

при Ь2(/2(Д С)) получаем одно решение С = (1, 3, 5,4, 2), т.е. групповое ранжирование CyDyByEyA, дальнейшее увеличение параметра р 2 в Lp(f2(A, С)) приводит к решению С = (4,1, 3, 2, 5) и соответственно ранжированию Е у А у С У D у В. Таким образом, при возрастании р в данном случае более рискованной цепочке Е У А отдается предпочтение;

при S2(fi(A, С)) получаем одно решение С = (1,3,2,4,5), т.е. групповое ранжирование EyDyByCyA, которое при возрастании степени р меняется; так при Sw(fi(A, С)) получаем С = (1,5,2,3,4), или ранжирование ByEyDyCyA, что опять соответствует более осторожному предпочтению варианта «Владивосток» перед «Евпатория»;

при ( (Д С)) получаем одно решение С = (1,3,5,4,2), что соответствует наиболее частому профилю CyDyByEyA, т.е. в этом случае решение принимается путем выявления диктатора, с которым согласно большинство. При р = 3 групповое ранжирование меняется на противоположное первому профилю EyDyCyByA, однако дальнейшее увеличение параметра р опять возвращает к решению диктатора CyDyByEyA. В дальнейшем выполним более детальные исследования использования поэлементной p-нормы. Покажем, что некоторые существующие правила группового выбора являются частными случаями введенного в рассмотрение общего подхода.

В литературе [128,144] рассматривается множество методов формирования группового решения по полному ранжированию сравниваемых объектов. Данные методы внешне никак не используют идею матричных норм. Однако детальный анализ показывает, что между ними существует связь. Дадим здесь краткое описание двух таких методов из [128].

Правило Борда. На рангах данное правило можно сформулировать следующим образом: по каждому признаку pj каждому объекту qz выставляется балл: rJ{ql) = \{qi Є Q : atj aij, l Ф г}. Итоговый балл объекта qt подсчитывается как сумма оценок по всем признакам: r(ql) = rJ(ql).

Обоснование свойств логической модели OP-model

Для обоснования свойств предложенной модели покажем соответствие и имеющиеся различия OP-model и логической ER-модели данных [74,124,210].

Лемма 4. Любая сущность ER-модели данных может быть реализована в OP-model.

Доказательство. В данном случае возможны два варианта, представленные на рисунке 4.30:

1. Первичный ключ сущности (Entity_1) является простым. Подобный пример представлен на рисунке 4.30 (a). Такая сущность соответствует множеству объектов в OP-model. Каждый экземпляр сущности отображается в соответствующий объект OP-model. Все объекты этого множества имеют одинаковый тип - имя сущности. Атрибут (Attribute_1) - первичный ключ задает имя объекта, все остальные атрибуты задают свойства объекта.

2. Имеется одна сущность (Entity_2), первичный ключ которой является составным - например, состоит из атрибутов Attribut_-21,Attribute_22 (рисунок 4.30 (b)). В этом случае отображение строится аналогично предыдущему случаю, за исключением имени объекта. Имя объекта можно построить соединением частей составного ключа, кроме этого, каждая часть составного первичного ключа добавляется также как отдельное свойство объекта.

Заметим, что если рассматривать статическую OP модель (значение d\ не меняется у имени объектов и их свойств), то построенное отображение экземпляров сущностей ER модели в объекты OP модели является биективным, т.е. возможно взаимно однозначное отображение объектов OP модели в сущности и экземпляры сущностей ER моде ли.

Лемма 5. Рекурсивное отношение ER-модели данных может быть реализовано в OP-model.

Доказательство. Возможные виды рекурсивных отношений в ER-модели показаны на рисунке 4.31.

Заметим, что в базовом функционале OP-model отсутствует механизм фиксации вида отношения - один к одному, один ко многим, многие ко многим. Данное разграничение вида отношений может быть перенесено на программные приложения по взаимодействию с хранилищем. Поэтому для доказательства достаточно рассмотреть только один вид отношений: многие ко многим, считая остальные виды частными случаями, получаемыми из этого отношения наложением определенных ограничений (как правило, для обеспечения целостности данных).

Для реализации рекурсивного отношения многие ко многим в OP-model в объекты, соответствующие экземплярам сущности, кроме свойств - атрибутов сущности, добавляется свойство с именем типа объектов. Причем ссылочное значение этого свойства указывает на uuid объекта, отвечающего структуре отношения:

Доказательство. На рисунках 4.32, 4.33, 4.34 показаны возможные виды связей между сущностями в ER модели данных. Кроме этого, на рисунках показана модальность связей: двойная линия связи - «должен» (каждый экземпляр сущности имеет связь), одинарная линия связи - «возможно» (некоторые экземпляры сущности имеют связь). Как уже было отмечено, в базовом функционале OP-model не предусмотрено механизмов контроля вида отношений. Также в OP-model не предусмотрено специальных механизмов контроля модальности связей. Однако введение ограничений на создание новых объектов определенного типа, добавления и изменения свойств объектов позволяют реализовать все рассмотренные виды связей ER модели данных (причем реализация этих ограничений может быть вынесена за рамки базового функционала OP-model).

Реализация связей один к одному.

Entity_l

Entity_2

Entity_l

Entity_2

Entity_l

Entity_ Relationship ! H Relationship Relationship

1. Пусть экземпляры сущности «Entity_l» при простом первичном ключе «Attri bute_ll» отображаются в объекты OP-model:

Для доказательства примем соглашение, что F(Ojt) - внешняя функция, задающая наличие связи один к одному для объекта (принимает значение t при наличии связи и nil при ее отсутствии), соответствующего і-му экземпляру j-й сущности. В этом случае объекты, соответствующие экземплярам «Entity_2», можно выделить из значений первичного ключа экземпляров «Entity_l» следующим образом:

- выделить множество А объектов, типа «Entity_1.Name»: A Q(Entityi. Name);

- выделить подмножество В объектов из А, для которых внешняя функция Р(--) указывает наличие связи: B -red(map(if(F(x), х, nil), А));

- для каждого объекта из В создать объект типа «Entity_2.Name» со ссылкой на созданный объект в В:

Все это удобнее записать, используя введенные обозначения функций при технической реализации.

2. Пусть экземпляры сущности «Entity_l» при составном первичном ключе «Attribute_ll», «Attribute_12» отображаются в объекты OP-model: {(uuid0l, Entityі.Name, Рг, {Attribute Value : Attributei2.Value,di))z=i,_n} Рг = {(uuidpk, Attributeik.Name, {(Attributeik.Value, nil, di)})k=i..m}

В этом случае порядок действий может быть аналогичен предыдущему пункту, отличие состоит в том, что объекты выделяются из каждого атрибута составного первичного ключа «Entity_l»:

А - О.ТуреО( Entity 1 .Name)

В - red(map([x], if(F(x), х, nil), А))

С - map( [х] ,GetName(x, Attributell .Name) , В)

D - map( [x] ,GetName(x, Attributed .Name) , B)

E - map([x], O.AddO(GenUuid , Attributell .Name,

P.VT(x,d),d), C) F - map([x] ,O.AddO(GenUuid, Attributed .Name,

P.VT(x,d),d), D) map([x,y], block(x -y), B,

map([xl,x2,x3] ,

P.AddL(xl,x2,x3,d) ,

В, C, map([z] , z.Uuid,E)))

map([x,y], block(x -y), B,

map([x1,x2,x3] ,

P.AddL(x1,x2,x3,d) ,

B, D, map([z] , z . Uuid,F)))

Модальность связей: «Entity_1» - «должен»; «Entity_2» -«возможно». В дальнейшем разрешается добавлять новые объекты в множество объектов типа «Entity_2», а также запрещается добавлять объекты «Entity_1» без выделения нового объекта из значения первичного ключа и добавления его в множество «Entity_2».

Модальность связей: «Entity_1» - «должен»; «Entity_2» -«должен».

Порядок действий совпадает с предыдущим случаем. Однако после выделения объектов запрещается добавлять новые объекты в множество объектов типа «Entity_2», а также запрещается добавлять объекты «Entity_1» без выделения нового объекта из значения первичного ключа и добавления его в множество «Entity_2».

Модальность связей: «Entity_1» - «возможно»; «Entity_2» -«возможно».

Порядок действий совпадает с предыдущими случаями. После выполнения действий разрешается добавлять новые объекты в множество объектов типа «Entity_2» и «Entity_1».

Описание структуры и алгоритма работы разработанной информационно-аналитической среды

Предложенное методическое обеспечение целесообразно интегрировать в состав единой информационно-аналитической среды. Для этого выделим ее основные модули и рассмотрим алгоритмы их взаимодействия. На рисунке 5.13 представлена обобщенная структура разработанной информационно-аналитической среды, включающей в себя:

Кластер серверов хранилища OP-model-3 - каждый сервер кластера реализует хранилище OP-model третьего уровня, локально храня информацию о части объектов и их свойствах.

Сервер uuid адресов - сервер хранит соответствие uuid адресов объектов и их свойств с IP адресами серверов кластера хранилища OP-model-3, а также время последнего изменения соответствующего объекта или свойства. Данный сервер используется для ускорения доступа к объектам и их свойствам.

Кластер серверов хранилища OP-model-3, сервер uuid адресов образуют сетевой сегмент, каждый отдельный сервер кластера серверов хранилища OP-model-3 образует локальный сегмент, реализуя таким образом распределенное хранение данных.

Локальный сегмент хранилища данных OP-model-2 делает копию части объектов из локального хранилища данных OP-model-3, если какой-либо объект или свойство отсутствует в локальном сегменте OP-model-2, он запрашивается в энергонезависимом хранилище OP-model-3, если он и там отсутствует, через модуль синхронизации данных происходит обращение к сетевому сегменту. Любое изменение в локальном хранилище OP-model-2 сразу же отражается в энергонезависимом хранилище OP-model-3.

Модуль синхронизации данных входит в состав локального сегмента хранилища и реализуют функцию распределенного хранения и поиска объектов и их свойств. Фактически модуль синхронизации реализует функции локального сервера uuid адресов, храня соответствие uuid и IP адреса сервера сетевого сегмента, где этот uuid находится. Модуль синхронизации обеспечивает формирование групповых запросов (сразу несколько uuid) конкретному серверу сетевого сегмента, или серверу uuid адресов. Для согласованного хранения данных модуль периодически проводит синхронизацию с сервером uuid адресов, если время изменения объекта, свойства в сетевом сегменте больше, чем в локальном хранилище. Если на какой-либо объект или свойство был сформирован запрос в сетевой сегмент, то после получения всех необходимых атрибутов, этот объект или свойство будет храниться локально (как только произойдет запись его в локальное хранилище OP-model-3). Таким образом, каждый локальный сегмент включается в конкурентную борьбу за хранение объектов и их свойств у себя. Актуальным всегда считается объект или свойство на том локальном сегменте, на который указывает сервер uuid адресов. Соответственно, если в локальном сегменте объект или его свойство изменяется, сразу же выполняется транзакция к серверу uuid адресов. В транзакции по месту последнего актуального хранения объекта или свойства проходит проверка непротиворечивости данных (все атрибуты, кроме измененного, у объекта или свойства из сетевого сегмента совпадают с атрибутами объекта или свойства локального хранилища). Если транзакция проходит, на сервере uuid адресов информация о последнем актуальном состоянии объекта или свойства обновляется с указанием IP адреса рассматриваемого локального хранилища. В случае несогласованности данных транзакция отклоняется, вместо этого актуальное содержимое объекта или свойства копируется в локальное хранилище. Такой алгоритм реализует согласованность данных локального сегмента в соответствии с его временем синхронизации, обеспечивает высокую масштабируемость системы (фактически каждое локальное хранилище пытается работать по максимуму без сетевых обращений). Таким образом, предлагаемая система относится к классу AP-систем (предпочтения отдаются масштабируемости и доступности в ущерб целостности данных). Чтобы снизить отрицательные последствия от потери целостности целесообразно вводить ограничения на объем данных, которые могут храниться локально. Вместе с регулированием времени синхронизации локального сегмента это позволяет гибко настраивать систему, добиваясь требуемой согласованности, целостности данных. Заметим также, что такой подход гарантирует хранение актуальных объектов и свойств на том локальном хранилище, на котором они чаще изменяются.

Модуль манипулирования данными хранилища OP-model-2 реализует синтаксис и семантику описанного ранее языка манипулирования данными хранилища и позволяет реализовать все необходимые операции по работе с моделью OP-model.

Модуль сериализации/десериализации данных хранилища для OP-model-1 осуществляет представление объектов и свойств хранилища OP-model-2 в сериализованном виде, используя формат json. С данным модулем взаимодействуют модуль синхронизации данных (для формирования ответа другим серверам сетевого сегмента на запрос информации об объекте или его свойстве, или наоборот для разбора и добавления сериализованного объекта или свойства от других серверов в локальное хранилище OP-model-2), модуль запросов к хранилищу OP-model из аналитического сегмента данных, модуль манипулирования данными хранилища OP-model-2.

Модуль запросов к хранилищу OP-model входит в состав аналитического сегмента и реализует трансляцию высокоуровневых, групповых команд модуля запросов на аналитическую обработку в команды, понятные модулю манипулирования данными хранилища OP-model-2, также при необходимости данный модуль реализует трансляцию запросов модуля взаимодействия с внешними клиентами.

Модуль запросов на информационно-аналитическую обработку выполняет роль транслятора поступивших от модуля запросов к хранилищу OP-model результатов в форму, пригодную для аналитической обработки в рамках разработанного научно-методического обеспечения, а также обратного преобразования результатов аналитической обработки.

Блок информационно-аналитической обработки включает в себя библиотеку реализации научно-методического обеспечения (методики оценки результативности, эффективности, информационной значимости показателей и другие), CAS систему Maxima, среду R, а также интерфейсный модуль взаимодействия с блоком информационно-аналитической обработки данных, который осуществляет координацию потоков данных сформированных запросов на информационно-аналитическую обработку, вызывая необходимые библиотеки и осуществляя клиент-серверное взаимодействие со средами Maxima, R.

Блок взаимодействия с внешними клиентами реализует визуальное представление в web-ориентированном формате для клиентов в виде обычных браузеров.