Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Управление процессом обработки данных на основе их уникальности Космачева Ирина Михайловна

Управление процессом обработки данных на основе их уникальности
<
Управление процессом обработки данных на основе их уникальности Управление процессом обработки данных на основе их уникальности Управление процессом обработки данных на основе их уникальности Управление процессом обработки данных на основе их уникальности Управление процессом обработки данных на основе их уникальности Управление процессом обработки данных на основе их уникальности Управление процессом обработки данных на основе их уникальности Управление процессом обработки данных на основе их уникальности Управление процессом обработки данных на основе их уникальности Управление процессом обработки данных на основе их уникальности Управление процессом обработки данных на основе их уникальности Управление процессом обработки данных на основе их уникальности
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Космачева Ирина Михайловна. Управление процессом обработки данных на основе их уникальности : диссертация ... кандидата технических наук : 05.13.01, 05.13.19 / Космачева Ирина Михайловна; [Место защиты: Астрахан. гос. техн. ун-т].- Астрахань, 2009.- 146 с.: ил. РГБ ОД, 61 09-5/2323

Содержание к диссертации

Введение

ГЛАВА 1. Анализ процесса обработки медицинских данных и постановка задачи исследования 10

1.1 Особенности обработки медицинской информации в здравоохранении 10

1.2 Анализ функциональных возможностей медицинских информационных систем 17

1.3 Постановка задачи исследования 19

1.4 Основные требования по использованию медицинской информации 25

1.5 Формирование дерева целей защиты медицинской информации 28

1.6 Анализ угроз конфиденциальности медицинской информации 33

1.7 Формирование системы показателей безопасности медицинской информации 39

1.8 Способы оценки показателей информационной безопасности 47

1.9 Выводы по первой главе 51

ГЛАВА 2. Метод оценки уникальности медицинских данных пациента 53

2.1 Методы идентификации человека 53

2.2 Формирование совокупности диагностических показателей пациента 54

2.3 Метод оценки уникальности данных пациента 62

2.3 Кластеризация диагностических показателей 67

2.4 Вычислительная процедура оценки степени уникальности медицинских данных пациента 70

2.5 Особенности определения границ интегрирования при вычислении коэффициента уникальности 75

2.6 Выводы по второй главе 77

ГЛАВА 3. Управление обработкой медицинских данных на основе их уникальности 79

3.1 Анализ недостатков существующих средств ограничения и контроля доступа к МИПХ в компьютерной системе 79

3.2 Управление обработкой данных на основе мониторинга действий пользователей 86

3.3 Процедура управления процессом обработки данных на основе их уникальности 92

3.4 Выводы по третьей главе 97

ГЛАВА 4. Реализация результатов диссертационной работы .98

4.1 Общий алгоритм работы программного продукта 98

4.2 Подготовка данных 103

4.3 Особенности механизма осуществления процедуры кластерного анализа в оценке степени уникальности данных пациента 107

4.4 Практическое применение алгоритма анализа уникальности данных пациента на реальном объекте 111

4.5 Выводы по четвертой главе 115

Заключение 117

Список литературы 119

Введение к работе

Задача обработки уникальных данных имеет важное практическое значение, так как такие данные связаны с описанием и решением нестандартных, специфичных проблем. В системном анализе термин «уникальность» употребляется для обозначения свойства объекта [4, 11, 33], связанного с непредсказуемостью его поведения. Уникальным называют то, что является исключением из общих правил, норм [30]. Управление обработкой уникальных данных вызывает затруднения и требует специального подхода, учитывающего повышенную ответственность і при принятии решений на основе такого рода данных. Уникальность данных определяет их ценность, что выражается в изменении вероятности достижения цели тем, кому предоставляются данные [4]. Наиболее представительными уникальными данными являются медицинские данные.

В течение нескольких следующих лет автоматизированные истории болезни (АИБ) станут технически и экономически осуществимы в широком масштабе [23, 24, 27, 33, 46]. Активная информатизация в медицинской сфере и реализация национальных проектов заставляют разрабатывать новые эффективные методы управления обработкой медицинских данных с целью улучшения качества оказания медицинской помощи [60, 61, 76, 80, 87].

Выделение медицинских данных, в которых фигурирует редкая медицинская информация о пациенте, позволяет определить пациентов, для которых технология лечения не укладывается в стандартные схемы и шаблоны. Редкое сочетание медицинских данных может объясняться ошибками, допущенными при проведении исследований или регистрации данных, фальсификацией медицинских фактов, индивидуальными особенностями человека. Проблема врачебных ошибок в настоящее время очень актуальна, что связано, в том числе, с повышенной нагрузкой врачей, большим объемом анализируемых данных, учитываемых при диагностике и лечении. Решение задачи по совершенствованию проведения контроля ка-

5 чества оказания медицинской помощи уже давно стоит перед учреждениями и органами управления здравоохранения [10, 73, 79, 87].

Контроль качества оказания медицинской помощи опирается не на сплошную, а на выборочную проверку медицинской документации: амбулаторных карт,

историй болезни [19, 55]. В связи с чем существует вероятность пропуска важной і

информации, связанной с необходимостью оперативного принятия решения на ее

основе. Актуальной задачей является разработка механизма автоматизированного поиска амбулаторных карт пациентов с уникальным набором данных и подходящих под определение «нуждающиеся в проверке» для включения их в контрольную группу. Пациенты с уникальным набором данных требуют обязательной и более тщательной проверки качества оказанных им услуг. Поэтому анализ степени уникальности медицинских данных пациентов позволит систематизировать процесс их обработки.

Тема диссертационной работы обусловлена и появлением новых требований в законодательстве, регулирующих процесс обработки данных [74, ,75]. К специ-альной категории персональных данных относится информация о состоянии здоровья, врачебная тайна [74, 77]. Повышение правовой грамотности населения и ужесточение требований по защите информации способствует росту судебных исков, вызванных врачебными ошибками и нарушением врачебной тайны [32, 107].

Наличие уникального сочетания значений диагностических признаков в медицинских данных создает весьма благоприятные условия для выявления субъекта (пациента), к которому относятся эти данные. Медицинские базы данных представляют большую ценность. Особенно, если информация из них относится к ли-' цам, которые могут представлять потенциальный интерес для злоумышленников: политики, государственные служащие, бизнесмены, и т.д. По данным компании Info Watch [53], за последние два года каждая вторая медицинская организация допустила утечку информации о пациентах. Медицинский сектор по доле скомпрометированных записей уступает только финансовому и составляет больше 20% .

Медицинская отрасль активно внедряет информационные технологии, а безопасность пока остается на вторых ролях. Руководство игнорирует или недооценивает возможные угрозы информационной безопасности.

Обеспечение конфиденциальности персональных медицинских данных в случае их обезличивания в соответствии с законом не требуется [74]. Свободной обработкой такой информации в научных, учебных, статистических и других целях может заниматься большое количество пользователей без каких-либо ограничений. Но вопрос о том, не сохраняется ли риск установления принадлежности обезличенных данных конкретному лицу, требует изучения. В случае уникальной медицинской информации обезличивание данных может оказаться недостаточным для обеспечения информационной безопасности и соблюдения врачебной тайны.

Таким образом, проблема, связанная с управлением процессом обработки данных на основе их уникальности, является актуальной.

Целью диссертационной работы является повышение эффективности управленческих решений, связанных с обработкой и защитой данных на основе анализа их уникальности.

Поставленная цель достигается решением следующих задач:

  1. Проведение системного анализа процесса обработки данных и угроз информационной безопасности в сфере здравоохранения.

  2. Разработка метода оценки уникальности данных пациента на основе совокупности значений диагностических признаков.

  3. Разработка алгоритма вычислительной процедуры, связанной с анализом уникальности данных.

  4. Обоснование работоспособности разработанного метода оценки уникальности данных.

  5. Разработка процедуры управления процессом обработки медицинских данных с учетом требований по информационной безопасности.

Методы исследования. В процессе работы использовались методы системного анализа, математического моделирования, теории вероятностей, математической статистики, теории принятия решений.

Достоверность и обоснованность работы. Обоснованность научных суждений и выводов, сформулированных в работе, обусловлена корректным применением указанных методов исследования и результатами экспериментов, проведенных с помощью разработанного программного обеспечения. Достоверность подтверждается успешным практическим применением результатов диссертационной работы, что отражено в актах внедрения.

Научная новизна работы заключается в разработке процедуры управления процессом обработки данных, основанной на методе оценки их уникальности, что позволяет уточнять в автоматизированном режиме в случае обнаружения уникальных данных последовательность дальнейших действий с ними, определять условия доступа к информации:

  1. Разработана процедура обработки данных на основе анализа их уникальности, позволяющая усовершенствовать систему оказания и оценки качества медицинской помощи, систему разграничения доступа в специализированных СУБД за счет предупреждения вероятных ошибок и злоупотреблений со стороны пользователей.

  2. Разработан метод оценки степени уникальности данных, на основе которого производится идентификация редких сочетаний персональных данных.

  3. Разработан алгоритм вычислительной процедуры, позволяющий реализовать на практике теоретические результаты работы и возможность выделения уникальных данных в автоматическом режиме.

  4. Проведена системная классификация задач обеспечения конфиденциальности медицинских данных, предложен способ оценки показателей, характеризующих безопасность обрабатываемых данных.

8 Практическая значимость:

1. Разработано программное обеспечение, реализующее алгоритм оценки
і уникальности медицинских данных пациента. Программное обеспечение

предназначено для выявления сложных или недостоверных случаев в медицинской практике, объясняемых индивидуальными особенностями пациента или врачебными ошибками (фальсификация данных, ошибки при проведении обследования пациента).

  1. Разработанная процедура управления обработкой данных на основе их уникальности может быть использована для контроля поступающих запросов данных от пользователей, определения условий доступа к данным, повышения качества оказания медицинских услуг.

  2. Результаты исследования используются при подготовке учебных курсов для специальностей «Комплексное обеспечение информационной безопасности автоматизированных систем», «Прикладная информатика в экономике» Астраханского государственного технического университета и в процессе организационно-управленческой деятельности МУЗ «Поликлиника № 6» г. Астрахани, что отражено в актах внедрения.

Апробация работы. Основные положения докладывались и обсуждались на IX Международной научно-практической конференции по информационной безо- пасности (Таганрог, 2007 г.); VI Всероссийской научно-практической конференции «Информационные технологии и математическое моделирование» (Анжеро-Судженск, 2007 г.), XX Международной научной конференции «Математические методы в технике и технологиях» (Ярославль, 2007 г.), XXI Международной научной конференции «Математические методы в технике и технологиях» (Саратов, 2008 г.), ежегодной научно-практической конференции преподавателей АГТУ.

Публикации. Основное содержание диссертации нашло отражение в 9 опубликованных научных работах, в том числе в 2 статьях в периодических и научно-

/

технических изданиях, выпускаемых в Российской Федерации, в которых ВАК рекомендует публикацию основных научных результатов диссертаций, получено свидетельство об официальной регистрации программы для ЭВМ.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, выводов, заключения, списка использованной литературы, приложений. Основная часть работы изложена на 130 страницах машинописного текста.

Особенности обработки медицинской информации в здравоохранении

В результате таких проверок осуществляется интенсивная обработка массивов данных с целью принятия на их основе необходимых решений. Правила проведения экспертизы предусматривают, что контролю подлежат некоторые обязательные события (например, выход на инвалидность лиц трудоспособного возраста) или события, связанные с расследованием жалобы, поданной в медучреждение. Все остальные случаи оказания медицинской помощи анализируются во время экспертизы, используя данные амбулаторных карт пациентов, отобранных случайным образом. Предоставление информации экспертам часто бывает избыточным, а отсутствие системного подхода при отборе данных на проверку снижает результативность экспертных мероприятий.

Проекты в здравоохранении предполагают в будущем расширение системы электронного документооборота, обеспечение населения дополнительными информационными и медицинскими сервисами, внедрение персонифицированного учета застрахованных граждан на основе пластикового полиса, паспорта здоровья и т.д. Это повлечет за собой необходимость разработки современного программно-технического обеспечения, пересмотра вопросов, связанных с обработкой и защитой данных. Анализ функциональных возможностей медицинских информационных систем

Медицинская информационная система (МИС) представляет собой совокупность программно-технических средств, баз данных и знаний, предназначенных для автоматизации различных процессов, протекающих в лечебно-профилактическом учреждении.

По данным статьи сайта www.pcweek.ru , первое исследование рынка программного обеспечения для медицины было проведено в 1998 году. В то время наибольшее распространение получили программы для автоматизации финансовых и административных служб лечебно-профилактических учреждений (ЛПУ), а системы, предназначенные непосредственно для лечебно-диагностического процесса, составляли лишь 9,6% от всего программного обеспечения для медицины. В 2000 г. ситуация несколько улучшилась. Количество новых систем в этой сфере растет медленно. Их разработка занимает в среднем от 2 до 5 лет и представляет собой сложнейшую задачу, требующую значительных финансовых, интеллектуальных и временных ресурсов.

Основным недостатком большинства МИС, представленных на рынке в 2000—2002 гг., была их узкая специализация [23, 56, 106]. Наиболее популярными были системы для отделений стоматологии, офтальмологии и других областей, программы, предназначенные для автоматизации регистратуры, целесообразность применения которых сомнительна в отрыве от автоматизации клинических отде- лений, отдела статистики и других основных служб ЛПУ. Взаимодействие основных служб в ЛПУ «Поликлиника» и обмен информацией между ними показаны на рисунке 1.5. Применение современных МИС в медицинском учреждении, в первую очередь, направлено на поддержку ведения документооборота, но и позволяющие решать другие задачи: 1. административно-хозяйственного и общего характера; 2. поддержки лечебно-диагностических мероприятий; 3. поддержки лабораторных и диагностических исследований; 4. поддержки контроля процесса лечения со стороны более опытных специалистов, руководителей отделений и других должностных лиц; 5. информационной поддержки оценки эффективности лечения; 6. финансово-экономического характера; 7. поддержки связи с внешним миром; 8. оптимизации бизнес-процессов. Разрабатываемые современные МИС универсальны и не специализируются на автоматизации, к примеру, только отдельной поликлиники, являются распределенными системами [36, 90, 92, 99]. В МИС реализуются математические модели, обеспечивающие анализ различных ситуаций и предоставляющие врачу дополнительную информацию для принятия решений по вопросам диагностики и выбора лечебной тактики. В тоже время интеллектуализация программных средств для поддержки врачебных решений предполагает формирование баз знаний в предметной области, которые быстро устаревают, а процесс их создания достаточно трудоемок. На рынке отсутствуют МИС, в которых реализована функция выявления нехарактерных сочетаний значений медицинских данных. Существующие системы, как правило, ограничиваются проверкой выхода значений параметров за допустимые пределы. Многомерный анализ данных в медицине не очень широко распространен [15, 52, 65, 84, 96]. Анализ вероятности сочетания значений медицинских данных может быть использован для установления тяжести состояния пациента, факта совершения врачебной ошибки, уровня сложности диагностирования пациента или уровня риска реализации злоумышленных действий по отношению к пациенту. Программная реализация решения указанных практических задач не нашла должного отражения в современных МИС. Защита данных в МИС построена по принципу необходимого минимума, с использованием традиционных средств защиты, не обеспечивающих должного контроля выполняемых запросов к данным, с учетом особенностей обрабатываемой информации.

Формирование совокупности диагностических показателей пациента

Конституционные права российских граждан, интересы здравоохранения диктуют необходимость обеспечения защиты врачебной тайны. Информация о факте обращения за медицинской помощью, состоянии здоровья гражданина, диагнозе его заболевания и иные сведения, полученные при его обследовании и лечении, составляют врачебную тайну [77]. Право на врачебную тайну, конфиденциальность медицинской информации - это право пациента на неразглашение без его согласия информации о факте обращения за медицинской помощью, состоянии его здоровья, диагнозе и иных сведений медицинского и немедицинского характера, полученных от него самого или в процессе обследования и лечения лицами, которым они стали известны при обучении, исполнении профессиональных, служебных и иных обязанностей. Лишь с согласия самого гражданина или его законного представителя допускается передача сведений, составляющих врачебную тайну, другим гражданам, в т.ч. должностным лицам, — в интересах обследования и лечения пациента, для проведения научных исследований, публикаций в научной литературе, использования этих сведений в учебном процессе. Предоставление сведений, составляющих врачебную тайну, без согласия гра жданина или его законного представителя допускается: 1) в целях обследования и лечения гражданина, не способного из-за своего состояния выразить свою волю; 2) при угрозе распространения инфекционных заболеваний, массовых отравлений и поражений; 3) по запросу органов дознания и следствия, прокурора и суда в связи с проведением расследования или судебным разбирательством; 4) в случае оказания помощи несовершеннолетнему в возрасте, установленном частью второй статьи 24 настоящих Основ, для информирования его родителей или законных представителей; 5) при наличии оснований, позволяющих полагать, что вред здоровью гражданина причинен в результате противоправных действий. При таких нечетких формулировках (к инфекционным заболеваниям относятся разные) существует двойственность в интерпретации правил. А ошибки в лечебной деятельности, связанные с неверным диагнозом, позволяют создать условия для нанесения ущерба пациенту, связанного с распространением информации о его «опасном» инфекционном заболевании. Лица, которым в установленном законом порядке переданы сведения, составляющие врачебную тайну, наравне с медицинскими и фармацевтическими работниками с учетом причиненного гражданину ущерба несут за разглашение врачебной тайны дисциплинарную, административную или уголовную ответственность в соответствии с законодательством Российской Федерации, республик в составе Российской Федерации. В целях обеспечения права граждан на конфиденциальность информации, составляющей врачебную тайну, территориальные фонды обязательного медицинского страхования организуют свою работу в соответствии с приказом Федерального фонда ОМС "О соблюдении конфиденциальности сведений, составляющих врачебную тайну" [67]. Действия ответственных лиц при передаче, обработке, хранении медицинской информации, направленные на поддержку безопасности МИПХ, регламентируются нормативными документами и реализуются за счет организационных, физических, программно-технических мер. Это и подписки о неразглашении конфиденциальной информации, и система официальных запросов на МИПХ, подразу I 27 мевающая регистрацию запроса, идентификацию участников предоставления информации и другие стандартные процедуры. На практике отсутствие должного контроля за их соблюдением приводит зачастую к игнорированию выполнения требований по защите обрабатываемых данных. Важной для формирования единой концепции защиты данных в информационных системах в российской законодательной практике явилось вступление в силу ФЗ «О персональных данных», новой редакции ФЗ «Об информации, информа- ционных технологиях и о защите информации», регулирующих взаимоотношения субъектов в процессе электронного обмена данными. К учреждениям, в которых хранятся и обрабатываются персональные данные гражданина Российской Федерации, относятся медицинские учреждения. В чЛ ст. 19 ФЗ «О персональных данных» определено, что оператор при обработке персональных данных обязан принимать необходимые организационные и технические меры, в том числе использовать шифровальные (криптографические) средства, для защиты персональных данных от неправомерного или случайного доступа к ним, уничтожения, изменения, блокирования, копирования, распростра-/ нения персональных данных, а также от иных неправомерных действий.

В ч.4 ст. 14 ФЗ «О персональных данных» определено также, что субъект персональных данных имеет право на получение при обращении или при получении запроса информации, касающейся обработки его персональных данных, в том числе содержащей сведения о лицах, которые имеют доступ к персональным данным или которым может быть предоставлен такой доступ [74].

Таким образом, закрепляется ответственность оператора при обработке МИПХ, его обязанности, и право пациента на получении информации об особенностях использования его МИПХ. В настоящее время решение о практической реализации этих требований отсутствует.

Анализ недостатков существующих средств ограничения и контроля доступа к МИПХ в компьютерной системе

Компьютерная система - это комплекс аппаратных и программных средств, предназначенных для сбора, хранения, обработки, передачи и получения информации [17, 30, 102]. Безопасность компьютерных систем основана на создании надежных и удобных механизмов регламентации деятельности пользователей и обслуживающего персонала.

Основной способ защиты конфиденциальной информации — это контроль и разграничение доступа. Обычной практикой в МИС считается ролевой принцип разграничения доступа, когда каждый пользователь (или группа пользователей) ассоциируется с определенным автоматизированным рабочим местом. Доступ к I составу данных, определенных заранее администрацией учреждения совместно с системным администратором, с определением привилегий настроен для данного рабочего места и соответствует функциональным задачам пользователя. Для пользователя- врача набор необходимых в работе персональных медицинских данных широк, необходимость доступа к ним иногда спорна, что провоцирует возникновение каналов утечки информации. В соответствии с [30] структура системы разграничения доступа к информации описывается схемой, представленной на рисунке 3.1. Распределение прав доступа является обязательным элементом защиты компьютерных систем. В основу , распределения прав доступа должны быть положены требования в отношении ведения бумажной медицинской документации, определенные существующими нормативными документами, а также технология организации лечебного процесса в медицинском учреждении. В политике безопасности должны быть определены технические и организационные средства аутентификации сотрудников при работе в МИС, на основе которых определяются права доступа сотрудника. К средствам аутентификации могут относиться пароли, SMART-карты, идентификационные карты (магнитные или штрих-кодовые), USB-ключи. Наиболее распространенный способ в МИС — это пароли. Каждый пользователь системы МИС, как правило, относится к той или иной группе пользователей (врачи, медицинские сестры, персонал аптеки и т. д.), связанной с определенной ролью. Возможность доступа к различным функциям (пунктам меню, прикладным программам) системы зависит от группы, к которой относится пользователь. Можно выделить основные автоматизированные рабочие места (АРМ), организуемые для работников медицинского учреждения [24,56,79,90]: АРМ врача общей практики (АРМ ВОП), которое обеспечивает работу по приему пациента (поиск в базе данных, ведение амбулаторной караты, на основе 81 регистрации случаев и посещений, постановку диагноза, назначение препарата, направление к врачам специалистам поликлиники или других медучреждений города), контроль собственных медико-экономических показателей работы. АРМ медицинской сестры общей практики, которое также поддерживает работу с электронной амбулаторной картой пациента (результаты анализов, смотровой кабинет) и ведает вопросами диспансерного учета, включая ведение списков, классификацию пациентов по группам диспансерного наблюдения, распечатку приглашений на профилактический осмотр. АРМ врача-специалиста, которое повторяет большинство функций АРМ ВОП, связанных с приемом пациента. АРМ заведующего отделением ВОП поддерживает процессы планирования и контроля важнейших медико-экономических показателей по отделению, каждому его участку и обслуживающих его ВОП. АРМ главного врача обеспечивает работу с заявкой на льготные медикаменты, контроль и управление качеством работы поликлиники, его подразделений и специалистов. АРМ менеджера регистратуры, которое решает задачи по регистрации паци ентов и их полисов, открепления пациентов, ведению графика работы врачей и за писи пациентов на прием. АРМ экономиста отделения ВОП, который осуществляет работу со страховыми организациями и, при необходимости, редактирует поступающие от них счета за оказанные медицинские услуги. АРМ статистика, который автоматически осуществляет генерацию отчетов по формам, предусмотренным регламентом. і Технологии управления медицинским обслуживанием постоянно совершенст вуются, взаимодействие с медтщнскими организациями других организаций расширяется. Варианты такого взаимодействия могут быть различными, реализованными посредством разработки специальных подсистем, разделения на внутрен 82 нюю и внешнюю сеть, использования Web-средств.

Общий алгоритм работы программного продукта

В дальнейшем, при вычислении коэффициента уникальности данных пациентов эти матрицы могут использоваться повторно до следующего запланированного подключения к базе данных. При необходимости программный продукт можно модифицировать и дополнить адаптивными алгоритмами, которые могли бы корректировать значения элементов указанных матриц в зависимости от изменений в базе данных в течение определенного периода.

Программный продукт должен включать как самостоятельные модули: Подготовительный модуль - реализует загрузку информации из базы данных, промежуточные расчеты, кластеризацию данных для передачи результатов в качестве входной информации основному компоненту; Основной модуль - выполняет расчет коэффициента уникальности данных пациента, затребованных в том или ином запросе. Как реализована логика работы программного продукта видно из рисунка, приведенного в приложении 7: в окне запрашивается входной файл с информацией из базы данных, устанавливаются границы множества данных, участвующих в расчетах (со став полей (записей), которые запрошены пользователем), Предусмотрено 3 режима обработки таблицы данных: 1) обработка всей таблицы; 2) выборочная обработка данных таблицы (выборка осуществляется случайно); 3) выборочная обработка данных таблицы (выборка производится пользователем); . устанавливается настройка при необходимости для осуществления про граммой нормализации данных, уточняется информация для проведения процедуры кластеризации объек тов. Процедура кластеризации может быть проведена в двух режимах: S поиск разбиения по заданным параметрам - задается параметры алгоритма, положенного в основу программного продукта, определяется решение; S поиск в автоматическом режиме - перебираются всевозможные комбинации параметры алгоритма, оценивается значение целевой функции и из множества результирующих разбиений выбирается лучшее. На рисунке (приложение 7) продемонстрировано окно программы после проведения кластеризации данных. Здесь осуществляется выбор оптимального варианта кластеризации, просмотр результатов. Сам процесс определения разбиения может идти в двух вариантах: S - поиск в автоматическом режиме; S -поиск по заданным параметрам. В первом случае различные настройки (параметры) алгоритма комбинируются, и осуществляется кластеризация с вычислением для каждого случая значения I критерия качества кластеризации. Выбирается в качестве оптимального разбиения то, которое соответствует минимальному значению критерия. Во втором варианте фиксируются параметры алгоритма, и производится группировка признаков в классы. В программном продукте реализована возможность загрузить специально подготовленный файл с перечислением членов групп, сформированных иными специальными программными продуктами (например, в пакете Statistica). И в дальнейшем возможно вычисление коэффициента уникальности данных пациента так, что необходимые данные с результатами кластеризации объектов берутся из нужного файла. В конечном итоге программой осуществляется переход к фазе расчета коэффициента уникальности. В последней экранной форме можно вызвать файл, в котором зафиксированы данные запроса виде таблицы вида пациент - признак -значение, для которого затем определяется значение коэффициента уникальности данных пациентов. Предварительно нужно отметить, какие диагностические при-І знаки качественные (категориальные). Значения признаков программа использует для определения границ интегрирования в многомерном интеграле, используемого при расчете коэффициента уникальности медицинских данных пациента. В силу того, что в теоретической модели допускается наличие интеграла с бесконечными пределами интегрирования, было использовано для практической реализации модели известное положение. Теорией статистики доказано [2,3,18], что при нормальном распределении случайной величины практически достоверно, что ее значения заключены в пределах М±3 т(сг- среднеквадратическое отклонение случайной величины). Тогда нижний ) и верхний бесконечный пределы заменены соответственно на М-Ъ т и М+3 а, где М — математическое ожидание. Работу приложения можно представить в виде блок-схемы (рисунок 4.1).

Похожие диссертации на Управление процессом обработки данных на основе их уникальности