Лингвистическое обеспечение музейного электронного каталога Гук Дарья Юрьевна

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Гук Дарья Юрьевна. Лингвистическое обеспечение музейного электронного каталога : Дис. ... канд. филол. наук : 05.25.05 СПб., 2005 155 с. РГБ ОД, 61:06-10/377

Содержание к диссертации

Введение

Глава 1. Электронные каталоги в российских и зарубежных музеях 10

1.1. Зарубежный опыт создания музейных электронных каталогов 10

1.2. Отечественный опыт создания музейных электронных каталогов 14

1.3. Эволюция понятия «лингвистическое обеспечение» музейных электронных каталогов 31

1.4. Выводы по главе 1 41

Глава 2. Основные проблемы создания лингвистических средств музейного электронного каталога и пути их решения 43

2.1. Метаданные и метаинформация в музейном электронном каталоге 43

2.2. Словари в музейном электронном каталоге 48

2.3. Многоязычие в музейном электронном каталоге 55

2.4. Стандарты и форматы обмена данными в музейных электронных каталогах 59

2.5. Язык интерфейса музейного электронного каталога 72

2.6. Выводы по главе 2 77

Глава 3. Практическая реализация музейного электронного каталога как метаинформационной системы 79

3.1. Общая характеристика музейного электронного каталога «Атлант» 79

3.2. Лингвистическое обеспечение музейного электронного каталога «Атлант» 84

3.3. Лингвистическое обеспечение подсистемы по реставрации восточной живописи 98

3.4. Выводы по главе 3 106

Заключение 108

Список литературы 111

Список сокращений 130

Список иллюстраций 132

Зарубежный опыт создания музейных электронных каталогов
Эволюция понятия «лингвистическое обеспечение» музейных электронных каталогов
Словари в музейном электронном каталоге
Лингвистическое обеспечение музейного электронного каталога «Атлант»

Введение к работе

Актуальность проблемы. Современный музей с точки зрения теории информации является сложной информационной системой, состоящей из многих подсистем. Среди информационных подсистем выделяется каталог музейных предметов - полный или частичный перечень предметов, находящихся в музее. Созданию музейного электронного каталога (МЭК) были посвящены исследования и разработки нескольких поколений специалистов в области информатики. Создание информационных систем - дело трудное и медленное. В гуманитарных областях очень часто этот процесс идет по спирали. Такой характер развития во многом обуславливается накоплением многолетнего практического опыта без достаточной проработки теоретической базы. Смена поколений вычислительной техники повлекла за собой необходимость разработки нового комплекса лингвистических средств.

В конце 1990-х годов ЮНЕСКО приступила к исследованию проблем разработки стандартов для сохранения культурного наследия в эпоху цифровых технологий. Перед институтами, традиционно ориентированными на собирание и сохранение культурного наследия, встает неотложный вопрос об организации отбора и сохранения материалов для будущих поколений. Значительная часть информации появляется в настоящее время сразу в цифровой форме в самых разных форматах. В соответствии с Федеральным Законом РФ о музейном фонде РФ в музеях РФ от 26 мая 1996 года, создается Государственный каталог, содержащий основные сведения о каждом музейном предмете и каждой музейной коллекции, включенной в состав Музейного фонда РФ. В связи с этим представляется актуальным предпринятое автором обобщение разнообразного отечественного и зарубежного опыта разработок музейных информационных систем.

Анализ музейных информационных систем показал, что функциональная полнота системы существенно зависит от лингвистического обеспечения. Вместе с тем уровень развития лингвистического обеспечения на современном этапе уступает уровню развития других компонентов музейных информационных систем, поскольку достижения последних десятилетий в области информационных технологий позволили разработать математическое обеспечение, не только соответствующее ранее разработанным лингвистическим моделям, но и во многом заменяющее их.

Лингвистическое обеспечение МЭК как информационной системы, включающее структуру, стандарты и форматы описания музейных предметов, использует данные другой сравнительно молодой научной дисциплины -музееведения, которая изучает и разрабатывает принципы научного документирования и каталогизации коллекций, что подтверждает актуальность данного исследования.

Научная проблема, решению которой посвящено данное исследование: разработка ориентированного на практическую реализацию лингвистического обеспечения музейного электронного каталога в соответствии с тенденциями развития информационных технологий.

Разработанность проблемы. Первоначально создание электронного каталога считалось прерогативой библиотек, и самые успешные результаты отмечаются именно в этой сфере. Достаточно упомянуть разработку стандарта библиографического описания и межбиблиотечного обмена данными, а также теоретических основ электронных каталогов (Арлазаров В.Л., Емельянов Н.Е., Усачев М.Н., Генднна Н.И., Вершинин М.И.). Первые прототипы МЭК связаны с научными исследованиями, обработкой большого числа однородного материала, т.е. археологией и нумизматикой. Работы Р. Чинхолла и Ж.-К. Гардена определили на долгие годы подходы к проектированию и созданию автоматизированных музейных каталогов, проявился так называемый феномен «завораживающего влияния чисел», сформулированный в лекциях всемирно признанного специалиста в области аналитической психологии М.-Л. фон Франц. Теоретические подходы и практические решения в области создания МЭК в течение длительного времени разрабатывают специалисты из многих стран (GardinJ.-C, 1955; Шер ЯЛ. 1965; Mayer R., 1969; Miller G.A., 1969; CutbillJ.L., HallonAJ., Louis G.D., 1970; CuisenierJ., 1971; OehlerH., 1971; GardinJ.-C, 1975; Couprie L.D., 1978; Асеев Ю.А., ПоднозоваИ.П., ШерЯ.А., 1980; Adkins R.A., 1982; Грач B.A. и др., 1984; Лесман Ю.М., ЧеповецкийМ.А., ШерЯ.А., 1984; НольЛ.Я., Рябов А.Б., 1984; Gamier F., 1984; LavellC, 1984; Waal Н. van de, 1985; Асеев Ю.А., Киссель О.М., Поднозова ИЛ., 1986; Light R.B., Roberts D.A., Stewart J.D., 1986; Frank Е.В., HimleyFJ., WalneP., 1988; Щапова Ю.Л., Лихтер Ю.А., 1990; НольЛ.Я., 1991; Ноль Л.Я., Перцев Д.Г., ШерЯ.А., 1991; Bearman D., Perkins X, 1993; Лесман Ю.М., 1995; LahanierCh., Aitken G., Aubert M., 1995; Дремайлов A.B., 1996; Лесман Ю.М., 1997; Мителев А.В., 1997; Denitto Е., 1998; Holm S. А., 1998; НольЛ.Я., 1999; Кощеева Е.Л., Лошак Ю.М., 2000; Лихтер Ю.А., 2000; Лошак Ю.М., 2000; Кузьмина Е.С., 2000; Кузьмина Е.С., НольЛ.Я., 2000; Новикова О.Г., 2000; Glass Е., Harris СМ., 2000; Линд Н.М. и др., 2001; Holm S.A., 2001; LahanierCh., Aitken G., BergerM.T., Chevilliot C, PincemailleC, 2001; Арлазаров В.Л., Емельянов H.E., 2002; Кузьмина E.C., 2004; Кузьмина E.C., 2005).

Наибольшие успехи были достигнуты в Великобритании, и именно там в 1977 году учреждается профессиональная организация Museum Documentation Association (MDA). Особо следует отметить проекты Института Гетти в области разработки лингвистического обеспечения музейных информационных систем, в частности, the Art and Architecture Thesaurus (AAT), The Union List of Artist Names (ULAN) и The Getty Thesaurus of Geographic Names (TGN). Среди широко распространенных зарубежных музейных систем наиболее известна The Museum System (TMS) производства Gallery Systems (США).

В России основы МЭК были заложены в 1978 году коллективом разработчиков по инициативе Министерства культуры СССР. В .этой работе были задействованы крупнейшие музеи страны: Государственная Третьяковская галерея, Государственный Эрмитаж, Центральный музей Революции, Государственный музей этнографии народов СССР, В настоящее время в нашей стране создано несколько музейных автоматизированных систем различного уровня сложности и масштаба, включающих МЭК. В разработке моделей данных этих систем учитывались отдельные замечания музейных сотрудников, выступающих в роли заказчиков, но полноправными разработчиками они уже не являлись. Система «КАМИС» (ОАО «АльтСофт», Санкт-Петербург) является безусловным лидером по числу музеев, работающих с ней (более 100). В качестве ее основных конкурентов выступает система «АС Музей» (ГИВЦ МК РФ, Москва), установленная в десятках музеев России.

Число установок систем «Фонд» («АПП и К», Москва), «НИКА-Музей»

(Cognitive Technologies, Москва) и «Госкаталог» («Музеи России», Москва)

исчисляется единицами.

Анализ различных реализаций МЭК показывает неоднозначность в определении МЭК и принципиальные различия в объеме и содержании данных МЭК. Современные лингвистические модели не обеспечивают одну из важнейших функций МЭК - учет изменений в данных с сохранением старых.

Цель диссертационной работы - определение места, роли, функций, назначения и состава лингвистического обеспечения музейного электронного каталога, разработка методов повышения эффективности его работы.

Задачи диссертационной работы:

- проанализировать современное состояние проблемы и существующие музейные электронные каталоги;

- рассмотреть лингвистическое обеспечение музейного электронного каталога, формализовать возникающие проблемы и наметить пути их решения;

- разработать средства повышения эффективности лингвистического обеспечения музейного электронного каталога.

Объект исследования - музейный электронный каталог как информационная система.

Предмет исследования - лингвистическое обеспечение музейного электронного каталога.

База исследования - музейные электронные каталоги крупнейших зарубежных и отечественных музеев.

Основными источниками информации послужили музейная нормативная документация за два последних десятилетия, статьи и справочники, относящиеся к данной отрасли знаний. Отбор источников для составления терминологического словаря по описанию сохранности восточной живописи осуществлялся в непосредственном контакте со специалистами-реставраторами.

Методы исследования, используемые в работе, базируются на основных положениях системного анализа, теории информации и информационных процессов, теории индексирования и терминоведения, а также практике научно-технической лексикографии.

Научная новизна диссертационной работы заключается в том, что впервые обобщен российский и зарубежный опыт создания музейных электронных каталогов, сформулировано само понятие музейного электронного каталога, представлена концепция разработки музейного электронного каталога в виде лингвистической модели на основе предложенного автором принципа ее реализации как воспроизводящей инженерно-лингвистической метаинформационной системы, хранящей информацию не только об объекте -музейном предмете, но и о документах, где отражены его происхождение и история бытования.

На защиту выносятся следующие положения:

1. Релевантность поиска в музейном электронном каталоге обеспечивается не только средствами информационно-поискового языка, но и средствами интерфейса пользователя, выделяемым автором как самостоятельное лингвистическое средство.

2. Функциональная полнота музейного электронного каталога обеспечивается при трактовании музейного электронного каталога как метаинформационной системы.

3. Релевантность поиска в музейном электронном каталоге обеспечивается путем формирования поискового предписания с помощью метаданных.

4, Лингвистическая модель музейного электронного каталога, предлагаемая автором, объединяет все достоинства предыдущих разработок и инвариантна по отношению к математическому обеспечению.

Зарубежный опыт создания музейных электронных каталогов

Объемы информации, производимой в настоящее время, не идут ни в какое сравнение с теми, которые производились до появления электронных систем. Такое радикальное изменение объемов произошло одновременно с реорганизацией в управлении документооборотом. И именно возможность ведения электронного документооборота дала мощный толчок в развитии музейных информационных систем.

Традиционные системы архивирования и многие исследовательские методы, особенно используемые историками, были унаследованы от девятнадцатого века, поэтому справочные инструменты, каталоги, архивы и описи оставались весьма скромными. Первые компьютерные реализации МЭК относятся к типу вопросно-ответных систем и разрабатывались как реакция на плохое качество кодировки запросов при поиске информации в ИС. Необходимость использования топологической науки для моделирования подвижного распределения информации внутри киберпространства ясно показывает, что изменился масштаб нашего восприятия человеческих знаний. Достижения общественных наук 1960-х годов, которые перешли от интерпретации текстов к построению науки о знаниях, базировавшейся на многочасовом, методичном изучении материалов архивов и библиотек, и если принять все это во внимание, то окажется, что был охвачен весьма ограниченный объем информации. На уровне лингвистического обеспечения формируются системные представления в свойственных ему категориях и терминах в виде абстрактных описаний системы языковых средств и информационных процессов. Лингвистические модели детализируют информационные модели, уточняя их до процедуры преобразования элементов языковых средств, то есть алгоритмических моделей, создаваемых на уровне разработки математического обеспечения. Последнее в силу быстрого прогресса не только влияет на лингвистическое обеспечение, но и присваивает часть его функций.

С момента появления прототипов современных электронных каталогов в этой области лидируют библиотечные системы. Многие подходы, реализованные при создании библиотечных электронных каталогов, предположительно могли бы быть перенесены и на МЭК. Между тем, лингвистическое обеспечение библиотечных информационных систем отличается от лингвистического обеспечения музейных информационных систем. Даже оценка эффективности клавиатурного ввода - основного способа создания записей в базе данных - производится по иным критериям. Ошибки ввода и производительность зависят не от программного интерфейса, а от компетентности оператора, поскольку необходимо разбирать рукописный текст с значительного объема и с большим числом узко специальных терминов.

Первые текстовые МЭК начали разрабатываться в Лувре в 1975 году для отдельных категорий предметов таких, как изделия из бронзы, керамики и стекла с целью выполнения статистических научных исследований. Файл «Фараон» в системе Mistral 5 for Unix (Лувр, г.Париж): данные, относящиеся к тому или иному предмету и составляющие 50 полей описания, систематизируются и группируются по темам, т.е. по «аналитическим критериям, общим для каждого из предметов, относящихся к данной области» [34. С. 22]. Описательная система содержит исследовательские атрибуты и не содержит атрибуты, относящиеся к управлению коллекциями (учету). Составлен тезаурус Отделения египетских древностей для ведения словарей ключевых слов на основе терминов, используемых современной наукой. Были использованы словари из опубликованных справочников [153; 159]. Жесткость, свойственная иерархической классификации, была уравновешена созданными синонимическими связями [34. С. 23]. Так в этой системе оказалось 12612 типологических описаний. Запрос осуществляется с помощью логической комбинации ключевых слов, относящихся к одному или нескольким словарям, связанным с различными полями, или посредством нескольких отдельных вопросов, ответы на которые могут быть объединены. Возможен также поиск в отобранной информации. Изображения хранятся отдельно в файлах на диске. Программа оцифровки изображений разрабатывалась в Национальном центре научных исследований (Париж, Франция) с 1990 по 1994 годы и за период с 1996 по 2001 год позволила ввести в компьютер данные о 150000 клише, из которых 20000 были еще стеклянными. База данных «Живопись» в 1985 году включила в себя 5000 каталожных описаний [142. С. 31]. Улучшенная структура данных легла в основу разработки по проекту NARC1SSE [149; 150], куда также включалась информация об изображениях, научных исследованиях и реставрации музейных предметов. Были разработаны специальные словари на 8 языках. С развитием информационных технологий база стала доступна участникам международного проекта не только в локальном варианте на платформе Unix, но также в режиме интранет с помощью веб-сервера [142. С. 33-34]. Данные, накопленные за эти годы, успешно конвертируются в информационную систему Министерства культуры Франции (живопись, скульптура, рисунки) [137]. МЭК «Джоконда» доступен через интернет и способен предоставлять по запросу пользователя два вида отчетов: полный (14 полей) и сокращенный (5 полей). К этому же времени относится файл, созданный в тектовом процессоре L-"— Word for Windows в Музее этнографии (г. Роттердам, Нидерланды). Внедренная во многих музеях Нидерландов система TINReg for Dos (Исторический музей, Г.Амстердам) является также очень характерным программным продуктом: отсутствуют словари-класссификаторьг. жесткий контроль ввода, вводится минимум информации или просто ссылки на информацию на бумажном носителе. 0 0 Тогда же были сформулированы требования, предъявляемые к стандартам научных данных: - сжатая, ясная и исчерпывающая форма материала, - обеспечение быстрого местонахождения предметов, - полнота данных или возможность ее обеспечения, - доступность за счет низкой стоимости, - отсутствие подробных комментариев, - высокое качество иллюстраций [109. С.27].

Что касается формата представления данных, то предполагаемые сведения заключаются в квадратные скобки. Если датировка является проблематичной [159], за ней ставится заключенный в скобки вопросительный знак. Цвет материала дается на основе таблицы Маиселла. Детализация описания - в атрибуте «Подробности описания предмета». Инвентарный номеру являющийся прототипом для ему подобных, помечается особым знаком (звездочкой). Масштаб воспроизведения предмета - не более 2:1 [109. С.28]. Термин «неограниченный» применительно к количеству полей следует понимать как «условно неограниченный», в силу физических ограничений, патотадываемых аппаратным обеспечением и операционной системой на поддержание файлов больших размеров.

Смена программных решений в связи с переходом на новую аппаратно-программную основу прослежена в табл. 1. Современные коммерческие проекты реализации МЭК решают в комплексе задачи ведения МЭК, управления коллекциями и документирования результатов научных исследований и реставрационных работ. В первую очередь, это ТМС - Gallery Systems for Windows [161; 120], позволяющая включать в МЭК топопланы и неограниченное количество изображений. Эта реализация МЭК, по сравнению с другими зарубежными музейными информационными системами, наиболее полно отражает все виды данных о музейных предметах, но система музейной учетно-хранительской документации, представленная в данной системе, не соответствует требованиям, предъявляемым к этой документации в отечественных музеях. Кроме того, юридический статус данных в МЭК в зарубежных музеях такой же, как и у бумажных документов.

Эволюция понятия «лингвистическое обеспечение» музейных электронных каталогов

С 1960-х до нашего времени в работах по информатике произошло изменение в содержании понятия «лингвистическое обеспечение». Определение этого понятия различается в зависимости от сферы и контекста использования [95; 16; 103]. Лингвистические средства инфоормационных систем описывают содержание и форматы данных, определяют логику запросов, а программные, к которым относят языки программирования, языки описания структур данных и т.п., реализуют эту логику в той или иной программной среде. Таким образом, информационная модель предметной области, относится к лингвистическому обеспечению, поскольку не зависит от прикладных программ. Согласно ГОСТу 34.003-90 «лингвистическое обеспечение автоматизированных систем представляет собой совокупность средств и правил для формализации естественного языка, используемых при общении пользователей и эксплуатационного персонала автоматизированной системы с комплексом средств автоматизации при функционировании автоматизированной системы» [94].

По мнению А.Б.Антопольского, «информатизация архивов и музеев в значительной степени повторяет историю развития ГАСНТИ и библиотечных информационных систем, с отставанием на 10-20 лет. Поэтому попыток комплексного системного проектирования лингвистического обеспечения в архивах и музеях в советское время не было предпринято, а сейчас такой возможности, очевидно, нет. Тем не менее, в отдельных коллективах происходит довольно активное создание различных языковых средств, как аналогичных языкам, создаваемым в информационно-библиотечных системах, так и оригинальных» [4. С.51 ]. За всплеском исследований в области информационных систем и информационного поиска в течение 1970-1980-х гг., сопровождаемых множеством публикаций, последовал спад в начале 1990 г. Смена технического обеспечения вызвала необходимость замены и лингвистического обеспечения. Создание и использование средств лингвистического обеспечения МЭК опирается на многие информационные технологии, влияющие на создание и реализацию языковых средств: технологию функционирования и архитектуру информационных систем, теорию информационного поиска, классические и современные решения в области технологий баз данных и, наконец, технологию проектирования пользовательских интерфейсов. Согласно ГОСТу 24.104-85 [94] в лингвистическом обеспечении АСУ должны быть: - предусмотрены языковые средства для описания любой используемой в АСУ информации, - унифицированы используемые языковые средства, - стандартизованы описания однотипных элементов информации и записи синтаксических конструкций, - обеспечены удобство, однозначность и устойчивость общения пользователей со средствами автоматизации АСУ, - предусмотрены средства исправления ошибок, возникающие при общении пользователей с техническими средствами АСУ.

При классическом подходе лингвистическим обеспечением называют комплекс информационно-поисковых языков, прежде всего, классификационных и вербальных (дескрипторных) [101]. В соответствии с так называемым лингвистическим подходом, лингвистическое обеспечение - это комплекс средств, используемых для автоматической обработки текстов на естественном языке (включая обработку запросов и поиск), т.е. прежде всего, языковые процессоры. При семиотическом подходе лингвистическое обеспечение определяется как средства представления информации в виде данных и интерпретации этих данных. При общем взгляде, с точки зрения программного обеспечения, в составе лингвистического обеспечения могут оказаться вообще все языковые средства пользователя, причем несущественно, носят ли они характер языков описания данных, представления данных или манипулирования данными. С точки зрения информационных лингвистов под лингвистическим обеспечением, по предложению А.Б.Антопольского, следует понимать «комплекс языковых средств и процессоров, предназначенных для обработки, представления и поиска письменных текстов на естественном языке в основном на семантическом уровне» [5]. Под лингвистическим обеспечением в современных информационных системах понимают: собственно информационно-поисковый язык, средства обеспечения совместимости, процедурные средства, критерий смыслового соответствия, языки структурирования и метаописания данных, вспомогательные средства обработки текстов на естественном языке и средства поддержки лингвистического обеспечения. Лингвистическое обеспечение - это типы, форматы, структуры информации (данных, записей, документов), языковые средства описания (ЯОД, словари данных) и ЯМД, классификаторы, кодификаторы, словари и тезаурусы [3. С. 65-66]. «В понятие лингвистического обеспечения АИС включают всю совокупность языков, которые применяются как для составления программ, так и в процессе функционирования ИС», - критикует В.П.Захаров [33. С. 44]. Расширение сферы применения понятия лингвистического обеспечения вполне объяснимо. При различном назначении информационных языков и языков программирования, налицо факт влияния последних на первые. Автоматизированный поиск имеет отличительную особенность -отсутствует какая-либо завершающая обработка, связанная с осмыслением полученных результатов или с принятием решений [33. С. 3]. ИС отводится роль средства поиска и минимальной статистической обработки, как правило, обеспечиваемой стандартными интегрированными языками манипулирования данными. Осмысление результата возможно лишь в экспертных системах [88].

Развитие автоматизированных ИС тесно связано с широким внедрением вычислительной техники. Характерная черта поискового аппарата первых ИС в библиотеках и музеях состоит в сравнении поискового образа запроса, составленного на основе дескрипторных словарей или тезаурусов с поисковым образом данных [33. С. 12-13]. В связи с чем особый интерес проявлялся к ИПЯ и методикам индексирования. Для формализованного описания смыслового содержания документов используются искусственные языки, история возникновения и развития которых описана достаточно подробно [101; 33]. Вербальные языки были и остаются центральным элементом лингвистического обеспечения МЭК. В настоящее время доминируют языки, основанные на свободной, неконтролируемой лексике. Поскольку основной и чуть ли не единственный тип высказываний, которые удается автоматически извлекать из плохо структурированной информации - это факты типа «объект признак - значение», постольку языки данного класса принято именовать «объектно-признаковыми», или, пользуясь терминологией специалистов по электронным библиотекам, иначе говоря, специалистов по обработке плохо структурированной информации, фактографическими или объектографическими. В теории баз данных эти средства именуют «моделями данных» или языками описания данных. Они используются для составления словаря данных МЭК.

Словари в музейном электронном каталоге

Проект внутримузейного стандарта описания предмета на основе 16 информационных категорий был впервые представлен на обсуждение CIDOC в 1978 году. За детальным обсуждением последовало принятие этого документа в качестве основы разрабатываемых в то время рекомендаций по описанию музейного предмета. Результат углубленной работы по совершенствованию исходного документа был опубликован в том же году [155]. Стандарт описания музейного объекта в британских музеях [119. С. 119-120.] разрабатывался в течение длительного времени и привел к появлению стандарта SPECTRUM, подробно описанного в пп.2.4. В целях обеспечения совместимости различных форматов данных уже в начале 1980-х годов C1DOC выработал минимальный список данных для описания музейных предметов: - учреждение (название страны и музея), - номер по книге поступления, - способ поступления, - дата поступления, - источник поступления, - общее название объекта (на государственном языке), - классификация - стандартный термин (на английском, французском, латинском или свободный текст) или дополненный подкатегориями, разработанными СШОС при содействии других комитетов ICOM, - описание объекта, - история бытования объекта [148. С. 313].

В 1987 году Министерство культуры СССР разработало и утвердило «Унифицированный паспорт на движимые памятники истории культуры (музейные предметы)» [69]. В силу ряда причин документ не получил широкого распространения в музеях России. Однако работы по унификации системы описания музейного предмета проводились и продолжают проводиться [74; 76; 45; 108; 28; 106]. Наиболее значимые из них ведутся в РЭМ [9; 89], ГМИ [68; 50; 51; 62], ГМИИ им. А.С.Пушкина [76] и Государственном Эрмитаже [61; 47. С. 55-57; 58; 59; 66; 19; 25; 26; 27].

Анализ существующих в разных странах стандартов позволяет CIDOC в 1994 году издать руководство по описанию музейного предмета, удовлетворяющее всем существующим в мире типам музеев [146]. Следуя по пути создания международного стандарта описания музейного предмета, на основе этого документа были разработаны: франко-канадская ИС описания предметов церковного обихода, включающая англо-французские словари-тезаурусы [151] и методические рекомендации для описания предметов изобразительного и декоративного видов искусств [155], руководство по описанию музейных предметов [114], нормы описания африканских коллекций [143] музеев Мали, Кении, Мадагаскара, Заира, Намибии и Туниса, австралийский стандарт метаданных Dublin Core [126], перечень категорий описания произведений искусства, принятый Институтом фонда Гетти [113].

БД EROS, используемая в Лувре (Франция), включает многоязычные иерархические словари на французском, итальянском, английском, русском, японском, португальском, арабском, греческом и китайском языках. Информация в системе хранится в виде коротких кодов и не зависит от языка. В момент обращения к системе она переводится на нужный язык. Благодаря кодировке Unicode (UTF-8) осуществлена возможность работы со всей иерархической лексикой и синонимами. Дефиниции на разных языках к словарным единицам из словарей индексации доступны через интернет. Русифицированы 30 из 35 словарей. Существенное влияние на развитие системы оказывают используемые совместимые стандарты и форматы: - стандарты изображения (качество и компрессия), - цветовая настройка, - защита информации (водяные знаки, ограничение доступа), - ОС и приложения, - форматы языкового обмена, - многоязычные словари для индексации [142; 53].

Проблеме терминологического единства за рубежом уделяется чрезвычайно серьезное внимание, особенно разработке терминологических словарей и словарей-тезаурусов, которые используются в вышеназванных системах и могут использоваться в дальнейшем в рамках других систем, а именно словари Института фонда Гетти [158; 162; 160] и словари иконографического анализа [164; 129]. Используемая в ГИМ «НИКА-музей» -единственная отечественная музейная информационная система, предполагающая работу с переведенными на русский язык иконографическими словарями-тезаурусами Гарнье, но полный перевод этих словарей - вопрос времени [53].

Лингвистическое обеспечение музейного электронного каталога «Атлант»

Учитывая современное представление о составе лингвистического обеспечения МЭК, рассмотрим последовательно лингвистическое обеспечение МЭК, реализованное в МЭК «Атлант». В лингвистическое обеспечение МЭК «Атлант» входят: логическая схема данных МЭК (структуры информации, типы и форматы данных), описанная средствами языка Oracle SQL, словарь метаданных МЭК, классификаторы и словари для отдельных атрибутов объектов МЭК. В качестве языка манипулирования данными и языка запросов на физическом уровне используется также Oracle SQL, на который запрос пользователя переводится с языка интерфейса МЭК.

Модель МЭК «Атлант» на логическом уровне, представленная на рис.9, включает 10 основных объектов: «артефакты», «документы», «персоналии», «материалы», «выставки», «источники поступления», «посредники», «библиография», «материально-ответственные лица», «воспроизведения». Дополнительно введены еще 17 объектов описания, которым на физическом уровне соответствуют отношения, позволяющие отслеживать изменения в описании, происходящие во времени.

Структура данных включает несколько уровней: обязательный, расширенный и метаинформационный. Обязательный уровень структуры данных определяется основными задачами, решаемыми МЭК (рис.10). Расширенный уровень структуры данных, необязательный для заполнения, зависит от конкретной категории музейного предмета (рис.11). В частности, принадлежность музейного предмета к категории «археологические материалы» исключает необходимость заполнения параметров из информационного блока «авторы». И обратная ситуация: предмет, относящийся к категории «станковая живопись», не имеет параметров описания, относящихся к информационному блоку «место находки». Структура данных в соответствии с представленной на логическом уровне моделью полностью приведена с комментариями в приложении 1. МИПС «Атлант» позволяет хранить как текстовую информацию, так и графическую, причем текстовая информация включает в себя в основном символьный и численный форматы данных, а также данные типа дата. Формат представления данных задается средствами пользовательского интерфейса в формах ввода и вывода данных. Таким образом, при вводе формат может быть один, который более удобен оператору, а при выводе данных - другой, принятый для конкретного вида документации. Метаинформация представляет собой специальную служебную информацию, позволяющую устанавливать связи между объектами схемы данных и накладывать ограничения целостности. Так специальный атрибут в отношении «артефакты» позвояет устанавливать в случае необходимости связи между отдельными артефактами - рекурсии, если, например, из одного артефакта образовалось несколько или, наоборот, несколько соединились в один. Есть дополнительные атрибуты, например, для отношения «размеры», позволяющие управлять порядком вывода данных, если он отличен от стандартных принципов сортировки (в алфавитном порядке, по возрастанию, по убыванию и т.п.).

Поиск осуществляется в режиме формирования запроса. Их несколько: «поиск по инвентарю» (рис. 13а), «поиск по книге поступлений музея», «поиск по актам», «поиск по топографии», «поиск по описанию» (рис.136). Первые четыре режима соответствуют основным видам хранительской работы и критериям, по которым ведется поиск информации. Последний режим включает наиболее полный перечень атрибутов (см. табл.9) из которых может быть сформировано поисковое предписание в соответствии со стандартом языка SQL. Атрибуты, из которых может формироваться запрос пользователя, берутся из словаря метаданных METADATA.

Проблема многоязычия решается за счет поддержки национальных языков самой СУБД Oracle. Сервер может хранить данные на любом языке, обеспечивать их правильную сортировку в соответствии с особенностями языка. Средства разработки приложений также адекватно отображают пользовательскую информацию на необходимом языке и само приложение можно настроить на работу на необходимом языке. Основные трудности в настройке сервера БД и приложения решаются администратором базы данных. Таким образом, система допускает хранение в БД словарей-классификаторов на различных языках.

Некоторые из разработанных фасетных классификаторов на логическом уровне образуют структуру данных, а не словарь - множество значений атрибута описания объекта. Такой метод наиболее ярко отражен в логической модели подсистемы по описанию сохранности восточной живописи.