Е. А. Охезина,
Главный библиотекарь
Научной библиотеки
Уральского государственного университета
Цифровая коллекция авторефератов диссертаций в Научной библиотеке УрГУ
Прежде чем говорить о создаваемой Цифровой коллекции авторефератов диссертаций в Научной библиотеке Уральского государственного университета, посмотрим на международные проекты по созданию и представлению в интернет Электронных Библиотек Диссертаций и авторефератов (ЭДБ).
I. Зарубежные проекты.
Лидером в этом направлении (доступ к электронным диссертациям (ETD - Electronic Theses and Dissertations)) является компания UMI (University Microfilms) (http://www.umi.com), активно сотрудничающая с компанией ProQuest. На сегодняшний день БД UMI содержит более 1.7 млн. диссертаций, из которых более 1 млн. Представлены в виде полных текстов и микроформ. БД представляет работы более тысячи североамериканских научных школ и европейских университетов. Ежегодное пополнение составляет около 60 тысяч диссертаций. Доступ к БД осуществляется в основном на платной основе. Стоимость доставки зависит от времени доставки ( за доставку в течение 5-7 дней вы заплатите $ 45, в течение 2-3 недель - $ 34 за каждую копию).
Если год назад среди описаний диссертаций не было ни одной, удовлетворяющей запросу language = russian, то сегодня их 45! Более того, можно просмотреть и распечатать первые 24 страницы документа.
Основные поставщики UMI это университеты. Взаимодействие с ними строится по следующей схеме: университеты пересылают диссертации в текстовом формате, UMI создает файл PDF и описание диссертации. Доступ к диссертации для представившего ее университета - бесплатный, для остальных платный. Авторам диссертаций начисляется авторское вознаграждение, размер которого определяется договором (publishing agreements). Кроме университетов, UMI работает напрямую и с авторами. Вопросы авторского права обсуждаются на сайте компании UMI по адресу: http://www/umi/com/hp/Dservices/prepare/copyrigh.htm . Там же размещена брошюра "Copyright Law & Graduate Research: New Media, New Rights and New Dissertation".
Некоммерческой альтернативой БД UMI является международный проект Networked Digital Library of the Theses and Dissertations NDLTD (http://www.ndltd.org). Этот проект зародился в середине 90-х годов и начинался как кооперативный проект американских университетов, но очень быстро расширился до международного уровня. Сейчас в нем участвуют такие страны как США, Канада, Австралия, страны Западной Европы, Азии и даже есть один российский участник - Санкт-Петербургский Государственный Технический Университет.
Основные участники проекта NDLTD это университеты. Сегодня их 132, а еще год назад было 98. Затем идут библиотеки и объединения, представляющие несколько организаций. Всего участников сегодня 152, а год назад 106.
Поиск диссертаций можно вести как в отдельных базах участников, так и в общей распределенной БД, реализованной с использованием VTLS. Сейчас там реализован только простой поиск. Но есть возможность использовать русский вариант интерфейса. Результат поиска выдается в виде описания диссертации или marc-записи в формате MARC21, где имеются ссылки на полные тексты документов. В экспериментальном режиме открыт доступ к объединенному каталогу.
Общий объем баз данных проекта NDLTD явно уступает БД UMI. Самыми развитыми и объемными считаются ЭБД Virginia Tech и Massachusetts Institute of Technology, которые содержат около 3 и 4 тысяч полнотекстовых диссертаций соответственно, защищенных в этих университетах.
Но значение проекта NDLTD не ограничивается только пополнением Электронных Библиотек Диссертаций. В проекте участвуют исследовательские группы, занимающиеся разработкой самых передовых технологий создания и поддержки электронных библиотек. NDLTD проводит ежегодные международные симпозиумы по проблемам ЭБД. Последняя Пятая конференция состоялась в США в Brigham Young University. А Шестая состоится в мае 2003 года в Берлине. Вообще, Германия в рамках проекта занимается проблемами создания DTD (Data Type Definition) на электронные копии диссертаций. Проектом уделяется большое внимание проблемам авторского права и научной этики. Например, Virginia Tech (http://etd.vt.edu) организует семинары по этим вопросам и занимается организацией различных вариантов доступа к диссертациям.
Проект NDLTD открыт для новых участников. Чтобы присоединиться к проекту необходимо сделать несколько шагов, описанных на сайте проекта. Среди требований к участникам это поддержка формата MARC21 и доступность каталога по протоколу Z39.50.
Существуют аналогичные национальные системы доступа к диссертациям. Например, во Франции действует национальная общедоступная университетская база данных SUDOC (http://www.sudoc.abes.fr), куда диссертанты представляют краткие формализованные описания своих диссертаций. Доступ же к полным текстам диссертаций осуществляется через сайты организаций, которые занимаются созданием ЭБД.
ЮНЕСКО в последние годы стал активно поддерживать работы по созданию ЭБД. В итоговом документе рабочего семинара по проблемам ЭБД (состоявшегося в сентябре 1999 г. в Париже) записано, что содействие работам по созданию ЭБД соответствует политике ЮНЕСКО по обеспечению свободного доступа к научным сетевым ресурсам. Поэтому основные цели ЮНЕСКО в этой области это:
II. Российские проекты.
Крупнейшая база данных описаний диссертаций ведется во Всероссийском Научно-техническом Информационном Центре (ВНТИЦ, http://www.vntic.org.ru). БД содержит около 300 тысяч записей в виде информационных карт диссертаций (ИКД), начиная с 1985 года.
Доступ к информационным ресурсам ВНТИЦ осуществляется на основе договоров. Все услуги от поиска до получения копий платные. В свободном доступе только БД описаний диссертаций за 1997 год, реализуемая через интерфейс WEB-IRBIS, используемый в БД ИНИОН.
База данных авторефератов и диссертаций Российской Государственной Библиотеки содержит описания диссертаций с 1995 года, а авторефератов с 1987 года. Полные тексты диссертаций представлены в новом проекте РГБ "Электронная библиотека диссертаций" и доступны через сайт "Открытой Русской Электронной Библиотеки" (http://orel.rsl.ru).
База данных "Авторефераты диссертаций" ГПНТБ России содержит описания авторефератов, поступающих в фонд ГПНТБ с 01.10.91 года. Общий объем базы 72 тысячи записей.
Еще один источник это базы данных российских библиотечных корпораций. Например, через шлюз Института Корпоративных библиотечных систем (Санкт-Петербург) можно попытаться найти описания авторефератов и диссертаций, создаваемые участниками российских библиотечных консорциумов.
III. Цифровая коллекция авторефератов в Научной библиотеке УрГУ.
Итак, что было сделано в Научной библиотеке УрГУ по созданию Цифровой коллекции авторефератов диссертаций?
К июлю 2001 года мы уже имели отработанную технологию создания цифровых копий изданий различных видов, таких как редкие книги и учебная литература. Поэтому летом 2001 года во время летней практики студентов первого курса мы начали оцифровывать авторефераты диссертаций. Накапливая фонд электронных копий авторефератов, мы понимали, что создание Цифровой коллекции авторефератов отличается от создания Цифровой коллекции "Правовая история России", содержащей электронные копии изданий из фонда Отдела редких книг. Здесь мы сталкиваемся с проблемой авторского права, от решения которой нам никуда не уйти, и необходимостью организации взаимодействия с Ученым Советом университета и авторами. Мы считали, что все наши работы в этом направлении должны быть санкционированы руководством университета. Поэтому было подготовлено Распоряжение проректора по НИР о создании Цифровой коллекции авторефератов диссертаций в Научной библиотеке УрГУ. Согласно этому Распоряжению была разработана Концепция цифровой коллекции авторефератов диссертаций и Авторский договор, согласованный с юристом университета. Так же была отработана и внедрена технологическая цепочка Ученый Совет ( Автор ( Библиотека ( Создание цифровой копии ( Организация доступа к полному тексту автореферата через электронный каталог библиотеки. Сразу скажу, что сегодня мы планируем внести изменения в этот процесс, чтобы Автору не нужно было идти в библиотеку, а все взаимоотношения с Авторами (подписание договора, передача электронных версий автореферата и диссертации) осуществлялись бы в Ученом Совете, а оттуда поступали в библиотеку.
Так же нам пришлось внести существенные изменения в библиографические описания авторефератов и диссертаций, чтобы они соответствовали предъявляемым требованиям на описания данных видов изданий. Для чего был разработан шаблон библиографического описания автореферата и диссертации в формате MARC21.
До июля 2002 года наши цифровые копии авторефератов были доступны только в графическом формате DjVu, используемом нами при создании других цифровых коллекций. Но для удовлетворения единых требований по представлению полных текстов этих изданий российскими библиотечными консорциумами летом 2002 года мы создали электронные копии еще и в формате PDF. Причем здесь следует иметь ввиду, что ЭЛЕКТРОННАЯ КОПИЯ автореферата или диссертации может быть сделана ТОЛЬКО сканированием бумажного издания. В случае обработки текстовой версии автореферата или диссертации и перевода ее в формат PDF мы можем говорить лишь об электронной версии автореферата или диссертации, так как гарантировать их 100% идентичность мы не можем. Однако при создании такой версии, мы получаем возможность организации полнотекстового поиска по документу.
Очень важным результатом нашей работы мы считаем вынесение на Ученый Совет университета вопроса о создании цифровых коллекций в Научной библиотеке, в том числе создания цифровой коллекции авторефератов. И тот интерес, с которым был выслушан наш доклад, и поддержка, которую мы получили в виде Постановления Ученого Совета, вселяют в нас уверенность, что дело, которым мы занимаемся является не делом не только библиотеки, но и университета.
Что касается технологий, которые мы используем, то о них вы подробно услышали в предыдущем докладе. А обо всех деталях, которые мы используем, а так же, о которых мы знаем, но до использования их у нас просто еще не дошли руки, мы расскажем на нашем тренинг-семинаре "Технологии создания цифровых коллекций".
Наши результаты на сегодня:
Около 5 тысяч страниц авторефератов (более 150 авторефератов) и 32 подписанных авторских договора. Резкий рост объема коллекции приходится на летние месяцы. Это связано с использованием студентов, отрабатывающих летнюю практику в библиотеке.
Теперь несколько слов о наших документах. Начнем с Концепции.
Сразу скажу, мы считаем, что Концепция - это живой документ, который может и должен изменяться. И документ, созданный нами в феврале 2002 года, сегодня нуждается в корректировке и развитии. И это нормально! Мы идем вперед и год назад мы еще не видели тех перспектив, которые стали нам доступны теперь.
Структура Концепции следующая:
Организация работ по проекту.
I этап
- создание цифровых копий авторефератов диссертаций, защищаемых в Диссертационных советах УрГУ и диссертаций, защищаемых преподавателями и сотрудниками УрГУ;
- создание библиографических описаний как на оригинал так и на цифровую копию, тем самым формируя ЭБД.
II этап это пополнение коллекции за счет создания цифровых копий авторефератов диссертаций из фонда библиотеки.
III этап, над которым мы сегодня считаем необходимым начать работу это организация работ по включению в цифровую коллекцию полных текстов диссертаций, что влечет за собой пересмотр Авторского договора, систему организации доступа к полным текстам и превращение Цифровой коллекции авторефератов в Цифровую коллекцию диссертаций и авторефератов, что существенно повысит ее ценность.
Что представляет собой Авторский договор сегодня?
Полное название Авторский договор на передачу неисключительных прав на использование произведения. Структура договора стандартная:
Какие перспективы мы видим в этом направлении?