Министерство образования и науки РФ 
           
          Федеральное государственное бюджетное образовательное учреждение высшего образования 
           
          Уфимский государственный авиационный технический университет 
           
          Лабораторный практикум 
           
          по учебной дисциплине 
          распределенная обработка экономической информации 
           
          Уфа 2017 
           
          Составители: ______________ Р.Р. Еникеев 
           
           
           
           
          Рассмотрено на заседании кафедры 
           
          Автоматизированных систем управления 
           
          « 23 » января 2016 г. (протокол № 5 ) 
           
          Заведующий кафедрой 
           
          ___________ д.т.н., профессор В.В.Антонов 
           
           
          Рассмотрено на заседании научно-методического Совета по направлению 09.03.03 «Прикладная информатика» 
           
          « 17» января 2017г. (протокол № 12 ) 
           
          Председатель научно-методического Совета 
           
          ____________ д.т.н., профессор В.В.Антонов 
           
           Министерство образования и науки Российской Федерации 
           
          Федеральное государственное бюджетное образовательное 
           
          учреждение высшего образования 
           
          Уфимский государственный авиационный технический университет 
           
           
          ОБРАБОТКА РАСПРЕДЕЛЕННОЙ 
           
          ИНФОРМАЦИИ 
           
          НА ОСНОВЕ XML И DB2. 
           
          СОЗДАНИЕ И ВЕДЕНИЕ XML-ДАННЫХ 
          Лабораторный практикум 
           
          по дисциплине «Распределенная обработка 
           
          экономической информации» 
           
          Уфа 2017 
           
          
             
            Министерство образования и науки Российской Федерации 
             
            Федеральное государственное бюджетное образовательное 
             
            учреждение высшего образования 
             
            Уфимский государственный авиационный технический университет 
            Кафедра автоматизированных систем управления 
             
            ОБРАБОТКА РАСПРЕДЕЛЕННОЙ 
             
            ИНФОРМАЦИИ 
             
            НА ОСНОВЕ XML И DB2. 
             
            СОЗДАНИЕ И ВЕДЕНИЕ XML-ДАННЫХ 
            Лабораторный практикум 
             
            по дисциплине «Распределенная обработка 
             
            экономической информации» 
             
            Уфа 2017 
             
            Составители: 
             
            Р. Р. Еникеев, Г. В. Старцев, Г. Р. Шакирова, А. М. Шамсиева 
             
            УДК 681.3.06 (07) 
             
            ББК 32.973-018.2 (я7) 
             
             
            Обработка распределенной информации на основе XML и DB2. Создание и ведение XML-данных: лабораторный практикум по дисциплине "Распределенная обработка экономической информации" для направления 09.03.03 – Прикладная информатика/ Уфимск. гос. авиац. техн. ун-т; Сост.: Р. Р. Еникеев, Г. В. Старцев, Г. Р. Шакирова, А. М. Шамсиева. – Уфа, 2017. – 47 с. 
             
            Рассматриваются основные принципы применения технологии PureXML для создания, ведения и поиска XML-данных в СУБД IBM DB2 – от создания, хранения, ведения и индексирования XML-данных до программирования XML-ориентированных запросов для получения иерархий данных и атомарных значений. 
             
            Пособие предназначено для студентов направления 09.03.03 «Прикладная информатика» с целью закрепления навыков, полученных при изучении курса «Распределенная обработка экономической информации». 
             
            Ил. 32. Библиогр.: 8 назв. 
            Рецензенты: канд. техн. наук, доц. А. Н. Набатов, 
             
            канд. техн. наук, доц. Н. И. Федорова 
             
            © Уфимский государственный 
             
            авиационный технический университет, 2017 
             
            
          СОДЕРЖАНИЕ 
          
            
            
            
               
              Введение
  | 
               
              2
  | 
             
            
               
              Вводные замечания
  | 
               
              4
  | 
             
            
               
              Лабораторная работа 1 
               
              XML-документы. создание, валидация и загрузка в DB2
  | 
             
            
               
              1. Цель работы
  | 
               
              6
  | 
             
            
               
              2. Задачи
  | 
               
              8
  | 
             
            
               
              3. Теоретическая часть
  | 
               
              8
  | 
             
            
               
              4. Описание программного комплекса
  | 
               
              12
  | 
             
            
               
              5. Методика выполнения работы
  | 
               
              12
  | 
             
            
               
              6. Задание на лабораторную работу
  | 
               
              35
  | 
             
            
               
              7. Контрольные вопросы
  | 
               
              35
  | 
             
            
               
              8. Содержание и оформление отчета
  | 
               
              35 
              
  | 
             
            
               
              Лабораторная работа 2. 
               
              XML-данные в DB2. модификация, удаление, индексация
  | 
             
            
               
              1. Цель работы
  | 
               
              35
  | 
             
            
               
              2. Задачи
  | 
               
              36
  | 
             
            
               
              3. Теоретическая часть
  | 
               
              36
  | 
             
            
               
              4. Методика выполнения работы
  | 
               
              39
  | 
             
            
               
              5. Задание на лабораторную работу
  | 
               
              46
  | 
             
            
               
              6. Контрольные вопросы
  | 
               
              46
  | 
             
            
               
              7. Содержание и оформление отчета
  | 
               
              46
  | 
             
            
               
              Список литературы
  | 
               
              47
  | 
             
            
           
          ВВЕДЕНИЕ 
           
          В настоящее время распределенная обработка данных является важной задачей для успешного функционирования автоматизированных информационных систем предприятий. Количество собираемых, обрабатываемых и анализируемых данных постоянно возрастает вместе с требованием к усовершенствованию технологий хранения и управления данными. Все эти данные представляют собой информационный ресурс, который имеет ключевое значение для получения конкурентного преимущества предприятия. Успешное и оптимальное управление данными требует все более активного использования современных технологий работы с данными. 
           
          Одной из таких технологий является XML. Расширенный язык разметки (eXtensible Markup Language, XML) широко распространен как платформо-независимый формат представления данных. Применяется для обмена информацией между различными слабосвязанными системами. XML все больше используется в приложениях уровня предприятия для моделирования частично структурированных и неструктурированных данных. Внешним представлением сообщений на реляционном языке является набор двухмерных таблиц. Внешним представлением сообщений на языке XML является набор реальных документов (и электронных, и бумажных), визуализация которых происходит при помощи универсального браузера. 
           
          В настоящее время XML становится обязательным элементом структур хранения данных. XML-документ является информационным объектом и экземпляром одного из классов, содержащихся в XML-ориентированной базы данных (БД). XML-ориентированные БД используют в качестве модели данных XML-модель данных. XML-ориентированные БД обеспечивают существенно более высокую скорость выполнения транзакций, в том числе через интернет, что обусловлено меньшими затратами на преобразование данных и эффективным способом управления памятью. Также XML-ориентированные БД характеризуются высокой скоростью разработки приложений, что обусловлено унификацией данных, методами их обработки и способом их представления. 
           
          Существуют методы хранения XML-данных: реляционные БД; прирожденные (native) XML-БД. 
           
          Прирожденная XML БД основана на использовании внутреннего представления XML в отличие от XML-надстроек над существующими реляционными БД, в которых реализована XML-надстройка в соответствии со стандартом доступа SQL-2003. 
           
          DB2 — семейство систем управления реляционными базами данных, выпускаемых корпорацией IBM. IBM DB2 является мощной СУБД, которая имеет эффективную и надежную платформу, для построения приложений. Современные версии DB2 обеспечивают расширенную поддержку использования данных в формате XML, в том числе операции с отдельными элементами документов XML. Поддержка XML в DB2 предлагает эффективные и универсальные возможности для управления вашими данными XML (XML-данные хранятся и запрашиваются в их собственном иерархическом формате). 
           
          ВВОДНЫЕ ЗАМЕЧАНИЯ 
           
          В курсе лабораторных работ в качестве сквозного примера рассматривается база данных «Labs». Она представлена единственной таблицей «Student_progress» (успеваемость студентов) с четырьмя столбцами. Структура таблицы и типы данных ее столбцов приведены в таблице 1: 
           
          Таблица 1 
           
          Student_progress 
          
            
              
              
              
              
              
                 
                ID
  | 
                 
                STUDENT
  | 
                 
                SUBJECT
  | 
                 
                RESULT
  | 
               
              
                 
                int
  | 
                 
                xml
  | 
                 
                xml
  | 
                 
                xml
  | 
               
             
           
           
          В каждый из XML-столбцов загружается свой XML-документ. Для хранения документов следует предварительно создать следующую структуру директорий: общая папка Labs → в ней – три вложенных директории: STUDENTS (для XML-файлов о студентах), SUBJECTS (для XML-файлов о дисциплинах), RESULTS (для XML-файлов об успеваемости). Нотация предполагает представление XML-элементов в виде прямоугольников с закругленными углами. 
           
          Концептуальные схемы XML-документов представлены на рис. В1. 
            
          Рисунок В1 – Концептуальные схемы XML-документов 
           
          (для методики выполнения работы) 
           
          В рамках лабораторных работ студенты должны ориентироваться на XML-документы, описывающие порядок закупки компьютерного оборудования. Для этого должны быть введены две XML-структуры, схемы которых представлены на рис. В2. Первая структура представлена элементом Equipment (оборудование), описывающим такие реквизиты оборудования, как идентификатор (eqID), название (eqName), параметры (Parameter) и производителя (Production). Последние два реквизита имеют сложную структуру и представлены дочерними элементами Name и Value (название и значение параметра оборудования) и Name и Status (название и статус изготовителя). 
           
          Вторая XML-структура показывает итерации покупки оборудования из первой структуры. Каждая итерация задается элементом Item внутри корневого элемента Purchase (покупка) и характеризуется идентификатором (элемент ID), датой (элемент Date), количеством (элемент Quantity), ценой за единицу (элемент Price per Unit), покупателем (элемент Client с дочерними элементами Name и Contacts). 
            
           
          Рисунок В2 – Концептуальные схемы XML-документов 
           
          (для задания на лабораторные работы) 
          Для выполнения заданий рекомендуется создать структуру вложенных директорий по аналогии с такой структурой в методике выполнения заданий. Аналогичным образом база данных должна быть представлена таблицей Sales с идентифицирующим полем ID и двумя XML-полями Equipment и Purchase. 
           
          Лабораторная работа № 1, 2 
           
          XML-ДОКУМЕНТЫ. 
           
          СОЗДАНИЕ, ВАЛИДАЦИЯ И ЗАГРУЗКА В DB2 
           
          1. Цель работы 
           
          Целью работы является изучение принципов создания XML-документов, их загрузки и использования в СУБД IBM DB2. 
           
          2. Задачи 
           
          Задачами лабораторной работы являются овладение навыками создания XML-документов с использованием стандартных текстовых и специфических XML-редакторов и разработки XML-ориентированных баз данных в СУБД DB2. 
           
          3. Теоретическая часть 
           
          XML – аббревиатура от «Extensible Markup Language» (расширяемый язык разметки). XML основан на хорошо известной разметке XML, однако не является заменой ей. Вообще говоря, XML и HTML создавались с разными целями: XML используется для описания данных, а HTML – для их визуализации. 
           
          Важно помнить, что XML сам по себе ничего не делает: это не язык программирования, а язык разметки, предназначенный для структурирования, хранения и передачи информации. 
           
          Расширяемость XML означает возможность введения своих собственных тегов, в отличие от HTML, где автор может использовать только те теги, которые определены в стандарте HTML (например,
          или 
         |