Общая классификация и характеристика технологий распределенных информационных систем. Распределенные информационные системы и сети

    Архитектура распределенных систем и основные понятия распределенной обработки данных……………………………………………………………….2

    Концепция открытых систем…………………………………………….12

    Преимущества идеологии открытых систем……………………………17

    Открытые системы и объектно-ориентированный подход……………19

    Компьютерные (информационные) сети…………………………………21

    Глобальные сети…………………………………………………………..24

    Локальные сети……………………………………………………………..27

    Многопроцессорные компьютеры………………………………………..31

    Взаимодействующие процессы…………………………………………..36

  1. Архитектура распределенных систем и основные понятия распределенной обработки данных

Под распределенными понимаются ИС, которые не располагаются на одной контролируемой территории, на одном объекте.

Распределенная информационная система (РИС) - любая информационная система, позволяющая организовать взаимодействие независимых, но связанных между собой ЭВМ. Эти системы предназначены для автоматизации таких объектов, которые характеризуются территориальной распределенностью пунктов возникновения и потребления информации.

В общем случае распределенная информационная система (РИС) представляет собой множество сосредоточенных ИС , связанных в единую систему с помощью коммуникационной подсистемы

Сосредоточенными ИС могут быть:

    отдельные ЭВМ, в том числе и ПЭВМ,

    вычислительные системы и комплексы,

    локальные вычислительные сети (ЛВС).

В настоящее время практически не используются неинтеллектуальные абонентские пункты, не имеющие в своем составе ЭВМ . Поэтому правомочно считать, что наименьшей структурной единицей РИС является ЭВМ (рис. 1).

Распределенные ИС строятся по сетевым технологиям и представляют собой вычислительные сети (ВСт).

Термин «распределенная система», подразумевает взаимосвязанный набор автономных компьютеров, процессов или процессоров. Компьютеры, процессы или процессоры упоминаются как узлы распределенной системы. Будучи определенными как «автономные», узлы должны быть, по крайней мере, оборудованы своим собственным блоком управления. Таким образом, параллельный компьютер с одним потоком управления и несколькими потоками данных (SIMD) не подпадает под определение распределенной системы. Чтобы быть определенными как «взаимосвязанными», узлы должны иметь возможность обмениваться информацией.

Так как процессы могут играть роль узлов системы, определение включает программные системы, построенные как набор взаимодействующих процессов, даже если они выполняются на одной аппаратной платформе. В большинстве случаев, однако, распределенная система будет, по крайней мере, содержать несколько процессоров, соединенный коммутирующей аппаратурой.

Коммуникационная подсистема включает в себя:

    коммуникационные модули (КМ);

    каналы связи;

    концентраторы;

    межсетевые шлюзы (мосты).

Основной функцией коммуникационных модулей является передача полученного пакета к другому КМ или абонентском пункту в соответствии с маршрутом передачи. Коммуникационный модуль называют также центром коммутации пакетов.

Рис. 1. Фрагмент распределенной информационной системы

Каналы связи объединяют элементы сети в единую сеть, каналы могут иметь различную скорость передачи данных.

Концентраторы используются для уплотнения информации перед передачей ее по высокоскоростным каналам.

Межсетевые шлюзы и мосты используются для связи сети с ЛВС или для связи сегментов глобальных сетей. С помощью мостов связываются сегменты сети с одинаковыми сетевыми протоколами.

В любой РИС в соответствии с функциональным назначением может быть выделено три подсистемы:

    пользовательская подсистема;

    подсистема управления;

    коммуникационная подсистема.

Пользовательская или абонентская подсистема включает в себя информационные системы пользователей (абонентов) и предназначается для удовлетворения потребностей пользователей в хранении, обработке и получении

Наличие подсистемы управления позволяет объединить все элементы РИС в единую систему, в которой взаимодействие элементов осуществляется по единым правилам. Подсистема обеспечивает взаимодействие элементов системы путем сбора и анализа служебной информации и воздействия на элементы с целью создания оптимальных условий для функционирования всей сети.

Коммуникационная подсистема обеспечивает передачу информации в сети в интересах пользователей и управления РИС.

Функционирование РИС можно рассматривать как взаимодействие удаленных процессов через коммуникационную подсистему .

Процессы вычислительной сети порождаются пользователями (абонентами) и другими процессами.

Взаимодействие удаленных процессов заключается в:

    обмене файлами,

    пересылке сообщений по электронной почте,

    посылке заявок на выполнение программ и получение результатов,

    обращении к базам данных и т. д.

Концептуально распределенная обра ботка данных подразумевает тот или иной вид организации сети связи и децентрали зацию трех категорий ресурсов:

    аппаратных вычислительных средств и собственно вычислительной мощности;

    баз данных;

    управление системой.

В распределенных информационных системах в той или иной степени осуществляется реализация следующих основных функций:

Доступ к ресурсам (вычислительным мощностям, программам, данным и т. п.) с терминалов и из пользовательских программ в режиме «файл-сервер»;

    выполнение заданий и интерактивное общение пользователей с запущенными по их требованию программами в режиме «клиент-сервер»;

    сбор статистики о функционировании системы;

    обеспечение надежности и живучести системы в целом.

В настоящее время применяют различные подходы к классификации распределенных информационных систем по разным критериям.

По степени однородности различают:

    полностью неоднородные РИС;

    частично неоднородные РИС;

    однородные РИС.

Полностью неоднородные РИС характеризуются тем, что в них объединены ЭВМ , построенные на основе различных архитектур и функционирующие п од управлением разных операционных систем (ОС ).

Как правило, РИС этого типа в качестве коммуникационной службы используют глобальные сети , базирующиеся на протоколах Х.25, Frame relay , ATM , Internet -технология.

Частично неоднородные РИС строят на базе однотипных ЭВМ , работающих под управлением различных ОС , либо они включают в себя компьютеры различных типов, работающие под управлением одной ОС.

Например , IBM PC компьютеры управляются различными ОС; MS DOS , OS /2, Windows 95, Windows NT .

Однородные распределенные системы строятся на однотипных вычислительных средствах, оснащенных одинаковыми операционными системами.

По архитектурным особенностям выделяют:

    РИС на основе систем телеобработки ;

    РИС на основе сетевой технологии .

Под сетевой технологией понимается такая форма взаимодействия ЭВМ, при которой любой из процессов одной из машин по своей инициативе может установить логическую связь с любым процессом в любой другой ЭВМ .

В отличие от таких систем РИС на основесистем телеобработки не обес печивают полного, симметричного и независимого взаимодействия процессов.

По степени распределенности с позиций пользователя РИС делятся на 2 группы:

региональные и локальные.

К региональным РИС относятся распределенные конфигурации, ха рактеризующиеся следующими основными параметрами :

Неограниченной географической распределенностью;

Наличием тех или иных механизмов маршрутизации;

Каждые два узла связаны собственным каналом, и отсутствует проблема его разделения;

Широким диапазоном скоростей передачи - 10 3 ... 10 8 бит/с;

Произвольной топологией.

В них можно выделить несколько способов организации взаимодействия между ЭВМ:

    коммутация каналов;

    коммутация сообщений;

    коммутация пакетов;

    коммутация фреймов - Frame relay ;

    коммутация ячеек - ATM -технология .

Основу локальных РИС составляют локальные сети со следующими ха рактеристиками:

    небольшая географическая распределенность;

    использование единой коммуникационной среды и, следовательно, физическая полносвязность всех узлов сети, приводящая к замене маршрутизации адресацией;

    высокие и очень высокие скорости обмена - 10 7 ... 10 9 бит/с;

    применение специальных методов и алгоритмов доступа к единой среде для обеспечения высокой скорости передачи при одновременном использовании среды всеми узлами коммуникационной службы;

    ограниченность возможных топологий.

Под архитектурой РИС понимают взаимосвязь еёлогической , физи ческой и программной структур .

Логическая структура РИС отражает состав сетевых служб и связи между ними (рис. 2).

В данной структуре информационно-вычислительная служба предназначена для решения задач пользователей сети.

Терминальная служба обеспечивает взаимодействие терминалов с сетью.

В эту службу входит:

    преобразование форматов и кодов,

    управление разнотипными терминалами,

    обработка процедур обмена информацией между терминалами и сетью и т. д.

Транс портная служба предназначена для решения всех задач, связанных с передачей сообщений в сети.

Она управляет:

    маршрутами,

    потоками и данными,

    декомпозицией сообщений на пакеты и рядом других функций.

Интерфейсная служба решает задачи обеспечения взаимодействий разнотипных ЭВМ, функциониру ющих под управлением различных ОС , имеющих разную архитектуру, длину слова, форматы представления данных и др.

Кроме того, служба управления интерфейсами осуществляет взаимодействие ЭВМ, входящих в состав различных сетей.

Административная служба

    управляет сетью,

    реализует процедуры реконфигурации и восстановления,

    собирает статистику о функционировании сети,

    осуществляет тестирование сети.

Приведенный полный состав элементов логической структуры не является обязательным для всех реальных систем .

Так, в однородных сетях отпадает необходимость в интер фейсной службе , в простейших сетях может отсутствовать административная служба и т. д.

Информационно-вычислительная (ИВС) и терминальная службы образуют абонентскую службу .

Интерфейсная и транспортная службы образуют коммуникаци онную службу.

Из этого следует, что административная служба не осуществляет непосредственно какие-либо функции, связанные с сетевым обслуживанием пользователей, и может рассматриваться как механизм обслуживания самой сети .

Распределение элементов логической структуры по различным ЭВМ задает физическую структуру РИС (рис.3).

Элементами такой структуры являются ЭВМ, связанные между собой и с терминалами.

В зависимости от реализации в ЭВМ той или иной сетевой служ бы в физической структуре можно выделить:

1 - главные ЭВМ;

2 - коммуникационные ЭВМ;

3 - интерфейсные ЭВМ;

4 - терминальные ЭВМ;

5 - административные ЭВМ.

В одной ЭВМ могут реализовываться несколько служб.

Программная структура РИС отражает состав компонентов сетевого программного обеспечения (ПО) и связи между ними .

Очевидно, что состав сетевого ПО определяется логической структурой, т. е. функциями, выполняемыми ее службами,

В то же время связи между компонентами ПО во многом зависят от физической структуры.

Сложность задач, выполняемых сетевым ПО распределенной информационной системы требует, чтобы это сетевое ПО было разработано высоко структурированным способом. В настоящее время сетевое ПО всегда организовывается как совокупность модулей, каждый из которых выполняет очень специфические функции и основывается на услугах, предлагаемых другими модулями. В сетевых организациях имеется всегда строгая иерархия между этими модулями, потому что каждый модуль исключительно использует услуги, предлагаемые предыдущим модулем. Модули названы уровнями в контексте сетевой реализации.

Сетевое ПО имеет многоуровневую иерархическую организацию, что обус ловлено двумя факторами:

    необходимостью минимизации затрат на модификацию сетевого ПО при изменении состава используемого оборудования;

    любые осуществляемые в сети изменения не должны отражаться на пользовательских программах, использующих сетевые возможности.

Для иерархической организации необходимо четкое описание интерфейсов и протоколов, т.е. правила взаимодействия:

    программ, выполняемых в одной ЭВМ и находящихся на различных уровнях,

    и программ, находящихся на одном уровне, но расположенных в различных ЭВМ.

Стремление создать единую, универсальную и открытую к изменениям логической и физической структур сетевую архитектуру обусловило стандарти зацию уровней иерархии ПО сетей ЭВМ.


Структура курса. Лекции Распределенные системы: задачи, терминология принципы функционирования. Архитектура клиент-сервер. Типовые задачи. Области применения. Пример информационной системы (типичное приложение в архитектуре клиент- сервер). Многозвенная архитектура. Области применения. Краткий обзор современных технологий. XML, CGI/JSP, Servlets, DCOM, CORBA, RMI (.NET). Выделение слоев в многозвенной архитектуре (типичная архитектура). «Тонкие» и «Толстые» клиенты. Сервер приложения (Application server). Сервер базы данных (Database Server). Миграция объектов (вопросы распределения вычислительной нагрузки). Развертывание системы. Основы CORBA. CORBA и ООП. Язык определения интерфейсов IDL. Отображение IDL на C++. Отображение IDL на Java. ОRB. Динамическое взаимодействие клиентов и серверов. Сервисы именования CORBA. Пример информационной системы, выполненной в многозвенной архитектуре.


Структура курса. Практика Лабораторная работа 1 Система обслуживания дисконтных карт Необходимый инструментарий: сервер - Oracle (MSSQL Server 2000 sp3), клиент – Java (jdk, VisualCafe, MS J++,...) Лабораторная работа 2 WMS (Warehouse Management System) Тонкий клиент (Web, HandHeld, сотовый телефон, …). Сервер приложения. Взаимодействие клиент – сервер приложений. Сервер бизнес- логики. Вопросы распределения вычислительной нагрузки. Обеспечение отказоустойчивости. Необходимый инструментарий: сервер - Oracle (MSSQL Server 2000 sp3), Приложение/бизнес-логика – Java (jdk, VisualCafe, MS J++,...)










Распределенные системы:определения распределенная система это набор независимых узлов (компьютеров), которые представляются пользователю как один компьютер. распределенная система это собрание независимых компьютеров соединенных сетью с программным обеспечением, обеспечивающим их совместное функционирование.


Последствия... Нет глобального времени –Асинхронная передача сообщений - –Ограниченная точность синхронизации часов Нет состояния системы –Нет ни одного процесса в распределенной системе, который бы знал текущее глобальное состояние системы Следствие параллелизма и механизма передачи данных


Последствия... Сбои –Процессы выполняют автономно, изолированно –Неудачи отдельных процессов могут остаться необнаруженными –Отдельные процессы могут не подозревать о общесистемном сбое –Сбои происходят чаще чем в централизованной системе –Новые причины сбоев (которых не было в монолитных системах) –Сетевые сбои изолируют процессы и фрагментируют систему


Принципы разделения Функциональное разделение: узлы выполняют различные задачи –Клиент / сервер –Хост / Терминал –Сборка данных/ обработка данных Решение - создание разделяемых сервисов Естественное разделение (определяемое задачей) –Система обслуживания сети супермаркетов –Сеть для поддержки коллективной работы


Принципы разделения Распределение нагрузки/балансировка: назначение задачи на процессора так, чтобы оптимизировать общую загрузку системы. Усиление мощности: различные узлы работают над одной задачей –Распределенные системы содержащие набор микропроцессоров, по мощности могут приближаться к суперкомпьютеру –10000 CPU, каждый 50 MIPS, вместе MIPS - > команда выполняется за nsec -> свет проходит 0.6 mm -> любой существующий чип - больше! команда выполняется за 0.002 nsec -> свет проходит 0.6 mm -> любой существующий чип - больше!">


Принципы разделения Физическое разделение: система строится в предположении, что узлы физически разделены (требования к надежности, устойчивости к сбоям). Экономические: набор дешевых чипов может обеспечить лучшие показатели отношения цена/производительность, чем мэйнфрэйм –Мэйнфрэйм: 10 раз быстрее, 1000 раз дороже














Разделение ресурсов Разделение ресурсов часто является одной из причин разработки распределенной системы –Уменьшается стоимость, (file и print сервера) –Разделение данных между пользователями (совместная работа над проектом) Сервисы –Управляют набором ресурсов –Представляют услуги пользователям


Разделение ресурсов Сервер используется для предоставления сервисов –Принимает запросы на обслуживание от клиентов вызов операции –Прием сообщения/ответ на сообщение полная реализация - удаленный вызов –Роли клиента и сервера меняются от вызова к вызову один и тот же процесс может быть как клиентом, так и сервером –Терминология Клиент/Сервер применяется к процессам, а не к узлам!!!




Распространение приложения Фрагментация –разделение приложения на модули для распространения Конфигурация –Связь модулей друг с другом (зависимости) Размещение –выгрузка модулей на целевую систему –Распределение вычислительных модулей между узлами (статическое или динамическое)






Гетерогенность Middleware: промежуточный программный слой –позволяет гетерогенным узлам взаимодействовать –Определяет однородную вычислительную модель –Поддерживает один или несколько языков программирования –Обеспечивает поддержку распределенных приложений Вызов удаленных объектов Удаленный вызов SQL Распределенная обработка транзакций Примеры: CORBA, Java RMI, Microsoft DCOM


Гетерогенность Мобильный код: код разработан для миграции между узлами –Необходимо преодолевать аппаратные различия (разные наборы инструкций) Виртуальные машины –Компилятор «изготавливает» байт-код для VM –VM реализована для всех аппаратных платформ (Java) Методы грубой силы –Портируем код под каждую платформу...






Безопасность Сценарий 1: Доступ к результатам тестирования по NFS –Откуда мы знаем, что пользователь - преподаватель, имеющий доступ к данным? –Авторизация Сценарий 2: Посылка номера кредитной карты в интернет-магазин –Никто кроме получателя не должен прочитать данные –Криптография






Масштабируемость Стоимость физических ресурсов –Растет,при увеличении числа пользователей –Не должна расти быстрее, чем O (n), где n = количеству пользователей Потери производительности –Увеличиваются с ростом размера данных (и количества пользователей) –Время поиска не должно расти быстрее, чем O (log n), где n = размер данных










Параллелизм Контроль параллелизма –Обращение нескольких потоков к ресурсу Правильное планирование доступа в параллельных потоках (устранение взаимоисключений, транзакции) –Синхронизация (семафоры) Безопасно, но уменьшают производительность –Разделяемые объекты(ресурсы) должны работать корректно в многопоточной среде




Прозрачность Прозрачность доступа: доступ к локальным и удаленным ресурсам посредством одинаковых вызовов Прозрачность расположения: доступ к ресурсам вне зависимости от их физического расположения Прозрачность параллелизма: возможность нескольким процессам параллельно работать с ресурсами, не оказывая влияния друг на друга Прозрачность репликации: возможность нескольким экземплярам одного ресурса использоваться без знания физических особенностей репликации. Прозрачность обработки ошибок: Защита программных компонентов от сбоев, произошедших в других программных компонентах. Восстановление после сбоев Прозрачность мобильности:Возможность переноса приложения между платформами, без его переделки Прозрачность производительности: возможность конфигурации системы с целью увеличения производительности при изменении состава платформы выполнения Прозрачность масштабируемости: возможность увеличения производительности без изменения структуры программной системы и используемых алгоритмов






Итоги Распределенная система: –Автономные (но соединенные средой передачи данных) узлы –Взаимодействие посредством передачи сообщений Много примеров того, что распределенные системы нужны и их нужно уметь строить Распределенные системы существуют и их нужно уметь развивать и поддерживать














Оглавление

ВВЕДЕНИЕ 4
1.ПОНЯТИЕ РАСПРЕДЕЛЕННЫХ ИС 6
1.1. Предпосылки создания распределенных ИС 6
1.2. Понятие распределенных информационных систем 8
1.3. Средства работы с распределенными данными 11
2. РАСПРЕДЕЛЕННЫЕ БАЗЫ ДАННЫХ 13
2.1. Основные принципы 13
2.2 Типы распределенных БД 15
2.3. Назначение и принцип работы распределенной БД 16
3. ПРИМЕРЫ РАСПРЕДЕЛЕННЫХ СИСТЕМ 21
ЗАКЛЮЧЕНИЕ 25
ЛИТЕРАТУРА 26

ВВЕДЕНИЕ

Актуальность данной темы реферата состоит в том, что в мировой экономике происходят процесса глобализации и информационной интеграции. Они затронули и нашу страну, которая в силу географического положения и размеров вынуждена применять распределенные информационные системы (ИС). Распределенные ИС обеспечивают работу с данными, расположенными на разных серверах, различных аппаратно-программных платформах и хранящимися в различных форматах. Они легко расширяются, основаны на открытых стандартах и протоколах, обеспечивают интеграцию своих ресурсов с другими ИС, предоставляют пользователям простые интерфейсы.
В мире существует громадное количество готовых к использованию информационно-вычислительных ресурсов. Они создавались в разное время, для их разработки использовались разные подходы. Почти всегда при разработке новой информационной системы можно найти подходящие по своим функциям уже работающие готовые компоненты. Проблема состоит в том, что при их создании не учитывались требования несовместимости. Эти компоненты не понимают один другого, они не могут работать совместно. Желательно иметь механизм или набор механизмов, которые позволят сделать такие независимо разработанные информационно-вычислительные ресурсы совместимыми.
В данной работе рассмотрены основные сведения о распределенной информационной системе: описаны предпосылки ее развития, средства работы с данными, введено понятие распределенной базы данных, а также ее типов и основных принципов. В третьей главе представлены примеры распределенных информационных систем, такие как: - Informix On-Line фирмы Informix Software;- Ingres Intelligent Database фирмы Ingres Corp;- Oracle (version 7) фирмы Oracle Corp;- Sybase System 10 фирмы Sybase Inc.
Целью исследования является изучение теоретических основ о распределенных информационных системах, а также формирование знаний о принципах ее работы.
Такое распределение данных позволяет, например, хранить в узле сети те данные, которые наиболее часто используются в этом узле. Такой подход облегчает и ускоряет работу с этими данными и оставляет возможность работать с остальными данными БД.

1.ПОНЯТИЕ РАСПРЕДЕЛЕННЫХ ИС
1.1. Предпосылки создания распределенных ИС

C самого начала развития вычислительной техники образовались два основных направления ее использования. Первое направление - применение вычислительной техники для выполнения численных расчетов, которые слишком долго или вообще невозможно производить вручную. Становление этого направления способствовало интенсификации методов численного решения сложных математических задач, развитию класса языков программирования, ориентированных на удобную запись численных алгоритмов, становлению обратной связи с разработчиками новых архитектур ЭВМ.
Второе направление - это использование средств вычислительной техники в автоматических или автоматизированных информационных системах. Обычно объемы информации, с которыми приходится иметь дело таким системам, достаточно велики, а сама информация имеет достаточно сложную структуру. Одними из естественных требований к таким системам являются средняя быстрота выполнения операций и сохранность информации.
Но поскольку информационные системы требуют сложных структур данных, эти индивидуальные дополнительные средства управления данными являлись существенной частью информационных систем и практически повторялись от одной системы к другой. Стремление выделить и обобщить общую часть информационных систем, ответственную за управление сложно структурированными данными, и явилось, судя по всему, первой побудительной причиной создания различных систем управления.
Очень скоро стало понятно, что невозможно обойтись общей библиотекой программ, реализующей над стандартной базовой файловой системой более сложные методы хранения данных, например, хранение информации в нескольких файлах. Таким образом, все это способствовало созданию распределенных информационных систем.
Фактически, если информационная система поддерживает согласованное хранение информации в нескольких файлах, можно говорить о том, что она поддерживает базу данных. Если же некоторая вспомогательная система управления данными позволяет работать с несколькими файлами, обеспечивая их согласованность, можно назвать ее системой управления базами данных. Уже только требование поддержания согласованности данных в нескольких файлах не позволяет обойтись библиотекой функций: такая система должна иметь некоторые собственные данные (метаданные) и даже знания, определяющие целостность данных .
В мире существует громадное количество готовых к использованию информационно-вычислительных ресурсов. Они создавались в разное время, для их разработки использовались разные подходы. Почти всегда при разработке новой информационной системы можно найти подходящие по своим функциям уже работающие готовые компоненты.

1.2. Понятие распределенных информационных систем

Обычно, распределенной считают такую систему, в которой функционирует более одного сервера БД. Это применяется для уменьшения нагрузки на сервер и обеспечения работы территориально удаленных подразделений. Различная сложность создания, модификации, сопровождения, интеграции с другими системами позволяют разделить ИС на классы малых, средних и крупных распределенных систем. Малые ИС имеют небольшой жизненный цикл (ЖЦ), ориентацию на массовое использование, невысокую цену, невозможность модификации без участия разработчиков, использующие в основном настольные системы управления базами данных (СУБД) , однородное аппаратно-программное обеспечение, не имеющие средств обеспечения безопасности. Крупные корпоративные ИС, системы федерального уровня и другие имеют длительный жизненный цикл, миграцию унаследованных систем, разнообразие аппаратно-программного обеспечения, масштабность и сложность решаемых задач, пересечение множества предметных областей, аналитическую обработку данных, территориальную распределенность компонент .
К функциям таких ИС следует отнести, прежде всего, работу с распределенными данными, расположенными на разных физических серверах, различных аппаратно-программных платформах и хранящихся в различных внутренних форматах. В этом случае система должна предоставлять полную информацию о себе и всех своих ресурсах, легко расширяться, быть основана на открытых стандартах и протоколах, обеспечивать возможность интегрировать свои ресурсы с ресурсами других ИС. Для пользователей система должна обеспечивать различные уровни привилегий для пользователей и предоставлять простые интерфейсы доступа к информации.
Данные из разнородных систем обычно объединяются в логические группы, к которой и адресуются запросы. Абстрактная система запросов предполагает, что система оперирует не конкретным синтаксисом запросов, а его логической сутью на основе абстрактных атрибутов.
При построении распределенных ИС, как правило, используются две базовые архитектуры: Клиент/сервер и Internet Intranet.
Корпоративные ИС, построенные по архитектуре Клиент/сервер, предоставляют клиентам широкий спектр приложений и инструментов разработки, которые ориентированы на максимальное использование вычислительных возможностей клиентских рабочих мест. Ресурсы сервера используются в основном для хранения и обмена документами, а также для выхода во внешнюю среду. Данная архитектура позволяет лучше защитить серверную часть приложений, при этом, предоставляя возможность приложениям либо непосредственно адресоваться к другим серверным приложениям, либо маршрутизировать запросы к ним. Однако, частые обращения клиента к серверу снижают производительность работы сети. Приходится решать вопросы безопасной работы в сети, так как приложения и данные распределены между различными клиентами. Распределенный характер построения системы обусловливает сложность ее настройки и сопровождения

В основе ИС на базе Internet Intranet лежит принцип "открытой архитектуры". ПО ИС реализуется в виде аплетов или сервлетов (программ на языке JAVA) или в виде cgi модулей (программ на Perl или С). ИС данной архитектуры включает Web-yinh\, реализованные при помощи технологий CORBA Enterprise JavaBeans, ActiveX 1X"ОМ, многоуровневые приложения на основе Java и XML, .Net-концепция с XML, в которой обмен между различными серверами (хранилищами данных, бизнес-приложениями, серверами для мобильных клиентов и другое) производится при помощи нейтрального к любой архитектуре XML.
Под распределенной информационной базой понимается неограниченное количество баз данных, дистанционно отдаленных друг от друга и имеющих ряд общих характеристик:
- функционирующих по единым правилам, определенным централизованно для всех баз данных, входящих в распределенную информационную базу;
- обмен данными осуществляется по правилам, также определенным централизованно.
Организация распределенной базы необходима для компаний, осуществляющих различные виды деятельности, если в их повседневной работе возникает потребность решения следующих задач:
- необходимость оперативного получения информации из баз данных дистанционно отдаленных подразделений (или филиалов);
-необходимость консолидации в единой базе данных информации из баз данных юридических лиц, входящих в структуру компании, для последующего анализа данных и получения отчетности из одной базы, как по компании в целом, так и по каждому юридическому лицу в отдельности;
- необходимость введения централизованного изменения структуры и правил работы баз данных для работы всех дистанционно отдаленных подразделений (филиалов) и юридических лиц (с невозможностью изменения определенных правил непосредственно в отдаленном подразделении);
- необходимость ограничения и осуществления контроля изменения данных в дистанционно отдаленных подразделениях компании (филиалах) .

1.3. Средства работы с распределенными данными

При выборе распределенной ИС в первую очередь следует обратить внимание на то, какие операционные системы и сетевые протоколы она поддерживает. Однако не менее важным является и то, какие методы распределения данных в ней реализованы.
1) Фрагментация и дублирование
Один из способов распределенного хранения таблиц - это фрагментация. Таблица может быть расщеплена на части, которые будут помещены в разные узлы. Другой способ распределения данных - это дублирование (репликация). Можно создать дубли всей БД или ее частей и разместить эти дубли в узлах. Оба метода позволяют хранить данные именно в том узле, где они наиболее часто используются. Это сводит к минимуму затраты на передачу данных по сети и уменьшает использование процессоров и прочих ресурсов остальных узлов. При такой архитектуре БД приложения передача данных по сети выполняется достаточно редко.
2) Словари данных и директории
После того, как данные распределены по разным узлам сети, важно найти и использовать эти данные. Для того, чтобы найти данные и преобразовать их в нужный формат, используются глобальные словари данных и директории. В словаре хранится информация о данных, их использовании, правах доступа к данным, а также о приложениях. Директории данных используются для того, чтобы определить, где хранятся данные и как их извлечь. Словари и директории могут быть глобальными и локальными
3) Двухфазная фиксация изменений
Методы распределения данных конечно очень важны, однако сердцем современных распределенных СУБД является протокол двухфазной фиксации изменений. Этот протокол управляет выполнением транзакций, изменяющих данные нескольких узлов. Основная идея двухфазной фиксации заключается в следующем: недопустима ситуация при которой транзакция, изменяющая данные в нескольких узлах, выполняется в одних узлах и не выполняется в других узлах. Транзакция должна быть либо успешно выполнена во всех узлах, либо не выполнена ни в одном узле.
4) Обеспечение целостности
Важной характеристикой распределенной ИС является то, как она обеспечивает поддержку ссылочной целостности между данными таблицы-мастера и данными связанных с ней таблиц. Рассмотрим пример ссылочной целостности. Предположим в распределенной БД имеются три таблицы:
- таблица, содержащая информацию о детях сотрудников;
- таблица, содержащая информацию о зарплатах сотрудников за год;
- таблица, содержащая информацию о темах, выполненных сотрудником.
Все эти таблицы содержат столбец "ФИО сотрудника". Правила обеспечения ссылочной целостности требуют, чтобы при изменении значений столбца "ФИО сотрудника" в одной таблице, автоматически выполнялась корректировка значений этого столбца в других таблицах. Для обеспечения ссылочной целостности используются 2 различных метода - триггеры и декларативные ограничения целостности стандарта ANSI .

2. РАСПРЕДЕЛЕННЫЕ БАЗЫ ДАННЫХ
2.1. Основные принципы

Распределённые базы данных (РБД) - совокупность логически взаимосвязанных баз данных, распределённых в компьютерной сети.
РБД состоит из набора узлов, связанных коммуникационной сетью, в которой:
а)каждый узел - это полноценная СУБД сама по себе;
б)узлы взаимодействуют между собой таким образом, что пользователь любого из них может получить доступ к любым данным в сети так, как будто они находятся на его собственном узле .
Каждый узел сам по себе является системой базы данных. Любой пользователь может выполнить операции над данными на своём локальном узле точно так же, как если бы этот узел вовсе не входил в распределённую систему. Распределённую систему баз данных можно рассматривать как партнёрство между отдельными локальными СУБД на отдельных локальных узлах.
Фундаментальный принцип создания распределённых баз данных («правило 0»): Для пользователя распределённая система должна выглядеть так же, как нераспределённая система.
Фундаментальный принцип имеет следствием определённые дополнительные правила или цели. Таких целей всего двенадцать:
1.Локальная независимость. Узлы в распределённой системе должны быть независимы, или автономны. Локальная независимость означает, что все операции на узле контролируются этим узлом.
2.Отсутствие опоры на центральный узел. Локальная независимость предполагает, что все узлы в распределённой системе должны рассматриваться как равные. Поэтому не должно быть никаких обращений к «центральному» или «главному» узлу с целью получения некоторого централизованного сервиса.
3.Непрерывное функционирование. Распределённые системы должны предоставлять более высокую степень надёжности и доступности.
4.Независимость от расположения. Пользователи не должны знать, где именно данные хранятся физически и должны поступать так, как если бы все данные хранились на их собственном локальном узле.
5.Независимость от фрагментации. Система поддерживает независимость от фрагментации, если данная переменная- отношение может быть разделена на части или фрагменты при организации её физического хранения. В этом случае данные могут храниться в том месте, где они чаще всего используются, что позволяет достичь локализации большинства операций и уменьшения сетевого трафика.
6.Независимость от репликации. Система поддерживает репликацию данных, если данная хранимая переменная-отношение - или в общем случае данный фрагмент данной хранимой переменной-отношения - может быть представлена несколькими отдельными копиями или репликами, которые хранятся на нескольких отдельных узлах.
7.Обработка распределённых запросов. Суть в том, что для запроса может потребоваться обращение к нескольким узлам. В такой системе может быть много возможных способов пересылки данных, позволяющих выполнить рассматриваемый запрос.
8.Управление распределёнными транзакциями. Существует 2 главных аспекта управления транзакциями: управление восстановлением и управление параллельностью обработки. Что касается управления восстановлением, то чтобы обеспечить атомарность транзакции в распределённой среде, система должна гарантировать, что все множество относящихся к данной транзакции агентов (агент - процесс, который выполняется для данной транзакции на отдельном узле) или зафиксировало свои результаты, или выполнило откат. Что касается управления параллельностью, то оно в большинстве распределённых систем базируется на механизме блокирования, точно так, как и в нераспределённых системах.
и т.д.................

Обычно, распределенной считают такую систему, в которой функционирует более одного сервера БД. Это применяется для уменьшения нагрузки на сервер и обеспечения работы территориально удаленных подразделений. Различная сложность создания, модификации, сопровождения, интеграции с другими системами позволяют разделить ИС на классы малых, средних и крупных распределенных систем. Малые ИС имеют небольшой жизненный цикл (ЖЦ), ориентацию на массовое использование, невысокую цену, невозможность модификации без участия разработчиков, использующие в основном настольные системы управления базами данных (СУБД) , однородное аппаратно-программное обеспечение, не имеющие средств обеспечения безопасности. Крупные корпоративные ИС, системы федерального уровня и другие имеют длительный жизненный цикл, миграцию унаследованных систем, разнообразие аппаратно-программного обеспечения, масштабность и сложность решаемых задач, пересечение множества предметных областей, аналитическую обработку данных, территориальную распределенность компонент.

Распределённые базы данных (РБД) - совокупность логически взаимосвязанных баз данных, распределённых в компьютерной сети.

РБД состоит из набора узлов, связанных коммуникационной сетью, в которой:

каждый узел - это полноценная СУБД сама по себе;

узлы взаимодействуют между собой таким образом, что пользователь любого из них может получить доступ к любым данным в сети так, как будто они находятся на его собственном узле.

Каждый узел сам по себе является системой базы данных. Любой пользователь может выполнить операции над данными на своём локальном узле точно так же, как если бы этот узел вовсе не входил в распределённую систему. Распределённую систему баз данных можно рассматривать как партнёрство между отдельными локальными СУБД на отдельных локальных узлах.

Фундаментальный принцип создания распределённых баз данных («правило 0»): Для пользователя распределённая система должна выглядеть так же, как нераспределённая система.

Фундаментальный принцип имеет следствием определённые дополнительные правила или цели. Таких целей всего двенадцать:

Локальная независимость. Узлы в распределённой системе должны быть независимы, или автономны. Локальная независимость означает, что все операции на узле контролируются этим узлом.

Отсутствие опоры на центральный узел. Локальная независимость предполагает, что все узлы в распределённой системе должны рассматриваться как равные. Поэтому не должно быть никаких обращений к «центральному» или «главному» узлу с целью получения некоторого централизованного сервиса.

Непрерывное функционирование. Распределённые системы должны предоставлять более высокую степень надёжности и доступности.

Независимость от расположения. Пользователи не должны знать, где именно данные хранятся физически и должны поступать так, как если бы все данные хранились на их собственном локальном узле.

Независимость от фрагментации. Система поддерживает независимость от фрагментации, если данная переменная-отношение может быть разделена на части или фрагменты при организации её физического хранения. В этом случае данные могут храниться в том месте, где они чаще всего используются, что позволяет достичь локализации большинства операций и уменьшения сетевого трафика.

Независимость от репликации. Система поддерживает репликацию данных, если данная хранимая переменная-отношение - или в общем случае данный фрагмент данной хранимой переменной-отношения - может быть представлена несколькими отдельными копиями или репликами, которые хранятся на нескольких отдельных узлах.

Обработка распределённых запросов. Суть в том, что для запроса может потребоваться обращение к нескольким узлам. В такой системе может быть много возможных способов пересылки данных, позволяющих выполнить рассматриваемый запрос.

Управление распределёнными транзакциями. Существует 2 главных аспекта управления транзакциями: управление восстановлением и управление параллельностью обработки. Что касается управления восстановлением, то чтобы обеспечить атомарность транзакции в распределённой среде, система должна гарантировать, что все множество относящихся к данной транзакции агентов (агент - процесс, который выполняется для данной транзакции на отдельном узле) или зафиксировало свои результаты, или выполнило откат. Что касается управления параллельностью, то оно в большинстве распределённых систем базируется на механизме блокирования, точно так, как и в нераспределённых системах.

Аппаратная независимость. Желательно иметь возможность запускать одну и ту же СУБД на различных аппаратных платформах и, более того, добиться, чтобы различные машины участвовали в работе распределённой системы как равноправные партнёры.

Независимость от операционной системы. Возможность функционирования СУБД под различными операционными системами.

Независимость от сети. Возможность поддерживать много принципиально различных узлов, отличающихся оборудованием и операционными системами, а также ряд типов различных коммуникационных сетей.

Независимость от типа СУБД. Необходимо, чтобы экземпляры СУБД на различных узлах все вместе поддерживали один и тот же интерфейс, и совсем необязательно, чтобы это были копии одной и той же версии СУБД.

Каждая организация разрабатывает более или менее весомую часть а не все информационное наполнения своей ГИС. Потребность в данных является стимулом для пользователей получать новые данные наиболее эффективными и быстрыми способами в том числе приобретая части баз данных для своих ГИС у других ГИС пользователей. Таким образом управление данными ГИС осуществляется несколькими пользователями.


Поделитесь работой в социальных сетях

Если эта работа Вам не подошла внизу страницы есть список похожих работ. Так же Вы можете воспользоваться кнопкой поиск


12. ГИС – РАСПРЕДЕЛЕННАЯ ИНФОРМАЦИОННАЯ СИСТЕМА

12.1. Общие сведения

Сейчас в большинстве географических информационных систем данные слоев и таблиц поступают из разных организаций. Каждая организация разрабатывает более или менее весомую часть, а не все информационное наполнения своей ГИС. Обычно хотя бы некоторые слои данных поступают из внешних источников. Потребность в данных является стимулом для пользователей получать новые данные наиболее эффективными и быстрыми способами, в том числе приобретая части баз данных для своих ГИС у других ГИС-пользователей. Таким образом, управление данными ГИС осуществляется несколькими пользователями.

12.2. Возможности взаимодействия

Распределенная сущность ГИС подразумевает широкие возможности для взаимодействия между многими ГИС-организациями и системами. Сотрудничество и совместная работа пользователей очень важны для ГИС.

ГИС-пользователи в своей работе давно опираются на взаимовыгодную деятельность по обмену данными и их совместному использованию. Реальным отражением этой фундаментальной потребности являются непрекращающиеся усилия в области создания ГИС стандартов. Приверженность отраслевым стандартам и общим принципам построения ГИС критически важна для успешного развития и широкого внедрения этой технологии. ГИС должна поддерживать наиболее важные стандарты и иметь возможность адаптации при появлении новых стандартов.

12.3. ГИС-сети

Многие географические наборы данных могут компилироваться и управляться как общий информационный ресурс и совместно использоваться сообществом пользователей. К тому же пользователи ГИС имеют собственное видение того, каким образом можно обеспечить обмен популярными наборами данных через Web.

Ключевые web-узлы, называемые порталами каталогов ГИС, предоставляют возможность пользователям как выкладывать собственную информацию, так и искать доступную для использования географическую информацию. В результате ГИС-системы все в большей степени подключаются к Всемирной паутине и получают новые возможности обмена и использования информации.

Это видение внедрилось в сознание людей за последнее десятилетие и нашло отражение в таких понятиях, как Национальная инфраструктура пространственных данных (NSDI) и Глобальная инфраструктура пространственных данных (GSDI). Эти концепции постоянно развиваются и постепенно внедряются, причем не только на национальном и глобальном уровнях, но также на уровне округов и муниципальных образований. В обобщенном виде эти концепции включены в понятие Инфраструктуры пространственных данных (SDI, Spatial Data Infrastructure).

ГИС-сеть по сути является одним из методов внедрения и продвижения принципов SDI. Она объединяет множество пользовательских сайтов, способствует публикации, поиску и совместному использованию географической информации посредством World Wide Web.

Географическое знание изначально является распределенным и слабо интегрированным. Вся необходимая информация редко содержится в отдельном экземпляре базы данных с собственной схемой данных. Пользователи ГИС взаимодействуют друг с другом с целью получить недостающие части имеющихся у них ГИС- данных. Посредством ГИС- сетей пользователям проще наладить контакты и обмен накопленными географическими знаниями.

В состав ГИС-сети входят три основных строительных блока:

  • Порталы каталогов метаданных, где пользователи могут провести поиск и найти ГИС-информацию в соответствии с их потребностями
  • ГИС-узлы, где пользователи компилируют и публи куют наборы ГИС-информации
  • Пользователи ГИС, которые ведут поиск, выявляют, обращаются и используют опубликованные данные и сервисы

12.4. Каталоги ГИС-порталов

Важным компонентом ГИС-сети является каталог ГИС-портала с систематизированным реестром разнообразных мест хранения данных и информационных наборов. Часть ГИС-пользователей действует в качестве распорядителей данных, они компилируют и публикуют свои наборы данных для совместного использования в разных организациях. Они регистрируют свои информационные наборы в каталоге портала. Проводя поиск по этому каталогу, другие пользователи могут найти нужные им информационные наборы и обратиться к ним.

Портал ГИС-каталога - это Web-сайт, где ГИС пользователи могут искать и находить нужную им ГИС-информацию. Предоставляемые возможности зависят от комплекса предлагаемых сетевых сервисов ГИС-данных, картографических сервисов и сервисов метаданных. Периодически сайт портала ГИС-каталога может проводить обследование каталогов связанных с ним сайтов-участников с целью опубликования и обновления одного центрального ГИС-каталога. Таким образом, ГИС-каталог может содержать ссылки на источники данных, имеющиеся как на этом, так и на других сайтах. Предполагается, что будут созданы серии таких каталожных узлов, и на их основе сформируется общая сеть - Инфраструктура пространственных данных.

ГИС-данные и сервисы документируются в виде каталожных записей в каталоге ГИС-портала, по которому можно проводить поиск кандидатов для использования в разных ГИС-приложениях.

Одним из примеров портала ГИС-каталога является портал правительства США (Geospatial One-Stop, см. www.geodata.gov). Этот портал позволит правительственным органам всех уровней и широкой общественности проще, быстрее и с меньшими затратами обращаться к географической информации.

Другие похожие работы, которые могут вас заинтересовать.вшм>

4627. Информационная система Клиника 436.13 KB
Главная цель создания баз данных состоит в объединении функций обновления, ведения и пополнения хранимой информации, а также справочной функции. Основное характерное свойство базы данных - ее независимость от рабочих программ, с которыми она взаимодействует.
6245. Корпоративная информационная система (КИС) 39.86 KB
Корпоративная информационная система КИС это совокупность информационных систем отдельных подразделений предприятия объединенных общим документооборотом таких что каждая из систем выполняет часть задач по управлению принятием решений а все системы вместе обеспечивают функционирование предприятия в соответствии со стандартами качества ИСО 9000. Модульность Позволяет распараллелить облегчить и соответственно ускорить процесс инсталляции подготовки персонала и запуска системы в промышленную эксплуатацию. Это требование приобретает...
1001. Информационная система в ОАО Газпромнефть 44.35 KB
Цели и задачи информационного обеспечения управления. Стратегия развития информационных систем управления. Информационное обеспечение управления деятельности руководителя организации Введение Об информации очень много говорят и лишь немногие организации четко и внятно формулируют требования к этому ресурсу необходимому для принятия эффективных управленческих решений.
7405. Маркетинговая информационная система ООО «Ривьера-Сочи» 1.96 MB
Объектом исследования является маркетинговая информационная система ООО Ривьера-Сочи. Цель исследования – разработка и внедрение маркетинговой системы сбора обработки и анализа информации с целью эффективного и рационального использования ресурсов предприятия. В процессе работы проводились исследования структуры организации анализ ее экономических показателей. В результате исследования был разработан модуль Опрос который функционирует на сайте компании ООО Ривьера-Сочи с целью получения необходимой информации от потребителей...
11460. Управленческий учет как информационная система предприятия 64.49 KB
Переход на МСФО – это новый взгляд на бухгалтерский учет. Теперь действия бухгалтера – уже не выполнение указаний а собственное профессиональное суждение по всем вопросам связанным с учетом ограниченное определенными принципами предлагаемыми МСФО.
17542. Информационная управляющая система товарного снабжения для супермаркета 79.67 KB
В программах сохраняются электронные данные о запасах которые постоянно используются для быстрого решения стандартных вопросов для чего в противном случае пришлось бы работать непосредственно с запасами. Для современных супермаркетов характерным является наличие следующих признаков: - значительный объем торговой площади от 200 м2 и более; - значительное количество отделов в которых представлена разнообразная продукция мясные фруктово-овощные молочные продукты хлеб хлебобулочные изделия и выпечка кондитерские табачные парфюмерные...
19833. Информационная система. Классификация ИС. Структурные составляющие корпоративных ИС 33.24 KB
Для бизнеса такими задачами являются повышение рентабельности рост продаж снижение издержек снижение рисков и общая стабилизация положения на рынке. Для государства важно с наименьшими затратами решить спектр социальных экономических оборонных и других задач. Определенный прорыв произошел в 2005 году когда впервые для автоматизации бизнес-процессов было внедренное полномасштабное компьютерное управление. Для примера можно упомянуть новейшие информационные технологии которые характеризуются относительно небольшими объемами требуемых...
12160. Информационная система «Архивы Российской академии наук» (ИСАРАН) 17.86 KB
Краткое описание разработки. Программное обеспечение ИСАРАН создано в популярной среде визуальной разработки – Delphi Дельфи клиентсерверная версия и адаптировано к специфике ведомственного Архивного фонда РАН. Преимущества разработки и сравнение с аналогами. Области коммерческого использования разработки.
12142. Информационная система мониторинга научно-технического потенциала региона 17.24 KB
Информационная система представляет собой программноинформационный комплекс предназначенный для оперативного аналитического учета и контроля показателей научнотехнического потенциала на основе данных различных статистических показателей анализируемых по авторской методике. Разработанная прикладная ИС обладает следующими преимуществами: адаптируемость для широкого класса показателей преемственность новых информационных технологий автоматизация значительного числа функций осуществляемых при оценке научнотехнического потенциала. Продукт...
12060. Многофункциональная интегрирующая информационная система мониторинга водных объектов (МИСМ ВО) 17.91 KB
Многофункциональная интегрирующая информационная система мониторинга водных объектов МИСМ ВО разработана на базе портальной webтехнологии и позволяет интегрировать и обрабатывать данные о состоянии водных объектов ВО получаемые от всех возможных источников контроля состояния ВО включая автоматические посты мониторинга АПМ на различных уровнях отдельные ВО их гидрографическая сеть в пределах административного региона и страны в целом комплекс ВО например каскад водохранилищ водный бассейн для обеспечения оптимального управления...