Об'єктні моделі даних і їх реалізація
Геннадій Сменцарев
Обмеження реляційної моделі і побудованих на її основі СУБД
У наш час абсолютна більшість СУБД побудовано за принципом реляційних, які в теоретичному і практичному плані набули великого розвитку. Сервери БД відомих фірм Oracle, Informix, Sybase, Borland та ін. Підтримують мову запитів SQL, що дозволяє створювати і працювати з реляційними БД, а також формувати запити на рівні як клієнтської частини програми, так і серверної. Існують інструментальні системи, орієнтовані на створення СУБД, в тому числі в клієнт-серверній архітектурі з використанням сучасних технологій, включаючи візуально-компонентні. За оцінками фахівців, приблизно 99% світового ринку баз даних займають нині реляційні СУБД.
Разом з тим в останні роки чітко окреслилася тенденція розвитку СУБД в об'єктному напрямку. Об'єктна модель даних, інтегруючи всі можливості реляційної моделі, має низку істотних переваг в порівнянні з останньою. Ці переваги полягають перш за все в здатності природним чином інтегрувати в рамках єдиного інформаційного масиву різнорідні дані. Серед інших переваг можна виділити можливість створення імітаційних моделей різноманітних трудноформалізуемих предметних областей реального світу, а також істотного підвищення аналітичних можливостей банків даних, реалізованих на основі об'єктної моделі. Названі функції дозволяють використовувати ці банки даних як сховища вихідної інформації в складі експертних систем і систем підтримки прийняття рішень.
З огляду на переваги об'єктної технології, розробники наділяють зараз старі реляційні СУБД (Informix, DB2, Oracle) деякими об'єктними властивостями. Але об'єктно-орієнтовані СУБД, якщо їх творці не хочуть ставити своїх клієнтів перед необхідністю ламати все дощенту і починати заново, нерідко мають під собою реляційну машину даних і розписують об'єкти по відносинам.
Переваги об'єктної форми представлення даних
Об'єктна модель на основі прямих адресних посилань останнім часом активно розвивається і поширюється, тим більше що, як зазначалося вище, вона аж ніяк не суперечить реляційної моделі даних, а доповнює і розвиває останню (точніше сказати - реляційна модель є окремим випадком об'єктної форми представлення даних) . Механізми конвертації даних дають можливість переводити інформацію з реляційної структури в об'єктну і навпаки, дозволяючи тим самим використовувати в новій структурі створені раніше масиви інформації.
Основні переваги об'єктної моделі даних зводяться до наступного.
1. Можливість описувати в рамках єдиного інформаційного поля об'єкти, що мають різнорідну внутрішню структуру і склад елементів.
2. Встановлення складних багаторівневих відносин між інформаційними об'єктами, в тому числі типу "один до одного", "один до багатьох", "багато до одного" і "багато до багатьох".
3. "Вкладення" об'єктів один в одного, виділення загальних властивостей об'єктів на верхніх рівнях і облік індивідуальних якостей і властивостей об'єктів на нижніх рівнях ієрархії.
4. Можливість зберігати в єдиному банку даних структуровану інформацію і неформалізовані дані.
Інформаційна модель ринку телекомунікацій. Склад і структура
Серед російських фірм активну роботу в області об'єктних СУБД і інструментарію для їх розробки веде фірма "Кронос", що займається даною проблемою з середини 80-х років. Для ЗАТ "Московська телекомунікаційна корпорація" була розроблена інформаційна модель телекомунікаційного ринку, яка не тільки дозволяє вирішувати інформаційно-довідкові завдання, але і проводити комплексні аналітичні дослідження. Ця модель реалізована в АБД "Ринок зв'язку та телекомунікацій" (свідоцтво РосАПО № 980019 від 17.09.98 р), що містить поточну подієву і довідкову інформацію про розвиток ринку телекомунікаційних послуг, обладнання та програмного забезпечення, а також про суміжних з ним галузях економіки і політики.
Принципи, покладені в основу концептуальної моделі телекомунікаційного ринку
Реальний світ являє собою сукупність взаємодіючих і змінюються з плином часу різнорідних об'єктів, наділених певними якостями і атрибутами.
Кожен об'єкт має свою унікальну внутрішню структуру і взаємозв'язки, що відрізняють його від інших об'єктів цього світу.
Всі об'єкти знаходяться в стані безперервного взаємодії один з одним.
Кожен об'єкт телекомунікаційного ринку еволюціонує з плином часу, має свою історію і перспективи розвитку (в тому числі і тоді, коли це розвиток веде до його регресу і зникнення).
Зв'язки суб'єктів телекомунікаційного ринку між собою і з предметами цього ринку носять в загальному випадку багатовимірний характер, володіють певними кількісними та якісними характеристиками.
Кожен об'єкт реального світу, а також властивості та якості цього об'єкта, характер зв'язків і відносин між об'єктами можуть бути описані відповідними їм інформаційними моделями (будемо називати їх інформаційними об'єктами).
При описі інформаційних об'єктів використовується метод формалізації як спосіб виявлення і уточнення змісту досліджуваного суб'єкта або об'єкта телекомунікаційного ринку, явища або процесу через розкриття і фіксацію його форми, а також оперування цією формою. Подібний метод, будучи застосований до такої важко формалізується сфері суспільного буття, як діяльність соціальних сил (людей, компаній, держав), в сфері телекомунікацій носить гуманітарний характер і по суті є соціально-логічним.
Подієвий підхід до відбору і накопичення інформації
Подія, будучи одним з головних предметів аналізу ринку телекомунікацій, становить елементарну клітинку життя природи і суспільства. Причому масштаб події може бути різним: воно може бути пов'язане з розвитком глобальної телекомунікаційної системи, може ставитися до окремо взятому державі, регіону або групи регіонів, населеному пункту, компанії або конкретній особі - співробітнику компанії. Виходячи з цього, подія розглядається в якості основної вихідної інформаційної одиниці.
Хронологічна прив'язка отриманої інформації до тимчасового ряду дозволяє вивчати динаміку зміни обстановки на ринку телекомунікацій і складати прогнози розвитку об'єктів і суб'єктів цього ринку, окремих його сегментів і географічних регіонів.
У графічному вигляді структура інформаційної моделі представлена на рис. 1.
Рис.1. Графічне відображення інформаційної
моделі АБД "Ринок зв'язку та телекомунікацій"
Основу моделі складають формалізовані описи учасників телекомунікаційного ринку та явищ цього ринку (далі будемо називати їх об'єктами та суб'єктами телекомунікаційного ринку), до числа яких відносяться фізичні та юридичні особи, мережі передачі даних, документи, події і оглядові матеріали. На рис. 1 вони представлені у вигляді великих сфер червоного кольору.
Кожен суб'єкт і об'єкт мають набір унікальних, властивих тільки їм атрибутів. При цьому кожен тип атрибутів має єдину внутрішню структуру, але вони розрізняються між собою як складом, так і структурою складових їх елементів. Атрибути безпосереднім чином пов'язані з їх власниками (на рис. 1 вони позначені малими сферами зеленого кольору). Для юридичних осіб в якості атрибутів можуть виступати такі показники, як статутний капітал, бухгалтерський баланс, юридична та фактична адреса і т. Д. Атрибутами фізичних осіб можуть бути фотографії, характеристики з місць роботи, відомості про наявні державні нагороди і т. Д. Крім того, атрибути суб'єктів і об'єктів телекомунікаційного ринку, в свою чергу, також можуть володіти власними якостями, які будемо називати атрибутами другого порядку (наприклад, будь-яке обладнання зв'язку, програмне забезпечення та ум ги телекомунікацій мають вартісні характеристики). На рис. 1 такі атрибути відображені малими сферами рожевого кольору.
Всі об'єкти і суб'єкти телекомунікаційного ринку пов'язані і взаємодіють один з одним безпосередньо або через свої атрибути. На рис. 1 ці зв'язки позначені циліндрами жовтого кольору. Зв'язки, так само як суб'єкти і об'єкти, мають свою внутрішню структуру і зміст, яке може бути структуровано і представлено в формалізованому вигляді.
У реальному житті діяльність учасників телекомунікаційного ринку здійснюється в тісному взаємозв'язку з навколишнім середовищем, має територіальні і часові межі. В інформаційній моделі ринку ці зв'язки знаходять своє відображення через поняття "інформаційний фон", який являє собою сукупність баз даних, що описують обстановку, на тлі якої розгортається діяльність учасників ринку. В інформаційній моделі АБД "Ринок зв'язку та телекомунікацій" використовуються чотири "фонові" бази даних: "Географічний фон", "Технологічний фон", "Ситуаційний фон" і "Хронологічний ряд". Фонові характеристики мають певну структурну ієрархію, яка дозволяє пов'язувати їх між собою, а також з учасниками ринку безпосередньо або через атрибути останніх (на рис. 1 ці зв'язки не відображені, щоб не захаращувати схему). Крім відсилань і зв'язків кожен інформаційний об'єкт фонової бази даних містить опис кількісних і якісних характеристик того чи іншого елемента "фону", найчастіше безпосереднього відношення до телекомунікаційного ринку не мають, але необхідних для комплексного аналізу обстановки на цьому ринку, або дозволяють аналітику глибше усвідомити суть проблеми . Наприклад, база даних "Географічний фон" для кожного регіону, крім прив'язок до адрес організацій і подій, ліцензіями і т. Д., Містить опис рівня доходів населення і економічних показників розвитку. Дана інформація може становити інтерес для потенційних інвесторів з точки зору оцінки термінів окупності проектів, що фінансуються.
Бази даних "Технологічний фон" і "Ситуаційний фон", крім інформаційних об'єктів, що входять до складу цих баз, містять опис процесів, що лежать в основі тієї чи іншої технології, результати науково-дослідних і дослідно-конструкторських робіт, методичні матеріали, які стосуються тарифної політиці, інвестиційної діяльності, маркетингу ринку або його окремих сегментів, і т. д.
База даних "Хронологічний ряд" прив'язує дати публікацій, а також подій, що відбуваються на ринку телекомунікацій, до тимчасової осі. Діяльність учасників ринку розгортається в часі. З плином часу змінюються якості і властивості об'єктів. Руйнуються старі, видозмінюються існуючі та встановлюються нові зв'язки між об'єктами і суб'єктами ринку. Кожне нове стан ринку в цілому, його окремих учасників або їх атрибутів відображається в банку даних шляхом прив'язки до тимчасової осі (хронологічним ряду). У сукупності з можливістю СУБД "Кронос" об'єднувати однакову інформацію, не тиражуючи її, це властивість моделі ринку дозволяє вивчати динаміку зміни обстановки, якостей і властивостей об'єктів. Так, якщо кількісні та якісні характеристики атрибута об'єкта з часом не змінюються, то в банку даних лише збільшиться число прив'язок атрибута до тимчасової осі. Якщо ж атрибут змінюється динамічно, то адекватно його змін в банку даних збільшується число інформаційних об'єктів, що описують його нові стану.
Подібна організація інформаційної моделі телекомунікаційного ринку дозволяє вивчати його стан в різних часових зрізах, а також проводити причинно-наслідковий аналіз відбуваються на ньому подій, складати "телекомунікаційні портрети" регіонів, проводити інноваційний аналіз і прогнозувати тенденції і перспективи розвитку інформаційних технологій.
Розроблена інформаційна модель АБД "Ринок зв'язку та телекомунікацій" дозволяє накопичувати і зберігати не тільки формалізовані дані, але і неструктуровану інформацію з прив'язкою її до відповідних учасникам ринку, їх атрибутам, а також фоновим характеристикам. Неформалізовані дані утворюють фонд повнотекстових рефератів. Однак реферат в АБД не є точною копією обробленого документа (за винятком нормативних актів і деяких інших типів документів, де важливо не тільки зміст, а й форма подання матеріалу). Так як в системі прийнятий подієвий (а не документальний) принцип накопичення інформації, то відповідно до нього здійснюється декомпозиція реферату на логічно закінчені фрагменти тексту, кожен з яких відноситься до конкретного об'єкта (суб'єкта) ринку телекомунікацій або його атрибуту. Фонд рефератів є "багатошарової" структурою, так як дозволяє зберігати ідентичну інформацію на різних мовах народів світу. Разом з текстами можуть зберігатися пов'язані з ним графічні і (або) звукові матеріали.
Відшукати оригінал документа користувач може за його атрибутам (найменування, дата, номер видання, назва статті, автор документа), звернувшись до покажчика на джерело інформації. Сукупність подібних покажчиків утворює в рамках єдиного інформаційного простору спеціалізовану базу джерел інформації.
Приклад інформаційної моделі
Як приклад інформаційної моделі розглянемо ситуацію, коли дві людини розмовляють між собою по телефону, використовуючи систему супутникового зв'язку (ІС) "Ірідіум". Графічно така модель в істотно спрощеному вигляді представлена на рис. 2.
Рис. 2. Приклад опису інформаційної моделі
В даному випадку має місце подія (СБ) зв'язку по супутниковому телефону двох людей (ЛЦ1 і ЛЦ2), які виступають в якості суб'єктів події. Ці люди проживають (ПЖ1 і ПЖ2) в різних містах (АД1 і АД2), що відносяться до різних географічних регіонах (ТР1 і ТР2). Причому інформація про місце їх проживання прив'язана до певного моменту часу ІІ1. Для зв'язку між собою ЛЦ1 і ЛЦ2 використовують систему супутникового зв'язку "Ірідіум" (ІС). Вона в даному випадку виступає в якості об'єкта аналізованого події. Сама подія в базі даних класифіковано шляхом прив'язки до певного технологічного фону (ФО2), іменованого "супутниковий зв'язок", і ситуаційному фону "ділові переговори" (ФО3).
Вся права частина схеми пов'язана з описом системи "Ірідіум". З неї, зокрема, випливає, що система передачі даних "Ірідіум" належить (інформаційний об'єкт ОІ, інформація відноситься до дати ІІ) організації РГ1 і включає до свого складу сукупність супутників зв'язку ЕП1, ЕП2, ЕП3 і ЕП4. Причому супутники ЕП1, ЕП2 і ЕП3 є власністю (відповідно ВП1, ВП2 і ВП3) організації РГ1 (інформація прив'язана до дати, описуваної інформаційним об'єктом ІІ3). Щодо супутників відомо також, що вони входять в номенклатуру продукції (ТП), що випускається організацією Рг2, яка виготовляє (СЯ) ці супутники для організації РГ1. Номенклатура продукції ТП відноситься до класу обладнання, визначеному за допомогою посилання на об'єкт технологічного фону ФО1.
Управління орбітальної угрупованням супутників зв'язку в організації РГ1 забезпечує її працівник (ТД), який ідентифікований інформаційним об'єктом ЛЦ3.
Організація довідкової та інформаційно - аналітичної роботи з використанням об'єктної моделі даних
Створена програмно-інформаційна система, що включає в себе об'єктно-орієнтоване опис обраної предметної області (в даному випадку - ринок телекомунікацій), її інформаційне наповнення, а також інструментальні можливості СУБД "Кронос" утворюють основу для розробки систем підтримки прийняття рішень і експертних систем.
Система служить інформаційною базою для проведення аналітичних досліджень. Вона дозволяє формулювати складні критерії вибірок, засновані на категоріях не тільки складносурядних, але і складнопідрядних речень.
Все різноманіття доступних критеріїв вибірок і організованих на основі отриманих даних аналітичних досліджень можна класифікувати за такими основними групами.
1. Об'єктній аналіз. Проводиться Шляхом вібірок информации, что стосується різніх учасников Сайти Вся (его суб'єктів), а такоже матеріальніх и інтелектуальніх ресурсов (об'єктів) Сайти Вся. Вибірки можуть ставитися до всього обсягу накопиченої інформації про об'єкт або суб'єкт ринку на всій тимчасової осі (режим "досьє"), а також за окремими атрибутами на різних відрізках часового ряду (наприклад, продукція, вироблена організацією, або її фінансові показники за певний проміжок часу динаміка статутного капіталу організації).
2. Аналіз зв'язків і відносин. Його суть полягає у вивченні прямих і опосередкованих зв'язків суб'єктів ринку між собою, а також з різними предметами і явищами реального світу. Проводиться за допомогою побудови наступних типів вибірок:
- перевірка наявності і типів зв'язків між досліджуваними об'єктами реального світу із заданою глибиною вибірки;
- побудова ланцюжків послідовних і паралельних подій і аналіз причинно-наслідкових зв'язків;
- вибірка інформації, що стосується змісту конкретного зв'язку між досліджуваними об'єктами реального світу на всій тимчасової осі або на її окремих відрізках.
3. Географічний аналіз. Проводиться шляхом вибірок інформації про розвиток досліджуваної предметної області в цілому (наприклад, вся інформація, що стосується телекомунікацій) або її окремих фрагментів (наприклад, тільки організації, що надають послуги передачі даних) в заданому географічному регіоні з прив'язкою до всієї тимчасової осі (режим "досьє" ) або її окремих фрагментах (так звана телекомунікаційна обстановка в регіоні).
4. Технологічний і ситуаційний аналіз. Пов'язаний з відбором і подальшим аналізом теоретичних статей і конкретних фактів застосування учасниками ринку технологій і ситуацій в реальному житті.
5. Хронологічний аналіз. Дозволяє простежити динаміку зміни обстановки на всьому ринку, за його окремих сегментах, учасникам ринку або їх зв'язків. Проводиться за допомогою вибірки необхідної групи даних, що відноситься до заданих тимчасових інтервалах.
6. Комбінований приватний аналіз. Численні його різновиди забезпечуються вибірками інформації по різним учасникам і (або) предметів ринку з необхідними обмеженнями на їх атрибути, фонові характеристики і хронологічну прив'язку.
В якості можливих критеріїв відбору інформації можна навести такі:
- відібрати всі події, що відбулися до 01.05.98 р в Москві і пов'язані з розвитком стільникового зв'язку, в яких брала участь компанія КОМКОР;
- відібрати все організації, що знаходяться на території України і які надають послуги стільникового телефонного зв'язку в стандарті GSM;
- знайти організацію, яка випускає супутники зв'язку "Експрес", що входять до складу системи супутникового зв'язку "Інтерсупутник";
- відібрати все організації, які не перебувають на території Бурятії, але мають діючі ліцензії Державного комітету РФ по зв'язку та інформатизації на надання послуг передачі даних в цій республіці.
Можлива як змістовна вибірка даних, так і статистична обробка відібраної інформації з подальшим її поданням у вигляді діаграм і графіків.
Перспективи розвитку системи
Подальший розвиток системи пов'язано з автоматизацією типових аналітичних операцій, на базі яких можуть бути побудовані алгоритми або евристики більш складних видів аналізу, а також поліпшенням призначеного для користувача інтерфейсу. За ступенем пріоритетності та зростанню складності і трудомісткості робіт розробникам в найближчому майбутньому належить.
1. Розробити механізм, що забезпечує "багатомовність" системи.
2. Розробити мережеву версію банку даних, забезпечити доступ до накопичених в ньому відомостями по мережі Internet.
3. "інтелектуалізованих" системи, автоматизувати найбільш характерні і типові алгоритми і методики приватного аналізу інформації.
4. Автоматизувати процедури формалізації, класифікації та реферування вихідної інформації.
Телефон і адреси фірм: КОМКОР - (095) 200-2538, [email protected]; "Кронос" - (095) 229-4695, www.sins.ru/cronos.
Версія для друку