Класификация на базите данни: възможности, модели на данни и основни характеристики

Базата данни обозначава набор от данни, които трябва да бъдат организирани, а системата за управление на бази данни (СУБД) отговаря за нейното администриране, като по този начин определя нейната структура, ред, права на достъп и зависимости. За тази цел се използва собствен компилатор и подходящ модел, който определя архитектурата на системата за бази данни. Архитектурата се използва за класифициране на бази данни.

История на сътворението

Базите данни (БД) са логически структурирани системи за електронно администриране, което се извършва с помощта на система за управление на бази данни (СУБД) чрез добавянето ѝ към хранилището. Повечето бази данни могат да бъдат отваряни, редактирани и разглеждани само с помощта на специални приложения. БД се класифицират според следните принципи. През 60-те години на миналия век започва да се разработва концепцията за електронна база данни като отделен софтуерен слой между операционната система и приложната програма.

Идеята за електронна система от бази данни се превръща в едно от най-актуалните нововъведения в развитието на компютрите. Първите разработени модели бяха йерархични и мрежови бази данни. IBM направи революция в този сектор през 70-те години с разработването на модела на релационните бази данни. Най-успешните продукти по това време бяха SQL езикът за заявки за бази данни на Oracle и наследниците на IBM - SQL/DS и DB2.

Понятие за бази данни и класификация на базите данни

Днес системите за бази данни са важни в много области на науката, технологиите и потребителските приложения. Всеки тип софтуер, разработена за компании, се основава на стабилна база данни с много опции и инструменти за системни администратори. Сигурността на данните също става все по-важна, тъй като електронните бази данни съхраняват и криптират пароли, лични данни и дори електронни валути.

Съвременната финансова система не е нищо друго освен мрежа от бази данни, в която по-голямата част от парите съществуват само под формата на електронни информационни единици, чиято защита чрез сигурна база данни е една от основните цели на финансовите институции.

Понятие за база данни и класификация на бази данни

В зависимост от променливостта на базата данни, нейният тип се класифицира като статичен или динамичен.

Статични функции на базата данни:

  1. Позволява само операции за четене и никакви модификации.
  2. Те се използват за биографии и исторически факти или сценарии, които могат да бъдат използвани за научни изследвания, без да е необходимо да се променя съдържанието.
  3. Те са сигурни и лесни за използване, когато са свързани към мрежа.

Динамични функции на базата данни:

  1. Те имат представа за самоуправление.
  2. Може да се свързва с динамични мрежи.
  3. тази структурна асоциация позволява съхраняването и актуализирането на информация от базата данни.
  4. Използване на HTML като език за комуникация между мрежата и динамична база данни.
  5. Най-използвани езици за динамични мрежи, свързани с BBDD: Perl, CGI, PHP, JSP и ASP.

Основните СУБД, които работят с динамични уеб страници, са PostgresQL, MySQL, Oracle и Microsoft SQL.

За да разберете какви вариации има в класификацията на базите данни, използвани в научната и образователната среда, разгледайте:

  • библиографски;
  • Документален филм;
  • специализирани;
  • директории.

Функционалност на библиографските бази данни:

  1. Свързани със стари записи, които съдържат информация за местонахождението на дадена книга или документ.
  2. Не съдържат пълния текст, а само препратка.
  3. Благодарение на формати като PDF оригиналните статии са достъпни и могат да се използват за препратки.
  4. С напредването на технологиите се включват връзки от други медии.

Специализирани бази данни:

  1. Те съдържат точна информация и са ориентирани към определена тема.
  2. Използва се в академични и научни среди.
  3. Не се разглежда за някои случаи като правилен BBDD: напр. телефонен указател, списък с контакти на фирма или международна фирма.

Модели за електронна обработка

За да се разгледа подробно въпросът за съществуващите възможности за класифициране на базите данни, не може да се избегне темата за моделите. Йерархичните бази данни са разработени за първи път през 60-те години на миналия век в трудовете на Холерит, като те зависят от тип съхранение 1N/ NN под формата на обърнато дърво.

Връзката е от тип 1N, при която родителският възел може да има множество дъщерни възли, но един дъщерен възел не може да принадлежи на повече от един родителски възел. Техният недостатък е, че излишъкът на данни не е добре представен.

Моделът на мрежата от бази данни, предложен от CODASYL, е неговата първа система за управление (IMS), появила се през 1968 г. за програма на НАСА "Apollo". С него се решават някои от проблемите на предишния йерархичен модел, които вече почти не се използват в съвременните ИТ.

За да разберем съвременния модел, трябва да разгледаме каква е връзката между родителските и детските възли в класификацията на базата данни. Връзките от типа NN се използват днес, когато е позволено подчинен подвъзел да принадлежи на повече от един родителски възел. Заедно с йерархичния модел той формира първото поколение бази данни.

Предимства на модела: те предлагат отлична стабилност, добра производителност и по-добра резервираност на обработката. Недостатък на модела е сложността на системата, която изисква познания по програмиране.

Характеристики на транзакционните бази данни:

  1. Единствената цел е да се изпращат и получават данни с висока скорост.
  2. Те се фокусират върху качествен анализ и производствени данни.
  3. Уникалната цел е да се събират и извличат данни възможно най-бързо, така че излишъкът и дублирането на информация не са проблем, както при други бази данни.
  4. Позволяване на връзка с релационни бази данни.
  5. Транзакциите са атомарни, като при този тип е възможно те да бъдат изпълнени изцяло (цялостност) или изобщо да не бъдат изпълнени.

Основни разлики в базите данни

Документален - връща съдържание, работи с познавателни и концептуални документи, принадлежи към интелектуалната и академичната среда. Разполагат с мениджъри на документи и съдържание като CDS/ISIS, Filemaker, Knosys или Imagic Text за контрол на терминологията. Те са лесно достъпни с помощта на стандартизирани езици за заявки и имат класификация на базите данни по тип модел на данните.

Релационните се основават на установяване на връзки между набори от данни, организирани в таблици, които отговарят на някои основни изисквания. имат фиксиран брой полета. Всеки атрибут има име и набор от възможни стойности. Всеки запис е уникален и се идентифицира с ключ. Те прилагат езика за заявки SQL и се основават на модел, разработен от Едгар Код през 70-те години на миналия век.

Златно правило

Обектно-ориентираните бази данни връщат физически файлове или програмен код, те се появяват в края на ХХ век. Използва се в производството и проектирането. Работа на обектно-ориентиран език, като C++ или Python. Спазване на "Златно правило": устойчивост, мениджър за вторично съхранение, едновременност, възстановяване и обект на заявка.

Системи за управление на СУБД

Системи за управление на СУБД

Система за управление на бази данни (СУБД) е термин за описание на функциите и изискванията към транзакциите в система за управление на бази данни, съкратено ACID от Atomicity, Consistency, Isolation and Durability (атомичност, последователност, изолираност и трайност). Тези четири параметъра покриват най-важните изисквания за ACID-съвместима СУБД:

  1. Атомичност обозначава свойство "всичко или нищо" мениджърите на бази данни, за да се уверят, че заявката е валидна, транзакцията е изпълнена правилно и е изпълнена с правилния ред на процедурите.
  2. Последователност или кохерентност, при която транзакцията в базата данни остава стабилна, което изисква постоянно наблюдение на всички транзакции.
  3. Изолирането е условие и гаранция, че транзакциите не си пречат една на друга, което обикновено се постига чрез заключване на определени функции, които изолират данните, включени в транзакцията.
  4. Постоянството означава, че всички данни се съхраняват в СУБД за дълъг период от време, дори след извършване на транзакцията и в случай на срив на системата, ако СУБД се срине. За това условие Изискват се записи на транзакции, които регистрират всички процеси, които се случват.

Класификация на функциите и изискванията

Базата данни съхранява информация и я свързва в логическа единица заедно с метаданни, необходими за обработка. Това е много полезен инструмент за управление на големи файлове с помощта на проста заявка, със система от разрешения, която определя, кои потребители или програми имат права на достъп.

Класификация на функциите и изискванията

Класификация на базата данни:

Функция

Цел

Съхраняване на данни

Базата данни съхранява текстове, документи, пароли. Електронно, достъпът до данните може да се осъществи чрез консултация.

Промяна на данните

В зависимост от наличните разрешения повечето бази данни позволяват да редактирате филтрите за защита на данните.

Изчистване на данните

Записите в повечето класификации на бази данни могат да бъдат напълно изтрити, без да остават пропуски. В някои случаи изтритите данни могат да бъдат възстановени, но в други те се изтриват завинаги.

Управление на метаданни

Информацията обикновено се съхранява с метаданни или метаетикети, които поддържат реда в базата данни и позволяват функцията за търсене. Метаданните често се използват и за управление на разрешенията.

Сигурност на данните

Базите данни трябва да бъдат защитени, за да се предотврати достъпът на неупълномощени лица до съхраняваната в тях информация.

Цялост на данните

Цялостност на данните означава, че данните трябва да отговарят на определени правила, за да бъдат верни, надеждни и да могат да бъдат идентифицирани правила за Гарантиране на тяхната коректност и дефиниране на бизнес логиката на банката данни.

Функция за множество потребители

Приложенията за бази данни позволяват достъп от множество устройства. Разпределението на разрешенията и сигурността на данните са елементарни при многопотребителска употреба.

Оптимизиране на заявките

От техническа гледна точка базата данни трябва да може да обработва заявките по най-добрия възможен начин, за да се гарантира добра представяне.

Тригери и съхранени процедури

Тези две процедури са миниприложения, съхранявани в СУБД. Тригерите и съхранените процедури са типични процеси за релационните бази данни.

Прозрачност на системата

Прозрачността на системата е от значение, особено при моделите за класификация на разпределени бази данни.

Йерархичен модел

Йерархичен модел

Разликите между най-често срещаните Моделите на бази данни са резултат от техническото развитие на електронния пренос на данни, което не само преследва целите за ефективност и управляемост, но и разширява възможностите на най-известните доставчици. Това е най-старият модел, който днес е далеч по-популярен от релационния модел, въпреки че напоследък популярността му нараства.

XML използва тази система за съхранение информация. Някои застрахователни компании и банките се обръщат към йерархичните бази данни в най-старите приложения. Най-известният е IBM IMS/DB.

В йерархичния модел за класификация на данни в базата данни съществуват строги и еднозначни връзки. Всеки запис има само едно предимство (Връзки родител-дете, PCR), с изключение на корена, който съставлява дървото. Макар че всеки подчинен възел може да има само един родителски възел, "родителите" могат да имат толкова подчинени възли, колкото искат.

При строга йерархична подредба нивата, които не са пряко свързани, не взаимодействат помежду си, така че свързването на две различни дървета не е лесно. Йерархичните структури на базите данни са изключително гъвкави и прости. Вписвания с "деца" се наричат записи, а тези без тях - листа, и обикновено са документи в записа за листата в класификацията на базата данни. Йерархичните заявки за бази данни достигат до листата, като започват от корена и преминават през различни записи.

Графично ориентирана DMS

Мрежовият модел се развива почти едновременно с релационния модел, въпреки че в крайна сметка е изпреварен от своите конкуренти. За разлика от йерархичния модел, тук записите не разкриват строги връзки "родител - дете", но всеки от тях може да има няколко предшественика, което му дава собствена мрежова структура. Съществува също така уникален и неизменен път за достъп до даден запис.

В модела на мрежовата база данни няма фиксирана йерархия, така че има няколко пътя, водещи до една и съща дестинация. Записът, разположен в центъра на изображението, теоретично може да бъде достъпен от пет други записа и чрез достъпа до него може да се получи достъп до другите пет записа.

Зависимостите могат да бъдат дефинирани и в мрежовия модел - примерът по-горе. То не е пряко свързано с делото в крайната дясна част, така че трябва да премине през делото в центъра, за да достигне до него, което може да го приеме или отхвърли. Тя може да бъде свързана с тази в горния ляв ъгъл. В мрежовия модел записите се добавят или премахват, без да се засяга глобалната структура.

Днес този модел се използва в големите компютри. В други области все още се разчита на йерархичен модел или се преминава към релационен модел, който е много по-гъвкав и лесен за използване. Някои добре познати модели на мрежови бази данни са Siemens UDS и Sperry Univac DMS. С течение на времето и двамата производители развиват интересни смесени форми между мрежовия и релационния модел. Графово-ориентираната база данни се счита за съвременна еволюция на мрежовия модел поради своята мрежова структура.

Графично ориентирана DMS Sperry Univac

Мащабируемост на съхранението

В документално ориентирания модел на база данни документите са основната единица за съхранение на информация. Тези единици са тези, които структурират данните, и не трябва да се бъркат с документите за текстообработка. Тук данните се съхраняват в така наречените двойки "ключ - стойност".

Тъй като не са определени нито структурата, нито броят на двойките, документите, които съставляват документално-ориентираната база данни, могат да се различават значително помежду си. Всеки документ сам по себе си е затворена единица и не е лесно да се установят връзки между документите.

Документално-ориентираните бази данни преживяха голям бум през последните години поради успеха на NoSQL, особено поради добрата мащабируемост. Пример за система за бази данни от този тип е MongoDB. При документално ориентирания модел на база данни данните се съхраняват в отделни документи, а не в таблици, както е при релационния модел.

Тези системи са особено интересни за уеб приложения, тъй като позволяват съхраняването на пълни HTML форми. Трябва да се подчертае, че между различните системи, базирани на документи, има значителни разлики - от синтаксиса до вътрешната структура, така че не всички документално ориентирани бази данни са подходящи за този сценарий. Именно поради тези разлики съществуват няколко системи за бази данни, ориентирани към хранилища Lotus Notes, Amazon SimpleDB, MongoDB, CouchDB, Riak, ThruDB и OrientDB.

Предимства и недостатъци

Предимства и недостатъци

Правилните системи за управление на бази данни помагат за по-добър достъп до данните, както и за оптимизиране на управлението на данните. Точковият достъп, от своя страна, помага на крайните потребители да споделят данни бързо и ефективно като част от задачите на организацията.

Модел на базата данни

Година на създаване

Ползи от

Недостатъци

Йерархичен

1960-й

много бърз достъп за четене, ясна структура, техническа простота.

Фиксирана структура в дървото, която не позволява връзки между дърветата.

Мрежови

Началото на 70-те години

Поддържа Няколко начина Достъп за писане без строга йерархия.

Лоша видимост при големи бази данни.

Релационен

1970-й

Просто, гъвкаво създаване и редактиране, лесно разширяване, бързо стартиране, лесно разширяване, бързо стартиране, много динамичен контекст.

Неуправляемост при големи обеми данни, лошо сегментиране, изкуствени ключови атрибути, външен програмен интерфейс, слабо отразяване на свойствата и поведението на обектите.

Обектно-ориентиран

Краят на 80-те години

По-добра поддръжка на обектно-ориентирани езици за програмиране, съхранение на мултимедийно съдържание. Поддържа Обектно-ориентирани езици за програмиране, Позволява съхранение на мултимедийно съдържание.

По-ниска производителност при повече данни, малко съвместими интерфейси.

Ориентирани към документи

1980-е

Съответните данни се съхраняват централно в независими документи, свободна структура, мултимедийно понятие, отнася се до класификация на същността на базата данни.

Организационната работа е сравнително висока и често изисква умения за програмиране.

Приложения

Приложения

Човек може да не го осъзнава, но базите данни са навсякъде. Независимо дали ги осъзнавате, или не, тяхното въздействие върху ежедневието е голямо. Базите данни са отговорни за много услуги, които хората използват всеки ден - от метеорологични приложения до онлайн филми - и за да не се затъва в нарастващото количество информация, се използва класификация на данните в базите данни.

приложения за СУБД:

  1. Банкиране - за информация за клиенти, сметки и заеми и банкови транзакции.
  2. Авиокомпании - за резервации и информация за разписанието. Авиокомпаниите бяха сред първите, които използваха бази данни по географски разпределен начин: терминали, разположени по целия свят, имаха достъп до централната система за бази данни чрез телефонни линии и други мрежи за предаване на данни.
  3. Университети - за информация за студентите, регистрация на курсове и оценки.
  4. Дружества за кредитни карти - за покупки с кредитни карти и генериране на месечни извлечения.
  5. Телекомуникации - за водене на регистър на проведените разговори, изготвяне на месечни сметки, поддържане на салда по предплатени карти за разговори и съхраняване на информация за комуникационните мрежи.
  6. Финанси - за съхраняване на информация за наличности, продажби и покупки на финансови инструменти, като акции и облигации.
  7. Продажби - информация за клиенти, продукти и покупки.
  8. Производство - за управление на веригата за доставки и проследяване на производството в заводите, наличностите в складовете, магазините и поръчките на стоки.
  9. Човешки ресурси - за информация за служителите, ведомост за заплати, данъци върху заплатите и обезщетения и ведомост за заплати.

Бъдещи тенденции

Бъдещи тенденции

В бъдещия светоглед на базите данни World Wide Web (WWW или накратко уеб) ще продължи да бъде важен аспект, както като средство за публикуване на документи, така и като средство за обмен на информация. WWW предоставя един от хетерогенни и сложни среди за сътрудничество.

Неотдавна се появиха технологии и стандарти, които превръщат уеб в мащабируема и управляема инфраструктура. Една такава технология е XML, която се превръща в система за бази данни в стила на традиционните обработчици на бази данни, която дава много по-добри резултати от търсачките. Предизвикателството е да се интегрира тази функционалност в XML и да се извлече максимална полза от стратегическата информация, която потребителят може да намери онлайн.

Новите тенденции са проактивен и прогнозен анализ на производителността, тестване на натоварването на бази данни, използване на NOSQL - mongodb и cassandra и BigData (Hadoop) в корпоративни и облачни среди.

Статии по темата