OLAP în managementul financiar. Abordare hibridă a stocării datelor. Acest OLAP de neînțeles

În 1993, fondatorul abordării relaționale a construcției bazelor de date, Edgar Codd și partenerii săi (Edgar Codd, matematician și IBM Fellow), au publicat un articol inițiat de Arbor Software (azi celebra companie Hyperion Solutions), intitulat „Providing OLAP ( procesare analitică online) pentru utilizatorii analitici”, care a formulat 12 caracteristici ale tehnologiei OLAP, care au fost completate ulterior cu încă șase. Aceste prevederi au devenit conținutul principal al unei tehnologii noi și foarte promițătoare.

Principalele caracteristici ale tehnologiei OLAP (de bază):

  • reprezentarea conceptuală multidimensională a datelor;
  • manipularea intuitivă a datelor;
  • disponibilitatea și detaliile datelor;
  • lot extragerea datelorîmpotriva interpretării;
  • Modele de analiză OLAP;
  • arhitectura client-server (OLAP accesibil de pe desktop);
  • transparență (acces transparent la date externe);
  • suport multi-utilizator.

Caracteristici speciale(Special):

  • prelucrarea datelor neformalizate;
  • salvarea rezultatelor OLAP: stocarea lor separat de datele sursă;
  • excluderea valorilor lipsă;
  • Gestionarea valorilor lipsă.

Caracteristici ale raportării(Raport):

  • flexibilitate în raportare;
  • performanța standard de raportare;
  • setare automată nivel fizic extragerea datelor.

Managementul dimensiunilor(Dimensiune):

  • universalitatea măsurătorilor;
  • număr nelimitat de dimensiuni și niveluri de agregare;
  • număr nelimitat de operații între dimensiuni.

Din punct de vedere istoric, astăzi termenul „OLAP” implică nu doar o vedere multidimensională a datelor din exterior Utilizator final, dar și o reprezentare multidimensională a datelor în baza de date țintă. Tocmai de aceea este legată apariția ca termeni independenți „OLAP relațional”(ROLAP) și „OLAP multidimensional”(MOLAP).

Serviciul OLAP este un instrument de analiză a unor volume mari de date în timp real. Prin interacțiunea cu sistemul OLAP, utilizatorul va fi capabil să vizualizeze informații în mod flexibil, să obțină secțiuni de date arbitrare și să efectueze operațiuni analitice de detaliere, convoluție, distribuție end-to-end și comparare în timp folosind mulți parametri simultan. Toate lucrările cu sistemul OLAP au loc din punct de vedere al domeniului subiectului și vă permite să construiți modele statistice solide ale situației afacerii.

software OLAP - este un instrument analiza operațională date conținute în depozit. Caracteristica principală este că aceste instrumente sunt destinate utilizării nu de către un specialist în domeniul tehnologiei informației, nu de către un expert statistician, ci de către un profesionist în domeniul aplicat al managementului - un manager al unui departament, departament, management și , în sfârșit, un director. Instrumentele sunt concepute pentru comunicarea analistului cu problema, nu cu computerul. În fig. Figura 6.14 prezintă un cub OLAP elementar care vă permite să evaluați datele pe trei dimensiuni.

Cub OLAP multidimensional și sistem de algoritmi matematici corespunzători prelucrare statistică vă permite să analizați date de orice complexitate la orice interval de timp.


Orez. 6.14.

Având la dispoziție mecanisme flexibile pentru manipularea datelor și afișarea vizuală (Fig. 6.15, Fig. 6.16), managerul examinează mai întâi datele din diferite unghiuri care pot (sau nu) să aibă legătură cu problema rezolvată.

În continuare, el compară diverși indicatori de afaceri între ei, încercând să identifice relații ascunse; poate analiza datele mai îndeaproape, în detaliu, de exemplu, defalcându-le în componente în funcție de timp, regiune sau client sau, dimpotrivă, generalizează și mai mult prezentarea informațiilor pentru a elimina detaliile care distrag atenția. După aceea, folosind modulul evaluare statistică și modelare prin simulare Sunt construite mai multe opțiuni pentru desfășurarea evenimentelor, iar dintre acestea este selectată cea mai acceptabilă opțiune.


Orez. 6.15.

Un manager de companie, de exemplu, poate avea o ipoteză că răspândirea creșterii activelor în diferite ramuri ale companiei depinde de raportul specialiștilor cu studii tehnico-economice în cadrul acestora. Pentru a testa această ipoteză, managerul poate solicita de la depozit și afișa pe grafic raportul dobânzii pentru acele sucursale a căror creștere a activelor în trimestrul curent a scăzut cu peste 10% față de anul trecut, și pentru cele care au crescut cu mai mult de 25%. Ar trebui să poată utiliza o selecție simplă din meniul oferit. Dacă rezultatele obținute se încadrează în mod semnificativ în două grupuri corespunzătoare, atunci acesta ar trebui să devină un stimulent pentru testarea ulterioară a ipotezei prezentate.

În prezent, o direcție numită modelare dinamică(Dynamic Simulation), care implementează pe deplin principiul FASMI de mai sus.

Folosind modelarea dinamică, analistul construiește un model al unei situații de afaceri care se dezvoltă în timp, conform unui anumit scenariu. Mai mult, rezultatul unei astfel de modelări pot fi câteva situații noi de afaceri care generează un arbore solutii posibile cu o evaluare a probabilității și perspectivelor fiecăruia.


Orez. 6.16.

Tabelul 6.3 arată caracteristici comparative analiza statica si dinamica.

Tabelul 6.3.
Caracteristică Analiza statica Analiza dinamica
Tipuri de întrebări OMS? Ce? Câți? Cum? Când? Unde? De ce este asta? Ce s-ar întâmpla dacă...? Ce se întâmplă dacă...?
Timp de raspuns Nereglementat secunde
Operații tipice de date Raport reglementat, diagramă, tabel, desen Secvență de rapoarte interactive, diagrame, formulare de ecran. Schimbarea dinamică a nivelurilor de agregare și a segmentelor de date
Nivelul cerințelor analitice In medie Înalt
Tip de formulare de ecran Practic predeterminat, reglementat Definit de utilizator, personalizabil
Nivelul de agregare a datelor Detaliat și rezumat Definit de utilizator
„Vârsta” datelor Istoric și actual Istoric, actual și proiectat
Tipuri de cereri În mare parte previzibil Imprevizibil - de la caz la caz
Scop Prelucrare analitică reglementată Analiză, modelare și prognoză multi-pass

Aproape întotdeauna, sarcina de a construi un sistem analitic pentru analiza multidimensională a datelor este sarcina de a construi un sistem informatic unic, care funcționează constant, bazat pe software și soluții eterogene. Și însăși alegerea mijloacelor de implementare a PI devine extremă sarcina dificila. Mulți factori trebuie luați în considerare aici, inclusiv compatibilitatea reciprocă a diferiților componente software , ușurința dezvoltării, utilizării și integrării acestora, eficiență operațională, stabilitate și chiar forme, nivelul și perspectivele potențiale ale relațiilor dintre diversele companii producătoare.

OLAP este aplicabil oriunde există o sarcină de analiză a datelor multivariate. În general, dacă aveți un tabel de date care are cel puțin o coloană descriptivă și o coloană cu numere, instrumentul OLAP va mijloace eficiente analiza si generarea de rapoarte. Ca exemplu de utilizare a tehnologiei OLAP, luați în considerare un studiu al rezultatelor procesului de vânzare.

Întrebări cheie: „Cât s-a vândut?”, „Pentru ce sumă s-a vândut?” se extind pe măsură ce afacerea devine mai complexă și datele istorice se acumulează la un anumit număr de factori, sau secțiuni: „..la Sankt Petersburg, Moscova, Urali, Siberia...”, „.. în ultimul trimestru, comparativ cu cea actuală,” „ ..de la furnizorul A față de furnizorul B...”, etc.

Răspunsurile la astfel de întrebări sunt necesare pentru luarea deciziilor de management: privind modificarea sortimentului, prețurilor, închiderea și deschiderea magazinelor, filialelor, rezilierea și semnarea acordurilor cu dealerii, desfășurarea sau încetarea campaniilor publicitare etc.

Dacă încerci să evidențiezi principalele cifre (fapte) și secțiuni (argumente de măsurare) pe care analistul le manipulează, încercând să extindă sau să optimizeze afacerea companiei, vei obține un tabel potrivit pentru analiza vânzărilor ca un fel de șablon care necesită ajustări adecvate pt. fiecare întreprindere specifică.

Timp. De regulă, acestea sunt mai multe perioade: an, trimestru, lună, deceniu, săptămână, zi. Multe instrumente OLAP calculează automat cele mai mari perioade de la o dată și calculează totalurile pentru ele.

Categorie produs. Pot exista mai multe categorii, ele diferă pentru fiecare tip de afacere: Soi, Model, Tip ambalaj etc. Dacă se vinde un singur produs sau sortimentul este foarte mic, atunci nu este nevoie de o categorie.

Produs. Uneori sunt folosite numele produsului (sau serviciului), codul sau numărul articolului acestuia. În cazurile în care sortimentul este foarte mare (și unele întreprinderi au zeci de mii de articole în lista de prețuri), analiza inițială pentru toate tipurile de mărfuri poate să nu fie efectuată, ci generalizată la unele categorii convenite.

Regiune. În funcție de globalitatea afacerii, puteți însemna Continent, Grup de țări, Țară, Teritoriu, Oraș, District, Stradă, Parte de stradă. Desigur, dacă există doar unul magazin, atunci această măsurătoare lipsește.

Vanzator. Această măsurare depinde și de structura și scara afacerii. Acesta ar putea fi: sucursală, magazin, dealer, director de vânzări. În unele cazuri, nu există nicio măsurătoare, de exemplu, când vânzătorul nu influențează volumele vânzărilor, există un singur magazin și așa mai departe.

Cumpărător. În unele cazuri, cum ar fi comerțul cu amănuntul, cumpărătorul este impersonal și nu există măsurare; în alte cazuri, informațiile despre cumpărător sunt disponibile și sunt importante pentru vânzări. Aceasta dimensiune poate contine numele firmei cumparatoare sau mai multe grupuri si caracteristici de clienti: Industrie, Grup de Intreprinderi, Proprietar etc.Analiza structurii de vanzari pentru identificarea celor mai importante componente in contextul de interes. Pentru aceasta, este convenabil să folosiți, de exemplu, o diagramă de tip „Plăcintă” în cazuri complexe, când sunt examinate 3 dimensiuni simultan - „Coloane”. De exemplu, în magazinul Computer Equipment pentru trimestrul respectiv, vânzările de computere s-au ridicat la 100.000 USD, echipamente fotografice - 10.000 USD, iar consumabile - 4.500 USD. Concluzie: cifra de afaceri a magazinului depinde în mare măsură de vânzarea computerelor (de fapt, poate că sunt necesare consumabile pentru a vinde computere, dar aceasta este o analiză a dependențelor interne).

Analiza dinamicii ( analiza regresiei- identificarea tendințelor). Identificarea tendințelor și a fluctuațiilor sezoniere. Dinamica este afișată clar printr-un grafic de tip „Linie”. De exemplu, vânzările de produse Intel au scăzut în cursul anului, în timp ce vânzările Microsoft au crescut. Poate că bunăstarea clientului mediu s-a îmbunătățit, sau imaginea magazinului s-a schimbat și, odată cu aceasta, și compoziția clienților. Sortimentul trebuie ajustat. Un alt exemplu: de 3 ani, vânzările de camere video scad iarna.

Analiza Dependenței(analiza corelației). Compararea volumelor de vânzări ale diferitelor produse în timp pentru a identifica sortimentul necesar - „coș”. De asemenea, este convenabil să utilizați o diagramă „Linie” în acest scop. De exemplu, când imprimantele au fost scoase din gamă în primele două luni, s-a constatat că vânzările de cartușe cu pulbere au scăzut.

Dispersie, abatere medie, moduri de ordin superior - pot fi obținute cele mai sofisticate tipuri de rapoarte analitice.

Sistemele OLAP fac parte din conceptul mai general de „resurse intelectuale ale întreprinderii” sau „instrumente inteligente de analiză a afacerii” (Business Intelligence - BI), care include, pe lângă serviciul tradițional OLAP, instrumente de organizare a partajării datelor și informațiilor apărute. în procesul de depozitare a lucrărilor utilizatorului. Tehnologia Business Intelligence asigură schimbul electronic de documente de raportare, diferențierea drepturilor utilizatorilor, accesul la informații analitice de pe Internet și Intranet.

Programe OLAP pentru desktop și componente OLAP

Clasificarea programelor OLAP

Mai întâi, să repetăm ​​binecunoscuta definiție a OLAP. OLAP (On Line Prelucrare analitică) - procesul de analiză operațională este o clasă software, oferind utilizatorului posibilitatea de a primi instantaneu, în timp real, răspunsuri la întrebări analitice arbitrare.

Se întâmplă că nu orice program care efectuează rapid interogări arbitrare, calcule și oferă utilizatorului date într-o formă pe care acesta poate fi înțeles să fie considerat un instrument OLAP. Clasa OLAP include doar acele programe care oferă utilizatorului un tabel multidimensional gestionat ca interfață externă. Acest tabel permite utilizatorului să schimbe coloane și rânduri, să închidă și să deschidă coloane descriptive, să stabilească condiții de filtrare și, în același timp, calculează automat grupurile de date intermediare și totalurile finale pentru coloanele numerice. O parte integrantă a analizei OLAP este afisaj grafic date.

Programele care implementează această tehnică sunt împărțite în următoarele categorii:

  1. Server OLAP sau SGBD multidimensional MOLAP. Este un motor de calcul și o bază de date multidimensională care este accesată de programele client cu comenzi pentru a prelua date și a efectua calcule. MOLAP stochează seturi de date, fapte și dimensiuni, cu agregate precalculate.
  2. componenta MOLAP. Acesta este un instrument de programare cu care sunt dezvoltate programe client care primesc cuburi calculate de la un server OLAP printr-o interfață, de exemplu OLE DB pentru OLAP de la Microsoft Corporation.
  3. componenta ROLAP. Acesta este, de asemenea, un instrument de programare. Spre deosebire de componenta vizuală OLAP, conține propriul său motor OLAP pentru transformarea datelor relaționale sau a unei matrice multidimensionale în cuburi multidimensionale. Cu alte cuvinte, acest program, la cererea utilizatorului, calculează agregatele în RAM și le afișează pe ecran.
  4. Serverul ROLAP. O clasă de software relativ nouă. Spre deosebire de un server OLAP, acesta nu conține o bază de date multidimensională, dar convertește datele DBMS relaționale în cuburi multidimensionale la cererea multor aplicații client.
  5. programul OLAP. Aceasta este o soluție completă care conține o componentă OLAP, instrumente de descriere cereri arbitrare(Interogare ad-hoc) și interfață de acces la baza de date. La rândul lor, astfel de programe pot fi împărțite în două grupe: programe MOLAP și ROLAP.

componente OLAP

Orice soluție finală conține o componentă OLAP, care este interfața cu utilizatorul. Aceste componente sunt similare între ele. Partea lor vizuală constă din comenzi și elemente de afișare a datelor. De obicei, acesta este un tabel ale cărui câmpuri conțin date, iar coloanele și rândurile sunt controale.

Marea majoritate a furnizorilor OLAP, dintre care există aproximativ 140 în întreaga lume, nu își vând componentele. Știm doar trei componente pe care le puteți cumpăra pentru propria dezvoltare. Acestea sunt Decision Cube al Inprise ca parte a compilatoarelor Delphi și C++ Builder, Pivot Table al Microsoft ca parte a MS Office și Data Dynamic's Dynamic Cube, care este specializată în dezvoltarea componentelor OLAP.

Cubul de decizie Inprise este furnizat ca componentă VCL. Conform clasificării noastre, aparține componentelor ROLAP, adică conține un motor OLAP și este destinat doar lucrului cu DBMS relațional sau tabele locale. Are capacități foarte modeste. De exemplu, este imposibil să deschideți un element de dimensiune sau să setați un filtru pentru mai multe dimensiuni sau să afișați mai multe fapte în același timp. Performanța componentei este scăzută. Limita este de aproximativ 4000 de înregistrări cu 5 dimensiuni. Componenta afișează un singur fapt la un moment dat în tabel. O caracteristică neplăcută este prezența mai multor erori în codul sursă, drept urmare numai programatorii cu înaltă calificare, după corectarea acestor erori, pot folosi componenta în dezvoltarea lor. Avantajele includ ușurința în utilizare și stăpânirea componentelor. Când sunt utilizate corect și cu cantități mici de date, produsele bazate pe această componentă pot fi utile și au performanțe acceptabile.

Masă rotativă Microsoft Corporation este furnizat în două versiuni: ca parte a MS Excel și ca componentă Web. Componenta web (ActiveX) poate fi folosită atât în ​​browser, cât și într-o aplicație Windows nativă. Pivot Table este atât o componentă MOLAP, cât și ROLAP. Folosind protocolul OLE DB pentru OLAP, poate interacționa cu serverul DBMS multidimensional MS OLAP sau cu alte 70 de SGBD-uri multidimensionale ai căror dezvoltatori au suportat acest protocol. Folosind protocolul OLE DB, Pivot Table poate primi date de la un DBMS relațional și poate efectua calcule cub în memorie. Și, desigur, datele pot fi obținute dintr-o anumită zonă a tabelului MS Excel. În acest caz, performanța sa nu este diferită de cea a Decision Cube. Componenta afișează un singur fapt la un moment dat în tabel. Cu toate acestea, setul de instrumente al componentei este mai larg decât cel al Decision Cube - sunt implementate filtrarea arbitrară și extinderea unui element de măsurare. Scopul principal al componentei este de a crea interfețe către un server OLAP în cadrul conceptului Business Intelligent al Microsoft Corporation.

Cub dinamic Data Dynamic este o componentă clasică ROLAP. Vine ca VCL pentru programatorii Delphi și C++Builder și ca COM pentru pasionații de modele de componente. Componentele motorului OLAP sunt destul de puternice. Procesează cu ușurință zeci și puțin mai lent chiar și sute de mii de înregistrări. Există filtre multiple, deschiderea unui element de o singură dimensiune și câteva funcții suplimentare. Componenta vă permite să afișați mai multe fapte într-un tabel în același timp. Cu toate acestea, această componentă este destul de scumpă, costul ei este deosebit de impresionant pentru dezvoltatorii profesioniști.

Toate cele trei componente descrise mai sus, în comparație cu produsele gata făcute de la mulți furnizori, au o funcționalitate foarte slabă, limitată la funcțiile clasice OLAP: detaliere, mutare, rotire etc. În același timp, în unele produse gata făcute există adesea o bară de instrumente plină cu butoane suplimentare funcții convenabile. Cum ar fi și chiar butoanele care efectuează sarcini analitice populare, cum ar fi analiza clasică de marketing 20/80.

Programe desktop OLAP

Până de curând, vânzătorii de servere OLAP își vindeau produsele la prețuri atât de mari încât clienții lor trebuiau să fie la fel de bogați ca șeicii arabi. Astfel, achiziția Oracle Express ar costa 100.000 de dolari pentru locurile de muncă a doi analiști și doi administratori. Însă, chiar și după ce Microsoft a intrat pe piață, care a redus prețurile prin furnizarea gratuită a unui server OLAP ca parte a MS SQL Server, crearea de depozite de date sau de marturi de date rămâne o întreprindere serioasă care necesită implicarea unui dezvoltator profesionist, administrare în timpul costuri de funcționare și alte costuri.

Prin urmare, pe piață a apărut o clasă specială de produse - DOLAP (Desktop OLAP) - desktop OLAP. Acesta este un program care este instalat pe fiecare computer personal. Nu necesită server și are „administrare zero”. Programul permite utilizatorului să se adapteze la bazele de date existente; De regulă, se creează un dicționar care ascunde structura fizică a datelor din spatele descrierii subiectului, pe înțelesul unui specialist. După aceasta, programul efectuează interogări arbitrare și afișează rezultatele într-un tabel OLAP. În acest tabel, la rândul său, utilizatorul poate manipula datele și poate primi sute de rapoarte diferite pe ecran sau pe hârtie.

Pe baza metodei de obținere a datelor, astfel de programe pot fi împărțite în locale și corporative:

  • Cele locale manipulează datele din tabele MS Excel sau baze de date mici precum Access, DBF, Paradox.
  • Enterprise DOLAP-urile au acces la servere SQL sau baze de date multidimensionale și astfel se încadrează și ele în două categorii.

Corporate DOLAP, conceput pentru analiza datelor de pe serverele SQL, vă permite să analizați datele deja disponibile în corporație, stocate în sistemele OLTP. Cu toate acestea, al doilea scop al lor poate fi crearea rapidă și ieftină de Depozite sau de marturi de date, atunci când programatorii organizației trebuie doar să creeze seturi de tabele stele și proceduri de încărcare a datelor. Cea mai consumatoare parte a muncii - dezvoltarea de interfețe cu numeroase opțiuni pentru interogări de utilizator, interfețe și rapoarte - devine inutilă. Acest lucru poate fi implementat în doar câteva ore în programul DOLAP. Stăpânirea unui astfel de program de către utilizatorul final necesită 30 de minute.

Programele DOLAP sunt furnizate chiar de dezvoltatorii bazei de date, multidimensionale și relaționale. Acestea sunt SAS Corporate Reporter, care este aproape un produs standard în ceea ce privește comoditatea și frumusețea, Oracle Discovery, pachetul software MS Pivot Services și Pivot Table și altele. Aceste produse, cu excepția programelor Microsoft, nu sunt ieftine. Deci, SAS Corporate Reporter va costa 2000 USD per utilizator.

Un grup mare de programe este furnizat ca parte a campaniei „OLAP pentru Masse”, care este realizată de Microsoft Corporation. Aceste programe sunt concepute pentru a funcționa cu MS OLAP Services. De regulă, acestea sunt versiuni îmbunătățite ale tabelului pivot și sunt destinate utilizării în MS Office sau Web. Acestea sunt Matryx, Knosys etc.

Datorită simplității, costului redus și eficienței enorme, această clasă de produse a câștigat o popularitate enormă în Occident. Marile corporații își construiesc depozitele cu acces distribuit pe baza unor astfel de programe.

Produse OLAP de la Intersoft Lab

Standard de contur

Produsul principal al companiei Intersoft Lab este marele sistem de informare și management „Kontur Corporation”, construit pe principiile unui Data Warehouse. Cu toate acestea, în procesul de comunicare cu clienții, compania și-a dat seama că nu toată lumea este pregătită pentru investițiile și măsurile organizatorice asociate construirii unui Data Warehouse serios. Primul pas pe această cale pentru multe bănci și întreprinderi ar putea fi analiza OLAP a datelor din sistemele OLTP existente și propriile baze de date analitice.

În aceste scopuri a fost creat produsul DOLAP „Contour Standard”.

Contour Standard 1.0 Prima versiune a sistemului a aparținut clasei DOLAP local. Instrumentele programului au făcut posibilă organizarea accesului direct la fișierele dbf și paradox. În plus, pachetul de distribuție a inclus un migrator de date, care a ajutat la colectarea datelor din sistemele existente ale organizației în tabele locale.

Contour Standard 2.0 Ulterior, pentru a extinde puterea produsului, sistemul Contour Standard 2.0 a oferit acces la servere SQL arbitrare la nivel de tabel și, ceea ce nu se găsește în analogii străini, la proceduri stocate. Acest lucru a transformat programul într-un sistem de informare și analitic corporativ. A fost implementată o interfață separată pentru sistemul Kontur Corporation.

Totodată, pentru ușurință în administrare, programul a fost împărțit în două ediții. Ediția „Developer” permite unui specialist IT să descrie sursele de date și mostre. În acest caz, sunt create dicționare semantice care ascund stratul fizic de utilizatorul final și traduc datele în limba domeniului subiect. Ediția Run-Time vă permite să analizați date și să produceți rapoarte. Principala modalitate de a manipula datele este componenta OLAP, care vă permite să creați rapoartele necesare fără programare sau abilități speciale. În același timp, au fost create noi tipuri de instrumente analitice convenabile, care nu sunt formal tabele OLAP, ci sunt instrumente OLAP în spirit, adică. implementați analiza on-line, dar într-o formă diferită de prezentare a datelor.

Primele două versiuni au folosit componenta Inprise Decision Cube ROLAP. Cu toate acestea, puterea sa redusă și simplitatea funcțională au împiedicat utilizarea programului în bănci și organizații pentru analiza unor volume mari de date. Prin urmare, s-a luat decizia înlocuirii acestuia. Analiza de marketing și un audit al capacităților intelectuale și de producție ale companiei în sine au dus la decizia de a crea propria noastră componentă OLAP. Ca urmare a dezvoltării componentei, care a fost numită Contour Cube, a apărut următoarea versiune a programului - „Contour Standard” 3.0, care vă permite să procesați mostre de date de până la un milion de înregistrări și are funcționalitate analitică avansată.

Contour Cube

Componenta Contour Cube de la Intersoft Lab este o componentă reprezentativă ROLAP. Acesta constă dintr-un motor OLAP, o interfață pentru accesarea datelor aflate în serverele SQL și alte surse și o parte vizuală.

Componenta va fi implementată în mai multe versiuni pentru diferite aplicații.

Versiunea VCL pentru utilizare în mediile Inprise Delphi și C++ Builder. În acest caz, datele sunt furnizate prin setul de date standard al acestor compilatoare. Accesul la surse este oferit folosind atât BDE, cât și ADO, acceptate în ultimele versiuni aceste medii.

Versiunea COM conceput pentru dezvoltatori care folosesc Visual Basic, Visual C++ etc. Oferă acces la date folosind ADO. În versiunile viitoare, va fi acceptat accesul la serverele OLAP prin interfața OLE DB pentru OLAP.

Versiunea ActiveX este o componentă Web pentru crearea de interfețe analitice de Internet în stilul propus de Microsoft.

Versiunea DHTML constă dintr-un server și pagini DHTML. Este destinat creării de interfețe analitice de Internet în mediul UNIX, precum și pentru piața în dezvoltare rapidă a dispozitivelor mobile de internet.

Principalele avantaje ale componentei sunt:

  • Prelucrarea unor volume mari de date.
  • Cerințe minime de memorie.
  • Funcționalitate extinsă.

Componentele de înaltă performanță sunt obținute printr-un model matematic unic creat de specialiștii companiei.

Crearea mai multor versiuni ale unei componente este posibilă datorită arhitecturii sale cu mai multe straturi. Stratul OLAP Engine este o parte relativ independentă a componentei. Este implementat ca o bibliotecă multiplatformă care are API-uri pentru diferite straturi de vizualizare. Acest API are funcții pentru încărcarea datelor, calcularea feliilor unui cub multidimensional și efectuarea de funcții analitice și de serviciu. Stratul OLAP Engine în sine constă dintr-un motor de calcul și un Magazin de date multidimensional abstract, care poate fi salvat ca fișier pentru a fi transferat către alți utilizatori sau pentru utilizare pe termen lung.

Prelucrarea unor volume mari de date

Teste pe un computer personal cu procesor Intel Celeron 400 și 64 MB RAM au dat următoarele rezultate. Încărcarea a 60.000 de înregistrări cu 6 dimensiuni durează 5 secunde; alte manipulări, cum ar fi rotirea completă a mesei, drill down și drill up, sunt efectuate în zecimi de secundă.

Acestea sunt cele mai bune rezultate de ordin de mărime (sic!) din componentele OLAP cunoscute de noi. Deci, Decision Cube și Pivot Table (fără folosind OLAP Servicii) necesită zeci de secunde pentru a încărca și roti un tabel cu 4000 de înregistrări și 6 dimensiuni. Viteza lui Dynamic Cube este mai mică decât cea a lui Contour Cube, cu o medie de 30% la volumele medii de date și de câteva ori mai mică la volumele maxime.

Astfel, în multe cazuri, datorită puterii sale, componenta face inutilă utilizarea unui server OLAP. Acest lucru simplifică foarte mult procesele de implementare și administrare a unui sistem corporativ.

Cerințe minime de memorie

Când lucrează cu date, componenta ocupă cea mai mică cantitate de RAM în comparație cu colegii săi de clasă. Deci, la încărcarea a 40.000 de înregistrări, Contour Cube consumă 7 MB, Decision Cube 15 MB.

Funcționalitate avansată

Componenta combină funcțiile celor mai bune componente OLAP:

  • Filtre multiple după dimensiuni.
  • Generarea atât a perioadelor standard de timp („Anul”, „Trimestrul”, „Luna”, „Deceniul”, „Săptămâna”, etc.) cât și a celor definite de utilizator („Anul fiscal”, „Sezonul”, „Momentul zilei” ) după tipul de dimensiune „data”.
  • Sortarea după dimensiuni.
  • Sortarea după fapte.
  • Deschiderea unei valori de dimensiune (ramură).
  • Gestionarea automată a graficelor.
  • Configurare manuală a graficului.
  • O mulțime de fapte.
  • Mulți algoritmi standard de agregare a faptelor.
  • Algoritm de agregare „Soldul contului”.

O proprietate unică a componentei este algoritmul de agregare „Soldul contului”. Datorită faptului că componentele OLAP sunt destinate în principal analizei vânzărilor și altor tipuri de analiză sumativă, ele agregează soldurile conturilor în timp. Aceasta este o eroare - soldul contului pentru trimestrul nu este suma soldurilor contului pentru ziua respectivă, ci soldul pentru ultima zi a trimestrului. Implementarea acestui algoritm permite ca componenta să fie utilizată pentru analiza bilanțurilor și o face utilă nu numai pentru economiști și marketeri, ci și pentru contabili.

Pentru ca produse finite puternice să fie create atunci când se utilizează componenta într-un timp minim, aceasta are încorporat un set de funcții analitice care sunt adesea întâlnite în munca reală. Fiecare dintre aceste funcții este implementată ca un buton în bara de instrumente a părții vizuale a componentei. Iată o listă cu aceste funcții:

  • Eliminați coloanele nule, eliminați rândurile nule, eliminați coloanele și rândurile nule. Folosit pentru a comprima tabele rare.
  • Turn complet. În acest caz, coloanele și rândurile tabelului sunt schimbate. Este folosit pentru a îmbunătăți percepția analistului asupra tabelelor și pentru a selecta cea mai bună formă de imprimare.
  • Filtrați după fapte. Vă permite să specificați limite absolute ale faptelor sau numărul de elemente mai mari sau mai mici. Este unul dintre instrumentele analizei factoriale.
  • Analiza grupului. Împărțirea datelor într-un număr specificat de grupuri în funcție de valorile limită ale faptului. De exemplu, împărțirea clienților în mari, mijlocii și mici în funcție de valoarea veniturilor primite de la aceștia.
  • 80/20. Un tip popular de analiză de cluster în marketing în Occident. Un exemplu de aplicare a acestuia: arată 20% dintre clienții care aduc 80% din profit.
  • Variind. Generarea unei noi dimensiuni „loc în listă” pe baza valorii unui fapt dat și sortarea după acesta. Util pentru analiza campaniilor electorale, compararea băncilor, întreprinderilor și sucursalelor în funcție de un indicator dat.
  • Afișați mai multe totaluri statistice simultan, cum ar fi media, abaterea standard etc. Această caracteristică va atrage profesioniștii avansați, în special în domeniul analizei financiare și a stocurilor.
  • Încărcarea în MS Excel, MS Word, formate html. Vă permite să continuați analiza folosind instrumentele obișnuite MS Excel și să creați un raport liber de la, publică raportul pe Internet.

Din cauza imposibilității de a proteja drepturile de autor în Rusia pentru produse software, a căror protecție fizică este fundamental imposibil de implementat, componente precum produs comercial va fi furnizat numai pe piața occidentală. Cu toate acestea, consumatorii ruși pot profita de avantajele sale pentru a-și dezvolta propria afacere în produsele „Kontur Standard” și „Kontur Corporation”.

OLAP- o abreviere pentru English On-Line Analytical Processing - acesta nu este numele unui produs anume, ci al unei intregi tehnologii. În rusă este cel mai convenabil să sunați OLAP operațional prelucrare analitică. Deși în unele publicații procesarea analitică este numită atât online, cât și interactiv, adjectivul „online” reflectă cel mai bine sensul tehnologiei OLAP.

Dezvoltarea de soluții de management de către un manager se încadrează în categoria zonelor care sunt cel mai greu de automatizat. Cu toate acestea, astăzi există o oportunitate de a ajuta managerul în dezvoltarea de soluții și, cel mai important, de a accelera semnificativ procesul de dezvoltare a soluțiilor, selecția și adoptarea acestora. Puteți utiliza OLAP pentru aceasta.

Să vedem cum are loc de obicei procesul de dezvoltare a soluției.

Din punct de vedere istoric, soluțiile de automatizare a activităților operaționale au fost cele mai dezvoltate. Vorbim despre sisteme de procesare tranzacțională (OLTP), altfel numite sisteme operaționale. Aceste sisteme asigură înregistrarea anumitor fapte, păstrarea lor pe termen scurt și păstrarea în arhive. Baza unor astfel de sisteme este asigurată de sistemele de management al bazelor de date relaționale (RDBMS). Abordarea tradițională este de a încerca să utilizați sisteme operaționale deja construite pentru a sprijini luarea deciziilor. De obicei ei încearcă să construiască un sistem dezvoltat de interogări către sistemul de operare și folosesc rapoartele obținute în urma interpretării direct pentru a sprijini deciziile. Rapoartele pot fi construite pe bază personalizată, de ex. managerul solicită un raport, și în mod regulat, atunci când rapoartele sunt construite pe baza realizării anumitor evenimente sau timp. De exemplu, un proces tradițional de sprijinire a deciziilor ar putea arăta astfel: un manager merge la un specialist în informații și îi împărtășește întrebarea. Apoi specialistul departamentului de informare construiește o solicitare către sistemul operațional, primește un raport electronic, îl interpretează și îl aduce în atenția personalului de conducere.

Desigur, o astfel de schemă oferă sprijin pentru luarea deciziilor într-o oarecare măsură, dar are o eficiență extrem de scăzută și un număr mare de dezavantaje. Cantități minuscule de date sunt folosite pentru a sprijini deciziile esențiale pentru misiune. Sunt si alte probleme. Acest proces este foarte lent, deoarece procesul de redactare a cererilor și interpretare a raportului electronic este lung. Durează multe zile, în timp ce managerul poate avea nevoie să ia o decizie chiar acum, imediat. Dacă luăm în considerare că, după primirea raportului, managerul poate fi interesat de o altă întrebare (să zicem, clarificarea sau solicitarea luării în considerare a datelor într-un context diferit), atunci acest ciclu lent ar trebui să se repete. Și încă din procesul de analiză a datelor sisteme de operare se va întâmpla iterativ, apoi se va petrece și mai mult timp. O altă problemă este diferența de domenii de activitate a unui specialist în tehnologia de informațieși liderul, care poate gândi în diferite categorii și, ca urmare, nu se înțeleg. Aceasta înseamnă că vor fi necesare iterații suplimentare de clarificare și, din nou, este timpul, care este întotdeauna în lipsă. O altă problemă majoră este că rapoartele sunt greu de înțeles. Managerul nu are timp să selecteze numerele de interes din raport, mai ales că pot fi prea multe dintre ele (remintiți-vă rapoartele uriașe cu mai multe pagini în care sunt folosite efectiv mai multe pagini, iar restul sunt folosite pentru orice eventualitate). Mai remarcăm că munca de interpretare revine cel mai adesea specialiștilor departamente de informare. Adică, un specialist competent este distras de munca de rutină și ineficientă de desenare a diagramelor etc., care, desigur, nu poate avea un efect favorabil asupra calificărilor sale. În plus, nu este un secret pentru nimeni că în lanțul de interpretare există binevoitori interesați să distorsioneze în mod deliberat informațiile primite.

Neajunsurile de mai sus ne fac să ne gândim la eficiența generală a sistemului de operare și la costurile asociate cu existența acestuia, deoarece se dovedește că costurile creării unui sistem de operare nu sunt compensate în mod adecvat de eficiența funcționării acestuia.

În realitate, aceste probleme nu sunt o consecință De calitate inferioară sistemul de operare sau construcția lui nereușită. Rădăcinile problemelor se află în diferența fundamentală dintre activitățile operaționale care sunt automatizate de sistemul de operare și activitățile care dezvoltă și iau decizii. Această diferență constă în faptul că datele sistemului de operare sunt pur și simplu înregistrări ale anumitor evenimente și fapte care au avut loc, dar nu informații în sensul general al cuvântului. Informația este ceea ce reduce incertitudinea într-o zonă. Și ar fi foarte bine dacă informațiile ar reduce incertitudinea în pregătirea deciziilor. Cunoscutul E.F. a vorbit odată despre inadecvarea sistemelor de operare construite pe RDBMS în acest scop. Codd, un pionier al tehnologiei sistemelor de management al bazelor de date relaționale în anii 1970: „Deși sistemele de management al bazelor de date relaționale sunt disponibile pentru utilizatori, ele nu au fost niciodată recunoscute ca oferind capabilități puternice de sinteză, analiză și consolidare (funcții numite analiză multidimensională a datelor)”. Vorbim în mod specific despre sinteza informațiilor, despre transformarea datelor din sistemele operaționale în informații și chiar în evaluări calitative. OLAP face posibilă această transformare.

OLAP se bazează pe ideea unui model de date multidimensional. Gândirea umană este multidimensională prin definiție. Când o persoană pune întrebări, el impune restricții, formulând astfel întrebări în multe dimensiuni - prin urmare procesul de analiză într-un model multidimensional este foarte apropiat de realitatea gândirii umane. În funcție de dimensiunile din modelul multidimensional, sunt trasați factorii care influențează activitățile întreprinderii (de exemplu: timpul, produsele, ramurile companiei, geografia etc.). În acest fel, se obține un hipercub (desigur, numele nu este foarte bun, deoarece un cub este de obicei înțeles ca o figură cu margini egale, ceea ce este departe de cazul în acest caz), care este apoi umplut cu indicatori de activitatea întreprinderii (prețuri, vânzări, plan, profituri, pierderi etc.). P.). Acesta poate fi completat atât cu date reale din sistemele de operare, cât și cu date de prognoză bazate pe date istorice. Dimensiunile unui hipercub pot fi complexe, ierarhice și se pot stabili relații între ele. În timpul procesului de analiză, utilizatorul poate schimba punctul de vedere asupra datelor (așa-numita operațiune de schimbare a vederii logice), vizând astfel datele în diferite secțiuni și rezolvând sarcini specifice. Pe cuburi pot fi efectuate diferite operații, inclusiv prognoza și planificarea condiționată (analiza ce se întâmplă dacă). Mai mult, operațiunile se efectuează pe cuburi, adică. produsul, de exemplu, va avea ca rezultat un produs hipercub, fiecare celulă a căruia este produsul celulelor hipercuburilor multiplicatoare corespunzătoare. Desigur, este posibil să se efectueze operații pe hipercuburi care au un număr diferit de dimensiuni.

Puțină istorie

Ideea de prelucrare a datelor tablouri multidimensionale nu este nou. De fapt, datează din 1962, când Ken Iverson și-a publicat cartea „A Programming Language” (APL). Prima implementare practică a APL a avut loc la sfârșitul anilor șaizeci de către IBM. APL este un limbaj foarte elegant, definit matematic, cu variabile multidimensionale și operații procesate. Acesta a fost conceput ca un instrument original și puternic pentru lucrul cu transformări multidimensionale în comparație cu alte limbaje practice de programare.

Cu toate acestea, ideea nu a primit o aplicare în masă de mult timp, din moment ce vremea interfețelor grafice și a dispozitivelor de imprimare încă nu venise Calitate superioară, și afișarea caracterelor grecești necesare ecrane speciale, tastaturi și dispozitive de imprimare. Mai târziu, cuvintele englezești au fost uneori folosite pentru a înlocui operatorii greci, dar puriștii APL au oprit încercările de a populariza limba lor preferată. APL a consumat și resursele mașinii. Pe vremea aceea era scump de folosit. Programele rulau foarte lent și, în plus, lansarea lor era foarte costisitoare: necesitau multă memorie, ceea ce la vremea aceea era pur și simplu șocant (aproximativ 6 MB).

Cu toate acestea, frustrarea acestor greșeli inițiale nu a distrus ideea. A fost folosit în multe aplicații de afaceri în anii 70, 80. Multe dintre aceste aplicații aveau caracteristici sisteme moderne prelucrare analitică. Astfel, IBM a dezvoltat un sistem de operare pentru APL numit VSPC, iar unii oameni l-au considerat un mediu ideal pentru uz personal, până când foile de calcul au devenit omniprezente.

Dar APL a fost prea greu de folosit, mai ales că de fiecare dată au existat neconcordanțe între limbajul în sine și hardware-ul pe care s-a încercat implementarea lui.

În anii 1980, APL a devenit disponibil pe mașinile personale, dar nu a găsit utilizare pe piață. Alternativa a fost de a programa aplicații multidimensionale folosind matrice în alte limbi. Aceasta a fost o sarcină foarte dificilă chiar și pentru programatorii profesioniști, forțându-i să aștepte următoarea generație de produse software multidimensionale.

În 1972, mai multe produse software de aplicații multidimensionale utilizate anterior în scopuri educaționale și-au găsit uz comercial: de exemplu, Express. Rămâne într-o formă complet rescrisă și acum, dar conceptele originale din anii 70 au încetat să mai fie relevante. Astăzi, în anii 90, Express este una dintre cele mai populare tehnologii OLAP, iar Oracle(r) o va promova și va adăuga noi capabilități.

Mai multe produse multidimensionale au apărut în anii 80. La începutul deceniului, un produs numit Stratagem, numit mai târziu Acumate (azi deținut de Kenan Technologies), care a fost încă promovat până la începutul anilor 90, dar astăzi, spre deosebire de Express, nu este practic folosit.

Comshare System W a fost un produs multidimensional cu un stil diferit. Introdus în 1981, a fost primul care a fost mai orientat spre utilizator și design aplicatii financiare. A introdus multe concepte noi care nu au fost bine adoptate, cum ar fi reguli complet non-procedurale, vizualizarea pe tot ecranul și editarea datelor multidimensionale, recalcularea automată și integrarea loturilor cu datele relaționale. Cu toate acestea, Comshare System W era destul de greu pentru hardware-ul vremii în comparație cu alte produse. A fost folosit mai puțin în viitor, vândut din ce în ce mai puțin și nu s-au adus îmbunătățiri produsului. Deși este încă disponibil pe UNIX, nu este client-server, ceea ce nu își îmbunătățește oferta pe piața de analiză. La sfârșitul anilor 1980, Comshare a lansat un produs pentru DOS și mai târziu pentru Windows. Aceste produse au fost numite Commander Prism și au folosit aceleași concepte ca și System W.

Un alt produs creativ de la sfârșitul anilor 80 se numea Metaphor. A fost destinat marketerilor profesioniști. De asemenea, a introdus multe concepte noi care abia încep să fie utilizate pe scară largă astăzi: calcul client-server, utilizarea unui model multidimensional pentru date relaționale, dezvoltarea de aplicații orientate pe obiecte. Cu toate acestea, hardware-ul PC standard al zilei nu era capabil să ruleze Metaphor, iar vânzătorii au fost forțați să-și dezvolte propriile standarde de computer și de rețea. Treptat, Metaphor a început să funcționeze cu mai mult succes pe mașinile personale în serie, dar produsul a fost realizat exclusiv pentru OS/2 și avea propria interfață grafică cu utilizatorul.

Metaphor a intrat apoi într-o alianță de marketing cu IBM, pe care a absorbit-o ulterior. La mijlocul anului 1994, IBM a decis să integreze tehnologia Metaphor (redenumită DIS) cu tehnologiile sale viitoare și, prin urmare, să nu mai finanțeze linia separată. Cu toate acestea, clienții și-au exprimat nemulțumirea și au cerut sprijin continuu pentru produs. Suportul a fost continuat pentru clienții rămași, iar IBM a relansat produsul sub noul nume DIS, care, totuși, nu l-a făcut popular. Dar conceptele creative, inovatoare ale Metaphor nu au fost uitate și sunt vizibile în multe produse astăzi.

La mijlocul anilor '80 a luat naștere termenul EIS (Executive Information System). Primul produs care a demonstrat clar această direcție a fost Pilot's Command Center. Era un produs care permitea calculul colaborativ, ceea ce numim astăzi calcul client-server. Deoarece puterea computerelor personale în anii '80 era limitată, produsul era foarte „server- centric", dar principiul este încă foarte popular astăzi. Pilot nu a vândut Command Center pentru mult timp, dar a introdus multe dintre conceptele care pot fi recunoscute în produsele OLAP de astăzi, inclusiv suport automat pentru intervale de timp, calcule multidimensionale client-server și control simplificat al procesului de analiză (mouse, ecrane sensibile, etc.) Unele dintre aceste concepte au fost reaplicate ulterior în Pilot Analysis Server.

La sfârșitul anilor 1980, foile de calcul dominau piața instrumentelor de analiză utilizatorilor finali. Prima foaie de calcul multidimensională a fost introdusă de Compete. A fost comercializat ca un produs foarte scump pentru profesioniști, dar vânzătorii nu au reușit să se asigure că produsul ar putea capta piața, iar Computer Associates a achiziționat drepturile asupra acestuia împreună cu alte produse, inclusiv Supercalc și 20/20. Principalul efect al achiziției Compete de către Computer Associates a fost reducerea dramatică a prețului acestuia și eliminarea protecției împotriva copierii, ceea ce a contribuit în mod natural la proliferarea acesteia. Cu toate acestea, nu a avut succes. Competența este baza Supercalc 5, dar aspectul multidimensional al acestuia nu este promovat. Vechiul Compete este încă în uz datorită faptului că s-au investit mulți bani în el la un moment dat.

Lotus a fost următorul care a încercat să intre pe piața foilor de calcul multidimensionale cu produsul său Improv, care rulează pe o mașină NeXT. Acest lucru a asigurat, cel puțin, că vânzările de 1-2-3 nu vor scădea. Dar când a fost lansat în cele din urmă pentru Windows, Excel avea deja o cotă mare de piață, ceea ce l-a împiedicat pe Lotus să facă orice modificări în distribuția pieței. Lotus, la fel ca CA cu Compete, a mutat Improv în partea de jos a pieței, dar aceasta nu a fost o condiție pentru promovarea de succes pe piață, iar noile dezvoltări în acest domeniu nu au continuat. S-a dovedit că utilizatorii de computere preferau foile de calcul 1-2-3 și nu erau interesați de noile capacități multivariate decât dacă erau pe deplin compatibile cu vechile foi de calcul. De asemenea, conceptul de foi mici de calcul desktop oferite ca aplicații personale, nu s-a dovedit cu adevărat convenabil și nu a prins rădăcini în lumea reală a afacerilor. Microsoft(r) a urmat această cale adăugând PivotTables (în ediția rusă acest lucru se numește „pivot tables”) în Excel. Deși puțini utilizatori Excel au beneficiat de pe urma utilizării acestei funcții, este probabil singura dovadă a utilizării pe scară largă a capabilităților de analiză multivariată din lume, pur și simplu pentru că există atât de mulți utilizatori Excel în lume.

OLAP, ROLAP, MOLAP...

Este bine cunoscut faptul că, atunci când Codd și-a publicat regulile pentru construirea SGBD-urilor relaționale în 1985, acestea au provocat o reacție puternică și, ulterior, au avut un impact puternic asupra industriei SGBD-urilor în general. Cu toate acestea, puțini oameni știu că în 1993 Codd a publicat o lucrare intitulată „OLAP for User Analysts: What It Should Be.” În acesta, el a subliniat conceptele de bază ale analizei online și a definit 12 reguli care trebuie îndeplinite de produsele care oferă capabilități de analiză online.

Acestea sunt regulile (textul original a fost păstrat dacă este posibil):

  1. Reprezentare conceptuală multidimensională. Utilizatorul-analist vede lumea întreprinderii ca fiind de natură multidimensională. În consecință, modelul OLAP trebuie să fie multidimensional în nucleul său. O diagramă conceptuală multidimensională sau o reprezentare personalizată facilitează modelarea și analiza, precum și calculele.
  2. Transparenţă. Indiferent dacă produsul OLAP face parte din instrumentele utilizatorului sau nu, acest fapt trebuie să fie transparent pentru utilizator. Dacă OLAP este furnizat de calculul client-server, atunci acest fapt ar trebui, de asemenea, dacă este posibil, să fie invizibil pentru utilizator. OLAP trebuie furnizat în context real arhitectura deschisa, permițând utilizatorului, oriunde s-ar afla, să comunice folosind un instrument analitic cu serverul. În plus, transparența ar trebui să fie realizată și atunci când instrumentul analitic interacționează cu medii de baze de date omogene și eterogene.
  3. Disponibilitate. Utilizatorul analist OLAP trebuie să poată efectua analize bazate pe o schemă conceptuală comună care conține date la nivel de întreprindere într-o bază de date relațională, precum și date din bazele de date moștenite, metode de acces comune și un model analitic comun. Aceasta înseamnă că OLAP trebuie să furnizeze propria sa schemă logică pentru acces într-un mediu de bază de date eterogen și să efectueze transformări adecvate pentru a furniza date utilizatorului. Mai mult, este necesar să aveți grijă în prealabil despre unde și cum și ce tipuri organizare fizică datele vor fi efectiv utilizate. Un sistem OLAP ar trebui să acceseze doar datele care sunt de fapt necesare, mai degrabă decât să adopte o abordare generală „pâlnie de bucătărie” care introduce intrări inutile.
  4. Productivitate constantă în elaborarea rapoartelor. Dacă numărul de dimensiuni sau dimensiunea bazei de date crește, analistul utilizator nu ar trebui să experimenteze nicio degradare semnificativă a performanței. Pentru utilizatorul final, atât performanța consecventă, cât și menținerea ușurinței în utilizare și limitarea complexității OLAP sunt esențiale. Dacă utilizatorul-analist întâmpină diferențe semnificative de performanță în funcție de numărul de dimensiuni, atunci va tinde să compenseze aceste diferențe cu strategia de proiectare, ceea ce va face ca datele să fie prezentate în alte moduri decât modul în care datele au nevoie de fapt. pentru a fi prezentate. Petrecerea timpului târându-se în jurul unui sistem pentru a compensa insuficiența acestuia nu este scopul pentru care sunt concepute produsele de analiză.
  5. Arhitectura client-server. Majoritatea datelor care trebuie procesate rapid și analitic astăzi sunt stocate pe mainframe cu acces la computer. Aceasta înseamnă că produsele OLAP trebuie să poată funcționa într-un mediu client-server. Din acest punct de vedere, pare necesar ca componenta server a instrumentului analitic să fie atât de „inteligentă” încât diverși clienți ar putea să se alăture serverului cu probleme minime și programare de integrare. Un server inteligent trebuie să fie capabil să mapeze și să consolideze între schemele de baze de date logice și fizice disparate. Acest lucru va oferi transparență și capacitatea de a construi un cadru conceptual, logic și fizic comun.
  6. Multidimensionalitate generală. Fiecare dimensiune trebuie aplicată indiferent de structura și capacitățile sale operaționale. Capacități operaționale suplimentare pot fi furnizate dimensiunilor selectate și, deoarece dimensiunile sunt simetrice, poate fi furnizată o singură funcție pentru orice dimensiune. Structurile de bază ale datelor, formulele și formatele de raportare nu ar trebui să fie părtinitoare către nicio dimensiune.
  7. Managementul dinamic al matricelor rare. Designul fizic al instrumentului OLAP trebuie să fie pe deplin adaptat modelului analitic specific pentru control optim matrici rare. Pentru orice matrice rară dată, există una și o singură schemă fizică optimă. Această schemă prevede eficienta maximaîn memoria și operabilitatea matricei, dacă, desigur, întregul set de date se încadrează în memorie. Pentru operațiuni practice cu modele analitice mari, datele fizice subiacente ale unui instrument OLAP trebuie configurate la orice subset de dimensiuni și în orice ordine. Metodele de acces fizic ar trebui, de asemenea, să se schimbe dinamic și să conțină Tipuri variate mecanisme precum: calcule directe, arbori B și derivate, hashing, capacitatea de a combina aceste mecanisme dacă este necesar. Sparsitatea (măsurată ca procent de celule goale la toate celulele posibile) este una dintre caracteristicile propagării datelor. Nereglementarea dispersității poate face ca eficiența operațională să nu fie atinsă. Dacă un instrument OLAP nu poate controla și reglementa distribuția valorilor datelor analizate, un model care se pretinde practic, bazat pe multe căi și dimensiuni de consolidare, poate fi în realitate inutil și fără speranță.
  8. Suport multi-utilizator. Adesea, mai mulți utilizatori analitici trebuie să lucreze în colaborare cu același model analitic sau să creeze modele diferite din aceleași date. Prin urmare, un instrument OLAP trebuie să ofere capabilități partajarea(interogare și completare), integritate și securitate.
  9. Operațiuni încrucișate nelimitate. Diferitele niveluri de acumulare și căi de consolidare, datorită naturii lor ierarhice, reprezintă relații dependente într-un model sau aplicație OLAP. Prin urmare, instrumentul în sine ar trebui să implice calculele corespunzătoare și să nu solicite utilizatorului analitic redefinirea acestor calcule și operațiuni. Calculele care nu rezultă din aceste relații moștenite necesită definirea prin formule diferite în funcție de limbajul aplicabil. Un astfel de limbaj poate permite calcule și manipulare a datelor de orice dimensiune și nu poate limita relațiile dintre celulele de date, indiferent de numărul de atribute comune de date ale celulelor specifice.
  10. Manipularea intuitivă a datelor. Reorientarea căilor de consolidare, detalierea, mărirea și alte manipulări reglementate de căile de consolidare ar trebui aplicate printr-un impact separat asupra celulelor modelului analitic și nu ar trebui să necesite utilizarea unui sistem de meniu sau a altor acțiuni multiple cu interfața cu utilizatorul. Vizualizarea utilizatorului-analist asupra dimensiunilor definite în modelul analitic trebuie să conțină toate informatie necesara pentru a efectua pașii de mai sus.
  11. Opțiuni flexibile de raportare. Analiza și prezentarea datelor este simplă atunci când rândurile, coloanele și celulele de date care vor fi comparate vizual sunt fie apropiate unele de altele, fie aranjate conform unor functie logica care are loc în întreprindere. Instrumentele de raportare trebuie să fie sintetizate date sau informații rezultate din modelul de date în orice orientare posibilă. Aceasta înseamnă că rândurile, coloanele sau paginile trebuie să arate între 0 și N dimensiuni simultan, unde N este numărul de dimensiuni din întregul model analitic. În plus, fiecare dimensiune de conținut afișată într-o singură postare, coloană sau pagină trebuie, de asemenea, să poată afișa orice subset de elemente (valori) conținute în dimensiune, în orice ordine.
  12. Dimensiune și număr nelimitat de niveluri de agregare. Un studiu privind numărul posibil de dimensiuni necesare necesare într-un model analitic a arătat că până la 19 dimensiuni pot fi utilizate simultan. Prin urmare, se recomandă cu tărie ca instrumentul analitic să fie capabil să furnizeze simultan cel puțin 15 dimensiuni și, de preferință, 20. Mai mult, fiecare dintre dimensiunile comune nu ar trebui să fie limitată în numărul de niveluri de agregare și căi de consolidare definite de utilizator de analist.

De fapt, dezvoltatorii de produse OLAP de astăzi respectă aceste reguli sau cel puțin se străduiesc să le respecte. Aceste reguli pot fi considerate baza teoretică a prelucrării analitice operaționale; este dificil de argumentat cu ele. Ulterior, din cele 12 reguli au fost trase multe corolare, pe care însă nu le vom cita, pentru a nu complica inutil narațiunea.

Să aruncăm o privire mai atentă asupra modului în care produsele OLAP diferă în implementarea lor fizică.

După cum sa menționat mai sus, OLAP se bazează pe ideea procesării datelor folosind structuri multidimensionale. Când spunem OLAP, ne referim la faptul că logic structura de date a produsului analitic este multidimensională. Cum exact acest lucru este implementat este o altă problemă. Există două tipuri principale de procesare analitică, care includ anumite produse.

MOLAP. De fapt, multidimensional (multidimensional) OLAP. Produsul se bazează pe o structură de date non-relațională care oferă stocare, procesare și prezentare multidimensională a datelor. În consecință, bazele de date sunt numite multidimensionale. Produsele din această clasă au de obicei un server de baze de date multidimensional. În timpul procesului de analiză, datele sunt selectate exclusiv dintr-o structură multidimensională. O astfel de structură este foarte productivă.

ROLAP. OLAP relațional. După cum sugerează și numele, structura multidimensională a acestor instrumente este implementată de tabele relaționale. Și datele din procesul de analiză, în consecință, sunt selectate din baza de date relațională printr-un instrument analitic.

Dezavantajele și avantajele fiecărei abordări sunt, în general, evidente. OLAP multidimensional oferă performanțe mai bune, dar structurile nu pot fi folosite pentru a procesa cantități mari de date deoarece dimensionalitatea ridicată va necesita resurse hardware mari, în timp ce raritatea hipercuburilor poate fi foarte mare și, prin urmare, utilizarea puterii hardware nu va fi justificată. Dimpotrivă, OLAP relațional oferă procesare pe matrice mari de date stocate, deoarece este posibil să se asigure o stocare mai economică, dar în același timp este semnificativ inferior OLAP-ului multidimensional în ceea ce privește viteza de operare. Raționament similar a dus la identificarea unei noi clase de instrumente analitice - HOLAP. Aceasta este o prelucrare analitică operațională hibridă. Instrumentele acestei clase vă permit să combinați ambele abordări - relaționale și multidimensionale. Accesul se poate face atât la datele de baze de date multidimensionale, cât și la datele relaționale.

Există un alt tip destul de exotic de procesare analitică operațională - DOLAP. Acesta este OLAP „desktop”. Vorbim despre astfel de procesări analitice în care hipercuburile sunt mici, dimensiunea lor este mică, nevoile sunt modeste, iar pentru o astfel de procesare analitică este suficientă o mașină personală pe un desktop.

Concluzie

Prelucrarea analitică operațională poate simplifica și accelera semnificativ procesul de pregătire și luare a deciziilor de către personalul de conducere. Prelucrarea analitică online are scopul de a transforma datele în informații. Este fundamental diferit de procesul tradițional de sprijinire a deciziilor, care se bazează cel mai adesea pe considerație rapoarte structurate. Prin analogie, diferența dintre rapoartele structurate și OLAP este aceeași ca între conducerea prin oraș cu tramvaiul și conducerea unei mașini personale. Când mergeți cu tramvaiul, acesta se mișcă pe șine, ceea ce nu vă permite să vedeți clar clădirile îndepărtate, cu atât mai puțin să vă apropiați de ele. Dimpotrivă, conducerea unei mașini personale vă oferă libertate totală de mișcare (desigur, trebuie să respectați regulile de circulație). Puteți ajunge cu mașina până la orice clădire și puteți ajunge în locuri unde tramvaiele nu merg.

Rapoartele structurate sunt șinele care împiedică libertatea în pregătirea deciziilor. OLAP este un vehicul pentru deplasarea eficientă de-a lungul autostrăzilor informaționale.

În plus față de acest articol, puteți consulta subiectele secțiunii curente:
în secțiunea „Enciclopedie”.
7 articoleîn secțiunea „Articole”.

După ce am înțeles ce este OLAP și care sunt proprietățile sale, să trecem, poate, la, problema importanta: Cui sunt destinate produsele software din această clasă?

După cum sa menționat deja, infrastructura informațională a companiei este de natură ierarhică și include nivelul de colectare a informațiilor primare (nivelul tranzacțional), nivelurile de stocare și marturi de date, nivelul OLAP și nivelul aplicațiilor analitice ale clienților. Astfel, sistemele OLAP ocupă un loc foarte specific în infrastructura informațională a companiei.

Adesea apare întrebarea: prin ce, din punctul de vedere al unui analist-utilizator, un sistem OLAP diferă de un depozit de date? Putem spune că principala diferență, din punctul de vedere al utilizatorului, între OLAP este structurarea informațiilor în concordanță cu esența subiectului acesteia (în special subiectul, nu tehnic). Lucrând cu o aplicație OLAP, analistul folosește termeni, categorii și indicatori financiari și economici familiari (tipuri de materiale și produse finite, regiuni de vânzări, volum de vânzări, cost, profit etc.) și pentru a forma orice, chiar și destul de interogare complexă, nu va trebui să învețe SQL. Și răspunsul la cerere va fi primit în doar câteva secunde. În plus, atunci când lucrează cu un sistem OLAP, un economist poate folosi instrumente familiare, cum ar fi foile de calcul sau prin mijloace speciale construirea rapoartelor.

Dacă un depozit de date este în principal obiectul atenției serviciilor IT, atunci OLAP este un instrument pentru analiștii specialiști „subiect”. În același timp, este posibil ca analiștii să nu fie conștienți de existența depozitului. Astfel, OLAP, fără exagerare, poate fi numit un instrument software din arsenalul economistului, deoarece economistul este cel care se ocupă de o varietate de sarcini analitice: analiza de marketing, analiza vânzărilor, analiza indicatorilor bugetului, analiza. situațiile financiareși multe altele.

Despre LAP - un instrument universal. Dar, în același timp, versatilitatea sa îl face să nu fie pe deplin potrivit pentru sarcini financiare și economice specifice care necesită utilizarea unor tehnici și principii organizaționale speciale. Prin urmare, aplicațiile OLAP nu pot servi ca o alternativă cu drepturi depline la aplicațiile analitice specializate, cum ar fi sistemele de bugetare sau consolidarea raportării financiare. Nu există nicio contradicție aici: un produs software care implementează principiile generale ale analizei economice nu poate pretinde că rezolvă absolut toate problemele particulare. Dar, pe de altă parte, combinația dintre OLAP și sisteme specializate este cea care oferă economistului cele mai mari avantaje, deoarece în acest caz funcțiile, metodele și algoritmii speciali sunt combinate cu succes cu universalitatea prelucrării datelor analitice.

Acesta este motivul pentru care instrumentele OLAP sunt adesea folosite de aplicațiile de analiză client pentru stocarea datelor multidimensionale. Aici utilizatorul folosește instrumentele familiare lui pentru a implementa anumite tehnici de management, dar datele pentru prelucrare și analiză sunt stocate în serverul OLAP. Un exemplu ilustrativ este Hyperion Planning - un sistem de bugetare, planificare și prognoză. Elementul său obligatoriu este o bază de date multidimensională, care este utilizată pentru a stoca informațiile care se schimbă cel mai dinamic (metadatele și alte informații statice sunt stocate într-o bază de date relațională).

Astfel, un sistem OLAP bine construit joacă un rol foarte important în viața unui economist, deoarece cu ajutorul lui puteți obține acces la cele mai recente informații și puteți efectua rapid proceduri analitice generale. Iar funcțiile financiare complexe și aspectele organizatorice necesare vor fi asigurate de sisteme specializate, din nou bazate pe date OLAP. După cum arată experiența companiilor de vârf (atât internaționale, cât și rusești), tehnologiile OLAP sunt rentabile, iar investițiile în astfel de soluții se plătesc destul de repede.

Conceptul de management al performanței în afaceri: începutul călătoriei Instrumente de interogare și raportare

După cum s-a menționat deja, instrumentele pentru generarea de interogări și crearea de rapoarte (Interogare și raportare au luat) oferă funcții pentru construirea de interogări către sistemele de informații și analitice, integrarea datelor din mai multe surse, vizualizarea datelor cu capacitatea de a detalia și rezuma, construirea și imprimarea completă. -rapoarte complete, inclusiv calitatea prezentării. Unele dintre produsele software din această clasă pot fi utilizate de utilizatorii finali, cu suport minim din partea departamentului IT, în timp ce altele necesită o anumită programare și sunt configurate de specialiști tehnici.

Reprezentanții tipici ai sistemelor din această clasă sunt produsele software de la Hyperion Corporation, unite în familia Hyperion Performance Suite.

Hyperion Performance Suite este un set de instrumente pentru interogare, analiză, raportare și livrare în cadrul unei organizații. Aceste produse software au devenit parte din linia de sisteme BI a Hyperion după ce Hyperion a achiziționat Brio Software în 2003, o companie bine cunoscută pe piața de business intelligence pentru soluțiile sale eficiente și ușor de utilizat. Înainte de aceasta, timp de câțiva ani, companiile Hyperion și Brio au lucrat îndeaproape ca parteneri tehnologici, astfel încât combinarea dezvoltărilor lor a făcut posibilă crearea unei linii unice în care soluțiile Hyperion (sistemul Hyperion Essbase OLAP și aplicațiile analitice - Hyperion Planning , Hyperion Financial Management și altele) au apărut completate organic de instrumente moderne de interogare și raportare Brio. Ca urmare, Hyperion a devenit proprietarul celei mai puternice și complete linii de produse software de Business Intelligence de pe piață. Astăzi, toate aceste soluții, apreciate de multe companii străine, au devenit disponibile întreprinderilor rusești.

Hyperion Performance Suite include două produse software- Hyperion Intelligence și Hyperion SQR.

Hyperion Intelligence este un sistem modern, ușor de utilizat pentru a genera interogări complexe diverse surse date, inclusiv ERP, CRM, sisteme bancare și alte sisteme tranzacționale, precum și pentru a prezenta aceste date într-o formă convenabilă pentru analiză. Prin valorificarea datelor stocate în sistemele informatice existente, Hyperion Intelligence le permite dezvoltatorilor, analiștilor și consumatorilor să transforme datele brute în informatie pretioasa pentru luarea deciziilor. Capacitățile analitice ale sistemului permit specialiștilor organizației să evalueze rapid oportunitățile și tendințele de afaceri și să crească valabilitatea deciziilor de management, iar interfața intuitivă cu utilizatorul, bazată pe tehnologiile Internet, pune informațiile la dispoziție oricărui utilizator autorizat.

Hyperion SQR oferă o soluție eficientă pentru gestionarea unor volume mari de rapoarte - de la mesaje relativ simple la rapoarte complexe, critice pentru afaceri. Hyperion SQR permite dezvoltatorilor să creeze rapoarte de prezentare de orice complexitate și apoi să livreze aceste rapoarte prin intermediul utilizatorilor finali din întreaga organizație. Prelucrare interogări complexe iar prin generarea de rapoarte vizuale pe baza acestora, Hyperion SQR transformă seturile de date în informații de afaceri, ceea ce vă permite să creșteți eficiența întregii organizații. Sistemul se concentrează pe lucrul cu raportare reglementată, generarea de rapoarte în conformitate cu un program dat și furnizarea de informații la timp angajaților, clienților, furnizorilor și partenerilor de afaceri. Lucrul cu rapoarte este foarte ușor: folosind browsere web familiare, utilizatorii pot vizualiza rapoarte, le pot imprima sau le pot trimite prin e-mail. e-mail V diverse formate. Sistemul oferă, de asemenea, capacitatea de a clasifica mesajele, controlul versiunilor și arhivarea, iar limbajul de programare încorporat de a treia generație vă permite să utilizați Hyperion SQR ca instrument pentru construirea de instrumente de extragere, transformare și încărcare a datelor.

Linia de soluții BI Hyperion, completată de instrumente de interogare și raportare moștenite de la Brio, este de interes atât pentru profesioniștii IT, cât și pentru utilizatorii finali.

Din punctul de vedere al utilizatorului final, acesta este un instrument convenabil care vă permite să rezolvați problema deja menționată cu care se confruntă atât de des managerii și experții în domeniu - problema unei „viziuni unice a informațiilor de management”. Să reamintim că această problemă este că de foarte multe ori informațiile de management necesare analizei și luării deciziilor sunt stocate în diferite surse - sisteme contabile, sisteme ERP, baze de date etc. Acest lucru face extrem de dificilă obținerea. informatie necesarași prezentarea acestuia într-o formă ușor de utilizat: specialiștii sunt nevoiți să petreacă timp procedurilor de rutină de colectare și prelucrare a datelor, cu riscul denaturarii. Informațiile de management obținute în acest mod adesea nu îndeplinesc cerințele de fiabilitate și relevanță, ceea ce îi reduce valoarea. În acest sens, soluțiile Hyperion BI pot simplifica și accelera semnificativ colectarea informațiilor, o pot unifica și o pot prezenta într-o formă convenabilă și vizuală. Astfel de informații reprezintă o bază de încredere pentru luarea deciziilor de management, în timp ce procedurile de rutină sunt reduse la minimum, iar timpul specialiștilor este eliberat pentru rezolvarea problemelor analitice.

Din punct de vedere IT, soluțiile Hyperion BI sunt scalabile, ușor de susținut și au limbaje încorporate care vă permit să extindeți funcționalitatea software-ului.

Scop munca de curs este studiul tehnologiei OLAP, conceptul implementării și structurii acesteia.

ÎN lumea modernă retele de calculatoare iar sistemele de calcul fac posibilă analiza și procesarea unor cantități mari de date.

O cantitate mare de informații complică foarte mult căutarea soluțiilor, dar face posibilă obținerea unor calcule și analize mult mai precise. Pentru a rezolva această problemă, există o întreagă clasă de sisteme informaționale care efectuează analize. Astfel de sisteme se numesc sisteme de suport pentru decizii (DSS) (Decision Support System).

Pentru a efectua analize, DSS trebuie să acumuleze informații, având mijloace pentru introducerea și stocarea acesteia. În total, putem distinge trei sarcini principale rezolvate în DSS:

· introducere a datelor;

· stocare a datelor;

· analiza datelor.

Introducerea datelor în DSS este efectuată automat de la senzori care caracterizează starea mediului sau a procesului, sau de către un operator uman.

Dacă introducerea datelor este efectuată automat de la senzori, atunci datele sunt acumulate printr-un semnal de pregătire care apare atunci când apar informații sau prin sondaj ciclic. Dacă introducerea este efectuată de o persoană, atunci aceasta trebuie să ofere utilizatorilor mijloace convenabile pentru introducerea datelor, verificarea corectitudinii introducerii, precum și efectuarea calculelor necesare.

La introducerea simultană a datelor de către mai mulți operatori, este necesar să se rezolve problemele de modificare și acces paralel al acelorași date.

DSS furnizează analistului date sub formă de rapoarte, tabele, grafice pentru studiu și analiză, motiv pentru care astfel de sisteme oferă funcții de suport decizional.

Subsistemele de introducere a datelor, numite OLTP (prelucrarea tranzacțiilor on-line), implementează procesarea operațională a datelor. Pentru implementarea acestora se folosesc sisteme convenționale de management al bazelor de date (DBMS).

Subsistemul de analiză poate fi construit pe baza:

· subsisteme de analiză de regăsire a informațiilor bazate pe SGBD relațional și utilizând interogări statice Limbajul SQL;

· subsisteme de analiză operaţională. Pentru implementarea unor astfel de subsisteme se utilizează tehnologia de prelucrare operațională a datelor analitice OLAP, folosind conceptul de reprezentare a datelor multidimensionale;

· subsisteme analiza predictivă. Acest subsistem implementează metode și algoritmi de DataMining.

Din punctul de vedere al utilizatorului, sistemele OLAP oferă un mijloc de vizualizare flexibilă a informațiilor în diferite secțiuni, primire automată date agregate, efectuarea de operatii analitice de convolutie, detaliere, comparare in timp. Datorită tuturor, sistemele OLAP sunt o soluție cu mari avantajeîn domeniul pregătirii datelor pentru toate tipurile de raportare de afaceri, implicând prezentarea datelor în diverse secțiuni și diferite niveluri de ierarhie, precum rapoarte de vânzări, diverse forme de bugete și altele. Sistemele OLAP au mari avantaje ale unei astfel de reprezentări în alte forme de analiză a datelor, inclusiv în prognoză.

1.2 Definiție OLAP -sisteme

Tehnologia pentru analiza complexă a datelor multidimensionale se numește OLAP. OLAP este o componentă cheie a unei organizații de depozit de date.

Funcționalitatea OLAP poate fi implementată în diverse moduri, atât simple, precum analiza datelor în aplicații de birou, cât și mai complexe - sisteme analitice distribuite bazate pe produse server.

OLAP (On-LineAnalyticalProcessing) este o tehnologie pentru prelucrarea operațională a datelor analitice care utilizează instrumente și metode pentru colectarea, stocarea și analiza datelor multidimensionale pentru a sprijini procesele de luare a deciziilor.

Scopul principal al sistemelor OLAP este de a sprijini activitățile analitice și interogările arbitrare ale analiștilor utilizatori. Scopul analizei OLAP este de a testa ipotezele emergente.