Konfiguracja sprzętu i oprogramowania

Kostki Excel olap w wersji laboratoryjnej. Kostki danych OLAP

W standardowej tabeli przestawnej dane źródłowe są przechowywane na lokalnym dysku twardym. W ten sposób zawsze możesz nimi zarządzać i reorganizować, nawet jeśli nie masz dostępu do sieci. Ale to w żaden sposób nie dotyczy tabel przestawnych OLAP. W tabelach przestawnych OLAP pamięć podręczna nigdy nie jest przechowywana na lokalnym dysku twardym. Dlatego natychmiast po odłączeniu od lokalna sieć Twoja tabela przestawna zawiedzie. Nie będzie można w nim przesuwać żadnego z pól.

Jeśli nadal musisz analizować dane OLAP po przejściu do trybu offline, utwórz moduł danych offline. Moduł danych offline to oddzielny plik, który jest pamięcią podręczną tabeli przestawnej i przechowuje dane OLAP, które są wyświetlane po odłączeniu od sieci lokalnej. Dane OLAP skopiowane do tabeli przestawnej można wydrukować, strona http://everest.ua opisuje to szczegółowo.

Aby utworzyć autonomiczną kostkę danych, najpierw utwórz tabelę przestawną OLAP. Umieść kursor w tabeli przestawnej i kliknij przycisk Narzędzia OLAP na karcie kontekstowej Narzędzia, która jest częścią grupy kart kontekstowych Narzędzia tabel przestawnych. Wybierz drużynę Tryb offline OLAP (Offline OLAP) (ryc. 9.8).

Zostanie wyświetlone okno dialogowe Ustawienia modułu danych OLAP w trybie offline. Kliknij przycisk Utwórz plik danych offline. Uruchomiono Kreator tworzenia pliku modułu danych. Kliknij przycisk Dalej, aby kontynuować procedurę.

Najpierw musisz określić wymiary i poziomy, które zostaną uwzględnione w kostce danych. W oknie dialogowym należy wybrać dane, które zostaną zaimportowane z bazy danych OLAP. Chodzi o to, aby określić tylko te wymiary, które będą potrzebne po odłączeniu komputera od sieci lokalnej. Im więcej określisz wymiarów, tym większy będzie moduł danych offline.

Kliknij przycisk Dalej, aby przejść do następnego Okno dialogowe mistrzowie. Daje możliwość określenia członków lub elementów danych, które nie zostaną uwzględnione w kostce. W szczególności nie będziesz potrzebować miary Internet Sales-Extended Amount, więc nie będzie ona zaznaczona na liście. Wyczyszczone pole wyboru wskazuje, że określony element nie zostanie zaimportowany i zajmie dodatkowe miejsce na lokalnym dysku twardym.

W ostatnim kroku określ lokalizację i nazwę kostki danych. W naszym przypadku plik kostki będzie miał nazwę MyOfflineCube.cub i będzie znajdować się w folderze Praca.

Pliki kostki danych mają rozszerzenie .młode

Po chwili program Excel zapisuje moduł danych offline w określonym folderze. Aby to przetestować, kliknij dwukrotnie plik, co automatycznie wygeneruje skoroszyt programu Excel zawierający tabelę przestawną powiązaną z wybraną kostką danych. Po utworzeniu kostkę danych offline można dystrybuować do wszystkich zainteresowanych użytkowników, którzy pracują w trybie offline sieci LAN.

Po połączeniu z siecią lokalną możesz otworzyć plik modułu danych offline i zaktualizować go, a także odpowiednią tabelę danych. Główną zasadą jest to, że kostka danych offline jest używana tylko do pracy, gdy sieć lokalna jest odłączona, ale jest obowiązkowa aktualizacja po przywróceniu połączenia. Próba aktualizacji modułu danych offline po zerwaniu połączenia zakończy się niepowodzeniem.

Adnotacja: Wykład obejmuje podstawy projektowania kostek danych dla hurtowni danych OLAP. Przykład pokazuje, jak zbudować kostkę danych za pomocą narzędzia CASE.

Cel wykładu

Po przestudiowaniu materiału tego wykładu dowiesz się:

  • co to jest kostka danych? Hurtownia danych OLAP ;
  • jak zaprojektować kostkę danych dla Hurtownie danych OLAP ;
  • co to jest wymiar kostki danych ;
  • jak fakt jest powiązany z kostką danych;
  • czym są atrybuty wymiarów ;
  • czym jest hierarchia;
  • co to jest metryka kostki danych;

i dowiedz się:

  • zbudować wykresy wielowymiarowe ;
  • projekt prosty wykresy wielowymiarowe.

Wstęp

Technologia OLAP nie jest samodzielna oprogramowanie, nie język programowania. Jeśli spróbujesz objąć OLAP we wszystkich jego przejawach, to jest to zestaw pojęć, zasad i wymagań, które leżą u podstaw produkty oprogramowania, co ułatwia analitykom dostęp do danych.

Analitycy są głównymi odbiorcami informacji korporacyjnych. Zadaniem analityka jest znajdowanie wzorców w dużych zbiorach danych. Dlatego analityk nie zwróci uwagi na fakt, że pewnego dnia kupującemu Iwanowowi została sprzedana partia długopisów - potrzebuje informacji o setkach i tysiącach podobnych wydarzeń. Pojedyncze fakty w hurtowni danych mogą zainteresować np. księgowego lub kierownika działu handlowego, którego kompetencją jest obsługa konkretnego kontraktu. Analitykowi nie wystarczy jeden rekord – może potrzebować np. informacji o wszystkich umowach punktów sprzedaży na miesiąc, kwartał czy rok. Analytics może nie być zainteresowany NIP lub numerem telefonu kupującego - pracuje z określonymi danymi liczbowymi, które są esencją jego aktywności zawodowej.

Centralizacja i wygodna strukturyzacja to nie wszystko, czego potrzebuje analityk. Potrzebuje narzędzia do przeglądania, wizualizacji informacji. Tradycyjne raporty, nawet budowane w oparciu o pojedynczą hurtownię danych, pozbawione są jednak pewnej elastyczności. Nie można ich „skręcać”, „rozwijać” ani „zwijać”, aby uzyskać pożądany widok danych. Im więcej „kawałków” i „kawałków” danych może eksplorować analityk, tym więcej ma pomysłów, które z kolei wymagają coraz większej liczby „plastrów” do weryfikacji. Jako takie narzędzie do eksploracji danych analitykiem jest OLAP.

Chociaż OLAP nie jest niezbędnym atrybutem hurtowni danych, jest coraz częściej wykorzystywany do analizy informacji zgromadzonych w tej hurtowni danych.

Dane operacyjne są zbierane z różnych źródeł, czyszczone, integrowane i dodawane do hurtowni danych. Jednocześnie są już dostępne do analizy za pomocą różnych narzędzi raportowania. Następnie dane (w całości lub w części) są przygotowywane do analizy OLAP. Można je załadować do specjalnej bazy danych OLAP lub pozostawić w relacyjnej hurtowni danych. Najważniejszym elementem korzystania z OLAP są metadane, czyli informacje o strukturze, lokalizacji i transformacja danych. Dzięki nim zapewnione jest efektywne współdziałanie różnych elementów składowych.

W ten sposób, OLAP można zdefiniować jako zestaw narzędzi do wielowymiarowej analizy danych zgromadzonych w hurtowni danych. Teoretycznie narzędzia OLAP można zastosować bezpośrednio do danych operacyjnych lub dokładne kopie. Istnieje jednak ryzyko poddania analizie danych, które nie nadają się do tej analizy.

OLAP na kliencie i serwerze

Sercem OLAP jest wielowymiarowa analiza danych. Można go wytwarzać przy użyciu różnych narzędzi, które można warunkowo podzielić na klienckie i serwerowe narzędzia OLAP.

Narzędzia OLAP po stronie klienta to aplikacje, które obliczają i wyświetlają zagregowane dane (sumy, średnie, maksima lub minima), a same zagregowane dane są buforowane w przestrzeni adresowej narzędzia OLAP.

Jeśli dane źródłowe są zawarte w desktopowym DBMS, dane zagregowane są obliczane przez samo narzędzie OLAP. Jeśli źródłem początkowych danych jest serwer DBMS, wiele narzędzi klienckich OLAP wysyła zapytania SQL zawierające klauzulę GROUP BY do serwera iw rezultacie otrzymuje zagregowane dane obliczone na serwerze.

Z reguły funkcjonalność OLAP jest implementowana w narzędziach statystycznego przetwarzania danych (od produktów tej klasy do Rynek rosyjski Produkty Stat Soft i SPSS są szeroko rozpowszechnione), a w niektórych arkusze kalkulacyjne. W szczególności Microsoft Excel 2000. Za pomocą tego produktu można utworzyć i zapisać jako plik małą lokalną wielowymiarową kostkę OLAP i wyświetlić jej dwu- lub trójwymiarowe sekcje.

Wiele narzędzia programistyczne zawierają biblioteki klas lub komponentów, które pozwalają na tworzenie aplikacji implementujących najprostszą funkcjonalność OLAP (np. komponenty Decision Cube w Borland Delphi i Borland C++Builder). Ponadto wiele firm oferuje sterownica ActiveX i inne biblioteki, które implementują podobną funkcjonalność.

Należy pamiętać, że klienckie narzędzia OLAP są używane z reguły z niewielką liczbą wymiarów (zwykle zaleca się nie więcej niż sześć) i małą różnorodnością wartości dla tych parametrów – w końcu otrzymane dane zbiorcze muszą mieścić się w przestrzeni adresowej takiego narzędzia, a ich liczba rośnie wykładniczo wraz ze wzrostem liczby pomiarów. Dlatego nawet najbardziej prymitywne klienckie narzędzia OLAP z reguły pozwalają dokonać wstępnej kalkulacji wymaganej ilości pamięć o dostępie swobodnym stworzyć w nim wielowymiarową kostkę.

Wiele (ale nie wszystkie) narzędzi OLAP po stronie klienta umożliwia przechowywanie zawartości zagregowanej pamięci podręcznej danych w postaci pliku, co z kolei uniemożliwia ich ponowne obliczenie. Należy pamiętać, że ta możliwość jest często wykorzystywana do oddzielania zagregowanych danych w celu przeniesienia ich do innych organizacji lub do publikacji. Typowym przykładem takich wyalienowanych danych zagregowanych są statystyki zachorowalności w różnych regionach iw różnych grupach wiekowych, które są informacjami publicznymi publikowanymi przez ministerstwa zdrowia różnych krajów oraz Światową Organizację Zdrowia. Jednocześnie same dane pierwotne, czyli informacje o konkretnych przypadkach zachorowań, są danymi poufnymi placówek medycznych i w żadnym wypadku nie powinny trafić w ręce towarzystw ubezpieczeniowych, nie mówiąc już o upublicznieniu.

Pomysł przechowywania cache danych zagregowanych w pliku został dalej rozwinięty w narzędziach OLAP po stronie serwera, w których przechowywanie i modyfikacja danych zagregowanych, a także utrzymanie magazynu je zawierającego, realizowane są przez oddzielna aplikacja lub proces zwany serwerem OLAP. Aplikacje klienckie mogą żądać takiego wielowymiarowego przechowywania i otrzymywać w odpowiedzi pewne dane. Niektóre aplikacje klienckie mogą również tworzyć takie sklepy lub aktualizować je zgodnie ze zmienionymi danymi źródłowymi.

Zalety korzystania z serwerowych narzędzi OLAP w porównaniu z klienckimi narzędziami OLAP są podobne do zalet korzystania z serwerowego DBMS w porównaniu z desktopowymi: w przypadku korzystania z narzędzi serwerowych obliczanie i przechowywanie zagregowanych danych odbywa się na serwerze i aplikacji klienckiej otrzymuje tylko wyniki kierowanych do nich zapytań, co pozwala ogólnie ograniczyć ruch w sieci, czas realizacjiżądania i wymagania dotyczące zasobów zużywane przez aplikację kliencką. Należy zauważyć, że narzędzia analityczne i przetwarzanie danych w skali przedsiębiorstwa z reguły opierają się właśnie na serwerowych narzędziach OLAP, na przykład takich jak Oracle Express Server, Microsoft SQL Server 2000 Analysis Services, Hyperion Essbase, Crystal Decisions, Business Objects, Cognos, produkty SAS Institute. Ponieważ wszyscy wiodący producenci serwerowych DBMS produkują (lub posiadają licencje od innych firm) określone serwerowe narzędzia OLAP, ich wybór jest dość szeroki i prawie we wszystkich przypadkach można kupić serwer OLAP od tego samego producenta, co sam serwer bazy danych.

Należy zauważyć, że wiele narzędzi klienckich OLAP (w szczególności Microsoft Excel 2003, Seagate Analysis itp.) umożliwia dostęp do magazynów OLAP serwera, działając w tym przypadku jako aplikacje klienckie, które wykonują podobne prośby. Ponadto istnieje wiele produktów będących aplikacjami klienckimi dla narzędzi OLAP różnych producentów.

Techniczne aspekty wielowymiarowego przechowywania danych

Wielowymiarowe hurtownie danych zawierają zagregowane dane o różnym stopniu szczegółowości, np. wielkości sprzedaży według dnia, miesiąca, roku, kategorii produktów itp. Celem przechowywania zagregowanych danych jest zmniejszenie czas realizacji prośby, ponieważ w większości przypadków do analiz i prognoz nie są to dane szczegółowe, ale dane zbiorcze, które są interesujące. Dlatego podczas tworzenia wielowymiarowej bazy danych niektóre dane zagregowane są zawsze obliczane i przechowywane.

Pamiętaj, że zapisywanie wszystkich danych zbiorczych nie zawsze jest uzasadnione. Faktem jest, że przy dodawaniu nowych wymiarów ilość danych składających się na kostkę rośnie wykładniczo (czasami mówią o „wybuchowym wzroście” ilości danych). Dokładniej, wielkość przyrostu zagregowanych danych zależy od liczby wymiarów w kostce i elementów członkowskich wymiarów na różnych poziomach hierarchii tych wymiarów. Aby rozwiązać problem „wybuchowego wzrostu”, stosuje się różne schematy, które pozwalają, przy obliczaniu daleko od wszystkich możliwych danych zagregowanych, osiągnąć akceptowalną szybkość wykonywania zapytań.

Zarówno dane źródłowe, jak i zagregowane mogą być przechowywane w strukturach relacyjnych lub wielowymiarowych. Dlatego obecnie istnieją trzy sposoby przechowywania danych.

  • MOLAP(Wielowymiarowy OLAP) - dane źródłowe i zbiorcze przechowywane są w wielowymiarowej bazie danych. Przechowywanie danych w strukturach wielowymiarowych pozwala na manipulowanie danymi jak wielowymiarową tablicą, dzięki czemu szybkość obliczania wartości zagregowanych jest taka sama dla każdego z wymiarów. Jednak w tym przypadku wielowymiarowa baza danych jest nadmiarowa, ponieważ wielowymiarowe dane całkowicie zawierają oryginalne dane relacyjne.
  • ROLAP(Relational OLAP) — oryginalne dane pozostają w tej samej relacyjnej bazie danych, w której pierwotnie się znajdowały. Zagregowane dane umieszczane są w tabelach serwisowych specjalnie stworzonych do ich przechowywania w tej samej bazie danych.
  • HOLAP(Hybrydowy OLAP) — oryginalne dane pozostają w tej samej relacyjnej bazie danych, w której pierwotnie się znajdowały, podczas gdy dane zagregowane są przechowywane w wielowymiarowej bazie danych.

Niektóre narzędzia OLAP obsługują przechowywanie danych tylko w strukturach relacyjnych, inne - tylko w strukturach wielowymiarowych. Jednak większość nowoczesnych narzędzi serwerowych OLAP obsługuje wszystkie trzy metody przechowywania danych. Wybór metody przechowywania zależy od wielkości i struktury danych źródłowych, wymagań dotyczących szybkości wykonywania zapytań oraz częstotliwości aktualizacji kostek OLAP.

Zauważamy również, że zdecydowana większość nowoczesnych narzędzi OLAP nie przechowuje wartości „pustych” (przykładem wartości „pustej” byłby brak sprzedaży towarów sezonowych poza sezonem).

Podstawowe koncepcje OLAP

Test FAMSI

Technologia złożonej wielowymiarowej analizy danych nosi nazwę OLAP (On-Line Analytical Processing). OLAP jest kluczowym elementem organizacji hurtowni danych. Koncepcja OLAP została opisana w 1993 roku przez Edgara Codda, znanego badacza baz danych i autora relacyjnego modelu danych. W 1995 roku, na podstawie wymagań stawianych przez Codda, tzw Test FASMI(Fast Analysis of Shared Multidimensional Information) - szybka analiza udostępnionych informacji wielowymiarowych z uwzględnieniem następujących wymagań dla aplikacji do analizy wielowymiarowej:

  • Szybko(Szybko) - dostarczanie użytkownikowi wyników analizy w rozsądnym czasie (zwykle nie dłuższym niż 5 s), nawet kosztem mniej szczegółowej analizy;
  • Analiza(Analiza) – możliwość realizacji dowolnych logicznych i Analiza statystyczna, Charakterystyka ta aplikacja, oraz jej zachowanie w postaci dostępnej dla użytkownika końcowego;
  • wspólny(Shared) - wieloużytkownikowy dostęp do danych z obsługą odpowiednich mechanizmów blokujących i autoryzowanych narzędzi dostępu;
  • Wielowymiarowy(Wielowymiarowy) — wielowymiarowa koncepcyjna reprezentacja danych, w tym pełne wsparcie dla hierarchii i wielu hierarchii (jest to kluczowe wymaganie OLAP);
  • Informacja(Informacje) - aplikacja musi mieć dostęp do dowolnych niezbędne informacje, niezależnie od jego objętości i miejsca przechowywania.

Należy zauważyć, że funkcjonalność OLAP można wdrażać na różne sposoby, od najprostszych narzędzi do analizy danych w aplikacjach biurowych po rozproszone systemy analityczne oparte na produktach serwerowych.

Wielowymiarowa reprezentacja informacji

Kuba

OLAP zapewnia wygodny, szybki sposób uzyskiwania dostępu, przeglądania i analizowania informacji biznesowych. Użytkownik otrzymuje naturalny, intuicyjny model danych, organizując je w postaci wielowymiarowych kostek (Cubes). Osie wielowymiarowego układu współrzędnych są głównymi atrybutami analizowanego procesu biznesowego. Na przykład w przypadku sprzedaży może to być produkt, region, typ nabywcy. Czas jest używany jako jeden z pomiarów. Na przecięciach osi pomiarów (Wymiary) znajdują się dane ilościowo charakteryzujące proces - miary (Miary). Mogą to być wielkości sprzedaży w sztukach lub w wartościach pieniężnych, stany magazynowe, koszty itp. Użytkownik analizując informacje może „pociąć” kostkę w różnych kierunkach, uzyskać podsumowanie (na przykład z podziałem na lata) lub odwrotnie, szczegółowe (co tydzień) informacji i wykonywać inne manipulacje, które przyjdą mu do głowy w procesie analizy.

Jak środki w trójwymiarowej kostce pokazanej na ryc. 26.1, kwoty sprzedaży są używane, a czas, produkt i sklep są używane jako miary. Pomiary są prezentowane na określonych poziomach grupowania: produkty są pogrupowane według kategorii, sklepy pogrupowane są według kraju, a czasy transakcji pogrupowane są według miesięcy. Nieco później przyjrzymy się bardziej szczegółowo poziomom grupowania (hierarchiom).


Ryż. 26.1.

„Cięcie” kostki

Nawet trójwymiarowa kostka jest trudna do wyświetlenia na ekranie komputera, aby można było zobaczyć wartości interesujących nas miar. Co możemy powiedzieć o kostkach o więcej niż trzech wymiarach. Aby zwizualizować dane przechowywane w kostce, z reguły stosuje się zwykłe dwuwymiarowe, tj. Reprezentacje tabelaryczne, które mają złożone hierarchiczne nagłówki wierszy i kolumn.

Dwuwymiarową reprezentację sześcianu można uzyskać, „przecinając” go wzdłuż jednej lub więcej osi (wymiarów): ustalamy wartości wszystkich wymiarów z wyjątkiem dwóch - i otrzymujemy normalną dwuwymiarową tabelę. Oś pozioma tabeli (nagłówki kolumn) reprezentuje jeden wymiar, oś pionowa (nagłówki wierszy) reprezentuje inny wymiar, a komórki tabeli reprezentują wartości miary. Jednocześnie zestaw miar jest faktycznie uważany za jeden z wymiarów: albo wybieramy wyświetlanie jednej miary (a następnie możemy umieścić dwa wymiary w nagłówkach wierszy i kolumn), albo pokazujemy kilka miar (a następnie jedną z osi tabeli zajmą nazwy miar, a druga - wartości pojedynczego wymiaru „nieokrojonego”.

(poziomy). Na przykład etykiety prezentowane na nie są obsługiwane przez wszystkie narzędzia OLAP. Na przykład oba typy hierarchii są obsługiwane w Microsoft Analysis Services 2000, podczas gdy tylko zrównoważone są obsługiwane w Microsoft OLAP Services 7.0. W różnych narzędziach OLAP może różnić się liczba poziomów hierarchii, maksymalna dozwolona liczba członków jednego poziomu oraz maksymalna możliwa liczba samych wymiarów.

Architektura aplikacji OLAP

Wszystko, co zostało powiedziane powyżej o OLAP, dotyczyło w istocie wielowymiarowej prezentacji danych. Z grubsza mówiąc, ani użytkownik końcowy, ani twórcy narzędzia, z którego korzysta klient, nie dbają o sposób przechowywania danych.

Wielowymiarowość w aplikacjach OLAP można podzielić na trzy poziomy.

  • Wielowymiarowa reprezentacja danych - narzędzia użytkownika końcowego, które zapewniają wielowymiarową wizualizację i manipulację danymi; wielowymiarowa warstwa reprezentacji abstrahuje od fizycznej struktury danych i traktuje je jako wielowymiarowe.
  • Przetwarzanie wielowymiarowe - narzędzie (język) do formułowania zapytań wielowymiarowych (tradycyjny relacyjny język SQL nie nadaje się tutaj) oraz procesor, który może przetworzyć i wykonać takie zapytanie.
  • Pamięć wielowymiarowa - środki fizycznej organizacji danych, które zapewniają sprawną realizację zapytań wielowymiarowych.

Pierwsze dwa poziomy są obowiązkowe we wszystkich narzędziach OLAP. Trzeci poziom, chociaż szeroko stosowany, nie jest wymagany, ponieważ dane do reprezentacji wielowymiarowej można również pobrać ze zwykłych struktur relacyjnych; wielowymiarowy procesor zapytań w tym przypadku tłumaczy zapytania wielowymiarowe na zapytania SQL, które są wykonywane relacyjny DBMS.

Określone produkty OLAP to zazwyczaj wielowymiarowe narzędzie do prezentacji danych (klient OLAP — taki jak tabele przestawne w programie Excel 2000 firmy Microsoft lub ProClarity firmy Knosys) lub wielowymiarowy system DBMS zaplecza (serwer OLAP — taki jak Oracle Express Server lub Microsoft OLAP Services).

Warstwa przetwarzania wielowymiarowego jest zwykle wbudowana w klienta OLAP i/lub serwer OLAP, ale można ją odizolować w najczystszej postaci, na przykład w ramach składnika Pivot Table Service firmy Microsoft.

Czym jest dziś OLAP w ogóle, wie każdy specjalista. Przynajmniej pojęcia „OLAP” i „dane wielowymiarowe” są mocno powiązane w naszych umysłach. Niemniej jednak fakt, że ten temat jest ponownie poruszany, mam nadzieję, zyska aprobatę większości czytelników, ponieważ aby pomysł nie stał się z czasem przestarzały, trzeba okresowo komunikować się z mądrzy ludzie lub przeczytaj artykuły w dobrej publikacji...

Hurtownie danych (miejsce OLAP w struktura informacji przedsiębiorstw)

Termin „OLAP” jest nierozerwalnie związany z terminem „hurtownia danych” (Hurtownia Danych).

Oto definicja sformułowana przez „ojca założyciela” hurtowni danych, Billa Inmona: „Hurtownia danych to specyficzny dla danej domeny, ograniczony czasowo i niezmienny zbiór danych wspierających proces podejmowania decyzji zarządczych”.

Dane w magazynie pochodzą z systemów operacyjnych (systemów OLTP), które mają na celu automatyzację procesów biznesowych. Dodatkowo repozytorium może być uzupełniane ze źródeł zewnętrznych, takich jak raporty statystyczne.

Po co budować hurtownie danych – wszak zawierają one oczywiście zbędne informacje, które już „mieszkają” w bazach danych czy plikach systemów operacyjnych? Odpowiedź może być krótka: bezpośrednia analiza danych systemów operacyjnych jest niemożliwa lub bardzo trudna. Wynika to z różnych przyczyn, w tym z fragmentacji danych, przechowywania ich w różnych formatach DBMS i w różnych „rogach” sieć korporacyjna. Ale nawet jeśli wszystkie dane w przedsiębiorstwie są przechowywane na centralnym serwerze bazodanowym (co jest niezwykle rzadkie), analityk prawie na pewno nie zrozumie ich złożonej, czasem mylącej struktury. Autor ma dość smutne doświadczenie, próbując „nakarmić” głodnych analityków „surowymi” danymi z systemów operacyjnych – okazało się to dla nich za trudne.

Tym samym zadaniem repozytorium jest dostarczenie „surowców” do analizy w jednym miejscu i w prostej, zrozumiałej strukturze. Ralph Kimball w przedmowie do swojej książki „The Data Warehouse Toolkit” pisze, że jeśli po przeczytaniu całej książki czytelnik zrozumie tylko jedną rzecz, a mianowicie, że struktura hurtowni powinna być prosta, autor rozważy swoje zadanie zakończony.

Jest jeszcze jeden powód, który uzasadnia pojawienie się osobnego magazynu – złożone zapytania analityczne o informacje operacyjne spowalniają bieżącą pracę firmy, blokując na długi czas tabele i zabierając zasoby serwerowe.

Moim zdaniem przechowywanie niekoniecznie jest gigantyczną akumulacją danych - najważniejsze jest to, że jest wygodne do analizy. Ogólnie rzecz biorąc, dla małych magazynów przeznaczony jest osobny termin - Data Marts (kioski danych), ale w naszej rosyjskiej praktyce rzadko go słyszysz.

OLAP- poręczne narzędzie analiza

Centralizacja i wygodna strukturyzacja to nie wszystko, czego potrzebuje analityk. W końcu wciąż potrzebuje narzędzia do przeglądania, wizualizacji informacji. Tradycyjne raporty, nawet te oparte na pojedyncze repozytorium, pozbawiony jednego - elastyczności. Nie można ich „skręcać”, „rozwijać” ani „zwijać”, aby uzyskać pożądany widok danych. Oczywiście można zadzwonić do programisty (jeśli chce przyjechać), a on (jeśli nie jest zajęty) dość szybko zgłosi nowy raport - powiedzmy w ciągu godziny (piszę i sam w to nie wierzę - w życiu nie dzieje się to tak szybko, dajmy mu trzy godziny) . Okazuje się, że analityk może sprawdzić nie więcej niż dwa pomysły dziennie. A on (jeśli jest dobrym analitykiem) może wymyślić kilka takich pomysłów na godzinę. A im więcej „plastrów” i „kawałków” danych widzi analityk, tym więcej ma pomysłów, które z kolei wymagają coraz to nowych „plastrów” do weryfikacji. Szkoda, że ​​nie ma takiego narzędzia, które pozwoliłoby mu w prosty i wygodny sposób rozwijać i zwijać dane! OLAP jest jednym z takich narzędzi.

Chociaż OLAP nie jest niezbędnym atrybutem hurtowni danych, jest coraz częściej wykorzystywany do analizy informacji zgromadzonych w tej hurtowni danych.

Komponenty wchodzące w skład typowego magazynu pokazano na ryc. jeden.

Ryż. 1. Struktura hurtowni danych

Dane operacyjne są zbierane z różnych źródeł, czyszczone, integrowane i umieszczane w magazynie relacyjnym. Jednocześnie są już dostępne do analizy za pomocą różnych narzędzi raportowania. Następnie dane (w całości lub w części) są przygotowywane do analizy OLAP. Można je załadować do specjalnej bazy danych OLAP lub pozostawić w magazynie relacyjnym. Jej najważniejszym elementem są metadane, czyli informacje o strukturze, rozmieszczeniu i transformacji danych. Dzięki nim zapewnione jest efektywne współdziałanie różnych elementów składowych.

Podsumowując, możemy zdefiniować OLAP jako zestaw narzędzi do wielowymiarowej analizy danych zgromadzonych w hurtowni. Teoretycznie narzędzia OLAP można zastosować bezpośrednio do danych operacyjnych lub ich dokładnych kopii (aby nie przeszkadzać użytkownikom operacyjnym). Ale robiąc to, narażamy się na ryzyko nadepnięcia na opisaną powyżej prowizję, tj. rozpoczęcia analizy danych operacyjnych, które nie nadają się bezpośrednio do analizy.

Definicja i podstawowe pojęcia OLAP

Na początek rozszyfrujmy: OLAP to Online Analytical Processing, czyli analiza danych online. 12 zasad definiujących OLAP zostało sformułowanych w 1993 roku przez E. F. Codda, „wynalazcę” relacyjnych baz danych. Później jego definicja została przerobiona na tzw. test FASMI, który wymaga aplikacji OLAP, aby zapewnić możliwość szybkiej analizy udostępnianych wielowymiarowych informacji ().

Test FASMI

Szybko(Szybko) – analiza powinna być przeprowadzona równie szybko we wszystkich aspektach informacji. Dopuszczalny czas odpowiedzi to 5 sekund lub mniej.

Analiza(Analiza) - Powinna istnieć możliwość wykonywania podstawowych rodzajów analiz numerycznych i statystycznych, predefiniowanych przez programistę aplikacji lub dowolnie zdefiniowanych przez użytkownika.

wspólny(Udostępnione) — wielu użytkowników musi mieć dostęp do danych, a dostęp do poufnych informacji musi być kontrolowany.

Wielowymiarowy(Wielowymiarowa) jest główną, najistotniejszą cechą OLAP.

Informacja(Informacje) - aplikacja musi mieć dostęp do wszelkich niezbędnych informacji, niezależnie od ich objętości i miejsca przechowywania.

OLAP = widok wielowymiarowy = sześcian

OLAP zapewnia wygodny, szybki sposób uzyskiwania dostępu, przeglądania i analizowania informacji biznesowych. Użytkownik otrzymuje naturalny, intuicyjny model danych, porządkując je w postaci wielowymiarowych kostek (Cubes). Osie wielowymiarowego układu współrzędnych są głównymi atrybutami analizowanego procesu biznesowego. Na przykład w przypadku sprzedaży może to być produkt, region, typ nabywcy. Czas jest używany jako jeden z pomiarów. Na przecięciach osi - pomiary (Wymiary) - znajdują się dane ilościowo charakteryzujące proces - pomiary (Miary). Mogą to być wielkości sprzedaży w sztukach lub w wartościach pieniężnych, stany magazynowe, koszty itp. Użytkownik analizując informacje może „pociąć” kostkę w różnych kierunkach, uzyskać podsumowanie (na przykład z podziałem na lata) lub odwrotnie, szczegółowe (co tydzień) informacji i wykonywać inne manipulacje, które przyjdą mu do głowy w procesie analizy.

Jak środki w trójwymiarowej kostce pokazanej na ryc. 2, używane są kwoty sprzedaży, a czas, produkt i sklep są używane jako miary. Pomiary są prezentowane na określonych poziomach grupowania: produkty są pogrupowane według kategorii, sklepy pogrupowane są według kraju, a czasy transakcji pogrupowane są według miesięcy. Nieco później omówimy bardziej szczegółowo poziomy grupowania (hierarchii).


Ryż. 2. Przykład kostki

„Cięcie” kostki

Nawet trójwymiarowa kostka jest trudna do wyświetlenia na ekranie komputera, aby można było zobaczyć wartości interesujących nas miar. Co możemy powiedzieć o kostkach o więcej niż trzech wymiarach? Do wizualizacji danych przechowywanych w kostce stosuje się z reguły zwykłe dwuwymiarowe, tj. tabelaryczne widoki, które mają złożone hierarchiczne nagłówki wierszy i kolumn.

Dwuwymiarową reprezentację sześcianu można uzyskać, „przecinając” go wzdłuż jednej lub więcej osi (wymiarów): ustalamy wartości wszystkich wymiarów, z wyjątkiem dwóch, i otrzymujemy normalną dwuwymiarową tabelę . Oś pozioma tabeli (nagłówki kolumn) reprezentuje jeden wymiar, oś pionowa (nagłówki wierszy) reprezentuje inny wymiar, a komórki tabeli reprezentują wartości miary. W tym przypadku zestaw miar jest faktycznie uważany za jeden z wymiarów — albo wybieramy jedną miarę do wyświetlenia (a następnie możemy umieścić dwa wymiary w nagłówkach wierszy i kolumn), albo pokazujemy kilka miar (a potem jedną osi tabeli zajmą nazwy miar, a druga wartość pojedynczego wymiaru „nieokrojonego”.

Spójrz na ryc. 3 - tutaj jest dwuwymiarowy wycinek kostki dla jednej miary - Unit Sales (sprzedane sztuki) i dwóch "uncut" wymiarów - Store (Sklep) i Time (Time).


Ryż. 3. Dwuwymiarowy kawałek sześcianu dla jednej miary

Na ryc. 4 pokazuje tylko jeden „nieokrojony” wymiar — Sklep, ale wyświetla wartości kilku miar — Sprzedaż jednostkowa (sprzedane sztuki), Sprzedaż w sklepie (kwota sprzedaży) i Koszt w sklepie (wydatki w sklepie).


Ryż. 4. Krojenie kostki 2D dla wielu pomiarów

Dwuwymiarowa reprezentacja sześcianu jest również możliwa, gdy więcej niż dwa wymiary pozostają „niepocięte”. W takim przypadku na osiach plastra (rzędy i kolumny) zostaną umieszczone dwa lub więcej wymiarów „wycinanego” sześcianu – patrz rys. 5.


Ryż. 5. Dwuwymiarowy kawałek sześcianu o kilku wymiarach na tej samej osi

Tagi

Wartości „odłożone” wzdłuż wymiarów nazywane są członkami lub etykietami (członkami). Etykiety służą zarówno do „wycinania” kostki jak i do ograniczania (filtrowania) wybranych danych – gdy w wymiarze, który pozostaje „nierozcięty” nie interesują nas wszystkie wartości, ale ich podzbiór, np. trzy miasta z kilku tuzin. Wartości etykiet pojawiają się w widoku kostki 2D jako nagłówki wierszy i kolumn.

Hierarchie i poziomy

Etykiety można łączyć w hierarchie składające się z jednego lub więcej poziomów. Na przykład etykiety wymiaru „Sklep” (Sklep) są naturalnie połączone w hierarchię z poziomami:

Kraj (Kraj)

Stan (stan)

Miasto (miasto)

Sklep).

Zgodnie z poziomami hierarchii obliczane są wartości zagregowane, takie jak sprzedaż dla USA (poziom „Kraj”) lub dla Kalifornii (poziom „Stan”). W jednym wymiarze można zaimplementować więcej niż jedną hierarchię - powiedzmy dla czasu: (Rok, Kwartał, Miesiąc, Dzień) oraz (Rok, Tydzień, Dzień).

Architektura aplikacji OLAP

Wszystko, co zostało powiedziane powyżej o OLAP, dotyczyło w istocie wielowymiarowej prezentacji danych. Z grubsza mówiąc, ani użytkownik końcowy, ani twórcy narzędzia, z którego korzysta klient, nie dbają o sposób przechowywania danych.

Wielowymiarowość w aplikacjach OLAP można podzielić na trzy poziomy:

  • Wielowymiarowa reprezentacja danych - narzędzia użytkownika końcowego, które zapewniają wielowymiarową wizualizację i manipulację danymi; wielowymiarowa warstwa reprezentacji abstrahuje od fizycznej struktury danych i traktuje je jako wielowymiarowe.
  • Przetwarzanie wielowymiarowe - narzędzie (język) do formułowania zapytań wielowymiarowych (tradycyjny relacyjny język SQL nie nadaje się tutaj) oraz procesor, który może przetworzyć i wykonać takie zapytanie.
  • Pamięć wielowymiarowa - środki fizycznej organizacji danych, które zapewniają sprawną realizację zapytań wielowymiarowych.

Pierwsze dwa poziomy są obowiązkowe we wszystkich narzędziach OLAP. Trzeci poziom, chociaż szeroko stosowany, nie jest wymagany, ponieważ dane do reprezentacji wielowymiarowej można również pobrać ze zwykłych struktur relacyjnych; wielowymiarowy procesor zapytań w tym przypadku tłumaczy zapytania wielowymiarowe na zapytania SQL, które są wykonywane przez relacyjny DBMS.

Konkretne produkty OLAP to zazwyczaj wielowymiarowe narzędzie do prezentacji danych, klient OLAP (na przykład tabele przestawne w programie Excel 2000 firmy Microsoft lub ProClarity firmy Knosys) lub wielowymiarowy system DBMS zaplecza, serwer OLAP (na przykład Oracle Express Server lub usług Microsoft OLAP).

Warstwa przetwarzania wielowymiarowego jest zwykle wbudowana w klienta OLAP i/lub serwer OLAP, ale można ją odizolować w najczystszej postaci, na przykład w ramach składnika Pivot Table Service firmy Microsoft.

Techniczne aspekty wielowymiarowego przechowywania danych

Jak wspomniano powyżej, narzędzia do analizy OLAP mogą również wydobywać dane bezpośrednio z systemów relacyjnych. Takie podejście było bardziej atrakcyjne w czasach, gdy serwery OLAP nie znajdowały się w cennikach wiodących dostawców baz danych. Ale dziś Oracle, Informix i Microsoft oferują pełnoprawne serwery OLAP, a nawet tych menedżerów IT, którzy nie lubią umieszczać „zoo” oprogramowania w swoich sieciach różni producenci, może kupić (a dokładniej złożyć wniosek do kierownictwa firmy) serwer OLAP tej samej marki co główny serwer bazy danych.

Serwery OLAP lub wielowymiarowe serwery baz danych mogą przechowywać swoje wielowymiarowe dane na różne sposoby. Zanim rozważymy te metody, musimy porozmawiać o takich ważny aspekt jak agregaty magazynowe. Faktem jest, że w dowolnej hurtowni danych - zarówno zwykłej, jak i wielowymiarowej - obok szczegółowych danych pobieranych z systemów operacyjnych przechowywane są również wskaźniki sumaryczne (wskaźniki zagregowane, agregaty), takie jak sumy wolumenów sprzedaży według miesięcy, według kategorii towary itp. Agregaty są przechowywane wyłącznie w celu przyspieszenia wykonywania zapytań. Przecież z jednej strony w magazynie gromadzona jest z reguły bardzo duża ilość danych, a z drugiej strony analityków w większości przypadków interesują nie szczegółowe, ale uogólnione wskaźniki. A gdyby trzeba było za każdym razem sumować miliony indywidualnych sprzedaży, aby obliczyć wielkość sprzedaży w ciągu roku, szybkość najprawdopodobniej byłaby nie do zaakceptowania. Dlatego podczas ładowania danych do wielowymiarowej bazy danych wszystkie wskaźniki całkowite lub ich część są obliczane i zapisywane.

Ale jak wiesz, za wszystko trzeba zapłacić. A za szybkość przetwarzania zapytań do danych sumarycznych trzeba zapłacić, zwiększając ilość danych i czas ich ładowania. Co więcej, wzrost wolumenu może stać się dosłownie katastrofalny – w jednym z opublikowanych standardowych testów pełna liczba agregatów na 10 MB danych początkowych wymagała 2,4 GB, czyli dane wzrosły 240 razy! Stopień „pęcznienia” danych przy obliczaniu agregatów zależy od liczby wymiarów sześcianu i struktury tych wymiarów, czyli stosunku liczby „ojców” i „dzieci” na różnych poziomach wymiaru. Do rozwiązania problemu przechowywania kruszyw są czasami używane złożone schematy, które pozwalają, przy obliczaniu daleko od wszystkich możliwych agregatów, osiągnąć znaczny wzrost wydajności wykonywania zapytań.

Teraz oh różne opcje przechowywanie informacji. Zarówno dane szczegółowe, jak i agregaty mogą być przechowywane w strukturach relacyjnych lub wielowymiarowych. Przechowywanie wielowymiarowe umożliwia traktowanie danych jako wielowymiarowej tablicy, która zapewnia tak samo szybkie obliczanie sum i różne wielowymiarowe przekształcenia dowolnego wymiaru. Jakiś czas temu produkty OLAP obsługiwały pamięć relacyjną lub wielowymiarową. Dziś z reguły ten sam produkt zapewnia oba te rodzaje przechowywania, a także trzeci rodzaj - mieszany. Obowiązują następujące warunki:

  • MOLAP(Wielowymiarowy OLAP) - w wielowymiarowej bazie danych przechowywane są zarówno dane szczegółowe, jak i agregaty. W tym przypadku uzyskuje się największą redundancję, ponieważ dane wielowymiarowe całkowicie zawierają dane relacyjne.
  • ROLAP(Relational OLAP) — szczegółowe dane pozostają tam, gdzie pierwotnie „zamieszkiwały” — w relacyjnej bazie danych; agregaty są przechowywane w tej samej bazie danych w specjalnie utworzonych tabelach serwisowych.
  • HOLAP(Hybrydowy OLAP) - szczegółowe dane pozostają na swoim miejscu (w relacyjnej bazie danych), a agregaty są przechowywane w wielowymiarowej bazie danych.

Każda z tych metod ma swoje zalety i wady i powinna być stosowana w zależności od warunków – ilości danych, mocy relacyjnego DBMS itp.

Podczas przechowywania danych w strukturach wielowymiarowych istnieje: potencjalny problem„rozdęcie”, przechowując puste wartości. W końcu, jeśli miejsce w wielowymiarowej tablicy jest zarezerwowane dla wszystkich możliwych kombinacji etykiet pomiarowych i tylko niewielka część jest faktycznie wypełniona (na przykład pewna liczba produktów jest sprzedawana tylko w niewielkiej liczbie regionów), to większość kostka będzie pusta, choć miejsce będzie zajęte. Nowoczesne produkty OLAP są w stanie poradzić sobie z tym problemem.

Ciąg dalszy nastąpi. W przyszłości porozmawiamy o konkretnych produktach OLAP produkowanych przez wiodących producentów.

Kostki danych OLAP (Online Analytical Processing) umożliwiają wydajną ekstrakcję i analizę danych wielowymiarowych. W przeciwieństwie do innych typów baz danych, bazy OLAP są zaprojektowane specjalnie do przetwarzania analitycznego i szybkiego wydobywania z nich wszelkiego rodzaju zbiorów danych. W rzeczywistości istnieje kilka kluczowych różnic między standardowymi relacyjnymi bazami danych, takimi jak Access lub SQL Server, a bazami danych OLAP.

Ryż. 1. Aby połączyć kostkę OLAP ze skoroszytem Excel, użyj polecenia Z usług analitycznych

Pobierz notatkę w formacie lub

W relacyjnych bazach danych informacje są przedstawiane jako rekordy, które są kolejno dodawane, usuwane i aktualizowane. Bazy danych OLAP przechowują tylko migawkę danych. W bazie danych OLAP informacje są archiwizowane jako pojedynczy blok danych i mają być wyświetlane tylko na żądanie. Chociaż możliwe jest dodanie do bazy danych OLAP Nowa informacja, istniejące dane są rzadko edytowane, a tym bardziej usuwane.

Bazy relacyjne i bazy danych OLAP różnią się strukturalnie. Relacyjne bazy danych zwykle składają się z zestawu tabel, które są ze sobą połączone. W niektórych przypadkach relacyjna baza danych zawiera tak wiele tabel, że bardzo trudno jest określić, w jaki sposób są ze sobą powiązane. W bazach danych OLAP relacje między poszczególnymi blokami danych są predefiniowane i przechowywane w strukturze zwanej kostkami OLAP. Kostki danych przechowują pełne informacje o struktura hierarchiczna oraz linki do baz danych, które znacznie ułatwiają poruszanie się po nim. Ponadto znacznie łatwiej jest tworzyć raporty, jeśli z góry wiesz, gdzie znajdują się pobierane dane i jakie inne dane są z nimi powiązane.

Główną różnicą między relacyjnymi bazami danych a bazami danych OLAP jest sposób przechowywania informacji. Dane w kostce OLAP rzadko prezentowane są w sposób ogólny. Kostki danych OLAP zazwyczaj zawierają informacje prezentowane we wstępnie zaprojektowanym formacie. W ten sposób operacje grupowania, filtrowania, sortowania i łączenia danych w kostkach są wykonywane przed wypełnieniem ich informacjami. Dzięki temu wyodrębnianie i wyświetlanie żądanych danych jest tak proste, jak to tylko możliwe. W przeciwieństwie do relacyjnych baz danych nie ma potrzeby odpowiedniego organizowania informacji przed wyświetleniem ich na ekranie.

Bazy danych OLAP są zazwyczaj tworzone i obsługiwane przez administratorów IT. Jeśli Twoja organizacja nie posiada struktury odpowiedzialnej za zarządzanie bazami danych OLAP, możesz skontaktować się z administratorem baza relacyjna dane z prośbą o wdrożenie przynajmniej pojedynczych rozwiązań OLAP w sieci korporacyjnej.

Łączenie z kostką danych OLAP

Aby uzyskać dostęp do bazy danych OLAP, musisz najpierw nawiązać połączenie z kostką OLAP. Zacznij od przejścia do zakładki wstążki Dane. Naciśnij przycisk Z innych źródeł i wybierz polecenie z menu rozwijanego Z usług analitycznych(rys. 1).

Po wybraniu określonego polecenia Kreatora połączenia danych (rysunek 2). Jego głównym zadaniem jest pomoc w nawiązaniu połączenia z serwerem, który będzie używany. Program Excel w zarządzaniu danymi.

1. Najpierw musisz podać Excelowi informacje rejestracyjne. Wprowadź nazwę serwera, nazwę logowania i hasło dostępu do danych w polach okna dialogowego, jak pokazano na rys. 2. Kliknij przycisk Dalej. Jeśli łączysz się za pomocą konta Wpisy Windows następnie ustaw przełącznik Użyj uwierzytelniania systemu Windows.

2. Wybierz bazę danych, z którą chcesz pracować z listy rozwijanej (rys. 3). Bieżący przykład korzysta z bazy danych samouczka usług Analysis Services. Po wybraniu tej bazy danych z poniższej listy zostanie wyświetlony monit o zaimportowanie wszystkich dostępnych w niej kostek OLAP. Wybierz żądaną kostkę danych i kliknij przycisk Dalej.

Ryż. 3. Wybierz działającą bazę danych i kostkę OLAP, których zamierzasz użyć do analizy danych

3. W kolejnym oknie dialogowym kreatora, pokazanym na ryc. 4, musisz podać opisowe informacje o tworzonym połączeniu. Wszystkie pola okna dialogowego pokazane na rys. 4 są opcjonalne. Zawsze możesz zignorować bieżące okno dialogowe bez wypełniania go i nie wpłynie to w żaden sposób na połączenie.

Ryż. 4. Zmień opisowe informacje o połączeniu

4. Kliknij przycisk Gotowe aby zakończyć połączenie. Na ekranie pojawi się okno dialogowe. Import danych(rys. 5). Ustaw przełącznik Raport tabeli przestawnej i kliknij OK, aby rozpocząć tworzenie tabeli przestawnej.

Struktura kostki OLAP

W procesie tworzenia tabeli przestawnej opartej na bazie danych OLAP zauważysz, że okno okienka zadań Pola tabeli przestawnej będzie inny niż w przypadku zwykłej tabeli przestawnej. Powodem jest uporządkowanie tabeli przestawnej w taki sposób, aby jak najwierniej wyświetlić strukturę dołączonej do niej kostki OLAP. Aby jak najszybciej poruszać się po kostce OLAP, musisz zapoznać się z jej składnikami i sposobami ich interakcji. Na ryc. Rysunek 6 przedstawia podstawową strukturę typowej kostki OLAP.

Jak widać, głównymi składnikami kostki OLAP są wymiary, hierarchie, poziomy, składowe i miary:

  • Wymiary. Główna charakterystyka analizowanych elementów danych. Najczęstsze przykłady wymiarów to Produkty (Towary), Klient (Kupujący) i Pracownik (Pracownik). Na ryc. 6 przedstawia strukturę wymiaru Produkty.
  • Hierarchie. Predefiniowana agregacja poziomów w określonym wymiarze. Hierarchia umożliwia tworzenie danych podsumowujących i analizowanie ich na różnych poziomach struktury, bez zagłębiania się w relacje, jakie istnieją między tymi poziomami. W przykładzie pokazanym na ryc. 6, wymiar Produkty ma trzy poziomy, które są agregowane w jedną hierarchię Kategorii Produktów.
  • Poziomy. Poziomy to kategorie, które są agregowane we wspólną hierarchię. Pomyśl o poziomach jako polach danych, które można przeszukiwać i analizować oddzielnie od siebie. Na ryc. 6 istnieją tylko trzy poziomy: Kategoria (kategoria), podkategoria (podkategoria) i nazwa produktu (nazwa produktu).
  • Członkowie. pojedynczy element dane w ramach wymiaru. Dostęp do członków jest zwykle realizowany za pomocą struktury OLAP obejmującej wymiary, hierarchie i poziomy. W przykładzie na ryc. Dla poziomu nazwy produktu zdefiniowano 6 członków. Inne poziomy mają elementy, które nie są wyświetlane w strukturze.
  • środki to rzeczywiste dane w kostkach OLAP. Miary są przechowywane we własnych wymiarach, które są nazywane wymiarami miar. Zapytania o miary można wykonywać przy użyciu dowolnej kombinacji wymiarów, hierarchii, poziomów i elementów członkowskich. Ta procedura nazywana jest „krojeniem”.

Teraz, gdy znasz już strukturę kostek OLAP, przyjrzyjmy się świeżej liście pól tabeli przestawnej. Organizacja dostępnych pól staje się przejrzysta i nie budzi zastrzeżeń. Na ryc. Rysunek 7 pokazuje, jak elementy tabeli przestawnej OLAP są prezentowane na liście pól.

Na liście pól tabeli przestawnej OLAP miary pojawiają się jako pierwsze i są oznaczone ikoną sumy (sigma). To jedyne elementy danych, które mogą znajdować się w obszarze WARTOŚĆ. Po nich na liście wskazane są wymiary, oznaczone ikoną z obrazem tabeli. W naszym przykładzie używany jest wymiar Klient. W tym wymiarze zagnieżdżonych jest wiele hierarchii. Po rozwinięciu hierarchii możesz zobaczyć poszczególne poziomy danych. Aby wyświetlić strukturę danych kostki OLAP, wystarczy nawigować po liście pól w tabeli przestawnej.

Ograniczenia dotyczące tabel przestawnych OLAP

Podczas pracy z tabelami przestawnymi OLAP należy pamiętać, że korzystasz ze źródła danych tabeli przestawnej w środowisku OLAP usług Analysis Services. Oznacza to, że każdy aspekt zachowania kostki danych, od wymiarów po miary zawarte w kostce, jest również kontrolowany przez usługi analityczne OLAP. To z kolei prowadzi do ograniczeń operacji, które można wykonać w tabelach przestawnych OLAP:

  • Nie można umieszczać pól innych niż miary w obszarze WARTOŚCI tabeli przestawnej;
  • nie ma możliwości zmiany funkcji używanej do podsumowania;
  • nie można utworzyć pola obliczeniowego lub elementu obliczanego;
  • wszelkie zmiany w nazwach pól są cofane natychmiast po usunięciu tego pola z tabeli przestawnej;
  • niedozwolona jest zmiana parametrów pola strony;
  • polecenie niedostępne Pokazaćstrony;
  • wyłączona opcja Pokazaćpodpisyelementy gdy nie ma pól w obszarze wartości;
  • wyłączona opcja Sumy częściowe według elementów strony wybranych przez filtr;
  • opcja niedostępna tłozapytanie;
  • po dwukrotnym kliknięciu pola WARTOŚCI zwracanych jest tylko pierwsze 1000 rekordów z pamięci podręcznej tabeli przestawnej;
  • niedostępne pole wyboru Optymalizowaćpamięć.

Twórz kostki danych offline

W standardowej tabeli przestawnej dane źródłowe są przechowywane na lokalnym dysku twardym. Dzięki temu zawsze możesz nimi zarządzać, a także zmieniać strukturę, nawet bez dostępu do sieci. Ale to w żaden sposób nie dotyczy tabel przestawnych OLAP. W tabelach przestawnych OLAP pamięć podręczna nie znajduje się na lokalnym dysku twardym. Dlatego natychmiast po odłączeniu się od sieci lokalnej tabela przestawna OLAP stanie się bezużyteczna. Nie będziesz mógł przenieść żadnego z pól w takiej tabeli.

Jeśli nadal musisz analizować dane OLAP, gdy nie masz połączenia z siecią, utwórz moduł danych offline. Jest to osobny plik, który jest pamięcią podręczną tabeli przestawnej. Ten plik przechowuje dane OLAP, które są wyświetlane po odłączeniu od sieci lokalnej. Aby utworzyć autonomiczną kostkę danych, najpierw utwórz tabelę przestawną OLAP. Umieść kursor w tabeli przestawnej i kliknij przycisk Narzędzia OLAP zakładka kontekstowa Analiza zawarta w zestawie zakładek kontekstowych Praca z tabelami przestawnymi. Wybierz drużynę Offline OLAP(rys. 8).

Na ekranie pojawi się okno dialogowe. Skonfiguruj OLAP w trybie offline(rys. 9). Naciśnij przycisk Utwórz plik danych offline. Na ekranie pojawi się pierwsze okno Kreatora tworzenia plików Data Cube. Naciśnij przycisk Dalej aby kontynuować procedurę.

W drugim kroku (Rysunek 10) określ wymiary i poziomy, które zostaną uwzględnione w kostce danych. W oknie dialogowym należy wybrać dane do zaimportowania z bazy danych OLAP. Należy wybrać tylko te wymiary, które będą potrzebne po odłączeniu komputera od sieci lokalnej. Im więcej określisz wymiarów, tym większy będzie moduł danych offline.

Naciśnij przycisk Dalej przejść do trzeciego kroku (rys. 11). W tym oknie wybierasz elementy lub elementy danych, które nie zostaną uwzględnione w kostce. Jeśli pole wyboru nie jest zaznaczone, określony element nie zostanie zaimportowany i zajmie dodatkowe miejsce na lokalnym dysku twardym.

Określ lokalizację i nazwę kostki danych (Rysunek 12). Pliki modułu danych mają rozszerzenie .cub.

Po chwili program Excel zapisuje moduł danych offline w określonym folderze. Aby to przetestować, kliknij dwukrotnie plik, co automatycznie wygeneruje skoroszyt programu Excel zawierający tabelę przestawną powiązaną z wybraną kostką danych. Po utworzeniu kostkę danych offline można dystrybuować do wszystkich zainteresowanych użytkowników, którzy pracują w trybie offline sieci LAN.

Po połączeniu się z siecią lokalną możesz otworzyć plik modułu danych offline i zaktualizować go, a także odpowiednią tabelę danych. Należy zauważyć, że chociaż kostka danych offline jest używana, gdy nie ma dostępu do sieci, należy ją zaktualizować po przywróceniu połączenia sieciowego. Próba aktualizacji modułu danych offline po zerwaniu połączenia sieciowego zakończy się niepowodzeniem.

Stosowanie funkcji kostki danych w tabelach przestawnych

Funkcje modułu danych używane w bazach danych OLAP można również uruchamiać z tabeli przestawnej. W starszych wersjach programu Excel dostęp do funkcji modułu danych uzyskuje się dopiero po zainstalowaniu dodatku Analysis Pack. W programie Excel 2013 funkcje te są wbudowane w program i dlatego można ich używać. Aby w pełni zapoznać się z ich możliwościami, rozważ konkretny przykład.

Jeden z najbardziej proste sposoby Nauka funkcji modułu danych polega na przekonwertowaniu tabeli przestawnej OLAP na formuły modułu danych. Ta procedura jest bardzo prosta i pozwala szybko uzyskać formuły kostek danych bez tworzenia ich od podstaw. Kluczową zasadą jest zastąpienie wszystkich komórek w tabeli przestawnej formułami połączonymi z bazą danych OLAP. Na ryc. 13 przedstawia tabelę przestawną powiązaną z bazą danych OLAP.

Umieść kursor w dowolnym miejscu w tabeli przestawnej, kliknij przycisk Narzędzia OLAP kontekstowa karta wstążki Analiza i wybierz polecenie Konwertuj na formuły(rys. 14).

Jeśli tabela przestawna zawiera pole filtru raportu, okno dialogowe pokazane na ryc. 15. W tym oknie możesz określić, czy chcesz przekonwertować listy rozwijane filtrów danych na formuły. Jeśli tak, listy rozwijane zostaną usunięte, a zamiast nich zostaną wyświetlone formuły statyczne. Jeśli planujesz używać list rozwijanych do zmiany zawartości tabeli przestawnej w przyszłości, usuń zaznaczenie pojedynczego pola wyboru w oknie dialogowym. Jeśli pracujesz nad tabelą przestawną w trybie zgodności, filtry danych zostaną automatycznie przekonwertowane na formuły bez wcześniejszego ostrzeżenia.

Po kilku sekundach zamiast tabeli przestawnej zostaną wyświetlone formuły, które działają w kostkach danych i dostarczają dane wyjściowe w Okno Excela niezbędne informacje. Należy pamiętać, że powoduje to usunięcie wcześniej zastosowanych stylów (rys. 16).

Ryż. 16. Spójrz na pasek formuły: komórki zawierają formuły kostki danych

Biorąc pod uwagę, że wartości, które przeglądasz, nie są już częścią obiektu tabeli przestawnej, możesz dodawać kolumny, wiersze i elementy obliczeniowe, łączyć je z innymi źródłami zewnętrznymi i modyfikować raport we własnym tempie. różne sposoby, w tym przeciąganie formuł.

Dodawanie obliczeń do tabel przestawnych OLAP

W poprzednich wersjach programu Excel obliczenia niestandardowe nie były dozwolone w tabelach przestawnych OLAP. Oznaczało to, że nie było możliwe dodanie dodatkowej warstwy analizy do tabel przestawnych OLAP w taki sam sposób, w jaki zwykłe tabele przestawne mogą dodawać pola obliczeniowe i elementy członkowskie (patrz ; przed kontynuowaniem czytania upewnij się, że znasz ten materiał).

Excel 2013 wprowadza nowe narzędzia OLAP — miary obliczeniowe i składowe obliczane MDX. Nie jesteś już ograniczony do używania miar i elementów w kostce OLAP dostarczonej przez administratora bazy danych. Otrzymujesz dodatkowe funkcje analiza poprzez tworzenie niestandardowych obliczeń.

Wprowadzenie do MDX. Gdy używasz tabeli przestawnej z modułem OLAP, wysyłasz zapytania MDX (wyrażenia wielowymiarowe) do bazy danych. MDX to język zapytań używany do pobierania danych ze źródeł wielowymiarowych (takich jak kostki OLAP). Gdy tabela przestawna OLAP jest modyfikowana lub aktualizowana, odpowiednie zapytania MDX są przesyłane do bazy danych OLAP. Wyniki zapytania są zwracane z powrotem do programu Excel i wyświetlane w obszarze tabeli przestawnej. Umożliwia to pracę z danymi OLAP bez lokalnej kopii pamięci podręcznej tabeli przestawnej.

Miary obliczeniowe i elementy MDX są tworzone przy użyciu składni języka MDX. Dzięki tej składni tabela przestawna umożliwia interakcję obliczeń z część serwerowa Bazy danych OLAP. Przykłady w tej książce są oparte na podstawowych konstrukcjach MDX, które demonstrują nowe Funkcje Excela 2013. Jeśli potrzebujesz stworzyć złożone miary obliczeniowe i elementy MDX, będziesz musiał poświęcić trochę czasu na poznanie możliwości MDX.

Twórz miary wyliczane. Miara wyliczana to wersja OLAP pola wyliczanego. Pomysł polega na stworzeniu nowego pola danych w oparciu o pewne operacje matematyczne wykonywane na istniejących polach OLAP. W przykładzie pokazanym na ryc. 17 stosuje się tabelę przestawną OLAP, która zawiera listę i ilość produktów, a także dochód ze sprzedaży każdego z nich. Musimy dodać nową miarę, która obliczy średnią cenę za sztukę.

Analiza Praca z tabelami przestawnymi. rozwijane menu Narzędzia OLAP Wybierz przedmiot (rys. 18).

Ryż. 18. Wybierz pozycję menu Miara obliczana MDX

Na ekranie pojawi się okno dialogowe. Utwórz miarę wyliczaną(rys. 19).

Wykonaj następujące czynności:

2. Wybierz grupę miar, która będzie zawierać nową miarę wyliczaną. Jeśli tego nie zrobisz, program Excel automatycznie umieści nową miarę w pierwszej dostępnej grupie miar.

3. W terenie MDX(MDX) wprowadź kod definiujący nową miarę. Aby przyspieszyć proces wprowadzania, użyj listy po lewej stronie, aby wybrać istniejące miary, które zostaną użyte w obliczeniach. Kliknij dwukrotnie żądaną miarę, aby dodać ją do pola MDX. Do obliczenia średniej jednostkowej ceny sprzedaży produktu używane jest następujące wyrażenie MDX:

4. Kliknij OK.

Zwróć uwagę na przycisk Sprawdź MDX, który znajduje się w prawej dolnej części okna. Kliknij ten przycisk, aby sprawdzić, czy składnia MDX jest poprawna. Jeśli składnia zawiera błędy, zostanie wyświetlony odpowiedni komunikat.

Po zakończeniu tworzenia nowej miary wyliczanej przejdź do listy Pola tabeli przestawnej i wybierz go (rys. 20).

Zakres miary wyliczanej jest ograniczony do bieżącego skoroszytu. Innymi słowy, miary wyliczane nie są tworzone bezpośrednio w kostce OLAP serwera. Oznacza to, że nikt nie może uzyskać dostępu do obliczonej miary, chyba że otworzysz ogólny dostęp skoroszytu lub opublikuj go online.

Utwórz elementy obliczeniowe MDX. Wyliczany element MDX jest wersją OLAP normalnego elementu wyliczanego. Pomysł polega na stworzeniu nowego elementu danych w oparciu o pewne operacje matematyczne wykonywane na istniejących elementach OLAP. W przykładzie pokazanym na ryc. 22 używa tabeli przestawnej OLAP, która zawiera dane sprzedaży za lata 2005-2008 (w podziale kwartalnym). Załóżmy, że chcesz zagregować dane z pierwszego i drugiego kwartału, tworząc nowy element, Pierwsza połowa roku. Połączymy również dane dotyczące III i IV kwartału, tworząc nowy element II półrocze (II półrocze).

Ryż. 22. Zamierzamy dodać nowych członków obliczonych MDX, pierwszą połowę roku i drugą połowę roku

Umieść kursor w dowolnym miejscu w tabeli przestawnej i wybierz kartę kontekstową Analiza z zestawu kart kontekstowych Praca z tabelami przestawnymi. rozwijane menu Narzędzia OLAP Wybierz przedmiot Obliczony członek MDX(rys. 23).

Na ekranie pojawi się okno dialogowe. (Rys. 24).

Ryż. 24. Okno Utwórz wyliczany członek

Wykonaj następujące czynności:

1. Nadaj wyliczonej mierze nazwę.

2. Wybierz hierarchię nadrzędną, dla której tworzone są nowe elementy wyliczane. Na budowie element nadrzędny przypisz wartość Wszystko. Dzięki temu Dostosowywanie Excela uzyskuje dostęp do wszystkich członków hierarchii nadrzędnej, gdy wyrażenie jest oceniane.

3. W oknie MDX wprowadź składnię MDX. Aby zaoszczędzić trochę czasu, użyj listy wyświetlanej po lewej stronie, aby wybrać istniejących członków do użycia w MDX. Kliknij dwukrotnie wybrany element, a Excel doda go do okna MDX. W przykładzie pokazanym na ryc. 24, sumę pierwszego i drugiego kwartału oblicza się:

..&& +

.. && +

.. && + …

4. Kliknij OK. Program Excel wyświetla nowo utworzony element obliczeniowy MDX w tabeli przestawnej. Jak pokazano na ryc. 25, nowy element obliczany jest wyświetlany wraz z innymi elementami obliczanymi tabeli przestawnej.

Na ryc. 26 ilustruje podobny proces stosowany do tworzenia składowej obliczanej za drugą połowę roku.

Zauważ, że Excel nawet nie próbuje usunąć oryginalnych elementów MDX (Rysunek 27). Tabela przestawna nadal pokazuje rekordy za lata 2005-2008 z podziałem na kwartał. W tym przypadku nie stanowi to problemu, ale w większości scenariuszy należy ukryć „dodatkowe” elementy, aby uniknąć konfliktów.

Ryż. 27. Excel wyświetla wygenerowany element obliczony MDX wraz z pierwotnymi elementami. Ale nadal lepiej jest usunąć oryginalne elementy, aby uniknąć konfliktów.

Pamiętaj: obliczeni członkowie są tylko w bieżącym skoroszycie. Innymi słowy, miary wyliczane nie są tworzone bezpośrednio w kostce OLAP serwera. Oznacza to, że nikt nie może uzyskać dostępu do miary wyliczanej lub elementu wyliczanego, chyba że udostępnisz skoroszyt lub opublikujesz go online.

Należy zauważyć, że jeśli zmieni się hierarchia nadrzędna lub element nadrzędny w kostce OLAP, element wyliczany MDX przestanie działać. Będziesz musiał odtworzyć ten element.

Zarządzanie obliczeniami OLAP. Excel udostępnia interfejs, który umożliwia zarządzanie miarami obliczeniowymi i elementami MDX w tabelach przestawnych OLAP. Umieść kursor w dowolnym miejscu w tabeli przestawnej i wybierz kartę kontekstową Analiza z zestawu kart kontekstowych Praca z tabelami przestawnymi. rozwijane menu Narzędzia OLAP Wybierz przedmiot Zarządzanie komputerami. W oknie Zarządzanie komputerami dostępne są trzy przyciski (rys. 28):

  • Tworzyć. Utwórz nową miarę wyliczaną lub element wyliczany MDX.
  • Zmiana. Zmień wybrane obliczenie.
  • Kasować. Usuń wybrane obliczenie.

Ryż. 28. Okno dialogowe Zarządzanie komputerami

Wykonaj analizę warunkową na danych OLAP. W programie Excel 2013 można przeprowadzić analizę warunkową na danych znajdujących się w tabelach przestawnych OLAP. Dzięki temu Nowa okazja możesz zmieniać wartości w tabeli przestawnej i ponownie obliczać miary i elementy członkowskie na podstawie wprowadzonych zmian. Możesz także propagować zmiany z powrotem do modułu OLAP. Aby skorzystać z analizy warunkowej, utwórz tabelę przestawną OLAP i wybierz kartę kontekstową Analiza Praca z tabelami przestawnymi. rozwijane menu Narzędzia OLAP wybierz drużynę Co jeśli analiza –> Włącz analizę warunkową(rys. 29).

Od teraz możesz zmieniać wartości tabeli przestawnej. Aby zmienić wybraną wartość w tabeli przestawnej, kliknij ją kliknij prawym przyciskiem myszy myszą i w menu kontekstowym wybierz (rys. 30). Program Excel ponownie uruchamia wszystkie obliczenia w tabeli przestawnej na podstawie wprowadzonych zmian, w tym miary obliczeniowe i obliczone elementy MDX.

Ryż. 30. Wybierz przedmiot Weź pod uwagę zmianę podczas obliczania tabeli przestawnej wprowadzić zmiany w tabeli przestawnej

Domyślnie edycje dokonywane w tabeli przestawnej w trybie analizy warunkowej są lokalne. Jeśli chcesz propagować zmiany na serwerze OLAP, wybierz polecenie, aby opublikować zmiany. Wybierz kartę kontekstową Analiza, znajdujący się w zestawie zakładek kontekstowych Praca z tabelami przestawnymi. rozwijane menu Narzędzia OLAP wybierz przedmioty Co jeśli analiza – > Opublikuj zmiany(rys. 31). To polecenie umożliwi „zapis zwrotny” na serwerze OLAP, co oznacza, że ​​zmiany mogą być propagowane do oryginalnej kostki OLAP. (Aby propagować zmiany na serwerze OLAP, musisz mieć odpowiednie uprawnienia dostępu do serwera. Skontaktuj się z administratorem bazy danych, aby uzyskać uprawnienia dostępu do zapisu w bazie danych OLAP).

Notatka napisana jest na podstawie książki Jelena Aleksandra. . Rozdział 9

W poprzednim artykule z tej serii (patrz #2'2005) mówiliśmy o głównych innowacjach usług analitycznych SQL Server 2005. Dzisiaj przyjrzymy się bliżej narzędziom do tworzenia rozwiązań OLAP zawartych w tym produkcie.

Krótko o podstawach OLAP

Zanim rozpoczniemy rozmowę o narzędziach do tworzenia rozwiązań OLAP, przypominamy, że OLAP (On-Line Analytical Processing) to technologia kompleksowej wielowymiarowej analizy danych, której koncepcję opisał w 1993 roku EF Codd, słynny autor relacyjnej model danych. Obecnie obsługa OLAP jest zaimplementowana w wielu DBMS i innych narzędziach.

Kostki OLAP

Co to są dane OLAP? Jako odpowiedź na to pytanie rozważ najprostszy przykład. Załóżmy, że w korporacyjnej bazie danych danego przedsiębiorstwa znajduje się zbiór tabel zawierających informacje o sprzedaży towarów lub usług, a na ich podstawie powstał widok Faktury z polami Kraj (kraj), Miasto (miasto), CustomerName (nazwa firmy klienta), Salesperson (kierownik według sprzedaży), OrderDate (data zamówienia), CategoryName (kategoria produktu), ProductName (nazwa produktu), ShipperName (firma przewozowa), ExtendedPrice (płatność za produkt), natomiast ostatnie z wymienionych pól jest w rzeczywistości przedmiotem analizy.

Wyboru danych z takiego widoku można dokonać za pomocą następującego zapytania:

WYBIERZ Kraj, Miasto, Nazwa klienta, Sprzedawca,

Data zamówienia, nazwa kategorii, nazwa produktu, nazwa nadawcy, cena rozszerzona

Z Faktury

Załóżmy, że interesuje nas całkowity koszt zamówień złożonych przez klientów z różnych krajów. Aby uzyskać odpowiedź na to pytanie, musisz złożyć następującą prośbę:

SELECT Kraj, SUM (cena rozszerzona) FROM Faktury

GRUPA WG Kraju

Wynikiem tego zapytania będzie jednowymiarowy zestaw danych zagregowanych (w tym przypadku sum):

Kraj SUMA (cena rozszerzona)
Argentyna 7327.3
Austria 110788.4
Belgia 28491.65
Brazylia 97407.74
Kanada 46190.1
Dania 28392.32
Finlandia 15296.35
Francja 69185.48
209373.6
...

Jeśli chcemy wiedzieć, jaki jest łączny koszt zamówień złożonych przez klientów z różnych krajów i dostarczonych przez różne firmy kurierskie, musimy wykonać zapytanie, które zawiera dwa parametry w klauzuli GROUP BY:

SELECT Kraj, Nazwa nadawcy, SUM (cena rozszerzona) FROM Faktury

GRUPA WG KRAJU, Nazwa nadawcy

Na podstawie wyników tego zapytania możesz utworzyć taką tabelę:

Taki zestaw danych nazywamy tabelą przestawną.

SELECT Kraj, Nazwa nadawcy, Osoba sprzedająca SUM (cena rozszerzona) FROM Faktury

GRUPA WG KRAJU, Nazwa nadawcy, Rok

Na podstawie wyników tego zapytania można zbudować trójwymiarową kostkę (rys. 1).

Dodając dodatkowe parametry do analizy można stworzyć kostkę o teoretycznie dowolnej liczbie wymiarów, natomiast wraz z sumami komórki kostki OLAP mogą zawierać wyniki obliczeń innych funkcji agregujących (np. wartości średnie, maksymalne, minimalne , liczba rekordów pierwotnego widoku odpowiadająca temu zestawowi parametrów). Pola, na których obliczane są wyniki, nazywane są miarami sześciennymi.

Hierarchie w wymiarach

Załóżmy, że interesuje nas nie tylko całkowity koszt zamówień złożonych przez klientów w różnych krajów, ale także całkowity koszt zamówień złożonych przez klientów w różne miasta jeden kraj. W takim przypadku można wykorzystać fakt, że wartości zastosowane do osi mają różne poziomy szczegółowości – jest to opisane w ramach koncepcji hierarchii zmian. Powiedzmy, że kraje są na pierwszym poziomie hierarchii, a miasta na drugim. Należy zauważyć, że począwszy od SQL Server 2000, usługi analityczne obsługują tak zwane niezrównoważone hierarchie, które zawierają na przykład członków, których „dzieci” nie znajdują się na sąsiednich poziomach hierarchii lub brakuje niektórych członków zmiany. Typowym przykładem takiej hierarchii jest uwzględnienie faktu, że w różnych krajach mogą, ale nie muszą istnieć takie jednostki administracyjno-terytorialne, jak państwo lub region, ulokowane w hierarchii geograficznej między krajami i miastami (rys. 2).

Należy zauważyć, że ostatnio powszechną praktyką stało się wyodrębnianie typowych hierarchii, na przykład zawierających dane geograficzne lub czasowe, a także wspieranie istnienia kilku hierarchii w jednym wymiarze (w szczególności dla roku kalendarzowego i podatkowego).

Tworzenie kostek OLAP w SQL Server 2005

Moduły programu SQL Server 2005 są tworzone przy użyciu programu SQL Server Business Intelligence Development Studio. To narzędzie jest specjalną wersją Visual Studio 2005 przeznaczoną do rozwiązywania tej klasy zadań (a jeśli masz już zainstalowane środowisko programistyczne, lista szablonów projektów jest uzupełniana projektami przeznaczonymi do tworzenia rozwiązań w oparciu o SQL Sever i jego usługi analityczne) . W szczególności szablon projektu usług analitycznych (rysunek 3) jest przeznaczony do tworzenia rozwiązań opartych na usługach analitycznych.

Aby utworzyć kostkę OLAP, najpierw musisz zdecydować, na podstawie jakich danych ją uformować. Najczęściej kostki OLAP budowane są w oparciu o relacyjne magazyny danych ze schematami gwiazdy lub płatka śniegu (o których mówiliśmy w poprzedniej części artykułu). Zestaw dystrybucyjny SQL zawiera przykład takiego repozytorium - bazę danych AdventureWorksDW, aby użyć jej jako źródła, znajdź folder Data Sources w Eksploratorze rozwiązań, wybierz element menu kontekstowe Nowe źródło danych i kolejno odpowiadaj na pytania odpowiedniego kreatora (rys. 4).

Następnie zalecane jest utworzenie Widoku Źródła Danych - widoku, na podstawie którego zostanie utworzona kostka. Aby to zrobić, wybierz odpowiednią pozycję z menu kontekstowego folderu Widoki źródła danych i odpowiedz po kolei na pytania kreatora. Efektem tych działań będzie schemat danych, za pomocą którego zostanie zbudowana reprezentacja źródeł danych, natomiast w powstałym schemacie zamiast oryginalnych można określić „przyjazne” nazwy tabel (rys. 5). .

Tak opisaną kostkę można przenieść na serwer usług analitycznych wybierając opcję Wdróż z menu kontekstowego projektu i przeglądając jego dane (rys. 7).

Podczas tworzenia kostek wykorzystuje się obecnie wiele funkcji Nowa wersja SQL Server, taki jak widok źródeł danych. Opis danych wyjściowych do budowy kostki, jak również opis struktury kostki, jest teraz wykonywany za pomocą znanego wielu programistom narzędzia Visual Studio, co jest niewątpliwą zaletą nowej wersji tego produktu - badania rozwiązania analityczne twórców nowych narzędzi w tym przypadku są zminimalizowane.

Należy zauważyć, że w utworzonej kostce można zmieniać kompozycję miar, usuwać i dodawać atrybuty wymiarów oraz dodawać obliczone atrybuty elementów wymiaru na podstawie istniejących atrybutów (rys. 8).

Ryż. 8. Dodawanie obliczonego atrybutu

Ponadto w kostkach SQL Server 2005 można automatycznie grupować lub sortować elementy wymiaru według wartości atrybutu, definiować relacje między atrybutami, implementować relacje wiele-do-wielu, definiować kluczowe wskaźniki biznesowe i wykonywać wiele innych zadań (szczegóły na temat wykonywane czynności można znaleźć w samouczku usług SQL Server Analysis Services system pomocy ten produkt).

W kolejnych częściach publikacji będziemy kontynuować naszą znajomość usług analitycznych SQL Server 2005 oraz dowiadywać się o nowościach w zakresie wsparcia Data Mining.

Podobał Ci się artykuł? Podziel się z przyjaciółmi!
Czy ten artykuł był pomocny?
tak
Nie
Dziekuję za odpowiedź!
Coś poszło nie tak i Twój głos nie został policzony.
Dziękuję Ci. Twoja wiadomość została wysłana
Znalazłeś błąd w tekście?
Wybierz, kliknij Ctrl+Enter a my to naprawimy!