SSAS-zelfstudie: wat is, architectuur, SSAS-kubus en typen

Wat is SSAS?

SQL Server-analyseservices (SSAS) is een multidimensionale OLAP-server en een analyse-engine waarmee u grote hoeveelheden gegevens kunt segmenteren. Het maakt deel uit van Microsoft SQL Server en helpt bij het uitvoeren van analyses met behulp van verschillende dimensies. Het heeft 2 varianten Multidimensionaal en Tabular. De volledige SSAS-vorm is SQL Server Analysis Services.

In deze SSAS-zelfstudie voor beginners leert u:

Architectuur van SSAS

Eerst in deze SSAS-zelfstudie leren we over de SSAS-architectuur:

De architectuurweergave van SQL-serveranalyseservices is gebaseerd op een architectuur met drie lagen, die bestaat uit:

  1. RDBMS: de gegevens uit verschillende bronnen zoals Excel, Database, Tekst, andere kunnen worden opgehaald met behulp van ETL-tool in het RDBMS.
  2. SSAS: geaggregeerde gegevens van RDBMS worden in SSAS-kubussen geduwd met behulp van analyseserviceprojecten. De SSAS-kubussen zullen een analysedatabase maken en zodra de analysedatabase klaar is, kan deze voor vele doeleinden worden gebruikt.
  3. Klant: Klanten hebben toegang tot gegevens met behulp van dashboards, scorekaarten, portals enz.

Geschiedenis van SSAS

In deze SSAS-zelfstudie gaan we nu door de geschiedenis van SSAS:

  • MSOLAP-functie voor het eerst opgenomen in SQL Server 7.0. Deze technologie werd later gekocht van een Israëlisch bedrijf genaamd Panorama.
  • Al snel worden het de meest gebruikte OLAP-engines omdat het onderdeel uitmaakte van SQL Server.
  • SSAS is volledig vernieuwd met de release van MS-SQL Server 2005
  • Deze nieuwste versie biedt ook een functie voor 'subcubes' met het Scope-statement. Dit heeft de functionaliteit van SSAS-kubussen vergroot.
  • SSAS 2008R2- en 2012-versies houden zich voornamelijk bezig met queryprestaties en schaalbaarheid
  • In Microsoft Excel 2010 kwam een ​​invoegtoepassing genaamd PowerPivot die een lokaal exemplaar van de analyseservice gebruikt met een nieuwe XVelocity-engine die de queryprestaties verbetert

Belangrijke SSAS-terminologie

In deze zelfstudie over het SSAS-tabelmodel leren we enkele belangrijke terminologieën van SSAS:

  • Databron
  • Gegevensbronweergave
  • Kubus
  • Afmeting tafel
  • Dimensie
  • Peil
  • Feitentabel
  • Meeteenheid
  • Schema

Databron:

Gegevensbron is een soort verbindingsreeks. Het brengt een verbinding tot stand tussen de analysedatabase en RDBMS.

Gegevensbronweergave:

Gegevensbronweergave is een logisch model van Database

Kubus:

Een kubus is een basiseenheid van opslag. Het is een verzameling gegevens die is geaggregeerd zodat zoekopdrachten snel gegevens kunnen retourneren.

MOLAP:

De MOLAP is gemaakt van een gegevenskubus die maten en dimensies bevat. Het omvat alle leden die zich in een hiërarchische relatie kunnen bevinden.

Het is een specifieke set regels die u helpt te bepalen hoe bepaalde cellen worden berekend in een dunne kubus en waarden meet die binnen die hiërarchieën zijn opgerold.

Afmeting tafel

  • Een maattabel bevat afmetingen van een feit.
  • Ze worden met een externe sleutel aan de feitentabel gekoppeld.
  • Dimensietabellen zijn gedenormaliseerde tabellen.
  • Dimensies bieden kenmerken van de feiten met behulp van hun attributen.
  • Geen aanbiedingen limiet ingesteld voor een bepaald aantal dimensies
  • De dimensie bevat een of meer hiërarchische relaties.

Dimensie:

Dimension biedt de context rondom een ​​bedrijfsprocesgebeurtenis. In eenvoudige bewoordingen geven ze aan wie, wat, waar van een feit. In het bedrijfsproces Verkoop, voor het feit verkoopnummer, zouden de dimensies de naam van de klant zijn.

  • Waar – Locatie
  • Wat - Productnaam
  • Met andere woorden, je kunt zeggen dat een dimensie een venster is om de informatie in de feiten te bekijken.

Peil:

Elk type samenvatting dat uit de enkele dimensie kan worden opgehaald, wordt label genoemd.

Feitentabel:

Een feitentabel is de belangrijkste tabel in een dimensionaal model. Een feitentabel bevat metingen/feiten en een vreemde sleutel naar de dimensietabel. Bijvoorbeeld loonadministratie.

Meeteenheid:

Elke feitentabel bevat een of meer tabellen die geanalyseerd moeten worden. Een boek verkoopt bijvoorbeeld een informatietafel. Het kan winst of verlies zijn voor het aantal verkochte boeken.

Schema:

De database schema van een databasesysteem en zijn structuur beschreven in een formele taal. Het ondersteunt het databasebeheersysteem. De term 'schema' betekent het ordenen van data als blauwdruk van een manier waarop database wordt opgebouwd.

Type modellen in SSAS

Nu zullen we soorten modellen in SSAS leren in deze SSAS-kubus-tutorial:

Multidimensionaal gegevensmodel

De Multidimensionaal gegevensmodel , die bestaat uit een gegevenskubus. Het is een groep bewerkingen waarmee u de waarde van cellen kunt opvragen door kubus- en dimensieleden als coördinaten te gebruiken.

Het definieert regels die bepalen op welke manier meetwaarden worden opgerold binnen hiërarchieën of hoe specifieke waarden worden berekend in een schaarse kubus.

Tabelmodellering

Modellering in tabelvorm organiseert gegevens in gerelateerde tabellen. De tabel duidt niet aan als 'dimensies' of 'feiten' en de ontwikkelingstijd is minder met tabellen omdat alle gerelateerde tabellen beide rollen kunnen vervullen.

Tabelvorm versus multidimensionaal model

Parameters: Tabelvorm Multidimensionaal
GeheugenIn geheugencacheOp bestanden gebaseerde opslag
Structuurlosse structuurStijve structuur
Beste eigenschapGegevens hoeven niet van de bron te worden verplaatstHet is het beste wanneer gegevens in een sterschema worden geplaatst.
Type modelrelationeel modelDimensionaal model
DAXMDX
ComplexiteitEenvoudigComplex
MaatKleinergroter

Belangrijkste kenmerken van SSAS

Essentiële kenmerken van SSAS zijn:

  • Het biedt achterwaartse compatibiliteit op API-niveau.
  • U kunt OLEDB voor OLAP gebruiken voor de clienttoegang-API en MDX als querytaal.
  • SSAS helpt u bij het bouwen van MOLAP-, HOLAP- en ROLAP-architecturen
  • Hiermee kunt u werken in client-servermodus of offline modus.
  • U kunt de SSAS-tool gebruiken met verschillende wizards en ontwerpers.
  • Het maken en beheren van datamodellen is flexibel.
  • Pas de applicatie aan vanuit uitgebreide ondersteuning
  • Biedt dynamische structuur, ad-hocrapport, gedeelde metadata en beveiligingsfuncties

SSAS versus PowerPivot

ParameterSSASPowerPivot
Wat isSSAS Multidimensionaal is 'Corporate BI'Microsoft PowerPivot is een 'Self-Service BI'
InzetImplementeren op SSASHet wordt geïmplementeerd in SharePoint
Gebruik voorVisual Studio-projectExcel
MaatGrootte beperkt tot geheugenCapaciteit beperkt tot 2 GB.
Partitie ondersteuningOndersteunt partitioneringGeen partities
Type zoekopdrachtDirectQuery en VertipaqStaat alleen Vertipaq Query's toe
BeheerderstoolsHulpprogramma's voor serverbeheer (bijv. SSMS]Excel en SharePoint 'Beheerder'
VeiligheidRij-niveau & dynamische beveiligingBeveiliging van werkmapbestanden

Voordelen van SSAS

Voordelen/voordelen van SSAS zijn:

  • Helpt u om bronconflicten met het bronsysteem te voorkomen
  • Het is een ideaal hulpmiddel voor numerieke analyse.
  • SSAS maakt de ontdekking van datapatronen mogelijk die niet meteen duidelijk zijn met behulp van de dataminingfuncties die in het product zijn ingebouwd.
  • Het biedt een uniform en geïntegreerd overzicht van al uw bedrijfsgegevens. Rapportage, analyse van Key Performance Indicator (KPI)-scorecards Datamining.
  • SSAS biedt online analytische verwerking (OLAP) van gegevens uit verschillende gegevensbronnen.
  • Het stelt gebruikers in staat om gegevens te analyseren met een groot aantal tools, waaronder SSRS en Excel.

Nadelen van het gebruik van SSAS

  • Zodra u een pad selecteert (tabel of multidimensionaal), kunt u niet migreren naar de andere versie zonder opnieuw te beginnen
  • U mag geen gegevens 'samenvoegen' tussen tabelvormige en multidimensionale kubussen
  • Tabular blijkt riskant te zijn als de vereisten halverwege het project veranderen

Best practices voor het gebruik van SSAS

  • Kubus- en meetgroepontwerp optimaliseren
  • U moet nuttige aggregaties definiëren
  • Gebruik de partitiemethode
  • Schrijf efficiënte MDX
  • Efficiënt gebruik van de Query Engine-cache
  • Uitschalen wanneer u niet meer kunt opschalen