customers

Data warehouse van de ING Bank wordt omvangrijke Datahub

ING Bank Nederland heeft in drie jaar tijd een data warehouse ontwikkeld dat de commerciële sector van de bank verregaand ondersteunt. Dit data warehouse, dat de naam Informatie Services ING Bank -oftewel ISI- heeft meegekregen, wordt nu ook in toenemende mate ingericht voor de informatievoorziening van de Controller-processen ten behoeve van interne sturing en externe verantwoording.

“Zeker als je snel gegevens uit een bepaalde bron nodig hebt en daarop gelijk queries wilt loslaten, is de weg via de Operational Data Store sneller dan de vragen te richten op de meer geïntegreerde bestanden van het data warehouse. Tegelijk vindt het querien hierdoor niet plaats op het bronbestand zelf – met alle performancevoordelen van dien.”

- Henk van Roekel, Senior Management Consultant bij LogicaCMG Finance


Uitdaging:
Consistentie en integrale managementinformatievoorziening.

Voordelen:

  • Koppeling van gegevens uit verschillende systemen.
  • Mogelijkheid van nieuwe functionaliteiten zoals 1-op-1 marketing en het aanleveren van (kanaalspecifieke) leads.
  • Bredere ondersteuning.
  • Mogelijkheid voor nieuwe functionaliteiten om sneller gegevens los te maken uit de bron dankzij operationele datastore.

ISI heeft tot doel een bankbreed warehouse te realiseren. Er waren natuurlijk al managementinformatie-omgevingen toen ISI in 1999 startte, maar het ontbrak aan consistentie en integrale informatievoorziening. Als gevolg van het feit dat met verschillende basisbestanden werd gewerkt, kreeg de directie rapportages die elkaar deels tegenspraken.

Daarnaast was een grotere flexibiliteit van de ICT-omgeving gewenst. Nieuwe informatiebehoeften traden op terwijl de groeimogelijkheden beperkt waren. Tot slot moest de ING Bank over van een ‘kantorenstructuur’ naar een multichannel-aanpak (een aanpak met o.a. call centers en internet).

“Daar waren de systemen helemaal niet geschikt voor, dus de ombouw naar een klantgerichte organisatie met vele kanalen heeft zeker een swing gegeven aan de inrichting van de nieuwe infrastructuur. Vroeger was het kantoornummer dé sleutel, in ISI is dat het klantnummer en is er dus sprake van meer klantgericht werken. Voor een klant behoort het niet uit te maken via welk kanaal hij binnenkomt; hij moet alle producten kunnen afsluiten. En onze eigen mensen moeten binnen elk kanaal over dezelfde klantinformatie beschikken”, stelt de heer M. de Lusenet, Hoofd Marketing Facilities, Data en Support bij ING Bank vast.

Marketing Facilities is binnen ING Bank als het ware de poort naar de automatiseringsafdeling om te voorkomen dat deze overspoeld wordt door vragen van marketeers. Anderzijds kijkt Marketing Facilities naar het grotere geheel: “past de ene vraag bij de andere?”, “zijn er meer structurele oplossingen denkbaar?” etc. De afdeling is als ‘informatiemakelaar’ dienstverlenend naar de marketeers en primair verantwoordelijk voor het gebruik van gegevens binnen met name de marketingprocessen. Maar de afdeling van De Lusenet staat niet alleen voor deze taken.

Marketing Facilities geeft aan de IT-afdeling aan wat de informatiebehoefte op een bepaald moment is en de informatie-analisten maken daar datamodellen van. “We kijken vervolgens uit welke bronsystemen we de gegevens moeten halen. En hoe we de manier waarop de data in de bronsystemen zitten, kunnen vertalen naar hoe ze uiteindelijk in het datamodel terechtkomen. De resultaten komen dan voor validatie en testing weer terug bij Marketing Facilities.” Henk van Roekel,Senior Marketing Consultant bij LogicaCMG Finance, geeft leiding aan het ISI-project en is dus een belangrijke sparringpartner van De Lusenet in onder andere modellenkwesties. Gezamenlijk zorgen zij ervoor dat het data warehouse structureel functioneel is.

Data Warehouse Architectuur

De multi channel architectuur (MCA) bij ING Bank kent tien objectgebieden; deze zijn tevens uitgangspunt voor de modellen in het data warehouse. Voorbeelden van deze objectgebieden, gevoed uit tal van bronbestanden, zijn: campagne (actieresponse), producten, overeenkomsten, transacties, kanalen, soort relatie, segment en ING-organisatie. De Lusenet: “Elke klantgroep krijgt een bepaald bedieningsconcept, dus dat moet je in de volle breedte kunnen volgen, meten en aansturen vanuit het data warehouse.”

De data warehouse-architectuur bestaat uit een aantal services en ondersteunende bedrijfsprocessen. Datastaging is de service die alle gegevensverwerkende processen in het data warehouse ondersteunt. Hierbij gaat het zowel om gegevensontvangst vanuit bronnen als om bewerkingen binnen het warehouse tussen bijvoorbeeld de Operational Data Store (ODS), het Enterprise Data Warehouse en de verschillende datamarts. PowerCenter van Informatica wordt gebruikt voor de ontwikkeling en exploitatie van alle processen binnen de datastaging service. Bronnen leveren data aan in een standaard bestandsformaat en als flat files. Die worden door Informatica PowerCenter opgepakt en er worden in de datastaging service een aantal technische controles uitgevoerd; onder andere op compleetheid, correcte datum, etc. De data – een extract, bepaald op basis van gegevensvragen van gebruikers – wordt over het algemeen één-op-één doorgeplaatst in het ODS. De informatiebehoefte is immers vertaald in een gegevensvraag naar een bron toe.

Vervolgens gaat data uit de operational data store weer via de datastaging laag, naar het enterprise data warehouse. Daarvoor vindt nadere bewerking plaats: met name de integratie van gegevens uit verschillende bronnen. “Een relatiesysteem en een contactregistratiesysteem wil je bijvoorbeeld graag aan elkaar knopen. Die integratie vindt nu plaats met behulp van Informatica PowerCenter”, licht Van Roekel toe. Op de gegevens kan ook nog een bewerkingsslag plaatsvinden als uit het enterprise data warehouse extracties nodig zijn voor specifieke toepassingen; de bewerkte data gaat dan naar datamarts.

Ook dat gebeurt weer via PowerCenter in de datastaging laag. Uiteraard is veel zorg besteed aan de metadata. Tot de architectuur behoort een systeemonderdeel dat dient als repository service. De standaards waarop de bronbestanden data aanleveren, houden ook in dat gelijk met de datalevering metadata wordt geleverd aan de repository service. De repository vanuit Informatica PowerCenter komt daar tevens automatisch in terecht zodat precies te volgen is wat er in de datastaginglaag is gebeurd.

Ook Oracle’s PowerDesigner, waarin alle ontwikkelde modellen worden neergezet, heeft een eigen repository die naar de metadata-opslag gaat. De voor gebruikers belangrijkste service is natuurlijk de query-, reporting- en analyse-functionaliteit. Nadat het werk achter de schermen is gedaan, worden alle gegevens beschikbaar gesteld voor queries en analyses via de business intelligence tool van een andere software leverancier. Er worden periodiek vele standaard rapporten geproduceerd, maar de meer gespecialiseerde vragen gaan nog steeds naar de informatiemakelaars. “We zijn wel bezig met de bouw van een business intelligence-portal op het data warehouse”, meldt Van Roekel, “zo hebben de marketeers zelf wat meer mogelijkheden, maar het is een heikel punt. Men wil in het begin heel veel, maar uiteindelijk is men blij met mensen die er echt verstand van hebben.”

De Lusenet kent het probleem. “Dit soort toepassingen loopt in de praktijk het gevaar te verstoffen.”

UItdagingen

De belangrijkste uitdagingen waar Van Roekel zich voor gesteld zag in de realisatie van ISI door slechts twee afdelingen waren niet zozeer van technische aard. Hij noemt als eerste de eeuwige strijd tussen een gedegen opzet van een nieuwe architectuur en infrastructuur en een tijdige oplevering. “Pas na het eerste jaar zijn we serieus begonnen met het vullen van het data warehouse en konden we ook echt toegevoegde waarde leveren.”

Een ander lastig element is de ‘sponsoring’ van ISI door twee afdelingen in plaats van door de hele bankorganisatie. Wel vertelt Van Roekel dat de beheerorganisatie, de architectuur en de ontwikkelmethodiek van ISI nu dé standaard voor managementinformatie voor ING Bank is. Tevens is de ISI-oplossing een belangrijke kandidaat voor verdere standaardisatie binnen ING Nederland (dus alle ING-dochters en niet alleen de ING Bank). “Men kan niet meer zijn eigen systeem bouwen. Dat is winst en het geeft toch wat extra impulsen.”

Niet zozeer voor managementrapportages als wel voor dagelijkse beslissingen komt met enige regelmaat de wens naar voren om de operational datastore meer real-time te maken. Daarvoor moeten echter geavanceerdere uploadprocedures vanuit de bronsystemen worden gehanteerd. Aan deze ‘mooie en gewilde’ real-time omgeving zijn echter ook nadelen verbonden. Zo verliezen databeheerders in hun ogen het overzicht op de gang van zaken, de workload op ‘hun’ operationele systemen neemt toe en de veiligheid zal nog meer aandacht vragen.

Dat er in ISI toch een Operational Data Store naast een enterprise data warehouse staat, wordt ingegeven door besparing van tijd en energie. Van Roekel: “Zeker als je snel gegevens uit een bepaalde bron nodig hebt en gelijk daarop queries wilt loslaten, is de weg via de Operational Data Store sneller dan de bevragingen te richten op de meer geïntegreerde bestanden van het data warehouse. Tegelijk vindt het querien hierdoor niet plaats op het bronbestand zelf. Iets dat allerlei performance voordelen met zich meebrengt.”

Baten

Over performance gesproken: er moet toch het één en ander te melden zijn over kosten-baten van ISI na drie jaar? De Lusenet is over de baten stellig: “Wij kunnen met ISI niet veel zaken beduidend sneller en beter. Het is althans nog te vroeg om daar iets concreets over te zeggen. ISI heeft het wél mogelijk gemaakt om bredere ondersteuning te verlenen. Werd in het verleden door Marketing Facilities voornamelijk de verkooporganisatie van de bankkantoren en de verkoop via mail ondersteund, door ISI is het mogelijk om ook de ‘nieuwere’ kanalen, zoals het call center en internet, op dit vlak te ondersteunen.”

Daarnaast biedt ISI Marketing Facilities de mogelijkheid om nieuwe functionaliteiten aan te bieden. De Lusenet noemt als voorbeeld 1-op-1 marketing en het aanleveren van (kanaalspecifieke) leads. “Op termijn is het zelfs mogelijk om labeloverstijgende leads te genereren.” Gegevens van alle ING-dochters kunnen worden geanalyseerd binnen de ISI omgeving. Belangrijk uitgangspunt hierbij is wel dat alles in overeenstemming moet zijn met Europese privacy-wetgeving, waarbij de gegevensverstrekker (klant) toestemming moet geven voor dergelijk gebruik. Enkele maanden terug heeft ING om deze reden het gehele klantenbestand gemaild.

Speerpunt voor Van Roekel in deze tweede fase is de verdere aansluiting van ISI op de rapportage-omgeving die de controllers nodig hebben voor interne sturing van de ING Bank en externe verantwoording. Gedurende migratie van het oude naar het nieuwe systeem moet daarbij worden gewaakt voor een nieuw soort inconsistentie voor het management, namelijk die van rapportages gegenereerd uit de oude omgeving versus die uit ISI.

In 2003 is daarom veel aandacht in de projectaanpak uitgegaan naar optimalisering van het tempo waarop de oude managementinformatie-systemen gesaneerd zouden kunnen worden. “De klus is te gecompliceerd om snel af te willen wikkelen, maar te rustig is ook niet goed. Als de oude IT-infrastructuur wordt afgebouwd, gaat het namelijk om significante besparingen”, weet Van Roekel zeker.