Overslaan en naar de inhoud gaan

Green Belt DMAIC (3/8) – Measure Fase voor Numerieke Data

Green Belt DMAIC series

In deze serie artikelen beschrijf ik de verschillende statistische tools die je op green belt niveau kan verwachten te gebruiken binnen een DMAIC project. In deel 1 van de serie beschreef in het verschil tussen de yellow belt en de green belt, en het verschil tussen discrete en numerieke data. In het tweede artikel beschreef ik de 3 tools die gebruikt worden in de measure fase van een project bij discrete data. In dit artikel beschrijf ik de statistische tools die je in dezelfde fase kunt gebruiken bij numerieke data.

 

Figuur 1 laat het overzicht zien van statistische tools die in de verschillende fasen van verschillende niveaus van six sigma gebruikt worden. Dit artikel focust zich op de blauw cellen in de meet fase van het project. Tools die gebruikt kunnen worden in deze fase zijn de scatterplot, matrixplot, process behavior chart, histogram, Gage R&R en twee manieren om capabiliteit meetbaar te maken: Cp en Cpk.
Deze tools wordt gebruikt binnen de 3 stappen binnen de meet fase zoals in figuur 1 afgebeeld: (1) de eerste indruk, (2) valideren van data, en (3) het in kaart brengen van de huidige prestaties.
 

Mudamasters - Green Belt table of Tests

Figuur 1: Overzicht van veel gebruikte statistische toetsen

 

De eerste stap binnen de meetfase van figuur 1 beschrijft het krijgen van een EERSTE INDRUK van de huidige data die we hebben. Afhankelijk van wat voor type data je hebt, kun je een histogram gebruiken, een scattterplot of matrix plot gebruiken, or een process behavioral chart bekijken.

Een histogram is een grafische weergave van de verdeling van een reeks van numerieke waarden (y) ten opzichte van 1 x waarden en deze tool is ook al besproken is in het eerste artikel van deze serie. De vorm van de grafiek die we zien helpt ons om een beeld te vormen van de huidige situatie. Vragen als: ‘is de numerieke reeks normaal verdeeld?’ En ‘Hoe groot is de spreiding van de waarden?’ kunnen worden beantwoord. We zullen verderop in dit artikel meer in detail ingaan op het aflezen van capabilities vanuit dit histogram.

Waar een histogram een grafische weergave is van een numerieke reeks voor 1 discrete waarde, is een scatterplot een weergave van de correlatie tussen twee numerieke reeksen. Hierdoor kun je in je eerste indruk al zien of er een link tussen de twee variabelen te vinden is. In Figuur 2 zien we 3 voorbeelden van een scatterplot. De linker grafiek laat een positieve correlatie tussen 2 numerieke reeksen zien: de hoger X is, de hoger Y is. De middelste grafiek laat een negatieve correlatie tussen X en Y zien: de hoger X is, de lager de Y-waarde. De rechter grafiek tot slot, laat zien dat er geen correlatie tussen X en Y is, de waarden zijn willekeurig over de grafiek verdeeld.

 

Scatterplot examples

Figuur 2: Scatterplot examples (BRON: Khan Academy)

 

Een matrixplot is een verzameling van scatterplots, waarbij we meerdere numerieke reeksen met elkaar kunnen vergelijken. Je kunt dan voor alle mogelijke combinaties van reeksen in één opslag zien of er een relatie bestaat tussen enkelen van die reeksen.

Tot slot kunnen we in de eerste stap van de meetfase een process behavioral chart gebruiken. Dit is een overzicht van de trend van de numerieke reeks, bijvoorbeeld het meten van temperatuur van een product wanneer hij van de machine komt in de tijd.

 

De tweede stap in de meetfase is het VALIDEREN VAN HET MEETYSTEEM (Measurement System Analysis – MSA) aan de hand van een GAGE R&R. Deze test meet de Repeatability (herhaalbaarheid) en de Reproducibility (reproduceerbaarheid) van de Gage, een meetinstrument. De Gage R&R is te vergelijken met de Attribute Agreement Analysis die we gebruiken voor discrete data, met als verschil dat we de Gage R&R dus voor numerieke data kunnen gebruiken.

De Gage R&R is een percentage dat 3 factoren met elkaar vermenigvuldigd:
(1) de herhaalbaarheid van test gedaan op hetzelfde product sample door dezelfde persoon,
(2) de reproduceerbaarheid tussen testresultaten van verschillende operators,
(3) het verschil tussen operators die dezelfde metingen doen.

De resultaten van de test lees ik persoonlijk het liefst af in de tabel die uit Minitab of JMP komt. De Figuur 3 laat een voorbeeld zien van een tabel als output van minitab. In de bovenste helft van de figuur We zien alle verschillende soorten variatie samengevat in een tabel, de contribution factors van elk van de 3 factoren. Afhankelijk van welk type variatie het hoogst is, kunnen we verbeter acties definiëren.
In de green belt focussen we ons alleen op de bovenste helft van de figuur, en lezen we de contribution variance (VarComp) af van de Gage R&R. In dit voorbeeld is de VarComp-waarde 7.76%. Over het algemeen is een VarComp-waarde van <10% een goed meetsysteem, een waarde tussen de 10 en 20% een acceptabel meetsysteem, en een waarde van >20% onacceptabel.

 

Gage R&R example

Figuur 3: Gage R&R tabelweergave van de resultaten.

 

De derde stap binnen de meet-fase van een DMAIC-project met numerieke dat is het in kaart brengen van de HUIDIGE PRESTATIES a.d.h.v. CAPABILLITY ANLAYSES.
Dit is waar de klassieke procescapabiliteitsindexen, Cp en Cpk, een rol gaan spelen.

De procescapabiliteitsindex Cp is het kengetal dat staat voor de verhouding tussen de spreiding van het technische tolerantiegebied en de variatie van het proces. In grafische beeldvorming heeft dit te maken met de breedte van het histogram ten opzichte van de breedte van het gebied waarin de klanten eisen worden weergegeven (upper- en lower limit). Het woord ‘capabiliteit’ geeft al aan dat dit ermee te maken heeft om aan te geven of het proces in staat is om binnen de spreiding van klanteneisen te produceren.
Figuur 4 laat drie mogelijke grafieken zien met bijbehorende Cp waarden: In de bovenste grafiek bevind de spreiding van de grafiek zich buiten de specificaties van de klant, wat een Cp <1 betekent. Dit is niet wenselijk.
In het middelste gedeelte van het plaatje bevind de spreiding van het histogram zich precies binnen de specificaties, wat betekent dat  Cp = 1.
De onderste lijn in de grafiek laat een spreiding van het histogram zien dat zich ruim binnen de specificaties bevind. Dit resulteert in een Cp van >1, en is dus positief.
Het doel van de capabiliteitsindex Cp is om even groot of kleiner dan de spreiding van de klanteneisen te zijn. Deze waarde zegt alleen wat over de breedte van de grafiek die we hebben, van de spreiding van het histogram. Een Cp=0.5 betekent niet automatisch dat we geen uitval produceren. Hiervoor hebben we de combinatie met de Cpk nodig.

Capability Index Cp

Figuur 4: Drie voorbeelden van Cp

 

De procescapabiliteitsindex Cpk, heeft te maken met de locatie van de spreiding van numerieke waarde ten opzichte van de klanten eisen. Wanneer een proces en Cp heeft van precies 1, zoals in de middelste grafiek in figuur 4, maar hij is 2 cm naar links verschoven, valt een gedeelte van de producten toch buiten de klanten specificaties. Hierdoor is de Cpk een tweede index die belangrijk is om te bekijken bij een capabiliteitsanalyse. Het berekent de kortste afstand tussen de mean (hoogste punt van het histogram) tot één van de specificatie assen.
Er ontstaan 4 soorten waarden, elk weergegeven in figuur 5. In de bovenste grafiek is de Cpk >1, wat positief is. In de tweede grafiek zien we dat een gedeelte van het histogram buiten de specificaties ligt. De afstand van het gemiddelde naar deze Upper Specification Limit (USL) wordt dan < 1. Dit is geen ideaal proces. In het derde geval ligt de mediaan zelfs precies op de upper specification limit, wat een Cpk van 0 betekent. In dit proces zou 50% van de producten buiten specificatie vallen. Een niet zo geschikt proces dus. Tot slot de vierde grafiek uit figuur 5, waarbij we een negatieve Cpk waarde hebben. Dit is een nog slechter proces, waarbij meer dan de helft van de producten buiten specificaties ligt, ondanks dat de spreiding van de proces output (de Cp) kleiner is dan de spreiding van klantenspecificaties.

 

Capability index Cpk

Figuur 5: vier mogelijke Cpk bij dezelfde Cp waarde.

Na het analyseren van de Cp en Cpk heeft de projectleider als het goed is een goed idee waaraan hij of zij aan kan werken in het project. Bij een ideaal proces zijn beide waarden namelijk >1. Met deze waarden hebben we alle drie de stappen van de meetfase besproken. In de volgende drie artikelen wordt de analyse fase beschreven en de statistische tools die je kunt gebruiken aan de hand van dezelfde verdeling als dat ik in de meetfase heb gedaan:

 

Green Belt DMAIC (4/8) – Analyze Fase voor Discrete Data

 

Green Belt DMAIC (5/8) – Analyze Fase voor Numerieke Data

Reactie toevoegen