Overslaan en naar de inhoud gaan

Green Belt DMAIC - Measure Fase voor Discrete Data

Green Belt DMAIC series

In deze serie artikelen beschrijf ik de verschillende statistische tools die je op green belt niveau kan verwachten te gebruiken. In deel 1 van de serie beschreef in het verschil tussen de yellow belt en de green belt, en het verschil tussen discrete en numerieke data. In dit artikel beschrijf ik de statistische tools die vaak gebruikt worden op green belt niveau in de measure fase van een DMAIC-project bij discrete (categorische) data.

Figuur 1 laat het overzicht zien van statistische tools die in de verschillende fasen van verschillende niveaus van six sigma gebruikt worden. Dit artikel focust zich op de zalmkleurige cellen in de measure fase. De measure fase bestaat uit drie stappen: (1) de eerste indruk, (2) valideren van data, en (3) huidige prestaties. Voor elk van de stappen is er een tool beschikbaar die gebruikt kan worden wanneer je discrete data beschikbaar hebt, respectievelijk de boxblot, een Atribute Agreement Analysis, en een analyze van de DPMO/PPM waarden. Deze drie tools worden in dit artikel verder beschreven.

MudaMasters - GreenBelt Table of Tests

Figuur 1: Overzicht van veel gebruikte statistische toetsen

 

We beginnen met de eerste stap van de meetfase en de daarvoor geschikte tool: DE BOXPLOT - OM EEN EERSTE INDRUK OP TE DOEN. Dit is een visuele weergave van een (numerieke) dataspreiding die je kunt gebruiken om verschillende discrete categorieën met elkaar te vergelijken.
Figuur 2 laat een voorbeeld van een boxplot zien en de informatie die we hieruit kunnen afleiden.
De grijze box in het midden van de boxplot representeert 50% van de datapunten die hebt gemeten, met aan de uiteinden de upper- en lower quartile (resp. het 3e en 1e kwartiel). Hoe smaller de box, hoe minder de variatie tussen de datapunten.
De mediaan is weergeven als een zwarte lijn binnen deze grijze box. Dit betekent dat er evenveel datapunten hoger dan deze waarde zijn als dat er lager dan deze waarde zijn.
zowel boven als onder de boxplot zijn de minimum en de maximum waarde weergegeven met horizontale strepen. Deze woorden door een programma als Minitab statistisch berekend.
En zijn namelijk ook outliers weer te geven met een stip buiten deze grenzen. Dit zijn de waarden die onderdeel van je sample data zijn, maar die zover buiten de rest van de set liggen dat ze buiten beschouwing worden gelaten door het rekenprogramma omdat ze anders het totaalbeeld van bijvoorbeeld de boxplot te veel vertekenen.

 

Boxplot voorbeeld
Figuur 2: Boxplot voorbeeld (links) en vergelijkingsvoorbeeld (rechts)

 

Aan de rechterzijde van figuur 2 zien we een voorbeeld waarbij we verschillende boxplots met elkaar kunnen vergelijken. De discrete data categorieën in dit voorbeeld zijn de continenten waarop we de levensverwachting met elkaar vergelijken. Hieruit kunnen we bijvoorbeeld afleiden dat de mediaan leeftijd in Europa, Azië en (noord en zuid) Amerika veel hoger ligt dan in Afrika.  We kunnen echter ook zien dat de spreiding van leeftijd in Afrika veel groter is dan op de andere continenten. Zoals verwacht zijn er ook op dat continent mensen die 75 worden, alleen is het aandeel veel kleiner dan in de Westerse wereld.

 

De tweede stap van de meetfase ( de 3e stap van de Green belt) is de meetsysteemanalyse ( MeasurementSystem Analysis (MSA)in het Engels) en we testen daarbij of het meetsysteem eenduidig werkt. In het geval van discrete data praten we binnen de MSA-stap over een ATTRIBUTE AGREEMENT ANALYSIS, waarin gekeken wordt of verschillende personen producten indelen in categorische data, waaronder bijvoorbeeld de discrete groepen: zoals ‘ok’ en ‘niet ok’.
In deze analyse selecteer je een groep personen (bijvoorbeeld 3), en laat hen een nauwkeurige set van productsamples beoordelen (tussen de 30 en de 100). De volgorde waarin de samples worden beoordeeld staat vast en elk persoon krijgt de reeks aan samples meerdere keren aangeboden (bijvoorbeeld 3 keer). Belangrijk is om samples te kiezen die op de rand van goed- en afkeur liggen, zodat het niet te overduidelijk is of de sample goedgekeurd of afgekeurd zou moeten worden. De resultaten van de atribute agreement analysis zijn tweevoudig. De eerste helft van de resultaten beschrijft de herhaalbaarheid (de repeatability) van de meting. In dit geval laat een grafiek zien in hoeverre de verschillende mensen die mee hebben gedaan in de studie dezelfde samples hetzelfde beoordeelden.
De tweede helft van de resultaten van de toets vergelijkt de beoordeling van de medewerkers die van een expert. Hiermee kunnen we beoordelen in hoeverre de meetmethode reproduceerbaar (de reproducibility) is. Figuur 3 laat het resultaat zien van een voorbeeld test waarin 3 mensen de kwaliteit van een winegum testen en uitsorteren op basis van ‘ok’ en ‘niet-ok’. Wat valt op?
De herhaalbaarheid is bij operator 3 het beste. Deze persoon heeft alle samples de verschillende keren dat ze beoordeeld zijn, hetzelfde beoordeeld (zie linkerhelft van figuur 3). Operator 3 heeft ook de hoogste score in vergelijking met de expert. 93% van de waarden van operator 3 kwamen overeen met die van de expert (De blauwe stip op de rechterhelft van figuur 3).

Als doelstelling zou je 80% als waarden willen hebben voor zowel de herhaalbaarheid als de reproduceerbaarheid. Bedenk wel, dat de sample die je hebt genomen op de rand van goed- en afkeur liggen. Dus, wanneer operator 2 slechts 70% dezelfde conclusies heeft getrokken in dit experiment, is er wellicht verbetering wenselijk, maar het zegt niets over hoe deze persoon een hele populatie aan samples beoordeeld.

Attribute Agreement Analysis Example

Figuur 3: Attribute Agreement Analysis grafiek.

 

Het derde gedeelte van de meetfase, en de 4e stap van de 8 stappen van een Green Belt project gaat over de HUIDIGE PRESTATIES van het proces en wordt bij discrete data gemeten in Parts Per Million (PPM), de Defects per Unit (DPU) of de Defects Per Million Opportunities (DPMO). De PPM is eenvoudig te berekenen door het aantal fouten uit de populatie te extrapoleren naar het aantal fouten per miljoen. Heb je 7 fouten in 100 samples, dan heb je een PPM van 7%, ofwel 70.000 parts per million die defect zijn. Deze meting houdt geen rekening met het aantal verschillende fouten dat kan optreden in een product. Het maximale PPM is dus gelijk aan een miljoen.

De methode die wel rekening houdt met de mogelijkheid dat 1 product meerdere fouten bevat is de DPU. Deze berekent het aantal gemiddelde fouten per unit dat getest is. Wanneer er 26 fouten gevonden zijn in 10 samples, is de DPU dus 26/10 = 2.6. In dit geval kan het aantal fouten dus wel groter zijn dan het aantal producten dat getest is.

De derde methode, DPMO, geeft een waarde door het aantal defecten te delen door het aantal samples x het aantal error typen. Deze waarde is ontworpen om six sigma levels van discrete waarden met die van numerieke waarden te kunnen vergelijken. Het vreemde aan deze waarde is echter, dat deze daalt wanneer het aantal fouttypen toeneemt. Het lijkt daarom te suggereren dat je fouten aan het proces moet toevoegen als verbetering, en dat lijkt me een beetje vreemd. Mijn voorkeur gaat daarom ook uit naar de andere twee waarden: de PPM en DPU.

In dit tweede artikel in de serie Green Belt DMAIC stonden we stil bij de meetfase van een project wanneer je discrete data tot je vervoeging hebt. De drie stappen binnen deze meetfase worden uitgevoerd aan de hand van de tools die hierboven beschreven zijn: een eerste indruk van de data krijgen we aan de hand van de boxplot, we analyseren het meetsysteem aan de hand van de attribute agreement analysis en tot slot meten we de huidige prestaties van het systeem aan de hand (van bijvoorbeeld defecten) aan de hand van parts per million, defects per unit of de defects pre million opportunities.

 

Ga verder naar:

Green Belt DMAIC – Measure Fase voor Numerieke Data

Reactie toevoegen