Példa az eszközök használatát támogató Felkészítőre (Coach)
Egytényezős ANOVA - One-Way ANOVA
Az elemzés kimutatja a különbségeket a bemenet különböző szintjeihez (beállításihoz) tartozó kimenetek várható értékei között. Ahhoz, hogy az egytényezős ANOVA-t használhassuk az X változó mindenegyes szintjéhez kimenő adatokat (Y) kell gyűjteni
Hogyan csináljuk?
Igazoljuk, hogy a mérőrendszer az Y és X adatokra megfelelő
Hozzunk létre egy adatgyűjtő rendszert (ki fogja gyűjteni az adatokat, mikor, mennyit, milyen pontossággal, hogyan rögzítik, stb.)
Két különböző módon lehet bevinni az adatokat a Minitab-ba:
Az adatokat külön oszlopokba visszük be, mindenegyes oszlop egy faktorszintet jelent. Ehhez a bevitelmódhoz használjuk a következő elérést: ANOVA > One-Way (Unstacked)
Vigyük be az Y adatokat az egyik oszlopba, a faktorszinteket (X) egy másikba. Használjuk a következő elérési útvonalat: ANOVA > One-Way
Határozzuk meg a hipotéziseket. A nullhipotézis (Ho) az egytényezős ANOVA esetén: a kimenet várható értékei a bemenet minden szintjén (statisztikailag) megegyeznek. Az alternatív hipotézis (Ha): a kimenet várható értéke a bemenet legalább egy szintjén jelentősen (szignifikánsan) különbözik a többi szinthez tartozó várható érékek valamelyikéhez képpest
Ha megállapításra kerül, hogy a szintekhez tartozó várható értékek nem egyeznek meg, akkor a többszörös összehasonlítással (Multiple Comparison) megállapítható, hogy melyik várható értékek különböznek egymástól. A többszörös összehasonlításnál több alternatív módszer közül választhatunk. A választott módszer a megválaszolandó kérdéstől függ vagy a kockázat nagyságától, melyet hajlandók vagyunk elviselni. A Tukey módszert gyakran használják, mely egy konzervatív megközelítést jelent.
Választ kaphatunk a következő kérdésekre
Ha a bemenet szintjét változtatjuk az egyik szintről a másikra, akkor a folyamat várható értéke (statisztikailag) változatlan marad-e vagy az is változik?
Vajon a folyamat változékonysága a szintváltás előtt és után hasonló-e?
Mikor használjuk? Cél
Projekt közben |
Megállapítani - a bemenetek két vagy több különböző beállításával (szintjével) - hogy mely bemeneteknek van jelentős hatásuk a kimenet várható értékére |
Projekt közben |
Igazolni, hogy a bemenetek változtatása jelentős különbségeket hoz létre a kezdeti projekt várható értékéhez képest |
Adatok
Folyamatos Y, egyedülálló X kettő vagy több szintbeállítással (általában 3 vagy több)
Vegyük figyelembe a következőket
Először egy torzításmentes adatgyűjtési stratégiát kell kidolgozni azért, hogy a következtetéseink valóban reprezentatív adatokra támaszkodjanak
A maradékoknak függetleneknek, ésszerűen normális eloszlásúaknak valamint ésszerűen egyforma varianciával rendelkezőknek kell lenniük. ANOVA nagyon robosztus a nem normális eloszlással szemben különösen nagy mintanagyság esetén, és szintén robosztus a a varianciák különbözőségére ha a mintanagyságok egyformák vagy közelítőleg egyformák.
Mindig jó gyakorlat az, ha diagramokat használunk a statisztikai próbáknál. Az egytényezős ANOVA esetén a maradékokat elemezzük négy ábrával: hisztogram, normalitásvizsgálat, maradékok ábrázolása illeszkedő értékek függvényében és maradékok ábrázolása az adatfelvétel sorrendjében
Minitab standard kimenete csak az alternatív hipotézist értékeli, vagyis hogy legalább egy párosításnál a várható értékek között lényeges különbség tapasztalható-e? Az összehasonlítások (Comparisons) a páros összehasonlítások mindegyikét megadják.
Ha diszkrét számadatokkal rendelkezünk, melyek közötti különbségek egyformák valamint legalább 10 adatunk van, akkor úgy elemezhetjük az adatokat mintha folytonos adatok lennének.
One-Way ANOVA
Analyzes observed differences in the process mean at different levels (settings) of an input. To use the one-way ANOVA procedure you must collect a sample of data at each level of the X variable.
How-to
Verify that the measurement systems for the Y data and the input X are adequate.
Develop a data collection strategy (who will collect data, where, when, how much, how precise, how to record, and so on).
You can use one of two methods to enter data in Minitab:
Enter data in separate columns, one column for each factor level. Use ANOVA > One-Way (Unstacked) for data set up this way.
Enter Y data in one column, factor levels (X) in a second column. Use ANOVA > One-Way for data set up this way.
Determine your hypotheses. The null hypothesis (Ho) in a one-way ANOVA is whether the mean of the output is the same at all levels of the input, and the alternative hypothesis (Ha) is that the mean of at least one level is significantly different from the others.
If you determine that the means of the levels are not equal, you can use Multiple Comparisons to determine which means are different. There are alternative methods for making Multiple Comparisons. The method you choose may depend on the question you want answered, or it may depend on the amount of risk you are willing to accept. Tukey’s is often used, as it is a conservative approach.
Answers the questions:
If I change an input from one level to another, does the mean of the process stay the same or does it change?
Is the process variation the same before and after a change has been made to the process?
When to Use Purpose
Mid-project |
Fixing an input at two or more different settings (levels) helps to determine which inputs have significant influence on the mean of the output. |
Mid-project |
Verify that changes to inputs result in significant differences from the pre-project mean. |
Data
Continuous Y, a single X at 2 or more levels (generally 3 or more)
Take into consideration
First, you should develop a sound data collection strategy so that you ensure that your conclusions are based on truly representative data.
The residuals must be independent, reasonably normal and have reasonably equal variances. ANOVA is very robust to non-normality especially for large sample sizes and it is also robust to unequal variances especially when sample sizes are equal or nearly equal.
It is always good practice to graph your data whenever you use a statistical test. For one-way ANOVA, the residuals are usually analyzed by a histogram, normal plot, residuals vs. fits, and residuals vs. order. In addition, you may want to create a boxplot or individuals value plot on the raw data to identify any outliers.
Minitab’s standard output will only evaluate the alternate hypothesis that at least one of the levels has a different mean than at least one other level. However, the “Comparisons” option will provide various pairwise comparisons of all level means versus all other level means.
If you have discrete numeric data where it is possible to obtain every equally spaced value and you have measured at least 10 possible values, you can evaluate these data as if they are continuous.