Statisztikai jelentőség

A valóság költészete
Tudomány
Ikon science.svg
Tudnunk kell.
Tudni fogjuk.
  • Biológia
  • Kémia
  • Fizika
Kilátás a
óriások vállai.

Nyilatkozat statisztikai jelentőség a legközelebbi statisztika az eredmény igazolásához. Informálisan ez a kifejezés arra utal, hogy a null hipotézist valószínűleg nem igaz. Formálisan ez annak mércéje, hogy egy kísérletező mennyire hajlandó tévesen elutasítani a nullhipotézist. Statisztikai szignifikanciát akkor deklarálunk, ha az adatok megfigyelésének valószínűsége annak feltételezése mellett, hogy a nullhipotézis igaz (a p-érték) valamilyen tetszőleges érték felett vagy alatt van, amelyet kisbetűs alfa (α) képvisel. Az alfa alatti p-érték arra utal, hogy az adatok nincsenek összhangban a valódi nullhipotézissel. Hagyományosan a nullhipotézist elvetik, statisztikai szignifikanciát deklarálnak, és elindítják a pártokat.


A „jelentős” szó ebben az értelemben nem azt jelenti, hogy „nagy” vagy „fontos”, mint a szó mindennapi használatában. Ez csak azt jelenti, hogy a hatás elég nagy ahhoz, hogy valószínűtlennek tűnjön csak véletlenül. A statisztikailag jelentős hatások valójában nagyon kicsiek lehetnek. A kisebb hatások jelentőségének bemutatásához általában nagyobb mintaméret szükséges.

Tartalom

A statisztikai szignifikancia alapjai

  1. Kezdje a kifejezetten a kérdésre összegyűjtött adatokkal
  2. Világosan fogalmazzon meg egy null és alternatív hipotézist
  3. Alakítsa ki a vizsgálatnak megfelelő alfa szintet
  4. Számítson ki egy tesztstatisztikát és annak megfelelő valószínűségét a nullhipotézis alatt (vagy használjon számítógépet).
  5. Hasonlítsa össze a p-értéket az alfa-szinttel és
    1. Ha a p-érték alacsonyabb, utasítsa el a nullát
    2. Ne utasítsa el a null értéket, ha a p-érték magasabb

Megfelelően hipotézis Az alfa meghatározása az adatgyűjtés előtt történik. A megfelelő alfa kiválasztásának a téves következtetés levonásának kockázatának átgondolt mérlegelésén kell alapulnia, de általában 0,05 vagy 0,01. A szignifikancia és a statisztikai teljesítmény között kompromisszum van (annak valószínűsége, hogy a nullhipotézist elutasítják, mivel hamis). Az alacsony alfaérték azt jelenti, hogy a null elutasítása kevésbé valószínű, hogy hibás, de csökkenti az ilyen elutasítás esélyét is. A minta méretének növelése növelheti a szignifikancia valószínűségét a teljesítmény csökkenése nélkül.


Az elterjedtebb statisztikai megközelítéseknél (azaz „gyakoriak”) a statisztikai szignifikancia a hipotézis tesztelés eredményeiből fakad. An alternatív hipotézis (az ottvanhatást) előnyben részesítik - és a null hipotézist (hogy vannemhatás) elutasításra kerül - ha a kísérleti bizonyítékok szignifikáns eltérést mutatnak a nullhipotézistől. Ha nincs szignifikáns különbség, a nullhipotézist nem utasítjuk el.

Hogy világos legyen, a statisztikai szignifikancia teszt egyik hipotézist sem igazolja. A null elutasítása csak azt sugallja, hogy a bizonyítékok elutasítják a nullát ahhoz, hogy a befogadó alternatív hipotézis karjaiba ugorjunk. A nullhipotézis elutasítása azt mondja, hogy vagy a nullhipotézis valószínűleg igaz, vagy nincs elegendő bizonyíték annak elutasításához; nem bizonyítja a nullhipotézist. A statisztikai jelentőség csak egy módja annak, hogy kijelentést tegyünk a bizonyítékok erősségéről.

Alfaérték kontrao-érték

A p-érték jelentésének leírása a statisztikai szignifikancia tesztben

A hipotézis teszt egy nullhipotézis és egy alternatív hipotézis megfogalmazásából, egy alfa érték kiválasztásából, az elutasítási régió meghatározásából, az adatok gyűjtéséből, a statisztika kiszámításából és annak értékeléséből áll, hogy a statisztika az elutasítási régióba esik-e. A hipotézis tesztnek négy lehetséges eredménye van: a nullhipotézis igaz és megtartott, a nullhipotézis hamis és elutasított, a nullhipotézis igaz és elutasított, a nullhipotézis pedig hamis és megtartott. Ha a nullhipotézis igaz, de elutasításra kerül, akkor ez egy I. típusú hiba. Ha a nullhipotézis hamis, de megmarad, akkor ez egy II. Típusú hiba. Az I. típusú hiba valószínűsége definíció szerint megegyezik az alfa értékkel. A II. Típusú hiba valószínűsége általában nem számítható ki, mivel az alternatív hipotézis nem tartalmaz ismert eloszlást. Ha a kísérlet lehetséges eredményei „legvalószínűbbnek” (a nullhipotézist tekintve) a „legkevésbé valószínűnek” rendelhetők, akkor a tényleges eredményekhez az eredmények valószínűségével megegyező értéket rendelhetünk, hozzáadva az összes „kevésbé valószínű” eredményt . Ezt a valószínűséget „o-érték'. Ha aoértéke kisebb, mint az alfa értéke, a nullhipotézist elutasítják. A teszt jelentőségét az alfa-érték határozza meg, amelyet a teszt eredményei nem befolyásolnak. Az egyetlen hatás ao-értéke az, hogy vagy kisebb, mint az alfa-érték, és a nullhipotézist elutasítják, vagy pedig nagyobbak, mint az alfa-érték, és a null-hipotézist megtartják. Az eredmény nem válik statisztikailag szignifikánsabbá, ha ao-érték 'sokkal kisebb', mint az alfa érték, szemben azzal, hogy egyszerűen 'valamivel kisebb'.



Visszaélés

A statisztikákkal való visszaélés az, amikor újságírók vagy bizonyos napirend-tolók figyelmen kívül hagyni a jelentőség fogalma teljes egészében - hamis információkhoz vezet. 2005 - ben a Egyesült Királyság kormány arra a következtetésre jutott, hogy nem voltjelentősnövekedés drog használat az Egyesült Királyság iskoláiban ”. Nem elégedve azzal a következtetéssel, hogy „a dolgok valójában nem is olyan rosszak”, néhány újság ráugrott a jelentésre, és úgy döntött, hogy levonja saját következtetéseit. Őszintén amatőr módon keresnek valamit az enyémek számára ( Utómegjelölés ), ezt észrevették kokain az iskolákban történő felhasználás 1% -ról 2% -ra nőtt - bár ezeket összegeztük az összegzésben, valójában 1,4% és 1,9% volt, tehát 35% -os növekedés, nem pedig 100% -os növekedés . Megvolt a dohányzó fegyverük; annak ellenére amit a kormány megállapított, a kokainfogyasztás megvolt megduplázódott , a kokain elárasztotta a játszóteret, és a kormány leplezte. A kormány következtetése azonban pontosabb volt, mert figyelembe vette a jelentőséget, a klaszterezést és azt a tényt, hogy sokféle kábítószer használatát kérdezték le. Ha sok változót tesztel, annak esélye, hogy az egyik egyértelmű tendenciát mutatvéletlenülnövekedni, ezért a szignifikancia tesztjeit megfelelően módosítani kell. A tényleges matematika elvégzése után az eredmények valójában nagyon jelentéktelenek voltak, lényegében véletlenül, és annak a véletlenszerű esélynek az eredményeként, hogy a minta egy olyan csoportra esett volna, amely olyan gyógyszereket használ, amelyek nem reprezentálják az egész mintát.


Statisztikai szignifikancia problémái

Az alfa-értéket általában 0,05-re vagy annál kevesebbre állítják be. Ez azt jelenti, hogy kevesebb mint öt százalék az esély arra, hogy a véletlenszerűen elutasítsák a nullhipotézist. A 0,05-es alfa-szintben nincs semmi alapvetően varázslat, de sok generáció után az elemzés során úgy tűnik, hogy bizonyos mágikus érték sok tudomány számára. Ha egy statisztikai teszt visszatér p = 0,04-re, akkor az eredményeket szignifikánsnak, ha pedig p = 0,06, akkor nem szignifikánsnak nevezzük.

Ezzel a szokásos alfa-szinttel 20-ból körülbelül 1 eredménynek vissza kell térnie, ha valóban nincs hatás. Ez megteszi gyakran fordulnak elő tehát helytelen a jó értéket feltételezni, ami azt jelenti, hogy teljesen biztos vagy benne; még mindig arról szól valószínűség . Számos statisztikai tesztet lefuttató egyedi kísérletekben ez problémát jelent, ha 40 tesztet futtat, körülbelül kettő közülük olyan hatást mutat, amely valójában nincs. Ezt gyakran a családonkénti hibaarány és nehezen ellenőrizhető, de néhány intézkedés alkalmazható. Noha ezt a problémát könnyen át lehet látni egyetlen kísérleti sorozatban egyetlen cikkben, ugyanaz a jelenség akkor jelenik meg, ha egy rakás kísérletet tesznek közzé több cikkben. A világszerte naponta lefolytatott több ezer kísérlet miatt nagyon nagy számuk statisztikai jelentőséget mutat, amikor valóban nincs semmilyen hatás. A folyóiratokban megjelenő elfogultságok eltúlozzák ezt a problémát, mert a folyóiratok ritkán tesznek közzé olyan kísérleteket, amelyek csak nem hatásosak (vagyis „sikertelen” kísérletek), és sokkal valószínűbb, hogy olyan hatású cikkeket tesznek közzé. Tehát a publikált cikkek hatalmas, ellenőrizetlen elfogultsággal zárják a statisztikai jelentőséget ott, ahol valójában nincs.


Visszaélés az áltudománnyal

Ez az egyik oka annak, hogy értelmetlen egy teszt egyetlen dokumentumban történő kiválasztása a pont megfogalmazása érdekében. Ez egy általános taktika áltudomány nak nek papírok ezreiben keresgélve találja meg azt az egyetlen eredményt, amelyik lényeges és pontot tesz . A valódi tudományt a bizonyítékok túlsúlyának kell kísérnie, és a kísérleti eredményeket ismételten és megbízhatóan meg kell ismételni, mielőtt beépülnének az elfogadott tudásba. Ez az oka tudományos konszenzus fontos és quackok és forgattyúk amelyek ellentétesek ezzel a konszenzussal, nem szereznek pontot azzal, hogy egyetlen példát találnak egy cikkben, amely alátámasztja állításukat.

A fenti problémák többnyire a statisztikai elemzés gyakoriságú megközelítésének köszönhetők. Egyre növekszik a tudósok mozgalma, akik ösztönzik a Bayesian alapú statisztikák. A Bayes-féle megközelítésekre nem vonatkoznak ugyanolyan szisztematikus hibaelterjedési kérdések, mint a gyakoribb megközelítésekre (azonban saját egyedi problémakészleteik vonatkoznak rájuk).

P-értékű horgászat vagyo-hackelés '

'P-értékű horgászat (más néven: „halászati ​​expedíció”), közismertebb nevén „p-hackelés”, a statisztikai kézilabda elutasító kifejezés, amelyet a forgattyúk és azok, akiknek ütemtervük van, gyakran visszaélnek. A statisztikailag szignifikáns eredmény elérésének két általános módja van, ami egyáltalán nem sokat jelent. Az első az, hogy nagyszámú változóval végzett vizsgálatokban összehasonlítják az összes változót, és remélik, hogy valami jelentős lesz. A megfelelő módszertan előírja, hogy a kísérletező előzetesen válassza ki az összehasonlítandó változókat, és a további összehasonlítások után post-hoc korrekciókat hajtson végre. Más szavakkal, ha csak a lehető legtöbb változót hasonlítjuk össze, akkor jelentős eredmény születhet, bár ez valószínűleg statisztikai zaj. A post-hoc korrekció vagy csökkenti a post-hoc teszt alfa szintjét, vagy növeli annak szintjétoértéket úgy, hogy a család szerinti hibaarány (pl. 20-ból 1) fennmaradjon.

A második trükk a halászato-értékek az alanyok számának felpörgetésével, amíg a jelentőség nem érhető el. Normális esetben jó, ha több alany van, azonban az adatokat ennek fényében kell értelmezni. A nagy tárgykészletnél gyakran előfordul, hogy még az eszközök kis különbsége is jelentős lesz, annak ellenére, hogy a hatás nagysága közel semmis. Ezért fontos a hatás mellett a hatásméretet is megnéznio-érték.


Javasolt megoldások a problémákra

Egy másik megközelítés az volt, hogy azt állítsuk, hogy a statisztikának el kell veszítenie a tudomány mágikus státusát, mint valamiféle analógia a bizonyíték , hanem inkább érvként vagy a bizonyítékok erejének mércéjeként kell tekinteni rá. Ao- a statisztikák értéke csak egy darab a tágabb perspektívában, és ezeket más típusú bizonyítékokkal kell összehasonlítani.P-értékek közvetlenül jelenthetők, lehetővé téve az emberek számára, hogy más következtetésekkel integrálják őket következtetéseik meghozatalakor. Ha más bizonyíték gyenge, talán ao-0,05 értéke nem meggyőző, vagy ha az összes többi bizonyíték erős aoA 0,1-es érték elég jó. Ez azonban problematikus, mivel közvetlenül foglalkozik veleo-értékek sokféle statisztikai tévedés lehetőségét nyitják meg, például ao- két tanulmány értékei a „kombinált” megszerzéséhezo-érték.

A konfidencia intervallumokra összpontosítva a helyettoAz értékek rugalmasabb és kevésbé önkényes módszert nyújtanak a bizonyítékok súlyozására. Természetesen a 95% -os konfidenciaintervallum úgy értelmezhető, hogy elutasítja a bizalomintervallumon kívül eső értékek nullhipotézisét 0,05 alfánál. Maga a konfidenciaintervallum lehetővé teszi, hogy az összes értéket a valószínű tartományban láthassa, és eldönthesse, hogy a különbségnek ez a becslése még elég pontos-e ahhoz, hogy érdemes legyen rá támaszkodni. Az alacsonyhoz kapcsolódó széles konfidencia intervallumo-érték kevésbé tűnhet hasznosnak, mint egy keskeny, pontosabb konfidencia intervallum, amely nem utasítja el a null értéket.