parlarne, senza dare i numeri

Metodologie di studio e discussioni varie
Rispondi
DanieleU
Novizio
Messaggi: 541
Iscritto il: lun 3 mag 2010, 11:22
Cognome: Uboldi
Nome: Daniele
Provenienza: Milano

parlarne, senza dare i numeri

Messaggio da DanieleU »

In altro topic ho posto il testo che qui riproduco.

Prendiamo queste due seriazioni di Hebeloma sinapizans.
Ho colto un basidioma da un micelio e, a circa 800 mt. di distanza, un' altro basidioma da un micelio ovviamente diverso.
Scopo della raccolta: valutare le variazioni intraspecifiche.
I dati di riepilogo sono i seguenti:

Primo basidioma ( file: sinapizans) lunghezza: min. 8.37 , media 10.50, sd= 0.733 , max 2.42,n= 200
Secondo basidioma ( file: sinapizans1) min. 8.46, media 10.66, sd = 0.912, max 13.87, n=150

Si noti il numero delle osservazioni, rispettivamente 200 e 150: un numero considerevole, da tenere in cosiderazione.
Secondo voi le due seriazioni sono uguali ?
Per essere piu' rigorosi :

Ipotesi Nulla: sinapizans = sinapizans1 ; contro: Ipotesi Alternativa sinapizans diverso da sinapizans1

Devo dunque rispondere a due domande.
La prima: è possibile respingere l'Ipotesi Nulla perchè le due seriazioni sono significativamente diverse?
Seconda domanda: quante spore devo misurare perchè il test sia anche potente oltre che significativo?

Sulla seconda domanda va osservato che un test dell'ipotesi può essere significativo ma non potente.
Infatti, se io misuro poche spore posso avere una significatività nelle differenze ma, se aumentassi la dimensione del campione la significatività potrebbe non essere piu' provata.
In questo caso si dice che il test è significativo ma non potente.
La potenza dipende:
-dalla differenza delta tra le medie
- dalla differenza tra le deviazioni standard
- dalla potenza del test desiderata ( di solito la potenza beta viene posta all'80%)
- dalla formulazione di rischio alfa ( cioè dal livello di confidenza)
- dalla numerosità dei campioni
- dalla direzione delle ipotesi ( unilaterale o bilaterale; nel senso se vogliamo sapere che la prima seriazione sia o solo minore o solo maggiore della seconda; quando vogliamo sapere entrambe le cose allora serve un responso bilaterale sulle due code.)

Chi partecipa al quiz?
DanieleU
Novizio
Messaggi: 541
Iscritto il: lun 3 mag 2010, 11:22
Cognome: Uboldi
Nome: Daniele
Provenienza: Milano

Re: parlarne, senza dare i numeri

Messaggio da DanieleU »

Ecco alcune informazioni piu' nel dettaglio:
Allegati
percentili_sinapizans.png
percentili_sinapizans.png (105.43 KiB) Visto 5701 volte
DanieleU
Novizio
Messaggi: 541
Iscritto il: lun 3 mag 2010, 11:22
Cognome: Uboldi
Nome: Daniele
Provenienza: Milano

Re: parlarne, senza dare i numeri

Messaggio da DanieleU »

La significatività della differenza tra due medie è valutabile con il t di Student
Se carico i dati di riepilogo ( medie , deviazioni standard) nel programma statistico R ( ma va bene anche un semplice foglio di Excel) con le opportune istruzioni ottengo:

> a<-c(sinapizans$lunghezza)
> b<-c(sinapizans1$lunghezza)
> t.test(a,b)

Welch Two Sample t-test

data: a and b
t = -1.8175, df = 279.161, p-value = 0.07021
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.34370695 0.01370695
sample estimates:
mean of x mean of y
10.4996 10.6646
Tradotto dallo statistichese signifca, valutato il p-value ( cioè la probabilità di commettere un errore di primo tipo rifiutando l'Ipotesi Nulla) che non si può rifiutare l'Ipotesi Nulla.
Detto ancora meglio: non ci sono elementi per dire che le due medie siano diverse.
Per respingere l'ipotesi sarebbe stato necessario che fosse p<= a 0.05
Il fatto però che p sia abbastanza vicino a 0.05 non ci deve lasciare tranquilli.
Quantomeno, ottenuta la significatività del test, è bene indagare anche la potenza, in questo modo:

> power.t.test(delta=10.49-10.66, sd=0.733-0.912, power=0.80, sig.level=0.05, type="two.sample", alternative="two.sided", strict=TRUE)

Two-sample t test power calculation

n = 18.41539
delta = 0.17
sd = -0.179
sig.level = 0.05
power = 0.8
alternative = two.sided

NOTE: n is number in *each* group

Il numero di spore da misurare per essere confidenti che il test sia significativo ed anche potente è di 18,41 ( arr. 19)
Ne sono state misurate, rispettivamente, 200 e 150, dunque possiamo stare tranquilli. ( anzi, ho abbondato per niente :shock: )
Vediamo di capire le istruzioni impartite al programma:
-deltaè la differenza tra le due medie
- sd è la differenza tra le due deviazioni standard
- power è la potenza del test, il cui livello è fissato arbitrariamente ( di solito si considera una buona soglia porre b=80%)
- sig.level è la formulazione di rischio alfa ( di solito posto alfa=0.05 ovvero probabilità 1-alfa=0.95; ovvero confidenza 95%)
- two.sample si precisa con questa istruzione se si tratti di un solo campione o confronto tra due campioni
-two.sided viene definita la direzione dell'ipotesi ( può essere unilaterale, cioè a una coda o bilaterale, cioè a due code; secondo che si voglia esplorare a>b (o viceversa); oppure a<>b. Nel primo caso l'ipotesi è unilaterale; nel secondo bilaterale.
- strict.TRUE è un'istruzione che riguarda il trattamento dei dati, per riga o per colonna

Abbiamo dunque, al di là di possibili valutazioni "a occhio", la conferma scientifica delle variazioni intraspecifiche tra i valori medi di due seriazioni, provenienti da due diversi miceli di una medesima specie.

Finora abbiamo controllato se vi siano differenze tra le lunghezze. E le larghezze sporali?
Ripetiamo il procedimento anche per le larghezze:
> d<-c(sinapizans$larghezza)
> e<-c(sinapizans1$larghezza)
> t.test(d,e)

Welch Two Sample t-test

data: d and e
t = -4.4576, df = 317.339, p-value = 1.151e-05
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.3487889 -0.1351778
sample estimates:
mean of x mean of y
6.354550 6.596533

Ahio! Qui le cose vanno maluccio. p=1.151e-05; vale a dire p= 0.000001151
Questo vuole dire che esiste solo una probabilità su centomila di commettere un errore di primo tipo rifiutando l'Ipotesi Nulla. Ergo possiamo concludere che le medie delle larghezze sono molto diverse.
Viene da chiedersi, e prevengo un'obiezione: ma com'è possibile che con 0.24 µm di differenza si possa concludere che due medie di misure siano diverse?
La questione, e qui ne abbiamo la conferma, sta nel fatto che il test non valuta solo la distanza tra le medie ma, come ricordato, anche la distanza tra le loro deviazioni standard, il rischio alfa che siamo disposti a correre di sbagliare nel rifiutare l'Ipotesi Nulla, il livello di potenza beta del test, la direzione dell'ipotesi ( unilaterale, bilaterale), e infine, particolare rilevantissimo, la numerosità dei campioni.
Io ho misurato ben 200 e 150 spore; dunque il dato è da ritenersi molto stabile ( un pò come alle elezioni, quando i dati elettorali riguardano 80.000 su 90.000 sezioni). Questo spiega perchè, anche con differenze così piccole, si possa arrivare a concludere se siano o non siano significative.

Qui non riporto i dati ma ho eseguito anche il test sui volumi ed ho trovato anche li differenze altamente significative ( del resto, data la formula dell'elissoide di rotazione non ci si poteva aspettare nulla di diverso)

CONCLUSIONI:
La misura è cosa estremamente importante. I numeri ci dicono un sacco di cose: basta maneggiarli con cura e saperne cavare tutte le informazioni necessarie.
per questo insisto molto su quante spore si devono misurare, su come si prende nota degli intervalli e si riferiscono nei nostri report e, infine, su come li si elaborano.
Qui c'è la prova provata che anche 0.2 µm di differenza possono avere un'elevata significatività. Figuriamoci se le differenze sono di uno o piu' micron!
Da un punto di vista micologico, a proposito di questi basidiomi di Hebeloma sinapizans, provenienti da due miceli diversi, cosa si può concludere?
Le conclusioni spettano alla sensibilità e allo spirito di osservazione del micologo; il quale, a mio avviso, deve prendere atto di come le variazioni intraspecifiche possano essere anche notevoli.
Qui abbiamo parlato di un confronto semplice: tra le medie di lunghezza larghezza ( e volume) delle spore.
Ma è sempre possibile, con test piu' complessi ( regressioni multivariate, analisi fattoriale, in particolare modo con l'Analisi delle Corrispondenze, con la costruzione di cladogrammi fenetici) stabilire se le variazioni intraspecifiche riguardino piu' caratteri.
In questo caso è sempre possibile formulare un Ipotesi Nulla multivariata che consideri la possibilità di trovarsi d'innanzi a mutamenti sostanziali e non episodici.
Naturalmente l'indagine necessiterebbe di un approccio multilaterale, con il quale dovrebbero essere presi in considerazione sia gli aspetti macroscopici che microscopici e biomolecolari.
Questo è il modo corretto di trattare i numeri senza.......dare i numeri :) :D
Rispondi