Non ci sono recensioni
Descrizione
Questo libro è stato scritto per gli studenti in scienze mediche ed è un testo introduttivo allo studio della biostatistica o l’ uso di tecniche numeriche per l’ acquisizione di informazioni da dati ed eventi. I numeri, i nquanto più precisi delle parole, sono particolarmente adatti alla comunicazione di risultati scientifici.
Prefazione
Questo libro è stato scritto per gli studenti in scienze sanitarie ed è un testo introduttivo allo studio
della biostatistica – l’uso dei numeri e delle tecniche numeriche per estrarre informazioni dai dati e dagli
eventi – e per utilizzare queste informazioni per comunicare i risultati scientifici. Tuttavia, così come si può
mentire con le parole, si può mentire anche con i numeri. In effetti, i numeri e le bugie sono stati associati
per lungo tempo; c’è addirittura un libro intitolato How to Lie with Statistics. È probabile che questa
associazione debba la sua origine – o almeno la sua prima enunciazione – al primo ministro britannico
Benjamin Disraeli. Mark Twain sostiene che Disraeli abbia detto: «Esistono tre tipi di bugie: le bugie, le
maledette bugie e la statistica». Basta limitarsi ad osservare una moderna campagna politica per convincersi
dell’abuso della statistica. Ma basta con le bugie; questo libro adotta la posizione del Professore Frederick
Mosteller, che disse: «È facile mentire con la statistica, ma è ancora più facile mentire senza di essa».
Background
Principles of Biostatistics è rivolto agli studenti di scienze biologiche e sanitarie che desiderano apprendere
i moderni metodi della ricerca. La prima edizione era basata su un corso obbligatorio per studenti
laureati alla T.H. Chan School of Public Health della Harvard University, frequentato anche da numerosi
altri operatori sanitari di Harvard. Il corso è antico quanto la Scuola stessa, a testimonianza della sua importanza.
Si sviluppa nell’arco di 16 settimane di lezioni ed esercitazioni in laboratorio; le esercitazioni in
laboratorio richiamano gli argomenti trattati nelle lezioni ed introducono all’utilizzo del computer. Abbiamo
incluso una selezione del materiale svolto in laboratorio – ulteriori esempi o una differente prospettiva
del materiale già presentato nel capitolo – nei paragrafi “Ulteriori applicazioni”. Questi paragrafi hanno
l’obiettivo di stimolare la discussione, sebbene siano sufficientemente completi da poter essere letti anche
da chi non utilizza il libro come testo di un corso.
Il libro include una serie di argomenti di biostatistica, la maggior parte dei quali può essere trattata
in modo approfondito in un semestre di una università americana. Tuttavia, c’è materiale sufficiente per
consentire al docente una certa flessibilità. Ad esempio, alcuni docenti possono scegliere di omettere i paragrafi
sul calcolo della prevalenza (Paragrafo 6.5) o la distribuzione di Poisson (Paragrafo 7.3) o il capitolo
sull’analisi della varianza (Capitolo 12), se ritengono che tali concetti siano meno importanti di altri.
Struttura
Alcuni sostengono che la statistica sia lo studio della variabilità e dell’incertezza. Noi crediamo che vi
sia qualcosa di vero in questa affermazione e la abbiamo utilizzata come guida, suddividendo il libro in
tre parti che trattano i principi fondamentali del VIP: (1) variabilità, (2) inferenza, e (3) probabilità. Per
motivi pedagogici, l’inferenza e la probabilità sono trattate in ordine inverso nel libro. I Capitoli dal 2 al
4 trattano della variabilità insita nella raccolta dei dati e le diverse possibilità di sintetizzarli, esaminarli e
interpretarli. I Capitoli dal 5 all’8 si concentrano sulla probabilità e sono introduttivi agli strumenti necessari
per la successiva analisi dell’incertezza. Nel Capitolo 8 distinguiamo tra popolazioni e campioni ed
iniziamo ad esaminare la variabilità insita nel processo di campionamento da una popolazione, procedendo
così verso l’inferenza negli altri capitoli del libro. Riteniamo che questa introduzione modulare a livelli
crescenti di incertezza sia giustificata dal successo ottenuto dai nostri studenti. Presentare i concetti un po’
più difficili solo dopo aver costruito delle solide basi rende più facile la comprensione e la assimilazione da
parte del lettore.
Set di dati ed esempi
Nel libro abbiamo utilizzato dati estratti da studi pubblicati per illustrare i concetti di biostatistica. I
dati reali non solo sono più significativi, ma anche più interessanti. Naturalmente, non abbiamo voluto
XII | Prefazione
utilizzare esempi in cui l’argomento fosse troppo complesso. A tal fine, siamo stati guidati dal background
e dagli interessi dei nostri studenti – innanzitutto argomenti di sanità pubblica e ricerca clinica – per scegliere
esempi che dimostrassero in modo ottimale i concetti presentati.
Esiste qualche rischio nell’utilizzo di dati pubblicati. Non possiamo garantire che tutti gli esempi siano
veritieri e che i dati siano stati raccolti in modo corretto; possiamo basarci solo sull’affidabilità delle fonti.
Non sottovalutiamo l’importanza di questa considerazione. Il valore delle nostre inferenze dipende criticamente
dal valore dei dati e raccomandiamo vivamente di valutare con cura la loro qualità. Assumiamo che
ciò sia compreso dal lettore.
In alcuni casi abbiamo utilizzato esempi in cui la popolazione degli Stati Uniti è suddivisa in razze.
Nel riportare queste statistiche ufficiali ci siamo lasciati guidare dalle agenzie governative che le hanno
rilasciate. Non vogliamo ratificare questa suddivisione razziale, poiché le differenze osservate potrebbero
essere dovute a fattori socioeconomici piuttosto che razziali. Una possibilità sarebbe quella di ignorare
queste statistiche; tuttavia, ciò non rivelerebbe le disuguaglianze presenti nel nostro sistema sanitario – disuguaglianze
che devono essere eliminate. Focalizziamo l’attenzione su questo problema nella speranza di
stimolare l’interesse a promuovere soluzioni.
Abbiamo ridotto al minimo l’utilizzo delle notazioni matematiche tenendo presente la loro reputazione,
meritata, di linguaggio quasi incomprensibile. Se utilizzate in modo eccessivo, le notazioni matematiche
possono scoraggiare anche lo studente più audace. Non possiamo, tuttavia, eliminare del tutto il loro
utilizzo, che si è sviluppato nel tempo per facilitare la comunicazione dei risultati. In questa terza edizione,
le notazioni matematiche e le formule importanti utilizzate nel libro sono state inserite anche in riquadri
riassuntivi alla fine dei paragrafi pertinenti.
Utilizzo del computer
I numeri hanno qualcosa di più – forse un po’ di magia – che rende divertente il loro studio. Tuttavia,
il divertimento è nella concettualizzazione più che nei calcoli e siamo fortunati ad avere il computer per
svolgere i compiti più faticosi. Questo consente agli studenti di concentrarsi sui concetti. In altre parole, il
computer consente al docente di insegnare la poesia della statistica e non il suo aspetto forse più pesante.
Per utilizzare il computer in modo ottimale, è necessario avere un buon pacchetto statistico. Noi utilizziamo
Stata, della Stata Corporation, College Station, Texas, e anche R, un ambiente software scaricabile
gratuitamente. Stata è facile da utilizzare, accurato, potente, ha un prezzo ragionevole e opera in diversi
ambienti, tra cui Windows, Unix e Macintosh. R è disponibile con licenza open-source e funziona anch’esso
in diversi ambienti. È un linguaggio di programmazione versatile ed efficiente. Sono disponibili altri
pacchetti statistici e questo libro può essere integrato da uno qualsiasi di essi. Raccomandiamo vivamente
l’utilizzo di un pacchetto statistico per i calcoli.
Alcuni degli esercizi nel libro richiedono l’utilizzo del computer. I set di dati utilizzati sono disponibili
sul sito web del libro all’indirizzo https://github.com/Principles-of-Biostatistics/3rd-Edition. Ci sono
anche molti esercizi che non richiedono l’utilizzo del computer. Come sempre, un apprendimento attivo
dà migliori risultati di un apprendimento passivo. Non smetteremo mai di sottolineare l’importanza degli
esercizi e di esortare il lettore a svolgerne il maggior numero possibile.
Novità nella terza edizione
La terza edizione prosegue nello spirito della prima, ma è stata aggiornata per riflettere alcuni dei progressi
degli ultimi 30 anni. La trattazione di numerosi argomenti è stata rivista ed ampliata in tutto il libro.
Le principali revisioni includono:
• I capitoli sulla Presentazione dei dati e sulle Misure di sintesi numerica della seconda edizione sono stati
semplificati e riuniti in un unico capitolo intitolato Statistica descrittiva.
• Il capitolo sulle Tavole di sopravvivenza è stato riscritto e i calcoli dettagliati sono stati spostati nel
paragrafo Ulteriori applicazioni.
• Il materiale su Screening e Test diagnostici – precedentemente contenuto nel capitolo sulla probabilità
– è stato inserito in un capitolo a sé. Questo nuovo capitolo comprende paragrafi sui rapporti di
verosimiglianza e sul concetto di variazione della sensibilità.
| Prefazione XIII
• Nuovi paragrafi sul calcolo della dimensione del campione per i test a due campioni su medie e proporzioni,
sul test di Kruskal-Wallis e sul modello dei rischi proporzionali di Cox sono stati aggiunti nei
capitoli esistenti.
• I concetti precedentemente trattati nel capitolo Tabelle multiple 2 x 2 sono stati spostati nel capitolo
sulla Regressione logistica.
• Il capitolo sulla Teoria del campionamento è stato notevolmente ampliato.
• Un nuovo capitolo che introduce i principi di base del Disegno dello studio è stato aggiunto alla fine
del libro.
• I set di dati utilizzati nel libro e quelli necessari per alcuni esercizi sono ora disponibili sul sito web del
libro all’indirizzo https://github.com/Principles-of-Biostatistics/3rd-Edition.
• Il sito web contiene anche i dati in Stata e R utilizzati per produrre i risultati al computer inseriti nei
paragrafi Ulteriori applicazioni del libro, oltre a materiale introduttivo che descrive l’utilizzo di entrambi
i pacchetti statistici.
• Un glossario con le definizioni di importanti termini statistici è stato aggiunto alla fine del libro.
• Come già accennato, le notazioni e le formule matematiche utilizzate nel libro sono state inserite in
riquadri riassuntivi alla fine di ogni paragrafo per facilitarne la consultazione.
• In ogni capitolo sono stati inseriti ulteriori esercizi.
Oltre a queste modifiche di contenuto, i dati utilizzati in precedenza, quando possibile, sono stati aggiornati
per riflettere le informazioni più attuali di sanità pubblica. Come suggerisce il nome, Principles of
Biostatistics tratta argomenti fondamentali per una introduzione alla biostatistica. Naturalmente abbiamo
dovuto limitare il materiale presentato e alcuni argomenti importanti non sono stati inclusi. La decisione
su cosa escludere è stata difficile, soprattutto perché la biostatistica e l’informatica continuano ad evolversi.
Un ruolo non secondario in questa evoluzione è svolto dal computer; la capacità del pacchetto statistico
sembra aumentare senza limiti, fornendo nuovi ed entusiasmanti strumenti inferenziali. Tuttavia, per apprezzare
veramente questi strumenti ed essere in grado di utilizzarli correttamente, è necessaria una solida
base di principi statistici tradizionali. Quelli presentati in questo libro sono ancora essenziali e saranno utili
al lettore sia oggi che in futuro.
Ringraziamenti
Abbiamo un debito di gratitudine con molte persone: il Presidente della Harvard University Derek Bok
che ci ha fornito il sostegno necessario per fare decollare la prima edizione di questo libro, il Dr. Michael
K. Martin che ha calcolato le tabelle statistiche, John-Paul Pagano per l’assistenza fornita nella redazione
della prima edizione e tutti coloro che hanno revisionato il manoscritto. Il nostro ringraziamento va anche
ai tutor che ci hanno aiutato a tenere i nostri corsi nel corso degli anni e che ci hanno dato molti preziosi
suggerimenti. Probabilmente i ringraziamenti più meritati sono per i nostri studenti che ci hanno sopportato
quando imparavamo il modo migliore per insegnare. Stiamo ancora imparando.
Marcello Pagano
Kimberlee Gauvreau
Heather Mattie
Boston, Massachusetts
Presentazione alla III edizione italiana
La terza edizione del libro, probabilmente l’ultima, di Marcello Pagano, Kimberlee Gauvreau e Heather Mattie, presenta il percorso formativo del Corso introduttivo di Statistica Medica presso la T.C. Chan School of Public Health della Harvard University di Boston. La traduzione del libro rende disponibile al pubblico un testo di riferimento importante, aggiornato e con una ripartizione del suo contenuto strutturata in una diversa e più chiara presentazione dei concetti un po’ più difficili solo dopo aver costruito delle solide basi. Il libro è, inoltre, arricchito con un nuovo capitolo sui principi di base del Disegno dello studio e la illustrazione dei diversi argomenti si affianca ad una assai ricca serie di esempi e esercizi con dati reali estratti da studi pubblicati. Gli Autori confidano che ciò renda più facile la comprensione e la assimilazione da parte del lettore.
Nella curatela di questa edizione abbiamo cercato di mantenere fede il più possibile al testo originale. La traduzione è stata, quindi, mantenuta la più letterale possibile, talvolta sacrificando la più appropriata forma italiana. Lo stile degli Autori è lineare e facilmente comprensibile anche da parte dei non addetti ai lavori e dunque in fase di traduzione non sono stati necessari particolari aggiustamenti sulla struttura sintattica dei periodi e sulla costruzione delle frasi. In generale abbiamo, però, preferito mantenere alcuni termini in lingua inglese, ritenendo che siano ormai divenuti di uso comune tra gli addetti ai lavori e che risultino di maggior efficacia semantica proprio se non tradotte: si pensi, ad esempio, a termini come “range” più noto e utilizzato dell’italiano “campo di variazione” e come “cluster” a nostro avviso più efficace di “a grappolo”. Confidiamo di aver fatto una scelta opportuna e che nessuno dei lettori di questa edizione italiana avrà problemi a comprendere questi termini. Un lavoro, dunque, scrupoloso, che abbiamo affrontato con l’impegno e l’entusiasmo che meritavano la lunga amicizia, in particolare con Marcello Pagano, e la stima per la statura scientifica.
Un ringraziamento particolare è rivolto agli studenti che hanno studiato la Statistica Medica sulle precedenti edizioni del libro; all’Editore Guido Gnocchi, senza la cui disponibilità anche questa terza edizione italiana non avrebbe potuto essere realizzata. La edizione italiana è stata possibile anche per la collaborazione, attenta e disinteressata, alla traduzione di alcuni dei nostri più stretti collaboratori che ringraziamo di tanta affettuosa disponibilità.
Ci auguriamo che anche questa edizione abbia lo stesso favorevole riscontro nella comunità globale di professori, ricercatori e studenti e che possa contribuire ad avvicinare il maggior numero possibile di persone alla Statistica Medica.
Italo F. Angelillo
Maria Pavia
Paolo Villari
Presentazione alla II edizione italiana
I libri ai quali si è più affezionati tendono sempre ad essere letti più volte. È quanto accaduto a noi con il testo di Marcello Pagano e Kimberlee Gauvreau, che ci ha aiutato nel nostro lungo percorso formativo presso la School of Public Health della Harvard University di Boston; ci ha confortato nel preparare le lezioni di Statistica per i corsi di laurea delle scienze sanitarie; ci ha impegnato non poco nella cura della sua versione italiana.
Abbiamo cercato in tutti i capitoli di mantenere inalterato lo stile e di rendere apprezzabili anche le sfumature ed i dettagli, talvolta sacrificando la più appropriata forma italiana. Lo stile puntuale ed accessibile con cui il libro è stato scritto rappresenta, secondo noi, il suo vero punto di forza, rendendo facilmente comprensibili concetti ed applicazioni talora molto complessi.
Un ringraziamento particolare è rivolto agli studenti che hanno studiato la Statistica sulla prima edizione italiana del testo; sono loro che, grazie anche al meritorio impegno dell’editore Gnocchi, ne hanno consentito questa seconda edizione italiana. Ci auguriamo che anche questa edizione abbia lo stesso favorevole riscontro da parte degli studenti.
È doveroso, infine, ricordare il Professore Guido D’Alfonso, che non soltanto ha scritto la presentazione della prima edizione italiana del testo, ma ne ha anche letto, con l’impegno e la competenza che gli erano propri, le prime bozze, fornendoci utili e preziosi suggerimenti.
Italo F. Angelillo
Maria Pavia
Paolo Villari
Presentazione alla I edizione italiana
La moderna ricerca biomedica ha abbandonato i modi tradizionali di valutazione dei fenomeni biologici e clinici per darsi la norma e l’autorità di una metodologia capace da una parte di preordinare e programmare gli esperimenti secondo ben definiti schemi, e dall’altra di applicare correttamente le diverse tecniche nella varietà dei problemi che si presentano nella pratica.
Ne è derivata un’accresciuta consapevolezza da parte dei ricercatori e dei medici della necessità di una adeguata conoscenza di detti metodi e l’esigenza forte dell’introduzione, negli anni di studi universitari e postuniversitari, di insegnamenti finalizzati ad orientare lo studioso attraverso i capitoli fondamentali della biostatistica. La riforma dell’orientamento didattico della Facoltà di Medicina in Italia prevede, ad esempio, l’inserimento degli insegnamenti della Statistica medica al primo anno di corso e della Metodologia epidemiologica clinica e della Programmazione sociosanitaria nel triennio clinico.
Il confronto continuo e stimolante con gli studenti ha portato gli statistici medici ad una profonda riflessione sui contenuti e le forme dell’insegnamento, i cui frutti si possono cogliere dalla lettura dei testi che ripercorrono gli itinerari dei corsi condotti.
Il testo di Pagano e Gauvreau è tra questi. Esso ripropone l’itinerario del corso introduttivo di Biostatistica che gli Autori svolgono nella Harvard School of Public Health di Boston.
Il libro raccoglie ed espone in modo piano e largamente accessibile tutto quanto di attuale e fondamentale è necessario sapere sul campo della metodologia per la ricerca medica, privilegiando nella trattazione la struttura e il fondamento logico dei metodi piuttosto che le giustificazioni matematiche. Le tecniche sono tuttavia sviluppate in modo sufficientemente dettagliato, cosicché il lettore, studente, medico o ricercatore al primo approccio con la statistica, possa verificarne personalmente i risultati. Per illustrare principi e metodi, inoltre, gli Autori hanno utilizzato dati reali estratti dalla letteratura medica corrente a vari livelli di complessità e di settore medico di attinenza, che se da un lato illustrano in modo appropriato le procedure statistiche, dall’altro, sono di intrinseco interesse per il medico.
Nel complesso il libro è un’utile guida sia per chi si accosta per la prima volta alla Biostatistica che per i ricercatori interessati ad un approccio moderno alla ricerca biomedica.
Guido D’Alfonso.
Indice
Prefazione
Background
Struttura
Set di dati ed esempi
Utilizzo del computer
Novità nella terza edizione
Ringraziamenti
Presentazione alla III edizione italiana
1. Introduzione
1.1 Perché studiare la biostatistica
1.2 Numeri difficili
1.3 Panoramica del libro
1.3.1 Parte I: Capitoli 2-4 Variabilità
1.3.2 Parte II: Capitoli 5-8 Probabilità
1.3.3 Parte III: Capitoli 9-22 Inferenza
1.3.4 Risorse informatiche
1.4 Esercizi
Parte I – Variabilità
2. Statistica descrittiva
2.1 Tipi di dati numerici
2.1.1 Dati nominali
2.1.2 Dati ordinali
2.1.3 Dati ordinati in ranghi
2.1.4 Dati discreti
2.1.5 Dati continui
2.2 Tabelle
2.2.1 Distribuzioni di frequenza
2.2.2 Frequenza relativa
2.3 Grafici
2.3.1 Diagrammi a barre
2.3.2 Istogrammi
2.3.3 Poligoni di frequenza
2.3.4 Diagrammi a scatola
2.3.5 Diagrammi a punti (Diagrammi di dispersione a due dimensioni)
2.3.6 Diagrammi lineari
2.4 Misure di sintesi numerica
2.4.1 Media
2.4.2 Mediana
2.4.3 Moda
2.4.4 Range (Campo di variazione)
2.4.5 Range interquartile (Campo di variazione interquartile)
2.4.6 Varianza e Deviazione standard
2.5 Regola empirica
2.6 Ulteriori applicazioni
2.7 Esercizi
3. Tassi e standardizzazione
3.1 Tassi
3.2 Tassi corretti
3.2.1 Standardizzazione diretta
3.2.2 Standardizzazione indiretta
3.3 Ulteriori applicazioni
3.4 Esercizi
4. Tavole di sopravvivenza
4.1 Sviluppo storico
4.2 Tavola di sopravvivenza come predittore di longevità
4.3 Sopravvivenza media
4.4 Sopravvivenza mediana
4.5 Ulteriori applicazioni
4.6 Esercizi
Parte II – Probabilità
5. Probabilità
5.1 Operazioni sugli eventi e probabilità
5.2 Probabilità condizionata
5.3 Teorema della probabilità totale
5.4 Rischio relativo e Odds ratio
5.5 Ulteriori applicazioni
5.6 Esercizi 118
6. Screening e test diagnostici 121
6.1 Sensibilità e specificità 121
6.2 Teorema di Bayes
6.3 Rapporti di verosimiglianza
6.4 Curve ROC
6.5 Calcolo della prevalenza
6.6 Variazione della sensibilità
6.7 Ulteriori applicazioni
6.8 Esercizi
7. Distribuzioni teoriche di probabilità
7.1 Distribuzioni di probabilità
7.2 Distribuzione binomiale
7.3 Distribuzione di Poisson
7.4 Distribuzione normale
7.5 Ulteriori applicazioni
7.6 Esercizi
8. Distribuzione campionaria della media
8.1 Distribuzioni campionarie
8.2 Teorema del limite centrale
8.3 Applicazioni del teorema del limite centrale
8.4 Ulteriori applicazioni
8.5 Esercizi
Parte III – Inferenza
9. Intervalli di confidenza
9.1 Intervalli di confidenza bilaterali
9.2 Intervalli di confidenza unilaterali
9.3 Distribuzione t di Student
9.4 Ulteriori applicazioni
9.5 Esercizi
10. Test di ipotesi
10.1 Concetti generali
10.2 Test di ipotesi bilaterali
10.3 Test di ipotesi unilaterali
10.4 Tipi di errore
10.5 Potenza
10.6 Stima della dimensione del campione
10.7 Ulteriori applicazioni
10.8 Esercizi
11. Confronto tra due medie
11.1 Campioni appaiati
11.2 Campioni indipendenti
11.2.1 Varianze uguali
11.2.2 Varianze diverse
11.3 Stima della dimensione del campione per due medie
11.4 Ulteriori applicazioni
11.5 Esercizi
12. Analisi della varianza
12.1 Analisi della varianza ad un criterio di classificazione
12.1.1 Il problema
12.1.2 Fonti di variabilità
12.2 Procedure per confronti multipli
12.3 Ulteriori applicazioni
12.4 Esercizi
13. Metodi non parametrici
13.1 Test del segno
13.2 Test di Wilcoxon dei ranghi con segno
13.3 Test di Wilcoxon della somma dei ranghi
13.4 Test di Kruskal-Wallis
13.5 Vantaggi e svantaggi dei metodi non parametrici
13.6 Ulteriori applicazioni
13.7 Esercizi
14. Inferenza sulle proporzioni
14.1 Approssimazione normale alla distribuzione binomiale
14.2 Distribuzione campionaria di una proporzione
14.3 Intervalli di confidenza
14.4 Test di ipotesi
14.5 Stima della dimensione del campione per una proporzione
14.6 Confronto tra due proporzioni
14.7 Stima della dimensione del campione per due proporzioni
14.8 Ulteriori applicazioni
14.9 Esercizi
15. Tabelle di contingenza
15.1 Test chi-quadrato
15.1.1 Tabelle 2 × 2
15.1.2 Tabelle r × c
15.2 Test di McNemar
15.3 Odds ratio
15.4 Fallacia di Berkson
15.5 Ulteriori applicazioni
15.6 Esercizi
16. Correlazione
16.1 Diagramma a punti (Diagramma di dispersione a due dimensioni)
16.2 Coefficiente di correlazione di Pearson
16.3 Coefficiente di correlazione dei ranghi di Spearman
16.4 Ulteriori applicazioni
16.5 Esercizi
17. Regressione lineare semplice
17.1 Concetti sulla regressione
17.2 Il modello
17.2.1 Retta di regressione della popolazione
17.2.2 Metodo dei minimi quadrati
17.2.3 Inferenza per i coefficienti di regressione
17.2.4 Inferenza per i valori predetti
17.3 Valutazione del modello
17.3.1 Coefficiente di determinazione
17.3.2 Grafici dei residui
17.3.3 Trasformazioni
17.4 Ulteriori applicazioni
17.5 Esercizi 387
18. Regressione lineare multipla
18.1 Il modello
18.1.1 Equazione di regressione dei minimi quadrati
18.1.2 Inferenza per i coefficienti di regressione
18.1.3 Variabili indicatrici
18.1.4 Termini di interazione
18.2 Selezione del modello
18.3 Valutazione del modello
18.4 Ulteriori applicazioni
18.5 Esercizi
19. Regressione logistica
19.1 Il modello
19.1.1 Funzione logistica
19.1.2 Equazione adattata
19.2 Variabili indicatrici
19.3 Regressione logistica multipla
19.4 Paradosso di Simpson
19.5 Termini di interazione
19.6 Selezione del modello
19.7 Ulteriori applicazioni
19.8 Esercizi
20. Analisi della sopravvivenza
20.1 Metodo della tavola di sopravvivenza
20.2 Metodo del prodotto limite
20.3 Log-rank test
20.4 Modello dei rischi proporzionali di Cox
20.5 Ulteriori applicazioni
20.6 Esercizi
21. Teoria del campionamento
21.1 Schemi di campionamento
21.1.1 Campionamento casuale semplice
21.1.2 Campionamento sistematico
21.1.3 Campionamento stratificato
21.1.4 Campionamento a cluster
21.1.5 Stimatore del rapporto
21.1.6 Campionamento a cluster bifasico
21.1.7 Effetto del disegno
21.1.8 Campionamento non probabilistico
21.2 Fonti di distorsione (Bias)
21.3 Ulteriori applicazioni
21.4 Esercizi
22. Disegno dello studio
22.1 Studi randomizzati
22.1.1 Gruppi di controllo
22.1.2 Randomizzazione
22.1.3 Mascheramento
22.1.4 Intenzione al trattamento
22.1.5 Studio crossover
22.1.6 Equipoise
22.2 Studi osservazionali
22.2.1 Studi trasversali
22.2.2 Studi longitudinali
22.2.3 Studi caso-controllo
22.2.4 Studi di coorte
22.2.5 Conseguenze dei difetti di progettazione
22.3 Big data
22.4 Esercizi
Glossario
Tabelle statistiche
Indice analitico
Bibliografia
Sei sicuro di voler eseguire questa azione?