Reply from Norwegian Knowledge Centre for the Health Services (NOKC) to
Directorate of Health's 15.11.2013 Request to NOKC
(English & Norwegian)
Directorate of Health's 15.11.2013 Request to NOKC
(English & Norwegian)
(Local Source: notat792__terminestimering.docx)
Memo To: Health Directorate by Cecilie Sommerstad and Jens Grøgaard
Cc: Torunn Janbu, Postmottak Directorate of Health
Date: 2nd July 2014
Case number: Booking 792, 14/00171
From: Knowledge Center Senior Lecturer: Kjetil Gundro Bruberg Sign .: [Enter Here]
Contact: Liv Merete Reinar, Gro Jamtvedt Sign .: [Enter here]
Methods to estimate gestational age and term
Metoder for å estimere svangerskapslengde og termin
Background
Gestational age and term currently have direct implications for the definition of absolute upper limit for late abortion (21 weeks + 6 days), lower limit for intensive care of premature birth, upper limit for prematurity and premature pregnancy. In Norway, term is predicted on the basis of routine ultrasound exams in weeks 17 to 19. Two different ultrasound-based methods are used, respectively, the "term wheel" (1) and "esnurra" (2), and the two methods are based on different prediction models that do not provide identical result (3).
Bakgrunn
Svangerskapslengde og termin har i dag direkte implikasjoner for definisjonen av absolutt øvre grense for senabort (21 uker + 6 dager), nedre grense for intensivbehandling av ekstremt prematurfødte, øvre grense for prematuritet og overtidige svangerskap. I Norge predikeres termin på bakgrunn av rutinemessige ultralydundersøkelser i uke 17 til 19. To ulike ultralydbaserte metoder er i bruk, henholdsvis «terminhjulet» (1) og «esnurra» (2), og de to metodene baserer seg på ulike prediksjonsmodeller som ikke gir identisk resultat (3).
To ensure equality across areas and regions, the health authorities want to define which methods and prediction models to be used to determine the gestational age and the term in Norway. This is the reason why the Knowledge Center received an order from the Directorate of Health in November 2013, where the Knowledge Center was asked to evaluate the precision of different tools for determining the gestational age and the term.
For å sikre likhet på tvers av landsdeler og regioner, ønsker helsemyndighetene å definere hvilke metoder og prediksjonsmodeller som skal ligge til grunn for fastsettelse av svangerskapslengde og termin i Norge. Dette er bakgrunnen for at Kunnskapssenteret i november 2013 mottok en bestilling fra Helsedirektoratet der Kunnskapssenteret ble bedt om å vurdere presisjonen til ulike verktøy for å bestemme svangerskapslengde og termin.
Rating of the booking
The primary objective of the Directorate's order is to obtain comparative data for the diagnostic accuracy of the "terminhjulet" versus "esnurra", which means the ability to predict the right term and the ability to provide correct measurements throughout the current measurement window. Traditional diagnostic validation studies require access to an unconventional reference standard for calculation of sensitivity and specificity, etc., but for term estimation there is no reference standard. It is natural to compare the predicted term with the actual date of birth, but since birth is premature and overtime, the date of birth is not a reference standard in the traditional sense. In the absence of the reference standard, other ways to validate the different prediction models must be found.
Vurdering av bestillingen
Den primære målsetningen med bestillingen fra Helsedirektoratet er å innhente sammenligningsdata for den diagnostiske treffsikkerheten til «terminhjulet» versus «esnurra», det vil her si evnen til å predikere rett termin og evnen til å gi riktige målinger over hele det aktuelle målevinduet. Tradisjonelle diagnostiske valideringsstudier krever tilgang til en omforent referansestandard for beregning av sensitivitet og spesifisitet m.m., men for terminfastsettelse finnes det ingen referansestandard. Det er naturlig å sammenligne predikert termin med faktisk fødselsdato, men siden barn fødes både prematurt og overtidig er ikke fødselsdato en referansestandard i tradisjonell forstand. I fravær av referansestandard må man finne andre måter å validere de ulike prediksjonsmodellene på.
One possible solution is to compare different prediction models within the framework of controlled studies or time series analyzes to see whether choice of prediction model affects measurable outcomes. It is possible to conduct a systematic search for such studies, but it is unlikely that such a search will lead to relevant findings.
Én mulig løsning er å sammenligne ulike prediksjonsmodeller innenfor rammene av kontrollerte studier eller tidsserieanalyser for å se om valg av prediksjonsmodell påvirker målbare utfall. Det er mulig å gjennomføre et systematisk søk etter slike studier, men det er lite trolig at et slikt søk vil lede til relevante funn.
Another validation strategy goes through studies where the properties of current methods are compared directly through measurements in the same population. In her doctoral dissertation from 2012 (4), Inger Økland conducted validation studies of three different prediction models ("snurra", "term wheel" and "esnurra"), a work that provides a good basis for assessing actual differences between different prediction models that are relevant in Norwegian context. Interesting projects are underway, among other things, new reference curves for symfyse fundus measurements (5) have been created that are calibrated for use in Norway with "esnurra". Preliminary searches do not indicate, however, that after 2012, validation studies have been published, where "terminhjulet" and "esnurra" are directly compared.
En annen valideringsstrategi går via studier der egenskapene til aktuelle metoder sammenlignes direkte gjennom målinger i samme populasjon. I sin doktorgradsavhandling fra 2012 (4) gjennomførte Inger Økland valideringsstudier av tre ulike prediksjonsmodeller («snurra», «terminhjulet» og «esnurra»), et arbeid som gir godt grunnlag for å vurdere faktiske forskjeller mellom ulike som prediksjonsmodeller som er relevante i norsk sammenheng. Interessante prosjekter er i gang, blant annet er det laget nye referansekurver for symfyse-fundusmål (5) som er kalibrert for bruk i Norge med «esnurra». Foreløpige søk tyder imidlertid ikke på at det, etter 2012, er publisert valideringsstudier der «terminhjulet» og «esnurra» sammenlignes direkte.
Conclusion
After an overall assessment, it seems unlikely that a systematic review carried out in accordance with the Knowledge Center's method handbook will help to highlight the problem beyond what is already known. When the Directorate of Health determines which prediction model should be used to estimate pregnancy length and term, it seems reasonable to base the decision on the findings presented in Inger Økland's doctoral thesis (4).
Konklusjon
Etter en helhetsvurdering virker det lite sannsynlig at en systematisk oversikt gjennomført i tråd med Kunnskapssenterets metodehåndbok vil bidra til å belyse problemstillingen utover det som allerede er kjent. Når Helsedirektoratet skal beslutte hvilken prediksjonsmodell som bør benyttes for å estimere svangerskapslengde og termin virker det følgelig rimelig å basere avgjørelsen på funnene som er presentert i Inger Øklands doktorgradsavhandling (4).
References
Referanser
1. Johnsen SL. Rasmussen S, Sollien R, Kiserud T. fetal age assessment based on femur length that 10 to 25 weeks of gestation, and reference ranges for femur length to head circumference ratios. Acta Obstet Gynecol Scand 2005; 84: 725-733 (Johnsen et al. 2005)
2. Gjessing HK Grøttum P, Eik-Nes SH. A direct method for ultrasound prediction of day of delivery: a new population based approach. Ultrasound Obstet Gynecol 2007; 30: 19-27 (Gjessing et al. 2007)
3. Øakland I, Nakling J Gjessing HK Grøttum P, Eik-Nes SH. Advantages of the population-based approach, two pregnancy dating: results from 23020 ultrasound examinations. Ultrasound Obstet Gynecol 2012; 39: 563-568 (Økland et al. 2012)
4. Økland I. Bias in second-trimester ultrasound dating related to prediction models and fetal measurements. Doctoral thesis, NTNU: 2012 (Økland 2012 NTNU dr.philos. Thesis)
5. Pay AS, Frøen JF, Staff AC, Jacobsson B, Gjessing HK. A new population-based reference curve for symphysis-fundus height. Acta Obstet Gynecol Scand 2013; 92: 925-33 (Pay et al. 2013)
[Note: The "Knowledge Center's method handbook" ("Kunnskapssenterets metodehåndbok") is available via NIPH: "Slik oppsummerer vi forskning".]
Cc: Torunn Janbu, Postmottak Directorate of Health
Date: 2nd July 2014
Case number: Booking 792, 14/00171
From: Knowledge Center Senior Lecturer: Kjetil Gundro Bruberg Sign .: [Enter Here]
Contact: Liv Merete Reinar, Gro Jamtvedt Sign .: [Enter here]
Methods to estimate gestational age and term
Metoder for å estimere svangerskapslengde og termin
Background
Gestational age and term currently have direct implications for the definition of absolute upper limit for late abortion (21 weeks + 6 days), lower limit for intensive care of premature birth, upper limit for prematurity and premature pregnancy. In Norway, term is predicted on the basis of routine ultrasound exams in weeks 17 to 19. Two different ultrasound-based methods are used, respectively, the "term wheel" (1) and "esnurra" (2), and the two methods are based on different prediction models that do not provide identical result (3).
Bakgrunn
Svangerskapslengde og termin har i dag direkte implikasjoner for definisjonen av absolutt øvre grense for senabort (21 uker + 6 dager), nedre grense for intensivbehandling av ekstremt prematurfødte, øvre grense for prematuritet og overtidige svangerskap. I Norge predikeres termin på bakgrunn av rutinemessige ultralydundersøkelser i uke 17 til 19. To ulike ultralydbaserte metoder er i bruk, henholdsvis «terminhjulet» (1) og «esnurra» (2), og de to metodene baserer seg på ulike prediksjonsmodeller som ikke gir identisk resultat (3).
To ensure equality across areas and regions, the health authorities want to define which methods and prediction models to be used to determine the gestational age and the term in Norway. This is the reason why the Knowledge Center received an order from the Directorate of Health in November 2013, where the Knowledge Center was asked to evaluate the precision of different tools for determining the gestational age and the term.
For å sikre likhet på tvers av landsdeler og regioner, ønsker helsemyndighetene å definere hvilke metoder og prediksjonsmodeller som skal ligge til grunn for fastsettelse av svangerskapslengde og termin i Norge. Dette er bakgrunnen for at Kunnskapssenteret i november 2013 mottok en bestilling fra Helsedirektoratet der Kunnskapssenteret ble bedt om å vurdere presisjonen til ulike verktøy for å bestemme svangerskapslengde og termin.
Rating of the booking
The primary objective of the Directorate's order is to obtain comparative data for the diagnostic accuracy of the "terminhjulet" versus "esnurra", which means the ability to predict the right term and the ability to provide correct measurements throughout the current measurement window. Traditional diagnostic validation studies require access to an unconventional reference standard for calculation of sensitivity and specificity, etc., but for term estimation there is no reference standard. It is natural to compare the predicted term with the actual date of birth, but since birth is premature and overtime, the date of birth is not a reference standard in the traditional sense. In the absence of the reference standard, other ways to validate the different prediction models must be found.
Vurdering av bestillingen
Den primære målsetningen med bestillingen fra Helsedirektoratet er å innhente sammenligningsdata for den diagnostiske treffsikkerheten til «terminhjulet» versus «esnurra», det vil her si evnen til å predikere rett termin og evnen til å gi riktige målinger over hele det aktuelle målevinduet. Tradisjonelle diagnostiske valideringsstudier krever tilgang til en omforent referansestandard for beregning av sensitivitet og spesifisitet m.m., men for terminfastsettelse finnes det ingen referansestandard. Det er naturlig å sammenligne predikert termin med faktisk fødselsdato, men siden barn fødes både prematurt og overtidig er ikke fødselsdato en referansestandard i tradisjonell forstand. I fravær av referansestandard må man finne andre måter å validere de ulike prediksjonsmodellene på.
One possible solution is to compare different prediction models within the framework of controlled studies or time series analyzes to see whether choice of prediction model affects measurable outcomes. It is possible to conduct a systematic search for such studies, but it is unlikely that such a search will lead to relevant findings.
Én mulig løsning er å sammenligne ulike prediksjonsmodeller innenfor rammene av kontrollerte studier eller tidsserieanalyser for å se om valg av prediksjonsmodell påvirker målbare utfall. Det er mulig å gjennomføre et systematisk søk etter slike studier, men det er lite trolig at et slikt søk vil lede til relevante funn.
Another validation strategy goes through studies where the properties of current methods are compared directly through measurements in the same population. In her doctoral dissertation from 2012 (4), Inger Økland conducted validation studies of three different prediction models ("snurra", "term wheel" and "esnurra"), a work that provides a good basis for assessing actual differences between different prediction models that are relevant in Norwegian context. Interesting projects are underway, among other things, new reference curves for symfyse fundus measurements (5) have been created that are calibrated for use in Norway with "esnurra". Preliminary searches do not indicate, however, that after 2012, validation studies have been published, where "terminhjulet" and "esnurra" are directly compared.
En annen valideringsstrategi går via studier der egenskapene til aktuelle metoder sammenlignes direkte gjennom målinger i samme populasjon. I sin doktorgradsavhandling fra 2012 (4) gjennomførte Inger Økland valideringsstudier av tre ulike prediksjonsmodeller («snurra», «terminhjulet» og «esnurra»), et arbeid som gir godt grunnlag for å vurdere faktiske forskjeller mellom ulike som prediksjonsmodeller som er relevante i norsk sammenheng. Interessante prosjekter er i gang, blant annet er det laget nye referansekurver for symfyse-fundusmål (5) som er kalibrert for bruk i Norge med «esnurra». Foreløpige søk tyder imidlertid ikke på at det, etter 2012, er publisert valideringsstudier der «terminhjulet» og «esnurra» sammenlignes direkte.
Conclusion
After an overall assessment, it seems unlikely that a systematic review carried out in accordance with the Knowledge Center's method handbook will help to highlight the problem beyond what is already known. When the Directorate of Health determines which prediction model should be used to estimate pregnancy length and term, it seems reasonable to base the decision on the findings presented in Inger Økland's doctoral thesis (4).
Konklusjon
Etter en helhetsvurdering virker det lite sannsynlig at en systematisk oversikt gjennomført i tråd med Kunnskapssenterets metodehåndbok vil bidra til å belyse problemstillingen utover det som allerede er kjent. Når Helsedirektoratet skal beslutte hvilken prediksjonsmodell som bør benyttes for å estimere svangerskapslengde og termin virker det følgelig rimelig å basere avgjørelsen på funnene som er presentert i Inger Øklands doktorgradsavhandling (4).
References
Referanser
1. Johnsen SL. Rasmussen S, Sollien R, Kiserud T. fetal age assessment based on femur length that 10 to 25 weeks of gestation, and reference ranges for femur length to head circumference ratios. Acta Obstet Gynecol Scand 2005; 84: 725-733 (Johnsen et al. 2005)
2. Gjessing HK Grøttum P, Eik-Nes SH. A direct method for ultrasound prediction of day of delivery: a new population based approach. Ultrasound Obstet Gynecol 2007; 30: 19-27 (Gjessing et al. 2007)
3. Øakland I, Nakling J Gjessing HK Grøttum P, Eik-Nes SH. Advantages of the population-based approach, two pregnancy dating: results from 23020 ultrasound examinations. Ultrasound Obstet Gynecol 2012; 39: 563-568 (Økland et al. 2012)
4. Økland I. Bias in second-trimester ultrasound dating related to prediction models and fetal measurements. Doctoral thesis, NTNU: 2012 (Økland 2012 NTNU dr.philos. Thesis)
5. Pay AS, Frøen JF, Staff AC, Jacobsson B, Gjessing HK. A new population-based reference curve for symphysis-fundus height. Acta Obstet Gynecol Scand 2013; 92: 925-33 (Pay et al. 2013)
[Note: The "Knowledge Center's method handbook" ("Kunnskapssenterets metodehåndbok") is available via NIPH: "Slik oppsummerer vi forskning".]