Gaia Data Release 1 Documentation release 0



Yüklə 5,01 Kb.
Pdf görüntüsü
səhifə93/125
tarix02.01.2018
ölçüsü5,01 Kb.
#19053
1   ...   89   90   91   92   93   94   95   96   ...   125

6.4.4
Period search and time series modelling
Author(s): Leanne Guy, Jan Cuypers, Joris De Ridder
Input
The time series and statistical parameters for sources identified as variable.
Method
The process of frequency (i.e. period) search and time series modelling, referred to collectively as Vari-
ability Characterisation, aims to characterise the variability behaviour of time series of Gaia data using a classical
Fourier decomposition approach. The model to fit is given by Equation 6.1. The Characterisation process takes as
input all time series identified as variable by the preceding Variability Detection module (see Section 6.4.3). The
goal is to produce, in an automated manner, the simplest and statistically most significant model of the observed
variability. See Sections. 2.2.3, 5.4, and 6.3 of Eyer et al. (2017) for more details.
Configuration parameters
• Frequency search
– only started if more than 9 observations available
– no de-trending was done prior to the frequency search
– frequency search method: least squares i.e. the generalised Lomb-Scargle periodogram (Zech-
meister & K¨urster 2009)
– minimum frequency: 2(
∆T)
−1
with
∆T the total time span of each time series
– maximum frequency: 3.9d
−1
(to avoid aliases and parasite frequencies)
– frequency step : (20
∆T)
−1
with
∆T the total time span of each time series
– the refinement of frequency search was done to the level 10
−6
.
• Modelling
– the polynomial part of Equation 6.1 was limited to degree zero
– no weights were applied in the fitting
– non-linear fitting (Levenberg-Marquard) was applied.
Published output
No data from this processing step was publishing in DR1.
6.4.5
Classification
Author(s): Berry Holl, Lorenzo Rimoldini
Input
The time series (to compute additional attributes), statistical parameters, and period and time series model
for sources identified as variable.
249


Method
Supervised classification was used in the initial identification of candidate Cepheids and RR Lyrae stars.
In specific, Gaussian Mixtures (GMs), Bayesian Networks (BNs), and Random Forests (RFs) supervised classifiers
were constructed using the training sets (see Section 6.2.2) and applied to a preliminary dataset preceding the
Gaia DR1 data, see sections 2.2.4, and 5.5 of Eyer et al. (2017) for more details.
Configuration parameters
• Classification training set, see section 5.5.1 of Eyer et al. (2017)
• Classification attributes, see section 5.5.2 of Eyer et al. (2017)
• Single stage Random Forest classifier with 150 trees, see section 5.5 of Eyer et al. (2017)
• Single stage Gaussian Mixtures classifier with 1 to 3 components per class, see section 5.5 of Eyer
et al. (2017)
• Multi-stage Bayesian Networks classifier, see section 5.5 of Eyer et al. (2017).
Published output
No data from this processing step was published in Gaia DR1.
6.4.6
Specific Object Studies
Author(s): Nami Mowlavi, Gisella Clementini
Input
The time series for sources classified as Cepheid or RR Lyrae by classification and visual inspection, as
described in Clementini et al. (2016).
Method
A detailed description of the SOS pipeline processing Cepheids and RR Lyrae stars is given in section 2
of Clementini et al. (2016).
Configuration parameters
The configuration parameters used in the SOS Cep&RRL processing is also given
in section 2 and 3 of Clementini et al. (2016) with the method description.
Published output
All 3194 Gaia DR1 Cepheid and RR Lyrae stars have an entry in the following DR1 tables:
• gaia source (phot variable flag set to VARIABLE, and to NOT AVAILABLE for all other sources)
• variable summary
• phot variable time series gfov
• phot variable time series gfov statistical parameters
• cepheid (for the 599 Cepheids)
• rrlyrae (for the 2595 RR Lyrae stars).
250


6.5
Quality assessment and validation
6.5.1
Verification
Author(s): Leanne Guy, Isabelle Lecoeur-Ta¨ıbi, Jan Cuypers, Berry Holl, Lorenzo Rimoldini, Nami Mowlavi,
Gisella Clementini, Laurent Eyer
Verification is the process of checking that the results meet the specifications. Below you will find an overview of
the various verifications performed on the data processed as part of this release.
6.5.1.1
Statistics
The distribution of various statistical parameters were inspected in detail as described in section 6.2 of Eyer et al.
(2017).
6.5.1.2
Variability detection
The selection of variable candidates was performed using a Random Forest classifier and the completeness and
contamination rates obtained are respectively around 92-93% and 7-8% for both variable and constant objects of
the OGLE-IV GSEP (Soszy´nski et al. 2012) training set as shown in figure 18 of section 5.3 in Eyer et al. (2017).
6.5.1.3
Classification
Confusion matrices of 10-fold cross-validation on the training sets of the supervised classifiers Gaussian Mixtures,
Bayesian Networks, and Random Forests are found in section 5.5.3 and figure 23 of Eyer et al. (2017). They show
excellent performance for the target classes of RR Lyrae and Cepheid variables.
6.5.2
Validation
Author(s):
Isabelle Lecoeur-Ta¨ıbi, Leanne Guy, Jan Cuypers, Berry Holl, Lorenzo Rimoldini, Nami
Mowlavi, Gisella Clementini, Laurent Eyer
Validating is the process of assessing the scientific accuracy of the results by comparison against independent
reliable sources of knowledge. Below you will find an overview of the various validations performed on the data
processed as part of this release.
6.5.2.1
Variability detection
For a given variability criterion, the analysis of the histogram of empirically computed p-values is a good way to
validate the results of the classifier. Several variability criteria showed the expected behaviour.
251


Yüklə 5,01 Kb.

Dostları ilə paylaş:
1   ...   89   90   91   92   93   94   95   96   ...   125




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə