B5, M5, V5 : Réduits… coulés

31 mai 2022

Au début des opérations de transfert des données du HPSS vers Irods, j'avais remarqué des archives de productions avec un code étrange.

En principe, dans Eros 2, les fichiers de suivi, et les fichiers de références utilisés pour l'identification des étoiles, portent le code de traitement P, indiquant l'utilisation de la suite logicielle Peida.

Dès lors, à quoi pouvait bien correspondre des productions dont le code n'était pas P ?

Les courbes de lumière ASCII, stade ultime des analyses, semblent provenir de la production P5.

Qu'en était-il dès lors des autres P: de P1 à P9.

Questions d'autant plus légitime que beaucoup de suivis avaient été réalisées pour P1, représentant une large couverture des quarts de CCD de l'expérience.

Question restée alors sans réponse. Mais les choses ont récemment changé...

Suivis et références par production

Un premier élément de réponse est donné en croisant le nombre de suivis et le nombre de références de chacune des productions par une requête à la base de données.

Production Suivi References
b5 6 246
f0 195
f1 6 141
f3 2 459
f4 389
f9 1
m5 6 224
o1 18
p1 30 666 10 340
p2 4 479 1 285
p3 2 448 824
p4 873 288
p5 75 306 13 872
p6 858 73
p65 1
p7 3 448 560
p8 780 64
p9 1 905 640
v5 636

Ce qui frappe aux yeux dans ce sommaire est que les suivis sont associés à des références pour les seules productions P. Or il n'est pas possible dans Eros d'analyser des images sans un catalogue d'étoiles, c'est-à-dire sans fichier de références. Ergo, les suivis des productions non P ne sont pas le résultat de photométries Peida...

La deuxième chose qui surprend est le relativement petit nombre de références, et donc de quarts de CCD traités, pour les productions autres que P1 et P5. On peut penser qu'il s'agissait d'études spécifiques réalisées sur quelques champs particuliers.

Photométries par production

La base de données était utilisée pour piloter le passage des batchs d'analyse. Les traces de ces passages sont conservées dans une table nommée ErPhotometries qui relie un suivi, l'image analysée et la référence utilisée pour identifier les étoiles. Cette table peut donc être servir pour connaitre le nombre de traitements réalisés par production.

Production Photometries
p1 1 237 373
p2 155 369
p3 89 097
p4 39 618
p5 7 054 415
p6 83 419
p7 131 324
p8 30 664
p9 52 081

Ce sommaire confirme la première impression: les suivis non P ne sont pas des "vrais" suivis, résultant d'analyses effectuées sur les images, puisqu'aucun n'apparait dans cette liste.

Par ailleurs, la prédominance des analyses réalisées pour P5 confirme l'importance de cette production.

Productions par archives de suivis HPSS

Le nombre de fichiers conservés dans le HPSS dont les noms pourraient être reliés aux suivis des différentes productions est également très révélateurs:

Production Nombre
B5 98
M5 98
P1 0
P2 32
P3 0
P4 0
P5 6915
P6 33
P7 0
P8 0
P9 28
V5 10

Bref, P1 a été sacrifié, alors que B5, M5 et V5 ont survécu...

L'abandon de P1 pourrait s'expliquer par une évolution du logiciel de traitement ayant conduit à reprendre les analyses déjà réalisées et à les poursuivre avec la nouvelle version. Dès lors, P1 n'avait plus guère d'intérêt.

L'étude des scripts

Sur une recommandation de Jean-Baptiste, je me suis pencher sur les scripts TCL présents à Lyon, dans différents répertoires ayant survécus au passage de AFS à SPS, puis en utilisant le vieux CVS du LAL.

Certains de ces scripts étaient chargés de la construction de courbes de lumière destinées à un serveur hébergé alors à Saclay, serveur qui ne répond plus. Ces scripts établissent une distinction entre des suivis ‟réduits” et des suivis ‟primaires”. Les scripts étudiés étaient dédiés aux suivis B5, M5, et V5.

En explorant le HPSS, on trouve ceci :

L'étude de quelques-uns de ces suivis montre un très petit nombre d'étoiles par rapport aux suivis primaires mais beaucoup plus d'images analysées.

Par exemple, le suivi réduit lm00100krb501 est constitué d'un seul bloc, alors qu'il y a 7 blocs "primaires" pour le quart de CCD: lm00100krp501..7.

L'entête du suivi réduit fait état de 1 275 étoiles pour 828 images analysées, là où les entêtes des suivis primaires indiquent 34 767 étoiles pour un total, sur les 7 blocs, de 819 images. Intéressant qu'il y ait plus d'images dans le réduit que dans les primaires. Mais si on élimine les images analysées plusieurs fois dans les deux cas, on arrive au même nombres: 602 images distinctes.

L'étude des suivis réduits M5 et V5 montrent des résultats comparables.

Par ailleurs, en comparant les mesures réalisées sur les étoiles présentes à la fois dans les réduits et dans les primaires, on obtient les mêmes valeurs. La seule conclusion à ce stade est que ces suivis réduits ne sont rien d'autres que le filtrage de certaines étoiles et le regroupement des différents blocs, sans doute pour réduire la taille des fichiers à manipuler dans le cadre d'analyses spécifiques. Il ne semble pas y avoir de "valeurs ajoutées", résultant par exemple de traitements particuliers, au contraire de ce qui semble être le cas des fichiers SLC.

Le mode des Non-P

Bon, je n'ai pas trop l'habitude de dire ça, mais là, je vais peut-être faire une exception: il ne semble effectivement pas très utile de conserver les suivis B, M, V ou les productions non-P.

Mais il me semble important de justifier un tel choix dans les pages du site ErosDbWeb.