You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Quoi qu'il arrive au sujet de ce point, je propose d'écrire le workflow de travail sans les exemples dans le readme en précisant à chaque étape les données d’entrées et de sortie et les fichiers externes qui ont été utilisés (règles de validation, d'agrégation, de correction).
Je vais prendre cet exemple UK / NIE à "2017-04-27 21:00:00"
Lorsqu'on charge les données initiales, on obtient ça
On constate que les données CTY | UK est plus grande que les deux autres et c'est normal.
Car d'après les règles "cty_rules", la valeur de UK doit contenir CTA|NORTH_IRELAND
jalazawa
changed the title
data_correct_with_rules : règles automatiques d’agrégation différentes des règles de validation
data_correct_with_rules : règles automatiques d’agrégation différentes des règles de validation ?
Dec 1, 2017
davidgohel
changed the title
data_correct_with_rules : règles automatiques d’agrégation différentes des règles de validation ?
Documentation du workflow
Dec 6, 2017
Le problème est un peu complexe
Quoi qu'il arrive au sujet de ce point, je propose d'écrire le workflow de travail sans les exemples dans le readme en précisant à chaque étape les données d’entrées et de sortie et les fichiers externes qui ont été utilisés (règles de validation, d'agrégation, de correction).
Je vais prendre cet exemple UK / NIE à "2017-04-27 21:00:00"
Lorsqu'on charge les données initiales, on obtient ça
On constate que les données CTY | UK est plus grande que les deux autres et c'est normal.
Car d'après les règles "cty_rules", la valeur de UK doit contenir CTA|NORTH_IRELAND
UK:
CTY:
- GB
- "CTA|NORTH_IRELAND"
CTA:
- GB
BZN:
- GB
Mais voilà ce qui se passe quand on appel la fonction
aggregate_with_rules
On obtient ce tableau
Ici, on a rajouté la donnée "CTA|NORTH_IRELAND" à la donnée CTY|GB.
PB la donnée CTY|GB contenait déjà la donnée "CTA|NORTH_IRELAND".
Au moment de la validation de la donnée, on a de nouvelles surprises
La règle d'égalité entre CTY|GB et CTA|GB devrait être égal à TRUE et ici cette règle est FALSE.
Le fait que ce test soit égal à FALSE implique que lors de la correction des données automatiques, la donnée CTY est corrigée.
Je pense que la règle qui corrige cette donnée est la suivante :
Le comportement des fonctions d'agrégations et de correction est encore à travailler.
Je ne sais si c'est une solution, mais il faut peut-être faire un fichier avec des règles d'agrégation et un fichier différent pour la validation.
Pour revenir au point initial, il est primordiale d'écrire le workflow de travail quelque part.
The text was updated successfully, but these errors were encountered: