Réunion 20/03/26

Lionel Viguier

Ordre du jours

  • Scaling
  • Test et plots

Scaling Démonstration

On s’est rendu compte que ce qui posait problème était l’addition consécutive de valeurs. Les valeurs devenaient de plus en plus extrêmes au fur et à mesure de la traversé du pedigree, surtout si celui-ci est profond. Pour pallier cet effet “boule de neige”, il est important de scaler les données.

Scaler les donnée reviens a les exprimer sous la forme: \[ \begin{cases} a_i(u_i)=C_i \centerdot a_i^* (u_i) \\ g_i(y_i|u_i)=E_i \centerdot g_i^*(y_i|u_i) \\ p_{ij}(u_i) = D_{ij} \centerdot p_{ij}^*(u_i) \end{cases} \]

Scaling Implémentation

Scaling de penetrance

def scalePenetrance(penetrance_Arr, log=True):
    if log:
        return penetrance_Arr - np.max(penetrance_Arr, axis=1)[:, np.newaxis]
    else:
        return penetrance_Arr / np.max(penetrance_Arr, axis=1)[:, None, :]

Scaling anterior

anterior_child = (anterior_child - self.scale_func(anterior_child)[:, None])

Scaling posterior

self.d.Pij[..., fam.idn, :] = (post_unscale - self.scale_func(post_unscale)[:, None, :])

Scale par le maximum sur les génotypes permet d’obtenir des valeurs plus proches de 1 et ne nécessite pas d’addition et donc pas d’exponentiations quand on travaille dans l’espace des logs. (qui est une opération coûteuse)

Test et Plots

tests effectués sur SimuPop \(\epsilon = 10\%\)

Estimation de la “AAF” en fonction de la “AAF” réelle au cours des Cycles

Test et Plots

tests effectués sur SimuPop \(\epsilon = 10\%\)

distribution de densitée

Test et Plots

tests effectués sur SimuPop \(\epsilon = 10\%\)

qualité d’estimation

Test et Plots

tests effectués sur SimuPop \(\epsilon = 30\%\)

Estimation de la “AAF” en fonction de la “AAF” réelle au cours des Cycles

Test et Plots

tests effectués sur SimuPop $= 30% $

distribution de densitée

Test et Plots

tests effectués sur SimuPop \(\epsilon = 30\%\)

qualité d’estimation

Retour

  • Faire en sorte que scalePenetrance renvoie toujours des données log
  • Tester avec les données réelle
  • tester avec des scale_func différents
  • Simuler des pénétrances avec loi de poisson, loi binomiale
  • Regarder comment STITCH écrit dans un VCF
  • Faire la présentation CHAMADE

Présentation: 1. Contexte 1. low-pass 2. Penetrance 3. Donc il faut imputer 1. Il existe ss pedigree(STITCH, Glippse) 2. avc pedigree(Fernando) 2. Methode 1. Présenter la formule bayesienne 2. Présenter l’algo avec pedigree FERNANDO 1. Dire que ca marche bien en récursif 2. Dire que ca marche pas en récursif s’il y a des boucles 3. Iterative Peeling 3. Problemes numérique Scaling 3. Resultats 1. Présenter le jeux de données simulé 2. montrer les résultat 1. expliquer les metriques et ce qui est tester 3. résultats sur JDD réel 4. Discussion 1. Pk les plots avc la fausse pénétrances sont claqués 2. comment on peut améliorer ca (le truc avc poisson et binomiale) 3. on peut ptetre parler du truc pour retrouver un parent?