La dépression de consanguinité spécifique au fondateur affecte les performances de course chez les chevaux pur-sang

Notre analyse des données de 135 572 chevaux pur-sang a révélé une forte relation négative (tous P < 0,001, Fig. 1) entre le coefficient de consanguinité de Wright, F, et cinq mesures de la performance en course qui englobent une gamme de facteurs qui contribuent à la performance à l'exercice28,29. Celles-ci comprenaient deux mesures basées sur l'hypothèse que les individus les plus performants gagnent plus d'argent : les gains cumulés en argent et les gains en argent par départ. Nous avons également inclus deux mesures de solidité constitutionnelle : le nombre total de départs de course et la durée de la carrière. Enfin, nous avons pris en compte la cohérence de la performance avec la mesure du taux d'exercice gagnant.

Coefficients de régression montrant la relation entre les mesures de performance en course et la consanguinité chez les chevaux pur-sang (n = 135 572). Toutes les mesures des performances de course ont une relation négative avec F mais une association positive avec AHC. Les barres d'erreur représentent 1 erreur standard autour de la moyenne. Les coefficients de régression et les erreurs standard ont été divisés par l'erreur standard de leurs traits respectifs. La relation entre chaque mesure de la consanguinité et les performances de course était hautement significative (P < 0,001).

La relation négative entre F et la performance peut s'expliquer par une charge génétique d'allèles partiellement délétères encore portée par la population. Nous nous attendons à ce que les allèles causant la dépression de consanguinité observée soient plus difficiles à sélectionner dans la population que ceux ayant des effets létaux ou débilitants sur la survie juvénile ou embryonnaire10,21,30,31,32. Les goulots d'étranglement de la population qui se sont produits au cours de l'ascendance du pur-sang, y compris la domestication du cheval33, et la fondation de la race2,3, pourraient avoir augmenté la fréquence des allèles délétères par dérive génétique. Il est également possible que la consanguinité continue de la population de pur-sang au cours des 300 dernières années ait augmenté par inadvertance la fréquence des variantes délétères dans la population, potentiellement en faisant de l'auto-stop sur des régions de balayage sélectif13,21,23. À la suite de nombreuses générations de consanguinité, le F moyen de la population de pur-sang du 21e siècle est de 0,139 (s = 0,011).

Contrairement aux résultats du coefficient de consanguinité de Wright, le coefficient d'histoire ancestrale, AHC, a montré une forte association positive avec les performances de course (tous P < 0,001, Fig. 1). Cette statistique, décrite par Baumung et al.34, compte le nombre de fois qu'un allèle a été atteint d'une MII dans le pedigree d'un individu, fournissant ainsi un reflet complet de la sélection des traits favorables au fil du temps. La statistique AHC est basée sur l'hypothèse qu'un allèle qui a été atteint d'une MII plusieurs fois dans le pedigree d'un individu est susceptible d'avoir un effet neutre ou positif sur la condition physique. En revanche, un allèle qui est IBD pour la première fois est plus susceptible d'avoir un effet négatif sur la forme physique. Par conséquent, les individus avec un AHC plus élevé sont plus susceptibles de contenir de plus grandes proportions d'allèles dans leur génome qui ont été sélectionnés positivement sur de nombreuses générations. Il est possible qu'un individu avec un pedigree complet ait un AHC supérieur à 1. En conséquence du pedigree complet et consanguin, la population de référence avait un AHC moyen de 1,973 (s = 0,089).

La relation positive entre l'AHC et toutes les mesures des performances de course est peut-être due aux nombreuses générations d'élevage sélectif qui ont augmenté la fréquence des allèles associés à des améliorations positives de la physiologie de l'exercice. Ces allèles apparaîtront IBD plusieurs fois dans les pedigrees de chaque génération suivante, augmentant ainsi l'AHC (annexe S2). Nos résultats indiquent que la consanguinité pour la sélection a effectivement augmenté les fréquences d'allèles favorables, mais n'a pas complètement éliminé la charge génétique de la population. Compte tenu de cette découverte, il n'est pas surprenant que des parties du génome du pur-sang présentent des signatures de balayages sélectifs liés à des gènes liés à la performance sportive, notamment la formation de fibres musculaires, la régulation à la hausse de l'activité mitochondriale, l'angiogenèse, la formation de tissu adipeux brun et le métabolisme des lipides5,35. En accord avec nos résultats, il existe certaines preuves que la sélection améliore les performances de course chez une autre race de chevaux, le trotteur norvégien à sang froid32.

F et AHC ont tous deux montré les associations les plus fortes avec les gains cumulatifs et les gains par démarrage (figure 1). Nous pensons que cela est dû au fait que ces mesures reflètent non seulement le talent, mais également une bonne constitution, car les chevaux qui courent plus ont plus de chances de gagner plus de prix. Le plus petit coefficient de régression concernait le taux de réussite, probablement parce que cette mesure est une estimation grossière de la cohérence et ne reflète pas la classe de course ou l'ordre d'arrivée d'un cheval lors d'occasions non gagnantes.

Les valeurs de reproduction estimées de la population au fil du temps

Nous avons constaté que les pratiques de reproduction sélective n'ont pas augmenté les niveaux de performance globale de la population au fil du temps. Nous avons mis en œuvre une matrice de relations de numérateur en conjonction avec un modèle mixte linéaire pour tenir compte des relations génétiques additives entre les animaux dans le pedigree (Matériels et méthodes). Sur la base des performances de course d'individus contemporains (n ​​= 135 572), nous avons utilisé cette matrice de relations pour calculer les valeurs de reproduction estimées (EBV) de tous les individus de leur pedigree (n = 257 249)36,37. La forte augmentation des EBV à la base de la population indique que les événements de sélection précoce ont entraîné un saut initial dans la fréquence des allèles favorables (Fig. 2). Après cette augmentation initiale, la distribution des EBV reste constante ; démontrant que l'élevage sélectif du début du 19ème siècle n'était pas efficace pour améliorer les performances de course de la population. Le niveau de F a augmenté constamment pendant cette période (Fig. S9), nous concluons donc que la consanguinité n'a pas efficacement éliminé la charge mutationnelle de la population. Ceci explique pourquoi on observe une forte dépression de consanguinité persistant dans la population contemporaine. Nous pensons que cela est dû en partie à un changement dans les régimes de course et d'entraînement au fil du temps qui, à son tour, a modifié les pressions de sélection sur la population38. Au XVIIIe et au début du XIXe siècle, les courses de pur-sang se déroulaient sur une distance de plusieurs kilomètres, chaque cheval participant à plusieurs manches le même jour. Au 20e siècle, l'accent s'est déplacé vers l'élevage de sprinteurs et les premiers développeurs pour les courses de deux ans39. De même, il y a eu très peu d'augmentation au fil du temps des EBV des chevaux warmblood polonais malgré la sélection pour la performance, ce qui indique qu'une sélection intensive pourrait être nécessaire pour améliorer la valeur moyenne des caractères quantitatifs complexes dans une population40.

La distribution des valeurs d'élevage estimées (EBV) au fil du temps pour les chevaux pur-sang australiens (n ​​= 257, 249), sur la base des revenus cumulés de 135 572 individus qui ont couru entre 2000 et 2010. Les cases ont été calculées sur des intervalles de 0,2, chaque case représentant une période de 10 ans. Les personnes dont les parents sont inconnus sont indiquées en rouge. Les résultats EBV pour les autres mesures de performance en course suivent les mêmes tendances et sont inclus dans l'annexe.

La baisse des EBV entre 1930 et 1980 peut également être attribuée en partie à un nombre accru d'individus avec des informations de pedigree inconnues, comme indiqué en rouge sur la figure 2. Ceci, ainsi que la variabilité accrue des EBV au cours de cette période, pourrait également être dû à la présence de lignées généalogiques moins réussies qui n'ont pas été purgées de la population moderne. Nous pensons que l'augmentation de l'EBV moyen à partir de 1980 est en partie due à l'introduction des tests parentaux dans les années 1980, conduisant à des pedigrees complets pour tous les individus enregistrés. La tendance à la hausse des EBV au cours des dernières générations indique une possibilité d'amélioration future de la qualité phénotypique globale de la population.

La contribution génétique ancestrale inégale dans la population de pur-sang contemporaine

Les pratiques de reproduction sélective sont susceptibles d'entraîner des contributions génétiques ancestrales inégales, favorisant les ancêtres porteurs d'allèles bénéfiques et conduisant à l'extinction des lignées ancestrales moins réussies25,41,42. Nous avons constaté qu'un petit nombre d'ancêtres dans les premières années de la formation de la race représentaient une grande partie du coefficient de consanguinité dans la population moderne de pur-sang australien.

Nous avons constaté que 10 ancêtres représentaient, en moyenne, plus de 80 % des allèles IBD chez les pur-sang australiens modernes (tableau 1). Près de 20 % des allèles IBD dans la population contemporaine ont été attribués à un seul individu, Hérode. Nous avons sélectionné ces 10 ancêtres parce qu'ils ont fourni les plus grandes contributions marginales aux individus dans nos données de performance de course (annexe S4). Les plus grands contributeurs marginaux sont sélectionnés en identifiant d'abord l'ancêtre unique avec la plus grande contribution à la population, puis en trouvant les autres ancêtres qui fournissent les plus grandes contributions génétiques non prises en compte par les ancêtres précédemment sélectionnés43 (annexe S4). Nous avons ensuite estimé la proportion de F (pF i ) et d'AHC (pAHCi) pour chaque individu de notre ensemble de données qui est attribuée à chacun de ces ancêtres34,44.

Nous avons identifié ces individus comme des athlètes supérieurs qui ont également eu beaucoup de succès au haras. Les archives historiques montrent que la plupart de ces individus sont étroitement liés les uns aux autres (Fig. S8). L'un d'eux, Godolphin Barb, était l'un des trois étalons fondateurs de la race au début du XVIIIe siècle1. Il a été rapporté qu'il contribue à 13,8% de la constitution génétique des chevaux pur-sang britannique3. Un autre des étalons fondateurs, Eclipse, a été identifié comme la source d'une mutation du chromosome Y qui est proche de la fixation dans la population moderne de pur-sang45.

Les 10 ancêtres notables représentaient plus de 82 % du coefficient AHC dans leurs descendants modernes (tableau 1). Nous nous attendions à cette relation car ces individus apparaissent plusieurs générations en arrière dans le pedigree des chevaux modernes. Pour que les allèles hérités d'eux aient une si grande contribution à F, ils doivent apparaître IBD plusieurs fois dans les pedigrees de leurs descendants. Conformément au principe du coefficient AHC, les allèles que l'on trouve plusieurs fois dans le pedigree IBD sont susceptibles d'avoir des effets neutres ou bénéfiques sur la fitness. Ces résultats se reflètent dans les tendances positives de F et AHC au fil du temps dans la population (Fig. S9).

Répartition inégale de la charge génétique entre les différents ancêtres

Nous avons trouvé des preuves que la dépression de consanguinité spécifique au fondateur affecte différemment les performances de course dans la population de pur-sang australien (Fig. 3). Nous avons déterminé la distribution de la charge génétique entre les 10 ancêtres dominants en utilisant des modèles mixtes linéaires pour examiner la relation entre les coefficients de consanguinité partielle et les performances de course. La charge génétique peut être inégalement répartie entre les différents ancêtres, de sorte que la consanguinité avec différents individus peut avoir un effet variable sur la forme physique24,25,26. Si la consanguinité avec un ancêtre particulier entraîne une réduction des performances de course de leurs descendants, une proportion plus élevée de la charge génétique dans la population peut leur être attribuée. La variation de la charge génétique entre les différents ancêtres indique que la dépression de consanguinité chez les pur-sang est due à un petit nombre de loci qui ont des effets importants sur les performances24,25,46.

La consanguinité avec différents ancêtres a des effets variables sur cinq mesures des performances de course chez les chevaux pur-sang australiens modernes. Des coefficients de consanguinité partielle ont été calculés pour les 10 ancêtres ayant les plus grandes contributions marginales à la population contemporaine de pur-sang australien. La relation entre chaque coefficient partiel et la consanguinité a été analysée à l'aide de coefficients de régression de modèles de maximum de vraisemblance restreints. Les barres d'erreur représentent 1 erreur standard par rapport à la moyenne. Ce graphique utilise le même ensemble de données que dans la figure 1, mais avec chaque coefficient de consanguinité divisé en partiels. Les barres rouges indiquent des relations significatives.

Nous avons constaté que la consanguinité résultant de quatre ancêtres avait des effets significatifs sur les performances de course. Les individus avec plus d'allèles IBD attribués à Hérode avaient des gains cumulatifs, des gains par début et une durée de carrière plus élevés. Cela ne signifie pas que l'augmentation de la consanguinité avec Hérode n'a pas eu d'effets négatifs sur la valeur phénotypique de ses descendants, mais que dans l'ensemble, ils présentent moins de dépression de consanguinité que d'autres individus également consanguins25. Inversement, la consanguinité avec Eclipse, Stockwell et Touchstone a eu des effets négatifs sur les performances de course de leurs descendants. Nous proposons que ces effets négatifs soient en partie dus au « coût de la domestication »23, par lequel la consanguinité de ces individus a sélectionné par inadvertance des allèles délétères liés à des sites qui ont subi des balayages sélectifs21,22.

De plus, des rapports historiques décrivent ces étalons comme étant des porteurs potentiels d'allèles de maladies, ce qui peut avoir prédisposé leurs descendants à des conditions courantes qui réduisent les performances de course. Touchstone a été signalé par ses contemporains comme ayant un certain nombre de problèmes de conformation et de comportement47, qui pourraient également avoir contribué au niveau de performance réduit de ses descendants. Bien qu'Eclipse soit un cheval de course supérieur, son grand-père souffrait d'une hémorragie pulmonaire induite par l'exercice (saignement des poumons)48. Cette condition héréditaire réduit le succès des courses49,50, et des épisodes récurrents entraînent l'interdiction permanente d'un cheval de courir en Australie. L'héritage de cette condition pourrait être un facteur contribuant à la durée de carrière réduite des descendants d'Eclipse. Les individus avec des niveaux plus élevés de consanguinité avec Stockwell présentent des taux de réussite réduits, bien que cela puisse être une anomalie statistique car P = 0,04. Cependant, la mère de Stockwell souffrait d'une maladie congénitale de neuropathie laryngée (paralysie du larynx)51,52,53, ce qui peut expliquer en partie la baisse de performance observée.

Nous nous attendons à ce que la plupart de ces ancêtres aient transmis un mélange d'allèles avec des effets à la fois positifs et négatifs, de sorte que la consanguinité avec eux a le même effet que la consanguinité avec d'autres individus du pedigree. Cependant, il est également possible que deux individus consanguins du même ancêtre aient hérité de différents ensembles de loci de différents chemins ancestraux, rendant l'effet de cet ancêtre sur la fitness variable entre différents descendants46. Un exemple de ceci a été trouvé chez les bovins, où l'apparition d'une dysplasie ectodermique chez un certain nombre de veaux de parents non affectés a été attribuée à une mutation de novo chez un taureau54. La condition n'a été révélée que par la consanguinité de ses descendants, lorsque certains de leurs descendants ont hérité de deux copies de l'allèle de la maladie. Cet exemple démontre que la consanguinité avec un individu particulier peut avoir des effets très variables sur les niveaux de forme physique entre leurs différents descendants.

Compte tenu des preuves solides d'une répartition inégale de la charge génétique, nous concluons que la majorité de la dépression de consanguinité n'est due qu'à une faible proportion d'allèles IBD25,42. Par conséquent, nous suggérons que la simple mesure de la proportion d'allèles IBD dans le génome ne fournit pas un reflet complet de la charge génétique d'une population. Comprendre la distribution hétérogène de la charge génétique est important pour aider les décisions de sélection afin de minimiser la consanguinité avec les ancêtres qui affecte négativement la fitness42.

Relation entre les coefficients de consanguinité basés sur le génome et les performances de course

Contrairement aux estimations de la consanguinité basées sur le pedigree, nous avons constaté que les mesures génomiques de la consanguinité ne montraient aucune relation globale avec aucune mesure de la performance en course (tableau 2). Pour un sous-ensemble représentatif de la population (n = 122), nous avons estimé les niveaux de consanguinité génomique comme la proportion du génome constituée de séquences d'homozygotie (FROH). Cette méthode reflète les niveaux de consanguinité en capturant de longues étendues homologues d'ADN héritées d'un ancêtre commun qui n'ont pas été brisées par recombinaison55,56,57,58,59. Pour nos analyses, nous avons sélectionné des seuils de longueur minimale de 5 Mb (FROH_5) et 12 Mb (FROH_12) pour correspondre respectivement à l'ancienne et à la nouvelle consanguinité (Annexe S2).

Pour cet ensemble de données plus petit, cependant, nous avons également constaté que les coefficients F et AHC pour ces individus n'ont également montré aucune relation avec la performance (tableau 2). Considérant que cette relation était significative pour une plus grande taille d'échantillon, nous concluons qu'une taille d'échantillon de 122 n'était pas suffisante pour saisir la relation entre la consanguinité et la performance. Nos modèles n'ont pas pu tenir compte d'un certain nombre de facteurs environnementaux de confusion qui pourraient affecter les performances de course (tels que le régime d'entraînement, le succès des jockeys et le processus d'élevage des poulains), donc un échantillon de grande taille est nécessaire pour déterminer la relation sous-jacente entre la consanguinité et performance. Il existe également un large continuum entre les individus les plus performants et les moins performants dans une population aussi nombreuse qui pourrait ne pas être capturé par un petit sous-ensemble d'individus. Nos résultats indiquent qu'il faut faire preuve de prudence dans les études portant sur des populations plus petites.

Les estimations moléculaires de la consanguinité sont souvent considérées comme supérieures aux mesures généalogiques car elles tiennent compte de la nature imprévisible de la recombinaison et des informations d'enregistrement généalogiques inexactes. Cependant, les paramètres des mesures FROH doivent également être choisis avec soin, afin qu'ils reflètent avec précision les niveaux de consanguinité. L'exactitude de ces estimations pourrait être affectée par une densité de SNP inadéquate56,60 et de longues étendues de ROH persistant dans les zones de faible recombinaison61,62 (annexe S2). De nombreuses études utilisent différents paramètres pour les densités de génotypage, le découpage des données et la ROH, ce qui rend les comparaisons difficiles à établir.

Nous avons constaté que la corrélation entre FROH et F dans notre ensemble de données (Fig. S3) était inférieure à celle rapportée chez d'autres espèces domestiques63,64, ce qui peut expliquer en partie les résultats contrastés. Nous avons constaté qu'une grande partie du coefficient de consanguinité dans la population de pur-sang australien était due à des ancêtres de plusieurs générations dans le pedigree. La consanguinité avec des ancêtres éloignés entraîne des régions ROH plus courtes qui pourraient ne pas être capturées par la densité de SNP utilisée dans notre analyse (annexe S2).

Pour ces raisons, nous pensons que pour les grandes populations avec des pedigrees complets, les mesures généalogiques de la consanguinité peuvent fournir des inférences importantes si la taille du pedigree est beaucoup plus grande que le nombre d'individus génotypés. L'utilisation des données généalogiques permet de faire des inférences pour les personnes décédées, pour lesquelles le génotypage pourrait ne pas être possible. De plus, l'utilisation d'un pedigree pour analyser les tendances au fil du temps peut être avantageuse car il pourrait ne pas être possible d'obtenir des données moléculaires pour les personnes décédées (comme les fondateurs de la population). Les pedigrees offrent également la possibilité d'estimer les effets d'individus spécifiques au fil du temps sur l'aptitude de leurs descendants.