تعیین برخی عوامل مؤثر بر نرخ خطای ایمپیوتیشن ژنوتیپی برای استفاده در مطالعات رابطه‌یابی سراسری ژنومی در گاوهای شیری

نوع مقاله : مقاله پژوهشی

نویسندگان

1 پردیس کشاورزی و منابع طبیعی دانشگاه تهران، کرج، ایران

2 استاد پردیس کشاورزی و منابع طبیعی دانشگاه تهران، کرج، ایران

3 دانشیار پردیس کشاورزی و منابع طبیعی دانشگاه تهران، کرج، ایران

4 استاد گروه علوم دامی، دانشگاه ایالتی آیوا، ایمز، ایالات متحدۀ امریکا

چکیده

در این مطالعه اثر دو راهبرد متفاوت، تأثیر رابطۀ خویشاوندی بین جمعیت مرجع و جمعیت‌های آزمون، و اثر فراوانی آلل نادر بر نرخ خطای ایمپیوتیشن با استفاده از جمعیتی شبیه‌سازی‌شده، بررسی شد. جمعیت مرجع حاوی 1000 فرد و جمعیت‌های آزمون حاوی 500 فرد بود. ژنوتیپ افراد در جمعیت مرجع با دو تراشه تعیین شد. تراشۀ اول تراشه‌ای متراکم حاوی 75000 SNP به اضافۀ QTLهای مؤثر بر صفات بود. تراشۀ دوم، تراشه‌ای با تراکم متوسط حاوی 7500 SNP بود. ژنوتیپ افراد جمعیت‌های آزمون بر مبنای تراشه‌ای با تراکم پایین حاوی 500 SNP تعیین گردید. ایمپیوتیشن ژنوتیپی طی دو راهبرد انجام گرفت. در راهبرد دو‌مرحله‌ای، ژنوتیپ تراشۀ تراکم‌ پایین به‌طور مستقیم از تراشۀ متراکم ایمپیوت شد. در راهبرد سه‌مرحله‌ای، ابتدا ژنوتیپ تراشۀ تراکم ‌پایین از تراشۀ تراکم متوسط ایمپیوت و سپس ژنوتیپ تراشۀ متراکم ایمپیوت شد. ایمپیوتیشن ژنوتیپی با روش BEAGLE صورت گرفت. بررسی همبستگی بین فراوانی آلل نادر با نرخ خطای ایمپیوتیشن نشان داد که نرخ خطای ایمپیوتیشن تحت تأثیر فراوانی آلل نادر قرار دارد. نرخ خطای ایمپیوتیشن زمانی که از تراشۀ SNP تراکم متوسط استفاده شد، کاهش یافت. با افزایش فاصله بین جمعیت مرجع و جمعیت‌های آزمون، نرخ خطای ایمپیوتیشن افزایش یافت.

کلیدواژه‌ها


عنوان مقاله [English]

Determination of the impact of some factors on genotype imputation error rates for genome wide association studies in dairy cattle

نویسندگان [English]

  • Mohammad Sahebhonar 1
  • Mohammad Moradi Shahrbabak 2
  • Seyed Reza Miraei Ashtiani 2
  • Abbas Pakdel 3
  • Dorian J. Garrick 4
1 PhD Candidate, University College of Agriculture & Natural Resources, University of Tehran, Karaj, Iran
2 Professor, University College of Agriculture & Natural Resources, University of Tehran, Karaj, Iran
3 Associate Professor, University College of Agriculture & Natural Resources, University of Tehran, Karaj, Iran
4 Professor, Department of Animal Science, Iowa State University, Ames, USA.
چکیده [English]

In this study, effect of two genotype imputation strategies, relatedness between reference panel and test populations and minor allele frequency on imputation error rate were examined with using a stochastic simulated population. Reference panel and test populations were composed of 1,000 and 500 individuals, respectively. Individuals in the reference panel were genotyped with using a high and a medium density chips. The high density chip contained 75,000 SNPs plus QTLs. The medium density chip contained 7,500 SNPs. Individuals in the test populations were genotyped with using a low density chip with 500 SNPs. Two strategies were applied for genotype imputation. In 2-tiered strategy, genotypes of low density chip were directly imputed from high density chip. In 3-tiered strategy, genotypes of low density chip were imputed from high density chip with using a medium density chip. In order to impute genotypes, BEAGLE method was used. Correlation between imputation error rate and minor allele frequency showed that imputation error rate was affected by minor allele frequency in both strategies. Imputation error rates were decreased when using a medium density chip to predict genotypes of low density chip. Closer relationship between reference panel and test populations led to a higher accuracy.

کلیدواژه‌ها [English]

  • genotype imputation
  • high density chip
  • minor allele frequency
  • simulation