معلومة

علم الوراثة الإحصائية: ترددات الأليل التي تتبع توزيع ديريتشليت


من Foll and Gagiotti (2008) (برنامج BayeScan). إنهم يعتبرون نموذجًا حيث يتم اشتقاق العديد من المجموعات السكانية الفرعية من مجموعة سلالة فريدة من نوعها.

نحن نعتبر مجموعة من $ I $ loci ونفترض أن $ K_i $ هو عدد الأليلات في $ i ^ {th} $ locus. يتم قياس مدى التمايز في locus $ i $ بين مجموعة سكانية فرعية $ j $ ومجتمع الأجداد بـ $ F ^ {ij} _ {ST} $ وهي نتيجة لتاريخها الديموغرافي. لنفترض أن $ p_i = {p_ {ik} } $ تدل على ترددات الأليل لسكان الأجداد في locus $ i $ ، حيث $ p_ {ik} $ هو تردد الأليل $ k $ عند locus $ i $ $ يسار ( sum_k p_ {ik} = 1 right) $. نستخدم $ mathbf {p} = { mathbf {p_i} } $ للإشارة إلى المجموعة الكاملة من ترددات الأليل لسكان الأجداد و $ mathbf { tilde p_ {ij}} = { tilde p_ { ijk} } $ للإشارة إلى ترددات الأليل الحالية في المكان $ i $ للتجمع السكاني $ j $. في ظل هذه الافتراضات ، تتبع ترددات الأليل في locus $ i $ في مجموعة سكانية فرعية $ j $ توزيع Dirichlet مع المعلمات $ theta_ {ij} mathbf {p_i} $،

$$ mathbf { tilde p_ {ij}} space tilde space space text {Dir} ( theta_ {ij} p_ {i1}،…، theta_ {ij} p_ {iK_i}) $$

، أين

$$ theta_ {ij} = frac {1} {F ^ {ij} _ {ST}} - 1 $$

(ليس لدي خبرة كبيرة في توزيعات Dirichlet لكني أفهم تعريفها وفائدتها في إحصائيات بايزي).

هل يمكنك مساعدتي في فهم سبب اتباع $ mathbf { tilde p_ {ij}} $ لتوزيع Dirichlet هذا؟

عند استدعاء المعلمة $ j ^ {th} $ لتوزيع Dirichlet ، $ alpha_j $ ، لا أفهم عادةً سبب "اختيارهم" $ alpha_j = left ( frac {1} {F ^ {ij} _ {ST}} - 1 right) p_ {ij} $ وليس ، قل فقط $ alpha_j = F ^ {ij} _ {ST} p_ {ij} $ أو أي شيء آخر.


إلى حد كبير تخمين مستنير يعتمد على خصائص التوزيعات بدلاً من معرفة محددة بعلم الوراثة الإحصائية: توزيع بيتا مفيد لنمذجة ترددات أليلين في موضع واحد. توزيع Dirichelet ، وهو تعميم متعدد المتغيرات لتوزيع بيتا ، سيكون مفيدًا لنمذجة يضع من المواقع.

الجانب الآخر هو التفكير في الإصدار التجريبي باعتباره مجرد حالة خاصة من Dirichelet: إذا كان لديك موضع واحد فقط ، فإن الإصدار التجريبي يعمل. إذا كان لديك مواقع متعددة ، ثم Dirichelet.


ديفيد بالدينج

منذ أن أنهيت درجة الدكتوراه ، عملت على تطوير وتطبيق الأساليب والأفكار الرياضية / الإحصائية / الحسابية في علم الوراثة. لقد ساهمت في جوانب من علم الوراثة السكانية والتطورية والطبية والشرعية.

في علم الوراثة الشرعي ، كانت مساهمتي الرئيسية هي تطوير طرق للسماح بتأثيرات الحشو في تفسير ملامح الحمض النووي. غالبًا ما تسمى صيغ احتمالية المطابقة التي تتضمن معاملات coancestry "صيغ Balding-Nichols" بعد بحثنا لعام 1994. في الآونة الأخيرة ، قمت بتطوير طرق لتفسير أدلة ملف تعريف الحمض النووي ذات القالب المنخفض ، في البداية بالتعاون مع John Buckleton من ESR New Zealand (ورقة 2009).

تعتمد صيغ المطابقة الجنائية على التوزيع متعدد الحدود - Dirichlet ، الذي طورته وطبقته على تعداد أليل السكان. أدى ذلك إلى أول تعريف مرضٍ لمعامل coancestry (F ، أو ثيتا) ، ونهج قائم على الاحتمالية لتقديره. بتضمين هذا التوزيع في نموذج هرمي يسمح بالتجمعات السكانية الفرعية وتأثيرات الموقع ، طور مارك بومونت وأنا في بحثنا لعام 2004 نهجًا واسع الاستخدام لاكتشاف المواقع الخاضعة للاختيار (يتضح من الاختلاف المرتفع أو المنخفض بشكل غير عادي عبر المجموعات السكانية الفرعية). تسمى أحيانًا ذات الحدين بيتا (أو بشكل عام متعدد الحدود - Dirichlet) كتوزيع لمحاكاة ترددات أليل التجمعات السكانية الفرعية "نموذج Balding-Nichols" بعد بحثنا في عام 1995.

كتب أنا ومارك ، مع Wenyang Zhang ، في عام 2002 ورقة تأسيسية في مجال الحساب التقريبي البايزي (ABC). قدمنا ​​تعديل الانحدار الخطي المحلي الذي ثبت أنه مفيد للغاية ، ولكن ربما بنفس القدر من الأهمية قدمنا ​​أول مراجعة مفيدة للطريقة ، والتي تم تطويرها على مراحل من قبل مؤلفين سابقين ، وقمنا بالترويج لها باعتبارها تقنية إحصائية قوية ومرنة.

مع إيان ويلسون ، قمت بتطوير أحد البرامج الناجحة الأولى (Batwing) لنمذجة التاريخ الديموغرافي للسكان بناءً على نمذجة صريحة للأصول الجينية للأفراد الذين تم أخذ عينات منهم من السكان (أوراق 1998 و 2003). لقد تم استخدامه على نطاق واسع ، لا سيما لنمذجة الأنساب الأبوية من بيانات كروموسوم Y.

لقد كتبت أو شاركت في تأليف عدد من أوراق المراجعة التي أثبتت شعبيتها ، حول الأساليب الإحصائية لدراسات الارتباط الجيني (2006) ، وطرق بايزي وبنية السكان والارتباط الخفي في الارتباط الجيني (كلاهما 2009) والجينوم دراسات جينية واسعة (2011). قام Will Astle ، بالعمل معي ، بتطوير خوارزمية سريعة لتحليل النماذج المختلطة لدراسات الارتباط الجيني ، الموضحة في مراجعتنا لعام 2009 والمتاحة في قسم MixAbel في برنامج GenAbel R.

أواصل حاليًا نمطي الراسخ لتطبيقات واسعة النطاق جدًا للإحصاء في علم الوراثة. أنا مشترك في مشاريع حول الأساليب الإحصائية لعلم الوراثة الدوائية ، بما في ذلك المتغيرات المشتركة الجينية في نماذج الحرائك الدوائية ، وتسلسل المتغيرات النادرة في حالات القلب الموروثة ، والاختيار الجيني في المحاصيل وتحديد السلالات في الكلاب المختلطة. كما أنني ما زلت نشطًا في الأساليب الإحصائية لمحات الحمض النووي للطب الشرعي.


2.1 أهداف هذا الفصل

لاحظ أن هناك فرقًا بين موضوعين غالبًا ما يتم الخلط بينهما: "الاحتمالية" و "الإحصاء".

تناسب البيانات مع التوزيعات الاحتمالية باستخدام الرسوم البيانية وحيل التصور الأخرى.

احصل على أول لقاء مع إجراء تقدير معروف باسم أقصى احتمال من خلال تجربة محاكاة.

عمل استنتاجات من البيانات التي لدينا معلومات مسبقة عنها. لهذا سوف نستخدم نموذج Bayesian الذي سيشمل توزيعات جديدة بخصائص مصممة خصيصًا. سنستخدم المحاكاة ونرى كيف يختلف تقدير بايز عن التطبيق البسيط لأقصى احتمال.

استخدم النماذج الإحصائية والتقدير لتقييم التبعيات في التوزيعات ذات الحدين ومتعددة الحدود.

تحليل بعض البيانات الجينومية المثيرة للاهتمام تاريخيًا والتي تم تجميعها في جداول.

اصنع نماذج سلسلة ماركوف لـ متكل البيانات.

قم ببعض التطبيقات الملموسة لعد الأشكال في الجينوم الكامل وتعامل مع فئات الموصلات الحيوية الخاصة المخصصة للبيانات الجينية.

أمثلة على المعلمات: المعلمة المفردة ( lambda ) تحدد توزيع بواسون. غالبًا ما يستخدم الحرف ( mu ) للتعبير عن المتوسط ​​الطبيعي. بشكل عام ، نستخدم الحرف اليوناني ( theta ) لتعيين مجموعة عامة من المعلمات اللازمة لتحديد نموذج الاحتمالية. على سبيل المثال ، في حالة التوزيع ذي الحدين ، ( theta = (n، p) ) يتكون من رقمين ، عدد صحيح موجب ورقم حقيقي بين 0 و 1.

المعلمات هي المفتاح.

رأينا في الفصل الأول أن معرفة جميع قيم المعلمات في مثال الحاتمة مكنتنا من استخدام نموذج الاحتمال الخاص بنا واختبار فرضية العدم استنادًا إلى البيانات المتوفرة لدينا. سنرى طرقًا مختلفة للنمذجة الإحصائية من خلال بعض الأمثلة الحقيقية ومحاكاة الكمبيوتر ، ولكن دعنا نبدأ بالتمييز بين حالتين اعتمادًا على كمية المعلومات المتاحة.


نتائج ومناقشة

تم إنشاء بيانات AE على مستوى SNP ومستوى النمط الفرداني لكل عينة GTEx باستخدام أفضل الممارسات الحالية ، مع وبدون استخدام ترشيح WASP [8] لتقليل تحيز التعيين الموجود أحيانًا في تحليل AE ، مما أدى إلى 4 أنواع بيانات لكل نموذج (ملف إضافي 1: الشكل S1 ، قسم "توليد البيانات وتوافرها" في قسم "الأساليب"). عبر العينات ، أنتج هذا أكثر من 431 مليون قياس AE على مستوى SNP و 153 مليون قياس AE على مستوى النمط الفرداني. لإثبات قدرة هذه البيانات على الالتقاط بقوة رابطة الدول المستقلة- التأثيرات التنظيمية وكذلك قياس أنواع البيانات الأربعة بالنسبة لبعضها البعض ، قدرنا أحجام تأثير eQTL عبر 49 أنسجة حيث تم تعيين eQTLs من بيانات AE باستخدام تغيير الطية الأليلية (aFC) ومقارنتها بتلك المشتقة من رسم خرائط eQTL [7] . تم قياس حجم التأثير باستخدام aFC لكل من بيانات AE و eQTL. لتسهيل إنشاء تقديرات aFC للمتغيرات التنظيمية من بيانات phASER ، قمنا بتطوير إضافة جديدة إلى حزمة البرامج ، phASER-POP ، مما يلغي الحاجة إلى البرامج النصية المخصصة (ملف إضافي 1: الشكل S2). باختصار ، يدمج phASER-POP مكالمات النمط الجيني وبيانات AE على مستوى النمط الفرداني عبر الأفراد ويطور كل متغير تنظيمي ذي أهمية (على سبيل المثال ، eQTL) في كل فرد مع بيانات AE الخاصة بهم. ثم يقوم بحساب الإحصائيات ، بما في ذلك aFC لكل عينة ، ومتوسطها عبر العينات للأفراد غير المتجانسين بالنسبة للمتغير. على مستوى العينة ، يعد aFC فرقًا في أضعاف التعبير الصافي بين نمطي الفرد في الفرد الذي يتأثر بجميع المتغيرات التنظيمية غير المتجانسة ، بما في ذلك eQTLs الأخرى والتباين التنظيمي النادر ، وبالتالي يمكن أن يختلف عن aFC المتوقع المشتق من رسم خرائط eQTL. ومع ذلك ، يمكن استخدام متوسط ​​aFC عبر جميع الأفراد في مجموعة سكانية متغايرة الزيجوت من أجل eQTL معين كتقدير قوي لحجم تأثيره [1]. تم وصف البرنامج بالتفصيل الكامل في قسم "الطرق".

لتوصيف مورد GTEx AE ، قمنا أولاً بمقارنة تقديرات aFC المحسوبة لـ GTEx eQTL بين بيانات SNP وبيانات AE على مستوى النمط الفرداني. وجدنا ارتباطات عالية بين تقديرات AE و eQTL ، بمتوسط ​​Spearman rho يبلغ 0.80 عبر الأنسجة لبيانات مستوى SNP و 0.83 لبيانات مستوى النمط الفرداني التي تم إنشاؤها بواسطة phASER (الشكل 1 ج). كانت الارتباطات على مستوى النمط الفرداني أعلى بكثير من الارتباطات على مستوى SNP (ص = 3.55e − 15 ، اختبار تصنيف موقع مقترن من Wilcoxon) بينما ينتج في نفس الوقت تقديرات لمتوسط ​​20٪ أكثر من eQTLs (ملف إضافي 1: الشكل S3). بناءً على ذلك ، نوصي باستخدام البيانات على مستوى النمط الفرداني لمعظم التحليلات النهائية ، حيث إنها تنتج المزيد من البيانات ذات الجودة الأعلى. ومع ذلك ، هناك بعض الظروف التي يجب فيها استخدام البيانات على مستوى SNP. على سبيل المثال ، عند تحليل التضفير الأليلي ، فإن البيانات على مستوى النمط الفرداني غير مناسبة لأنها تمتد على كامل النص ، بينما يجب تحليل تعدد الأشكال فقط داخل exon (s) أو intron (s) ذات الأهمية. علاوة على ذلك ، عند تحليل المتغيرات المكتوبة مع تأثيرات ما بعد النسخ على التعبير الجيني ، مثل توقف الكسب أو متغيرات لصق ، فإن بيانات AE على مستوى SNP من متغير الاهتمام تكون أكثر وضوحًا في التحليل.

بعد ذلك ، قمنا بتقييم تأثير تصحيح انحياز رسم الخرائط على تحليل التعبير الأليلي من خلال مقارنة ارتباطات حجم تأثير eQTL و AE مع وبدون تصفية WASP. أدت تصفية WASP إلى تحسين الارتباطات بشكل كبير لكل من SNP- (ص = 2.49e − 13 ، متوسط ​​التحسن 1.22٪) والنمط الفرداني- (ص = 3.55e − 15 ، متوسط ​​التحسن 1.28٪) بيانات المستوى (الشكل 1 ج). نظرًا لأن WASP يعمل عن طريق إزالة ، بدلاً من تصحيح القراءات مع تحيز التعيين ، قمنا بمقارنة عدد eQTLs التي يمكن حساب تقدير aFC لها ووجدنا انخفاضًا صغيرًا بنسبة 3.5٪ فقط (ملف إضافي 1: الشكل S3d). لذلك نوصي باستخدام البيانات التي تمت تصفيتها بواسطة WASP لمعظم التحليلات النهائية. هذا مهم بشكل خاص إذا كان الهدف هو تحديد الإشارات القوية لاختلال التوازن الأليلي ، والتي يمكن أن تكون في كثير من الأحيان إيجابية كاذبة بسبب رسم الخرائط التحيز. نحن نشجع مستخدمي المورد على تقييم تأثير تصفية WASP لحالة الاستخدام الخاصة بهم ، لذلك قمنا بتضمين بيانات AE غير المفلترة للمقارنة.

بعد ذلك ، قمنا بتمييز بيانات AE التي تمت تصفيتها بواسطة WASP. في بيانات GTEx RNA-seq ، عند تغطية 8 قراءات كحد أدنى ، كان للعينات متوسط ​​7،607 جينات مع بيانات AE على مستوى SNP و 10،043 جينًا على مستوى النمط الفرداني ، وقد انخفض هذا كدالة لزيادة عتبات التغطية (إضافية ملف 1: الشكل S4). بنفس حد التغطية ، على مستوى الأنسجة وباستثناء الأنسجة ذات أحجام العينات الصغيرة (ن & lt 70) حيث لم يتم إجراء رسم خرائط eQTL ، كان هناك متوسط ​​18،042 جينًا بمتوسط ​​128 عينة لكل جين باستخدام بيانات AE على مستوى النمط الفرداني ، مما يجعل مجموعة البيانات جيدة للكشف رابطة الدول المستقلة- التأثيرات التنظيمية (الشكل 2 أ). كان متوسط ​​عدد العينات التي تحتوي على بيانات AE لكل جين يعتمد إلى حد كبير على حجم عينة الأنسجة ، ويتراوح من 39 لقشرة الكلى (ن = 73 عينة) إلى 321 للغدة الدرقية (ن = 574 عينة). ارتبط عدد الجينات التي تحتوي على بيانات AE بحجم العينة (rho = 0.41) وعدد الجينات المعبر عنها (rho = 0.82) ، مع وجود أقل عدد من الجينات مع بيانات AE لخطي الخلية (LCLs = 15804 ، الخلايا الليفية = 16،526) والخصية التي تحتوي على أكبر عدد من الجينات مع بيانات AE (21952) على الرغم من حجم عينة وسيط يبلغ 322 (ملف إضافي 2: الجدول S1). كان هذا على الأرجح مدفوعًا بعدد الجينات المعبر عنها في الخصيتين ، والتي كانت الأعلى في جميع الأنسجة.

مورد التعبير الأليلي على مستوى النمط الفرداني GTEx v8. أ عدد الجينات لكل نسيج مع بيانات AE على مستوى النمط الفرداني (جينات AE) في فرد واحد على الأقل مقابل متوسط ​​عدد العينات مع البيانات لكل جين. ب النسبة المئوية لجينات AE مع اختلال كبير في الأليلات (اختبار ذو الحدين ، FDR على مستوى الجين & lt 5٪) على الأقل ن عينات لكل جين باستخدام جميع العينات (الزرقاء) أو باستثناء العينات غير المتجانسة لأي أعلى (FDR & lt 5٪) أو GTEx eQTL مستقل (التقليب) ص & lt 1e − 4) (أحمر). النقاط الباهتة هي قيم للأنسجة الفردية ، والنقاط الصلبة هي الوسيط عبر الأنسجة. تشير النسب فوق نقاط البيانات إلى انخفاض النسبة المئوية لجينات AE مع عدم التوازن بعد إزالة eQTL متغايرة الزيجوت. يتوفر ملخص كامل لهذه الإحصائيات عبر الأنسجة وعتبات العينة في ملف إضافي 3: الجدول S2. ج تأثير عدد المتغيرات غير المتجانسة في المحفزات الجينية أو القريبة منها (& lt 10 كيلو بايت من المنبع من TSS) على عدم التوازن الأليلي الطبقي حسب تواتر أليل ثانوي. القيم المرسومة هي تقديرات التأثير وفواصل الثقة 95٪ (راجع قسم "نمذجة تأثير متغير المروج" في قسم "الطرق")

أخيرًا ، سعينا لإثبات مدى انتشار رابطة الدول المستقلة- التأثيرات التنظيمية التي يمكن التقاطها باستخدام هذا المورد. لقد وجدنا أنه حتى التأثيرات التنظيمية القوية ، حيث تم التعبير عن أليل واحد عند ≥ 2x مستوى الأليل الآخر ، موجودة على نطاق واسع ، حتى بالنسبة للجينات المشفرة للبروتين ، حيث يظهر 53٪ من جينات ترميز البروتين مثل هذا التأثير في واحد على الأقل. الأنسجة وما لا يقل عن 50 فردًا (ملف إضافي 1: الشكل S5). بالنظر إلى جميع الجينات ، وجدنا أن متوسط ​​10183 جينًا (أو متوسط ​​56٪ من تلك الجينات مع بيانات AE) لكل نسيج أظهر اختلالًا أليليًا كبيرًا (اختبار ذو الحدين ، FDR & lt 5٪ على مستوى الجين) في عينة واحدة على الأقل ، مما يشير إلى الطبيعة الواسعة الانتشار لـ رابطة الدول المستقلة- التأثيرات التنظيمية (الشكل 2 ب). أدت إزالة الأفراد الذين كانوا متغاير الزيجوت لأي GTEx eQTL معروف (قسم "GTEx eQTL" في قسم "الطرق") إلى انخفاض متوسط ​​بنسبة 7.5٪ في عدد الجينات ذات الاختلال الكبير في عينة واحدة على الأقل ، مما يدل على إمكانات هذا المورد لتحديد التأثيرات التنظيمية الإضافية ، بما في ذلك التأثيرات التنظيمية النادرة ، التي لم يتم التقاطها في تحليل eQTL. لإثبات هذه الإمكانات بشكل أكبر ، قمنا بنمذجة عدم التوازن الأليلي كدالة لتردد الأليل الطفيف وعدد المتغيرات غير المتجانسة الموجودة في المروجين الجيني أو القريبة منها (& lt 10 كيلو بايت من TSS). كما هو متوقع ، وجدنا أن المتغيرات النادرة تميل إلى أن يكون لها تأثيرات أكبر على اختلال التوازن الأليلي من المتغيرات الشائعة ، مع أن أندر فئة من المتغيرات التي تم تحليلها (MAF & lt 0.005 في GTEx) لها أقوى التأثيرات (الشكل 2 ج).


تحليل بيانات المحاكاة

المحاكاة الجيوإحصائية / الاستدلال البايزي

يتكون تحقيقنا الأول من تحليل البيانات المحاكية وفقًا للنموذج الدقيق مع التوزيع متعدد الحدود (الموصوف في القسم 2.1.1 والمشار إليه فيما بعد باسم "النموذج الإحصائي الجغرافي" ، وهو نهج تم اتباعه ، على سبيل المثال بواسطة Novembre & Stephens 2008). درسنا ثلاثة أنواع من الهياكل لمصفوفة التغاير: بتأثير كل من المسافات الجغرافية والبيئية (G + E) ، وتأثير المسافة الجغرافية فقط (G) وتأثير المسافة البيئية فقط (E). تتوافق هذه التغايرات مع eqns 2 و 4 و 5 لقد أنشأنا 100 مجموعة بيانات لكل نموذج من النماذج الثلاثة التي تضم مجموعات سكانية تقع في 50 موقعًا جغرافيًا تتكون كل منها من 10 أفراد ثنائي الصبغيات تم تنميطهم الجيني في 100 موقع SNP ثم في 1000 موقع SNP. أيضًا ، نظرًا لأن اثنتين من مجموعات البيانات الحقيقية التي أعيد تحليلها أدناه تحتويان على عدد صغير من مواقع الأقمار الصناعية الصغيرة ، فإننا نتحرى أيضًا عمليات المحاكاة في 15 موقعًا مع 10-20 أليلات لكل موضع ، ومماثلة للمحاكاة المذكورة أعلاه من جميع النواحي الأخرى.

تم أخذ عينات من مواقع المواقع الجغرافية بشكل موحد في مربع [0،1] × [0،1] ، وتم أخذ عينات المتغير البيئي بشكل مستقل عن التوزيع المنفصل المنتظم بثلاث حالات تحاكي ، على سبيل المثال التوزيع المكاني غير المكتمل لثلاثة بيئات. نظرنا أيضًا في الحالة التي يكون فيها المتغير البيئي مستمرًا ومرتبطًا تلقائيًا مكانيًا. في هذه الحالة ، تمت محاكاته كمتغير غاوسي مركزي وموحد مع دالة تغاير أسية بمقياس معامل يساوي 0 · 3. تم إجراء جميع عمليات محاكاة الأنماط الجينية باستخدام نفس مجموعة المعلمات لمصفوفة التغاير ، وهي α = βجي = βه = γ = 1 و δ = 0 · 01. بالنسبة لهذه البيانات ، أجرينا الاستدلال البايزي واختيار النموذج ضمن النموذج مع احتمال متعدد الحدود (أو ذي الحدين).

المحاكاة المتحد

قمنا أيضًا بمحاكاة البيانات في ظل العزلة بنموذج المسافة باستخدام محاكاة متحدة مع برنامج ibdsim (Leblois، Estoup & Rousset 2009). لإنتاج البيانات في ظل ظروف تحاكي نموذجًا جغرافيًا بحتًا (يشار إليه باسم نموذج G أعلاه) ، أنتجنا عمليات محاكاة على شبكة 30 × 30 مع 20 فردًا ثنائي الصبغيات لكل عقدة شبكية ، أخذنا توزيع باريتو مقطوعًا كتوزيع تشتيت (احتمال التحرك ك خطوات ∝م/ك ن مع م = 0·82, ن = 4 · 11 وحد أعلى يساوي 48) واضبط معدل الترحيل على 0 · 03. لإنتاج البيانات في إطار نموذج G + E ، قمنا بمحاكاة مجموعتين مستقلتين من البيانات بواسطة جهازي SIM مستقلين من IBD يعملان في 25 موقعًا جغرافيًا لكل منهما ، مع نفس المعلمات مثل نموذج G الموصوف أعلاه. بعد ذلك ، قمنا بدمج مجموعتي البيانات الفرعية معًا في مربع لتقليد التعايش بين مجموعتين فرعيتين معزولتين وراثيًا بواسطة حاجز غير منفذ. لإنشاء البيانات في نموذج E ، فعلنا نفس الشيء كما في حالة G + E ، باستثناء أننا حددنا معدل الترحيل يساوي 0 · 999. هنا ، أنشأنا أنماطًا وراثية في 1000 موقع مستقل.في الخطوة الأخيرة ، قمنا أيضًا بمحاكاة البيانات كما في حالتي G + E و E ، لكننا اخترنا 4٪ من الأفراد في كل مجموعة وقمنا بتبديلها لتقليد المهاجرين F0. في هذه الحالة ، تمت محاكاة الأنماط الجينية في 100 موقع SNP. في جميع الحالات ، قمنا بأخذ عينات فرعية من 50 من 900 مجموعة أولية لإنتاج مجموعة بيانات في 50 موقعًا لأخذ العينات متباعدة بشكل غير منتظم. بالنسبة لهذه البيانات ، أجرينا الاستدلال البايزي واختيار النموذج ضمن النموذج ذي الاحتمالية ذات الحدين.

تم تلخيص النتائج على اختيار النموذج على أساس نموذج بايز مع التوزيع ذي الحدين / متعدد الحدود في الجدول 1. في الظروف المدروسة ، يمكن لخوارزميةنا استرداد النموذج الحقيقي باستثناء جزء صغير من الحالات التي تكون فيها الخوارزمية متساهلة للغاية: صحيح النموذج هو G أو E وتختار الخوارزمية G + E. تزداد الدقة في اختيار النموذج مع زيادة عدد المواقع المستخدمة ، مع وجود عدد قليل فقط من أخطاء اختيار النموذج من بين 300 مجموعة بيانات تمت محاكاتها لـ إل = 1000 موقع.

النموذج الصحيح ∖ الموديل المختار G + E. جي ه
المحاكاة الجيوإحصائية ، المتغير البيئي المنفصل
موقع ثنائي الأليلات إل=100
G + E. 100 0 0
جي 14 86 0
ه 0 0 100
موقع ثنائي الأليلات إل=1000
G + E. 100 0 0
جي 0 100 0
ه 0 0 100
المحاكاة الجيوإحصائية ، المتغير البيئي المستمر
مواضع متعددة الأشكال للغاية إل=15
G + E. 99 1 0
جي 32 68 0
ه 29 0 71
موقع ثنائي الأليلات إل=100
G + E. 100 0 0
جي 16 84 0
ه 7 0 93
موقع ثنائي الأليلات إل=1000
G + E. 100 0 0
جي 1 99 0
ه 0 0 100
محاكاة ibdsim ، متغير بيئي منفصل
موقع ثنائي الأليلات إل=1000
G + E. 100 0 0
جي 7 93 0
ه 0 0 100
موقع ثنائي الأليلات إل=100
G + E مع مهاجرين F0 95 5 0
جي 41 55 4
E مع المهاجرين F0 9 0 91

تقدير قيمة التقريب الغاوسي

لتقييم قيمة نموذج التقريب الغاوسي ، قمنا بمحاكاة البيانات تحت النموذج مع احتمالية ذات الحدين الموصوفة في القسم 2.1.1 ولكننا استنتجنا بموجب النموذج التقريبي والخوارزمية الموصوفة في القسمين 2.1.2 و 2.2.3. نظرنا في أعداد مختلفة من المواقع الجغرافية ن تتراوح من 50 إلى 500 وعدد من المواقع إل تتراوح من 100 إلى 100000. في جميع الحالات ، كان حجم أخذ العينات أحادية الصيغة الصبغية المحلية يساوي 2 (فرد واحد ثنائي الصيغة الصبغية). كان المتغير البيئي مستمرًا ومرتبطًا تلقائيًا مكانيًا. تم تلخيص النتائج في الشكل 1 ، حيث يتضح أن التقريب الغاوسي يعمل جيدًا بمجرد أن يكون عدد المواقع كبيرًا.


4. إعادة التركيب البكتيري في علم الوراثة الإحصائي

تأخذ إعادة التركيب (أو الجنس) العديد من الأشكال المختلفة اعتمادًا على ما إذا كان الكائن الحي أحادي الصيغة الصبغية أو ثنائي الصيغة الصبغية ونوع إعادة التركيب. الآلية التي تمت صياغتها في [30 ، 31] مخصصة للتكاثر الجنسي في الخميرة أحادية الصيغة الصبغية ، حيث ينتج كل من الوالدين جسمًا تزاوجًا (نسخة من الجينوم الأصل) ، ويتم دمج هذين الجسمين المتزاوجين لإنتاج جينوم واحد جديد بينما النصف الآخر من يتم التخلص من المواد الجينية لجسمي التزاوج. كلما اقتربنا من بياناتنا ، فإننا نعتبر بدلاً من ذلك شكلاً من أشكال إعادة التركيب البكتيري ، ومع ذلك يتبين أن التطور جوهريًا هو نفسه ، modulo a Stosszahlansatz.

وبالتالي ، فإن إعادة التركيب (نفترض) تتميز بوجود جينومين يدمجان ويشكلان جينومين جديدين. لا يمثل هذا نموذجًا مباشرًا للاقتران حيث تعطي إحدى البكتيريا مادة وراثية للأخرى ، ولكن يمكن أن تشكل نموذجًا للتحول والتنقل بمرور الوقت حيث يمكن للمادة أن تسير في كلا الاتجاهين. في الرئوية الرئوية يحدث إعادة التركيب عن طريق التحويل وإعادة التركيب المتماثل. في خطوة أولية ، يتم فقدان اثنين من الأنماط الجينية (الوالدان) ويتم اكتساب طريقتين وراثيتين (النسل). اسمحوا أن يكون الحدث أن شخصين مع الأنماط الجينية وإعادة الاتحاد وإعطاء فردين و. لوصف حركية العملية الفردية ، نفترض أن إعادة التركيب بين الوالدين يحدث بمعدل أين ص معدل إجمالي لإعادة التركيب ومعدل نسبي. يتم تحديد النوعين الجيني الجديد بواسطة متغير مؤشر:

وهذه النتيجة من إعادة التركيب تحدث باحتمالية. وبالتالي فإن المعدل الإجمالي للحدث الفردي هو. يتم إعطاء تغيير التوزيع على الأنماط الجينية بسبب إعادة التركيب من قبل

هذه المعادلة من نوع مألوف من نظرية الغاز غير المثالية: يعتمد التغيير في توزيع الجسيم الواحد (توزيع الجينوم الواحد) على توزيعات الجسيمين (توزيعات الجينوم). من الناحية العملية ، من الصعب استخدام (16) بدون إغلاق ، مثل افتراض أن احتمالات الزوج عامل. لاحظ أن المجموع الموجود على الجانب الأيمن يزيد عن أحد الوالدين () ومتغير المؤشر اللذين يعطيان الطفل معًا. نحن نفترض البساطة أيضًا س يعتمد فقط على التداخل ف بين النوعين الجينيين و:

إعادة التركيب كما هو موضح أعلاه لا يغير التداخل. يمكن رؤية هذا على النحو التالي: و. نظرًا لأن متغير المؤشر يأخذ قيمًا صفرية وواحدة فهذا يعطيها.

لنفترض الآن أن عوامل التوزيع ثنائية الجينوم ، وأن توزيع الجينوم الواحد هو من نوع بوتس وأن جميع معلمات نموذج بوتس التربيعية ياي جاي صغيرون. سيُنظر إلى هذه الافتراضات على أنها متسقة ذاتيًا عند معدل إعادة التركيب ص عالية. من خلال عملية حسابية مضطربة ، والتي نقدمها في الملحق ب (بشكل أساسي نفس ما هو موجود في الملحق ب من [31]) الجانب الأيمن من (16) يبسط إلى:

حيث استخدمنا الاختصارات

أولها هو احتمال أن يتم توريث موقعين من نفس الوالد ولا يعتمد (بالنسبة لهذا النموذج) على النمط الجيني. من ناحية أخرى ، تعتمد المتوسطات الثلاثة الأخيرة على. ومع ذلك ، إذا كانت الوظيفة س لا تركز بشكل حاد للغاية يمكن اعتبار الاعتماد ضعيفًا. على وجه الخصوص ، نفترض أن ذلك يعد متوسطًا ذاتيًا ، ولا يعتمد عليه في الأساس. في لغة فيزياء الدوران الزجاجي [44 ، 45] ، نفترض ذلك ، ونحسب متوسطًا ذاتيًا في المرحلة "البارامغناطيسية" حيث من المتوقع أن يثبت QLE.


2.3 علاقة مع F شارع

هناك مقياس شائع الاستخدام في علم الوراثة السكانية لقياس مدى التمايز بين السكان. نشأت مع Sewall Wright وعادة ما يتم الإشارة إليها بواسطة Fشارع. مرة أخرى ، نحيل القارئ إلى مراجعات روسيت (2001) وإكسكوفييه (2001) للحصول على حساب كامل ، فنحن نقدم فقط أقصر رسم تخطيطي. لقد استفاد فهمنا من الوصول إلى ملاحظات غير منشورة بقلم ديفيد بالدينج.

وصف رايت (1951) F شارع مثل "الارتباط بين الأمشاج العشوائية ، المستمدة من نفس المجموعة السكانية الفرعية ، بالنسبة إلى الإجمالي". لسوء الحظ ، هذا التعريف غير دقيق ، وبعض الارتباك اللاحق في الأدبيات ينبع من تفسيرات مختلفة. ينشأ الانقسام المفاهيمي بين المناهج من الاختلافات (عادة ضمنية وليست صريحة) في ما يتم تكييفه.

طرق أخرى (نموذج قائم في مصطلحات Balding) تفسير الاحتمالات في المعادلة (9) على أنها تتعلق بتكرار العملية التطورية بأكملها ، بدلاً من مجرد تكرار أخذ العينات من المجموعات السكانية الموجودة. في هذه الحالة، Fشارع يمكن اعتباره معلمة إحصائية ، والهدف هو تقديره من البيانات ، و / أو ربطه (عن طريق حسابات الاحتمالات) بالمعلمات التي تحدد بشكل مباشر النموذج التطوري. غالبًا ما تتم صياغة إجراء التقدير الأكثر شيوعًا (انظر على سبيل المثال Weir (1996)) عن طريق القياس مع تحليل التباين. إنه مكافئ (روسيت ، 2001) لمقاربة طريقة اللحظات التي فيها الاحتمالات س2 و س3 في المعادلة (9) تقدر بترددات أزواج متطابقة من الكروموسومات في الموقع ، داخل وبين السكان على التوالي ، في العينة ، والتقديرات المستبدلة في المعادلة (9).

لا توجد إرشادات في تعريف رايت حول كيفية التعامل مع الارتباطات المختلفة للأليلات المختلفة في مواقع متعددة الطبقات ، وغالبًا ما يتم حساب متوسطها عمليًا. (المسألة محل نقاش لبيانات SNP.) كما لوحظ أعلاه ، تتبع معظم الأساليب الحالية رايت في الحصول على قيمة واحدة Fشارع لتجميع السكان (غالبًا مع افتراض ضمني للمبادلة عبر المجموعات السكانية) ، على الرغم من وجود قيم مختلفة في بعض الأحيان لمواقع متميزة. نعتقد أنه من الأنسب وجود معلمات خاصة بالسكان ، مشتركة عبر مواقع SNP.

الصيغة (10) تحمل تشابهًا وثيقًا مع هيكل التباين الهامشي الذي يشير إليه نموذجنا (2). في الواقع ، إذا أردنا ذلك يصر على قيمة مشتركة ج عبر المجموعات السكانية ، فسيتم الحصول على المعادلة (10) مع Fشارع وحل محله ج، بشرط أن يتم تفسيرها على أنها مشروطة π. بهذا المعنى ، خاصة وأن الأساليب المختلفة تتضمن تكييفًا مختلفًا على أي حال ، معلماتنا جي يمكن اعتباره مشابهًا لـ Fشارع- القيم ، ولكن بواحد لكل مجموعة.


علم الوراثة الإحصائي: ترددات الأليل التي تتبع توزيع ديريتشليت - علم الأحياء

خلفية تعليمية

حصلت على شهادة المدرسة العليا (نيو ساوث ويلز ، أستراليا) في عام 1978 ، بعد دراستي في Chevalier College Bowral (1973-76) و Kiama High Shool (1977 - 78). حصلت على مجموع درجات 444/500 في المواد: الرياضيات (4 وحدة) ، الفيزياء (2 ش) ، الكيمياء (2 ش) ، اللغة الإنجليزية (2 ش) ، والفرنسية (2 ش). كان أفضل موضوع لي هو الرياضيات (189/200) ، لذلك قررت أنني قد ألتزم أيضًا بما كنت جيدًا فيه وواصلت دراستي في الجامعة ، بعد عام من السفر في أوروبا ، بما في ذلك فترة قضاها كعامل طرق في فرنسا . لتوفير المال للرحلة ، قمت بعمل مكتبي في شركة تأمين في شمال سيدني ، والتي تركتها مقابل أجر أعلى كعامل نظافة في متاجر حكومة نيو ساوث ويلز (في الإسكندرية ، سيدني ، ولكن لحسن الحظ هدمت الآن).

كانت شهادتي الجامعية مع مرتبة الشرف الأولى في الرياضيات ، مع ميدالية الجامعة ، من جامعة نيوكاسل (أوست.). درست هناك من عام 1980 إلى 83. تم قضاء الإجازات الصيفية في القيام بأعمال الورديات في أعمال الصلب في بورت كيمبلا ، ونمذجة استهلاك المياه في مرفق مياه نيوكاسل ، والمساعدة في أبحاث الإحصاءات الصحية - في عوامل خطر الإصابة بأمراض القلب ، مع أنيت دوبسون وبوب جيبيرد. طور مشروع الشرف الخاص بي نموذجًا رياضيًا لتوسيع الأوعية الدموية الناجم عن الورم ، تحت إشراف شون ماكلوين. نشرنا بحثًا في JTB في عام 1985.

خلال عام 1984 ، شغلت العديد من المناصب التعليمية بدوام جزئي ومساعدي الأبحاث في نيوكاسل ، بعضها في وحدة إحصاءات الصحة في هنتر.

في كانون الثاني (يناير) 1985 ، غادرت إلى إنجلترا للدراسة للحصول على درجة الدكتوراه في الرياضيات من جامعة أكسفورد ، والتي منحتها لي في عام 1989. كان مشرفتي في البداية جون هامرسلي ولكن بعد بضعة أشهر انتقلت إلى بيتر كليفورد. رسالتي بعنوان "حول بعض أنظمة الجسيمات المهلكة" ، تضمنت عمليات عشوائية وكانت مدفوعة بمشاكل في الكيمياء الفيزيائية (بتوجيه من المتعاون نيك جرين). كانت كليتي هي ترينيتي ، حيث قمت أيضًا ببعض أعمال التدريس وكنت عميدًا مبتدئًا لمدة عامين.

خلال عامي 1988-89 ، عندما أنهيت درجة الدكتوراه ، كنت محاضرًا مبتدئًا في الإحصاء الرياضي في أكسفورد ، وكان أول تعيين في قسم الإحصاء الذي تم إنشاؤه حديثًا ، وكذلك محاضرًا في الرياضيات في الليدي مارغريت هول.

في أكتوبر 1989 ، بدأت أول منصب دائم لي كمحاضر في الاحتمالات والإحصاءات في كوين ماري وأمبير ويستفيلد كوليدج لندن ، وهو منصب مرتبط برئيس بيتر دونيلي الجديد. في عام 1995 تمت ترقيتي إلى محاضر أول ، وفي 1995-1996 أمضيت سنة إجازة في جامعة شيكاغو (4 أشهر انتقل بيتر دونيلي إلى هناك) ، وجامعة جنوب كاليفورنيا في لوس أنجلوس (شهران) وجامعة نيو ساوث ويلز في سيدني (6 أشهر).

في كانون الثاني (يناير) 1997 بدأت العمل كأستاذ لعلم الوراثة الإحصائية في قسم الإحصاء التطبيقي في ريدينغ ، وهو منصب أنشأه تقاعد روبرت كورنو مؤخرًا. تم منح منصب المحاضرة المتعلق بهذا المنصب إلى John Whittaker ، وتعاوننا على مدار العديد من السنوات اللاحقة.

في سبتمبر 2001 ، انتقلت أنا وجون إلى إمبريال كوليدج لندن ، في قسم علم الأوبئة والصحة العامة في حرم مستشفى سانت ماري ، بادينغتون. غادرت إمبريال للانتقال إلى UGI في سبتمبر 2009. وصل فينسينت بلاجنول إلى UGI في نفس الوقت لتلقي محاضرة.

منذ أن أنهيت درجة الدكتوراه ، عملت على تطوير وتطبيق الأساليب والأفكار الرياضية / الإحصائية / الحسابية في علم الوراثة. لقد ساهمت في جوانب من علم الوراثة السكانية والتطورية والطبية والشرعية.

في علم الوراثة الشرعي ، كانت مساهمتي الرئيسية هي تطوير طرق للسماح بتأثيرات الحشو في تفسير ملامح الحمض النووي. غالبًا ما تسمى صيغ احتمالية المطابقة التي تتضمن معاملات coancestry "صيغ Balding-Nichols" بعد بحثنا لعام 1994. في الآونة الأخيرة ، قمت بتطوير طرق لتفسير أدلة ملف تعريف الحمض النووي ذات القالب المنخفض ، في البداية بالتعاون مع John Buckleton من ESR New Zealand (ورقة 2009).

تعتمد صيغ المطابقة الجنائية على التوزيع متعدد الحدود - Dirichlet ، الذي طورته وطبقته على تعداد أليل السكان. أدى ذلك إلى أول تعريف مرضٍ لمعامل coancestry (F ، أو ثيتا) ، ونهج قائم على الاحتمالية لتقديره. بتضمين هذا التوزيع في نموذج هرمي يسمح بالتجمعات السكانية الفرعية وتأثيرات الموقع ، طور مارك بومونت وأنا في بحثنا لعام 2004 نهجًا واسع الاستخدام لاكتشاف المواقع الخاضعة للاختيار (يتضح من الاختلاف المرتفع أو المنخفض بشكل غير عادي عبر المجموعات السكانية الفرعية). تسمى أحيانًا ذات الحدين بيتا (أو بشكل عام متعدد الحدود - Dirichlet) كتوزيع لمحاكاة ترددات أليل التجمعات السكانية الفرعية "نموذج Balding-Nichols" بعد بحثنا في عام 1995.

كتب أنا ومارك ، مع Wenyang Zhang ، في عام 2002 ورقة تأسيسية في مجال الحساب التقريبي البايزي (ABC). قدمنا ​​تعديل الانحدار الخطي المحلي الذي ثبت أنه مفيد للغاية ، ولكن ربما بنفس القدر من الأهمية قدمنا ​​أول مراجعة مفيدة للطريقة ، والتي تم تطويرها على مراحل من قبل مؤلفين سابقين ، وقمنا بالترويج لها باعتبارها تقنية إحصائية قوية ومرنة.

مع إيان ويلسون ، قمت بتطوير أحد البرامج الناجحة الأولى (Batwing) لنمذجة التاريخ الديموغرافي للسكان بناءً على نمذجة صريحة للأصول الجينية للأفراد الذين تم أخذ عينات منهم من السكان (أوراق 1998 و 2003). لقد تم استخدامه على نطاق واسع ، لا سيما لنمذجة الأنساب الأبوية من بيانات كروموسوم Y.

لقد كتبت أو شاركت في تأليف عدد من أوراق المراجعة التي أثبتت شعبيتها ، حول الأساليب الإحصائية لدراسات الارتباط الجيني (2006) ، وطرق بايزي وبنية السكان والارتباط الخفي في الارتباط الجيني (كلاهما 2009) والجينوم دراسات جينية واسعة (2011). قام Will Astle ، بالعمل معي ، بتطوير خوارزمية سريعة لتحليل النماذج المختلطة لدراسات الارتباط الجيني ، الموضحة في مراجعتنا لعام 2009 والمتاحة في قسم MixAbel في برنامج GenAbel R.

أواصل حاليًا نمطي الراسخ لتطبيقات واسعة النطاق جدًا للإحصاء في علم الوراثة. أنا مشترك في مشاريع حول الأساليب الإحصائية لعلم الوراثة الدوائية ، بما في ذلك المتغيرات المشتركة الجينية في نماذج الحرائك الدوائية ، وتسلسل المتغيرات النادرة في حالات القلب الموروثة ، والاختيار الجيني في المحاصيل وتحديد السلالات في الكلاب المختلطة. كما أنني ما زلت نشطًا في الأساليب الإحصائية لمحات الحمض النووي للطب الشرعي.

أنا منظم وحدة لـ GENEG005 Statistics for Interpreting Data (أو "علم الوراثة الإحصائي" باختصار) والتي تم تطويرها لدرجة الماجستير في علم الوراثة البشرية للأمراض ، ويتم أخذها الآن أيضًا من قبل طلاب ماجستير علم الوراثة الصيدلانية وماجستير العلوم الإحصائية (اختياري لـ كل الطلاب). تتمثل إحدى ميزات هذه الدورة التدريبية في مقدار الوقت الكبير الذي يقضيه في فصول معمل الكمبيوتر ، وهو ضروري لأن العديد من الطلاب لديهم خبرة قليلة أو معدومة في الحوسبة العلمية ، وليس لديهم خبرة سابقة في R ، البرنامج الرئيسي المستخدم. في المقابل ، يشكل العمل العملي المقدر 50٪ من علامات الدورة. التدريس مشترك مع فينسينت بلاجنول.

أساهم بربع التدريس في 8 أيام من الدورات القصيرة التي يديرها مركز بلومزبري للوبائيات والإحصاءات الجينية ، والتي تُعقد كل سبتمبر: http://bcges.lshtm.ac.uk/courses/

سأساهم أيضًا في التدريس في وحدة جديدة بعنوان "تفسير الأدلة" لدرجة الماجستير الجديدة في علم الجريمة والطب الشرعي ، ومقرها في مركز UCL لعلوم الطب الشرعي ، وأنا عضو في اللجنة التوجيهية.


حجم 2: تطور واختيار الصفات الكمية

  • الانجراف الجيني ، بما في ذلك التغيرات في الفروق غير المضافة
  • نظرية الانتقاء: التغيرات في الوسائل والتباينات ، الاستجابة قصيرة وطويلة المدى ، تأثيرات حجم السكان المحدود ، اختيار المؤشر.
  • قياس الانتقاء في التجمعات الطبيعية
  • نماذج التطور المظهرية: تطبيقات على علم البيئة ، علم الأحياء القديمة ، تطور ماركو ، الانتقاء الجنسي
  • الحفاظ على التباين الجيني الكمي

علم الوراثة الإحصائي: ترددات الأليل التي تتبع توزيع ديريتشليت - علم الأحياء

التطور: المجلد. 59 ، رقم 11 ، ص 2312 & # 1502323.

توقيع الاختيار الإيجابي على التباين الجيني الدائم

مولي برزورسكي ، أ ، ب جراهام كوب ، أ وجيفري دي وول ج

قسم علم الوراثة البشرية ، جامعة شيكاغو ، شيكاغو ، إلينوي 60637

ج قسم البيولوجيا الحاسوبية والجزيئية ، جامعة جنوب كاليفورنيا ، 1050 تشايلدز واي ، لوس أنجلوس ، كاليفورنيا 90089

الملخص. & # 151 يتركز الاهتمام الكبير على استخدام بيانات تعدد الأشكال لتحديد مناطق الجينوم التي تكمن وراء عمليات التكيف الحديثة. تسترشد عمليات البحث هذه بنموذج بسيط للاختيار الإيجابي ، حيث يتم تفضيل الطفرة بمجرد ظهورها. قد لا يكون هذا الافتراض واقعيًا ، لأن التغييرات البيئية وتوسعات النطاق قد تؤدي في السابق إلى أن تصبح الأليلات المحايدة أو الضارة في السابق مفيدة. ندرس تأثير وضع الاختيار هذا على أنماط التباين في المواقع المحايدة المرتبطة من خلال تنفيذ نموذج متحد جديد للاختيار الاتجاهي الإيجابي على التباين الدائم. في هذا النموذج ، ينشأ أليل محايد وينحرف في المجتمع ، ثم عند التردد f يصبح مفيدًا ، ويصل في النهاية إلى التثبيت. اعتمادًا على قيمة f ، يمكن أن يؤدي هذا السيناريو إلى تباين كبير في أطياف تردد الأليل وفي مستويات عدم توازن الارتباط في المواقع المرتبطة والمحايدة. على وجه الخصوص ، بالنسبة إلى الوسيطة f ، غالبًا ما يؤدي الاستبدال المفيد إلى فقدان الأليلات النادرة ونمط # 8212a الذي يختلف بشكل ملحوظ عن توقيع الاختيار الاتجاهي الذي يعتمد عليه الباحثون حاليًا. تسلط هذه النتائج الضوء على أهمية التوصيف الدقيق لتأثيرات الاختيار الإيجابي ، إذا أردنا تحديد التعديلات الحديثة بشكل موثوق من بيانات تعدد الأشكال.

تم الاستلام في 17 مايو 2005. تم القبول في 6 سبتمبر 2005.

الهدف الرئيسي لعلم الوراثة التطوري هو تحديد المواقع التي تكمن وراء التكيفات. في بعض الحالات ، تمت مواجهة هذا التحدي من خلال مناهج رسم الخرائط الكلاسيكية ، والتي سهلت الآن توافر الأدوات الجينومية (على سبيل المثال ، Colosimo وآخرون ، 2005). يتمثل أحد البدائل ذات الأهمية الخاصة للبشر والكائنات غير النموذجية في تحليل التباين الجيني داخل الأنواع وفيما بينها ، بهدف تحديد المناطق الجينومية التي يبدو أنها تطورت في ظل الانتقاء الطبيعي بدلاً من الانجراف وحده. على سبيل المثال ، هناك فئة شائعة من الأساليب تتناقض مع تعدد الأشكال والتباعد في المواقع المترادفة وغير المجهولة للكشف عن التطور غير المحايد لتسلسلات الأحماض الأمينية (على سبيل المثال ، Yang and Bielawski 2000 Nielsen et al.2005).نجح هذا النهج في تحديد العديد من البروتينات التي يبدو أنها تتطور في ظل الانتقاء الإيجابي المتكرر (راجع Swanson 2003) ، لكنها تفتقر إلى القدرة على اكتشاف التكيفات التي تتكون من عدد قليل من البدائل لبروتين معين. ولا ، في شكله الحالي ، ينطبق على المناطق غير المشفرة.

يمكن اكتشاف بديل مفيد واحد في بيانات تعدد الأشكال ، طالما أنه حدث مؤخرًا. يؤدي تثبيت أليل مواتٍ في مجتمع ما إلى تشويه أنماط التباين في المواقع المرتبطة ، مما يترك توقيعًا مميزًا يستمر حتى حوالي 10 4 أجيال في البشر أو حوالي 10 6 في Drosophila melanogaster (Przeworski 2002). من حيث المبدأ ، يمكن تحديد أهداف الاختيار الإيجابي من خلال البحث عن بيانات تعدد الأشكال للمناطق التي تؤوي هذا التوقيع (Nair et al. 2003 Wright et al. 2005).

طبقت العديد من الأوراق البحثية الحديثة نهج رسم خرائط الرحلات على البشر وأنواع ذبابة الفاكهة (على سبيل المثال ، Harr et al. 2002 Payseur et al. 2002 Glinka et al. 2003 Kauer et al. 2003 Kayser et al. 2003 Akey et al. 2004 Schofl و Schlotterer 2004 Storz وآخرون 2004). يشترك البشر الحديثون الأوائل ، D. melanogaster ، و D. simulans في نفس التاريخ الديموغرافي: لديهم أصل أفريقي ويعتقد أنهم أصبحوا عالميًا مؤخرًا (راجع Aquadro وآخرون 2001). قد يكون هذا التوسع من نطاق أسلافهم مصحوبًا بتكيفات مع المناخات والأنظمة الغذائية والأمراض الجديدة. الدافع وراء هذه الأوراق الأخيرة هو البحث عن توقيعات التكيف في السكان غير الأفارقة الذين لا بد أنهم عانوا من تغيير موطنهم مؤخرًا.

على الرغم من أن هذا النهج واعد ، إلا أنه لن يكون موثوقًا إلا إذا تم تمييز توقيع الانتقاء الطبيعي بدقة. في الوقت الحالي ، ينبع فهمنا لتأثيرات الاختيار الإيجابي الاتجاهي من النموذج البسيط لمجتمع التزاوج العشوائي ذي الحجم الثابت ، والذي يكون فيه الأليل مفيدًا بمجرد ظهوره ويتم دفعه سريعًا إلى التثبيت في المجتمع (يشار إليه فيما بعد كمسح انتقائي قياسي & # 8220 & # 8221). في ظل هذه الافتراضات ، يؤدي استبدال الأليل المفضل في موقع واحد إلى تقليل التباين والانحراف نحو المتغيرات النادرة والمشتقة عالية التردد في المواقع المحايدة المرتبطة (Maynard Smith and Haigh 1974 Simonsen et al. 1995 Fay and Wu 2000 كيم وستيفان 2002 برزيورسكي 2002). هذا التأثير المشوه هو البصمة المطلوبة في رسم خرائط التنزه.

ومع ذلك ، ما إذا كان توصيف الاختيار الإيجابي موثوقًا ، يظل سؤالًا مفتوحًا. في هذا الصدد ، من المقلق أنه في إحدى الحالات النادرة ذات الأدلة المستقلة لإجراء مسح انتقائي حديث ، لم يتم ملاحظة التوقيع المتوقع (Hamblin and Di Rienzo 2000). في موضع دافي عند البشر ، من المعروف أن تماثل الزيجوت للأليل الفارغ يمنح مقاومة لمرض الملاريا النشيطة. هذا الأليل الفارغ ثابت أو قريب من التثبيت في سكان إفريقيا جنوب الصحراء وغائبًا فعليًا في أي مكان آخر. ومع ذلك ، في أربعة من أصل خمسة أعراق أفريقية جنوب الصحراء التي تم مسحها من أجل التباين ، فإن ترددات الأليل في المواقع المرتبطة لا تحتوي على نسبة عالية من الأليلات النادرة ، كما أن التنوع لا ينخفض ​​دائمًا بشكل حاد (هامبلين ودي رينزو 2000 هامبلين وآخرون .2002). كما اقترح المؤلفون ، قد يكون هذا بسبب الخروج عن الافتراضات الديموغرافية. على سبيل المثال ، من المعروف أن تثبيت أليل مفيد في مجتمع منظم يؤدي إلى توقيع مميز عن ذلك المتوقع بموجب نموذج المسح القياسي (Slatkin and Wiehe 1998 Santiago and Caballero 2005).

الاحتمال الثاني هو أنه ، على عكس ما هو مفترض في النموذج القياسي ، لا يعمل الاختيار دائمًا على أليل جديد. يتم تقديم مثال صارخ من قبل ثلاث شوكات شوكية انتقلت من البيئات البحرية لاستعمار بحيرات المياه العذبة والجداول في العشرين ألف سنة الماضية. تظهر هذه المجموعات المعزولة انخفاضًا متوازيًا في لوحات الدروع الواقية للبدن ، وهي تعديلات يبدو أنها قد تم إنجازها من خلال التغييرات في نفس الموقع الرئيسي ، EDA (Colosimo et al. 2005). علاوة على ذلك ، تم العثور على الأليل المرتبط بالنمط الظاهري التكيفي بتردد 0.2 & # 037 و 3.8 & # 037 في مجموعتين بحريتين. وبالتالي ، يبدو أن الاختيار الاتجاهي للطلاء المنخفض قد عمل على تباين قائم موجود بتردد غير مهم في بيئة الأجداد (Colosimo et al. 2005). قد تكمن مجموعة مماثلة من الظروف وراء التردد العالي لتحمل اللاكتوز في تجمعات رعوية متفرقة من البشر (Bersaglieri et al.2004).

قد يكون مثل هذا السيناريو معقولاً بالنسبة لدافي ، حيث يُعتقد أن ظهور الزراعة (قبل 10000 عام) قد أدى إلى زيادة ضغوط الملاريا بشكل كبير (هامبلين ودي رينزو 2000). في الواقع ، قد ينطبق على العديد من التعديلات التي تحفز نهج رسم الخرائط. على سبيل المثال ، يُعتقد أن البشر المعاصرين الأوائل قد غادروا القارة الأفريقية منذ 100000 عام ، أو منذ حوالي 4000 جيل ، ووصلوا إلى أستراليا قبل حوالي 50000 عام والأمريكتين فقط في العشرين ألف عام الماضية (راجع Lewin and Foley 2004) . نظرًا لحجم التعداد السكاني الصغير ، فقد يكون هناك القليل من الوقت لظهور طفرات مفيدة جديدة. وبدلاً من ذلك ، قد تكون الاستجابات للضغوط الانتقائية الجديدة قد حدثت عن طريق الانتقاء على تعدد الأشكال الموجود.

إذا كان الأمر كذلك ، يصبح من المهم فحص ما إذا كان الاختيار على التباين الدائم يترك أثرًا مشابهًا لما يتركه المسح القياسي ، وإلا فقد نفشل في التعرف على العديد من المناطق الجينومية ذات الأهمية. للتنبؤ ببصمة الانتقاء على التباين الدائم ، نحتاج أولاً إلى معرفة عدد الطفرات المستقلة التي من المحتمل أن تكمن وراء تكيف معين (Hermisson and Pennings 2005). بافتراض وجود نموذج ديموغرافي بسيط ، فئتان فقط من فئتي اللياقة عند هدف الاختيار (المفضل وغير المفضل) ، ولا يوجد تداخل بين الأليلات المفضلة ، خلص Hermisson and Pennings (2005) إلى أن أصلًا واحدًا للأليل المفضل يكون أكثر احتمالًا طالما أن الاختيار قوي و 4 N 0.1 ، حيث N هو حجم السكان الفعال ثنائي الصبغة وهو معدل الطفرة لكل جيل بالنسبة للفئة المفضلة. في البشر ، يُعتقد أن معدل الطفرة السكانية ، 4 N & mu (حيث & mu هو معدل الطفرة المحايدة لكل جيل) ، حوالي 0.001 لكل زوج أساسي (Li and Sadler 1991 Przeworski et al.200) ، لذا فإن هذه الحالة تعادل الافتراض بأن الطفرات عند أقل من 100 نقطة أساس تؤدي إلى النوع المفضل. في D. melanogaster ، يقدر 4 N & mu بحوالي 0.01 لكل زوج أساسي (على سبيل المثال ، Moriyama and Powell 1996) ، وهو ما يتوافق مع شرط أن تكون الطفرات أقل من 10 نقاط أساس مفيدة. وهكذا ، بالنسبة لكلا النوعين ، فإن افتراض أصل واحد للأليل المفضل يبدو معقولًا.

في هذه الحالة ، يعتمد توقيع الانتقاء على التباين المحايد المرتبط بشكل حاسم على التردد ، f ، حيث يفضل أولاً الأليل الذي يصل في النهاية إلى التثبيت. إذا كان f & lt 1 / (2 Ns) والاختيار قويًا (حيث s هو معامل الاختيار للأليل المفضل) ، فإن تأثير الاستبدال المناسب سيكون كثيرًا كما هو متوقع في ظل نموذج المسح القياسي (Stephan et al. 1992). وهكذا ، طالما أن الانتقاء الطبيعي يعمل على أليل جديد أو نادر ، فإن المواقع المترابطة والمحايدة ستميل إلى إيواء فائض من الأليلات النادرة والتنوع المنخفض. تساعد هذه النتيجة أيضًا على فهم النموذج الذي يكون فيه الأليل ضارًا في الأصل ، ثم يُفضل. إذا كان اختيار التنقية قويًا بما يكفي للحفاظ على المتغير عند تردد منخفض جدًا في بيئة الأجداد ، فستشبه التنبؤات مرة أخرى تلك الخاصة بالمسح الانتقائي القياسي (Orr and Betancourt 2001). على وجه الخصوص ، إذا تسبب التحول البيئي في تغيير معامل الاختيار علامته ، ولكن ليس قيمته المطلقة ، فستكون التنبؤات متطابقة (Hermisson and Pennings 2005).

إذا كان الأليل في البداية ضارًا أو محايدًا بشكل ضعيف جدًا ، فقد لا يكون التردد f منخفضًا جدًا ، وهذا هو الحال أيضًا إذا تم إحضار الأليل عن طريق تدفق الجينات من بيئة لم يكن فيها ضارًا (Roper et al. 2004 كولوسيمو وآخرون 2005). في الحالات التي يكون فيها f ملموسًا ، قد لا يشبه توقيع الاختيار توقيع المسح القياسي. درس إينان وكيم (2004) هذه المشكلة في سياق تدجين النبات. لتقليد عملية الانتقاء الاصطناعي التي فرضها المزارعون الأوائل ، اعتبروا عنق الزجاجة السكاني الأخير (منذ 7500 جيل) متبوعًا بنمو سكاني يبلغ 20 إلى 100 ضعف. لقد قاموا بنمذجة اختيار قوي للغاية ، يحدث في بداية عنق الزجاجة ، ويعمل على أليل واحد كان محايدًا في السابق. باستخدام الاختبارات القياسية للحياد على أساس مستويات التنوع وترددات الأليل ، وجدوا أن قيم f الأكبر تؤدي إلى انخفاض القدرة على اكتشاف تثبيت أليل مفيد في بيانات تعدد الأشكال.

نعيد النظر في هذا السؤال للمعلمات المطبقة على الانتقاء الطبيعي. للقيام بذلك ، ننفذ نموذجًا متحدًا جديدًا للاختيار الاتجاهي على التباين الدائم ونميز كل من ترددات الأليل وأنماط عدم توازن الارتباط في المواقع المحايدة المرتبطة. مثل إينان وكيم (2004) ، نفترض أن الأليل المفضل له أصل فريد.

نأخذ في الاعتبار السيناريو التالي: في الوقت t m ، ينشأ الأليل A المحايد عن طريق الطفرة والانحراف في السكان حتى الوقت t s ، عندما يصبح مفيدًا بسبب التغيير في البيئة. يصلح Allele A في النهاية في الوقت T ، وعند هذه النقطة تحمل جميع الكروموسومات الأليل المفضل. يكون الاختيار جينيًا ، وفي البيئة الجديدة يكون لـ A معامل اختيار s. يُشار إلى تردد A في الوقت t s بالرمز f.

لدراسة تأثير استبدال الأليل A على أنماط التباين ، نقوم بنمذجة تاريخ الأنساب لعينة من منطقة مترابطة ومتطورة بشكل محايد. للقيام بذلك ، نفترض أن السكان يتزاوجون بشكل عشوائي ويكون ذو حجم ثابت N مزدوج. نفترض أيضًا أن الأليل A كان حدث الطفرة الوحيد في ذلك الموقع (في تاريخ الأنساب للمنطقة المحايدة). تنشأ الطفرات في المنطقة المحايدة وفقًا لنموذج المواقع اللانهائية. يتم نمذجة إعادة التركيب على أنها عبور بدون تحويل جيني وتحدث بمعدل ثابت r لكل زوج أساسي.

بالعودة بالزمن إلى الوراء (أي 0 & lt T & lt t & lt t m) ، هناك ثلاث مراحل. قبل ظهور الأليل A (t & gt t m) أو بعد A ثابت (t & lt T) ، يوجد أليل واحد فقط ، a ، في الموقع. لذلك يمكن وصف التاريخ من خلال التوحيد القياسي المحايد (راجع Hudson 1990). في المرحلتين الأخريين ، هناك أليلين: عندما يكون t & lt t & lt t m ، a و A متكافئان بشكل انتقائي ، بينما بالنسبة لـ T & lt t & lt t s ، فهي ليست كذلك. خلال هذه المراحل ، يمكن اعتبار أن سلالات الأسلاف للعينة من المنطقة المحايدة تتطور في مجتمع منظم ، حيث تحدد الفئات الأليلية (أ و أ) المجموعات السكانية الفرعية وإعادة التركيب بين سلالات الأسلاف لكل فئة بمثابة هجرة (هدسون و كابلان 1988 بارتون 1998 نوردبورغ 2001).

باستخدام هذا التشبيه للالتحام المنظم ، يمكننا محاكاة تاريخ الأنساب لعينة من المنطقة المتطورة بشكل محايد عن طريق توليد تردد الأليل المحدد عبر الزمن (يشار إليه فيما بعد بـ & # 8220 المسار & # 8221) ، ثم إنشاء رسم بياني لإعادة التركيب السلفي مشروط بـ هذا المسار (انظر الشكل 1). كان هذا النهج العام هو الرائد من قبل كابلان وآخرون. (1989) ومنذ ذلك الحين تم استخدامه في دراسات أخرى (على سبيل المثال ، Przeworski 2002 Ray et al. 2003 Coop and Griffiths 2004 Innan and Kim 2004).

نقوم بتنفيذ النهج عن طريق تعديل البرنامج المترابط الموضح في Przeworski (2002). التغيير الوحيد يتعلق بمسار الأليل أ. في Przeworski (2002) ، يفضل الأليل A من المقدمة إلى التثبيت ويستخدم التقريب القطعي لنمذجة المسار. هنا ، يكون A محايدًا في البداية ، ثم مفيدًا ، ويتم تصميم مسار A بشكل عشوائي (كما هو موضح أدناه). وهكذا ، بينما نقدم النتائج لوقت ثابت من التثبيت ، T ، فإن الأوقات t m و t s عشوائية وبالتالي ستختلف من تشغيل إلى آخر.

قمنا بفحص البرنامج بالخطأ عن طريق كتابة كود مستقل (يستخدم تقريب الولادة والوفاة لعملية الانتشار) ومقارنة النتائج. يتم تنفيذ هذا الأخير كإصدار من برنامج SELSIM (Spencer and Coop 2004) وهو متاح على pritch.bsd.uchicago.edu/software.html.

محاكاة مسار الأليل

يمكن نمذجة تكرار الأليل A في المجتمع من خلال عملية الانتشار X (t) على (0،1) ، مع المولد حيث & sigma 2 (x) & # 061 x (1 & minus x) هو التباين اللامتناهي و & mu (خ) المتوسط ​​المتناهي الصغر لعملية الانتشار (راجع Ewens 2004). في نموذجنا ، هناك عمليتا انتشار: واحدة محايدة ، X N (t) ، وعملية محددة ، X S (t). هذه لها متوسطات متناهية الصغر & mu N (x) & # 061 0 و & mu S (x) & # 061 2 Nsx (1 & ناقص x) ، على التوالي.

نحن نعتبر هذه العمليات مشروطة بوصولها إلى إحدى حالتين ممتعتين: صفر (أي خسارة A من السكان) وواحدة (أي التثبيت). عملية الانتشار الشرطي لها نفس وسيغما 2 (x) مثل الانتشار المعتاد ، لكن المتوسط ​​المتناهي الصغر يتضمن مصطلحًا إضافيًا ، والذي يعطي بشكل فعال الدفع المناسب نحو الحدود التي شرطنا عليها.

يعتمد نهجنا أيضًا على انعكاس عملية الانتشار (راجع Griffiths 2003). على وجه التحديد ، نستخدم حقيقة أن عملية الانتشار التي تنظر إلى الوراء في الوقت الحاضر من الحاضر (أي نحو إدخال الأليل) لها نفس التوزيع مثل العملية إلى الأمام في الوقت المناسب بشرط الامتصاص عند الصفر. هذه العملية الشرطية X N & # 042 (t) هي نفسها X N (t) ولكن مع استبدال & mu N (x) بـ & mu N & # 042 (x) & # 061 & minus x (Ewens 2004). وبالمثل ، نظرًا لأننا مهتمون فقط بالأليلات المفيدة التي تصل في النهاية إلى التثبيت ، فإننا نعتبر أن عملية الانتشار مشروطة بأن يصل الأليل المحدد إلى تردد واحد. هذه العملية الشرطية X S & # 043 (t) لها متوسط ​​متناهي الصغر & mu S & # 043 (x) & # 061 2 Nsx (1 & minus x) / tanh (2 Nsx) (Ewens 2004).

لإنشاء مسار للأليل A ، نستخدم مسارًا عشوائيًا للقفز متغير الحجم لتقريب عملية الانتشار. بالنظر إلى التردد الحالي x ، عند الفواصل الزمنية & Delta t ، يقفز التردد x إلى أيٍّ من: باحتمالية متساوية. يتم استبدال المصطلح & mu (x) بالمتوسط ​​المتناهي الصغر الشرطي للمرحلة المعنية (أي محايد أو انتقائي). هذه العملية لها حد الانتشار الصحيح ، أي ، يتم الحصول على المتوسط ​​المتناهي الصغر الصحيح والتباين وكل اللحظات الأعلى هي صفر ، مثل الفاصل الزمني & Delta t 0 (Karlin and Taylor 1981). ومن ثم ، بالنسبة لـ Small & Delta t ، فإنه يوفر تقريبًا جيدًا لعملية الانتشار. لقد تحققنا من ذلك من أجل اختيارنا لـ & Delta t & # 061 1 / (4 N) بالمقارنة مع التوقعات التحليلية والطرق البديلة للمحاكاة (النتائج غير معروضة).

هناك خطوتان في تنفيذنا: (1) محاكاة مسار أليل محايد من التردد f إلى الخسارة ، مع & mu (x) & # 061 & mu N & # 042 (x) في القفزات الموضحة أعلاه بواسطة خاصية الانعكاس الموصوف أعلاه ، يمكننا قلب هذا المسار لنمذجة الأليل A من المقدمة إلى التردد f و (2) محاكاة مسار الأليل المحدد من f إلى التثبيت ، باستخدام & mu (x) & # 061 & mu S & # 043 (x ) في القفزات. ثم نقوم بتسلسل نتائج (1) و (2) للحصول على مسار واحد من المقدمة إلى التثبيت.

يضمن نهجنا أن يتم اختيار A مبدئيًا عند التردد f ، دون افتراض أن A قد تم اختياره عندما يصل لأول مرة إلى التردد f (وهو أمر غير واقعي). علاوة على ذلك ، فهي فعالة من الناحية الحسابية ، لأننا نولد فقط المسارات التي يصلح فيها A في النهاية في المجتمع.

نحن مهتمون بمقارنة نموذجين: المسح الانتقائي القياسي ، والذي يُفضل فيه الأليل من المقدمة إلى التثبيت ، ونموذج التحديد الاتجاهي للتغير القائم. بالنسبة للأخير ، نأخذ في الاعتبار السيناريو التالي: ينشأ الأليل A المحايد وينحرف في المجتمع حتى الوقت t s ، عندما يصبح مفضلًا ، يصل في النهاية إلى التثبيت في المجتمع في الوقت T (انظر الطرق للحصول على التفاصيل). تردد الأليل A في الوقت t s ، f ، هو المعلمة البارزة في المقارنة.

لتوصيف تأثيرات هذين النموذجين على التباين الجيني ، نقوم بمحاكاة عينات من منطقة مرتبطة ومتطورة بشكل محايد باستخدام نهج مترابط منظم. على وجه التحديد ، نقوم بإنشاء مسار الأليل A من المقدمة إلى التثبيت ، ثم شرط على هذا الإدراك المعين لعملية الأنساب لإنشاء رسم بياني لإعادة التركيب السلفي لعينةنا (الشكل 1). تم تصميم مسار الأليل A بطريقة عشوائية ، باستخدام نهج جديد (انظر الطرق). تحت نموذج المسح القياسي ، f & # 061 1 / (2 N) ، بينما في ظل نموذج التحديد الاتجاهي للتغير القائم ، f 1 / (2 N).

تأثير f على مستويات التنوع

بغض النظر عن قيمة f ، فإن متوسط ​​مستويات التنوع يكون أكثر تشوهًا بالقرب من الموقع المحدد وتميل نحو توقعها المحايد مع زيادة المسافة الجينية. وهذا موضح في الشكل 2 أ ، باستخدام المعلمات التي قد تكون قابلة للتطبيق على البشر (على سبيل المثال ، Frisse وآخرون ، 2001). نقدم ثلاثة ملخصات للتنوع: & ثيتا دبليو (واترسون 1975) ، ثيتا إتش (فاي ووو 2000) ، & بي (تاجيما 1989). في ظل نموذج توازن محايد ، توفر هذه الإحصائيات تقديرًا غير متحيز لـ & ثيتا ، معدل طفرة السكان (& # 061 4 N & mu ، حيث & mu هو معدل الطفرة لكل جيل لكل زوج أساسي). بالنسبة لهذه المعلمات ، يؤدي المسح القياسي إلى انخفاض في متوسط ​​مستويات التباين في جميع أنحاء منطقة 100 كيلو بايت (بالنسبة إلى التوقعات المحايدة لـ & theta & # 061 0.001 لكل زوج أساسي).

من المتوقع وجود صورة مشابهة جدًا طالما أن f & lt 1 / (2 Ns) والاختيار قوي (Stephan et al. 1992). على سبيل المثال ، في الشكل 2 أ ، لا يمكن تمييز المستويات المتوقعة للتباين لـ f & # 061 1 / (2 N) & # 061 5 & times 10 & minus5 and f & # 061 1 / (2 Ns) & # 061 10 & minus3. مع زيادة f ، يكون لاستبدال الأليل المفضل تأثير أضعف على التنوع في المواقع المحايدة المرتبطة (Innan and Kim 2004) لـ f & # 061 0.20 ، يصعب اكتشاف التأثير. إذا كان حجم المجتمع الفعال ، N ، أكبر ، فإن الفرق بين المسح القياسي ونموذج الاختيار الاتجاهي على التباين الدائم يكون أكثر وضوحًا. على سبيل المثال ، باستخدام المعلمات التي قد تكون واقعية لـ D. melanogaster (على سبيل المثال ، Andolfatto و Przeworski 2000) ، يؤدي النموذج الذي يحتوي على f & # 061 0.05 إلى انخفاض طفيف جدًا في مستويات التنوع بالنسبة للتوقع عند التوازن المحايد (انظر الشكل. 2 ب).

تأثير f على ترددات أليل

قد تشير هذه النتيجة إلى أن التحديد الاتجاهي على التباين الدائم يتصرف مثل المسح القياسي ، ولكن بصمة أضعف. تبين أن هذا غير صحيح. الشكل 3 قطع الأرض و pi و & ثيتا W كدالة للمسافة من الموقع المحدد لأربع مجموعات بيانات تمت محاكاتها تم إنشاؤها وفقًا لنماذج التحديد الاتجاهي حيث f & # 061 0.05 وحيث f & # 061 1 / (2 N) ، وكذلك تحت التوازن المحايد.كما يمكن رؤيته ، تشبه بعض حالات الاختيار على التباين الدائم عملية مسح قياسية ذات بصمة أضعف (مثال 3) تبدو حالات أخرى مثل حالة التوازن المحايد ، مع وجود تنوع عالٍ قريب جدًا من الموقع المحدد (المثال 4) ومع ذلك تبدو حالات أخرى مختلفة إما المسح القياسي أو الحياد ، مع أودية منخفضة التنوع في بعض القطاعات ومستويات توازن محايدة في أخرى (الأمثلة 1 ، 2).

علاوة على ذلك ، في حين أن تثبيت طفرة مفيدة جديدة له تأثير أكبر على & pi من & theta W في جميع الأمثلة الأربعة ، فإن هذا ليس هو الحال عند f & # 061 0.05. نوضح هذا الاختلاف بين نموذجي الاختيار بمزيد من التفصيل من خلال تقديم خمسة أمثلة تم إنشاؤها عشوائيًا لترددات الأليل في منطقة محايدة مرتبطة (الشكل 4). بالقرب من الموقع المحدد ، يميل المسح المعياري إلى إنتاج فائض من الأليلات النادرة وعالية التردد نسبة إلى نموذج التوازن المحايد (على سبيل المثال ، Maynard Smith and Haigh 1974 Kaplan et al. 1989 Simonsen et al. 1995 Fay and Wu 2000) . كما هو موضح في المثالين 2 و 5 ، يحدث هذا أيضًا تحت نموذج حيث f 1 / (2 N). ما يميز نموذج الانتقاء الاتجاهي للتغير الدائم عن نموذج المسح المعياري هو العدد الملحوظ للحالات التي يوجد فيها فائض نسبي من أليلات التردد المتوسط ​​(المثالان 1 و 4 في الشكل 4). يشير هذا إلى أنه بالنسبة للقيم الوسيطة لـ f ، يؤدي اختيار الاتجاه إلى تباين أكبر بكثير في أطياف التردد مما هو متوقع في نموذج المسح القياسي.

لتقدير هذه الملاحظة ، نقدر التباين والفاصل الزمني الاحتمالي المركزي 95 & # 037 لـ Tajima & # 039s D (Tajima 1989) ، وهو ملخص شائع الاستخدام لطيف تردد الأليل المطوي استنادًا إلى الفرق الطبيعي (تقريبًا) بين & pi و & ثيتا W ( الجدول 1 ). في ظل نموذج التوازن المحايد ، يكون متوسط ​​هذه الإحصائية تقريبًا صفراً ، بينما تعكس القيمة السالبة (الموجبة) زيادة في الأليلات النادرة (ذات التردد المتوسط). نفكر أولاً في الحالة التي وصل فيها الأليل المفيد إلى التثبيت. كما هو متوقع ، يؤدي المسح الانتقائي القياسي إلى انخفاض حاد في قيم D. في المقابل ، بالنسبة لـ f & # 061 0.05 ، يتم تقليل المتوسط ​​بشكل طفيف فقط من الصفر ، ولكن كلا طرفي توزيع D يزدادان بشكل كبير (الجدول 1). إذا كان الوقت منذ التثبيت هو 2000 جيل ، أو ما يقرب من 50000 سنة في البشر ، فإن كلا النموذجين يؤديان إلى قيم D سلبية أكثر. ومع ذلك ، يظل التباين في النتائج أكبر بكثير في ظل نموذج اختيار الاتجاه على التباين الدائم ، ولا تزال النسبة المئوية 95 تشتمل على قيم إيجابية حادة (الجدول 1).

لوحظ نفس السلوك النوعي لنموذج تدجين النبات ، والذي يحدث فيه الاختيار خلال عنق الزجاجة الأخير (Innan and Kim 2004). اعتبر المؤلفون القدرة على رفض نموذج فارغ محايد باستخدام ملخصين من طيف تردد الأليل ، Tajima & # 039s D وإحصائية مشابهة لـ Fay و Wu & # 039s H (Fay and Wu 2000) ، كإحصاءات اختبار. لاحظوا أن & # 8220 الاختبارين يعملان تجاه كلا الطرفين لأن الاختيار يجعل أنماط تعدد الأشكال متغيرة & # 8221 (Innan and Kim 2004 ، ص .10670). تشير نتائجهم ونتائجنا معًا إلى أن التباين المتزايد في أطياف التردد هو سمة عامة لاختيار الاتجاه على التباين الدائم.

يمكن فهم هذه النتيجة في إطار متماسك. في ظل نموذج المسح الانتقائي القياسي وفي حالة عدم وجود إعادة التركيب بين المواقع المختارة والمحايدة ، فإن الأنساب لعينة من المنطقة المحايدة سيكون على شكل نجمة وينعكس في البيانات بنسبة عالية من الأليلات النادرة. إذا حدث مستوى منخفض من إعادة التركيب ، فسيميل إلى أن يكون عندما يكون الأليل A بتردد متوسط ​​في المجتمع ، قبل حدوث العديد من أحداث الالتحام. سيكون علم الأنساب الناتج غير متوازن ، مع وجود فرع خارجي طويل واحد أو عدد قليل من الفروع الخارجية ، بحيث تحتوي العينة على نسبة عالية من الأليلات النادرة والمشتقة عالية التردد (Barton 1998 Fay and Wu 2000). على النقيض من ذلك ، في إطار نموذج الاختيار على التباين الدائم ، ستحدث إعادة التركيب أيضًا عندما يكون A بتردد منخفض (الشكل 1). تنبع الفرصة المتزايدة لإعادة التركيب في المرحلة الأولية من حقيقة أن A يقضي وقتًا أطول في الانجراف على ترددات منخفضة. أحداث إعادة التركيب التي تحدث أثناء ندرة A ستؤدي إلى سلاسل أنساب أكثر توازناً ، أي في عدد أكبر من أليلات التردد المتوسط ​​في العينة (الشكل 1). بالنظر بطريقة أخرى ، إذا حدثت إعادة التركيب بينما يكون A نادرًا ، فإن أكثر من نمط فرداني واحد سيحمل الأليل بمرور الوقت t s. ستزيد مجموعة فرعية من هذه في التردد مع A ، وبعد التثبيت ، تميل الأليلات التي تميزها إلى أن تكون بترددات وسيطة في العينة. باختصار ، يعتمد الطيف الترددي الملاحظ في المواقع المرتبطة والمحايدة على عدد أحداث إعادة التركيب التي حدثت أثناء إقامة الأليل المفضل في المجتمع وعندما حدثت ، أي لقوة اختيار ثابتة ، على f ومعدل إعادة التركيب .

في هذا الصدد ، لا يستحق أي شيء أن أي سيناريو يؤدي إلى فترة بقاء طويلة نسبيًا للأليل المفضل ، خاصة عند التردد المنخفض ، سيزيد من فرصة إعادة التركيب بين الطبقات الأليلية ، وبالتالي إضعاف وتشويه بصمة أحد أقارب الاستبدال التكيفي لنموذج الاجتياح القياسي. على سبيل المثال ، يكون لتثبيت الأليل المفيد تأثيرًا أقل على التنوع في المواقع المحايدة المرتبطة عندما يكون الأليل متنحيًا بدلاً من السائد ، كما هو مفترض في النموذج القياسي (Teshima and Przeworski 2005). الأهم من ذلك ، أن التركيبة السكانية يمكن أن تزيد من وقت الإقامة للأليل المفضل (Cherry 2003 Whitlock 2003).

تأثير f على قوة جمعيات الأليلات

سيؤثر توقيت أحداث إعادة التركيب أثناء المسح الانتقائي أيضًا على مستويات اختلال التوازن (LD). لفحص هذا الجانب من بيانات تعدد الأشكال ، نقوم بتقدير معدل إعادة التركيب السكاني & # 061 4 N e r (Hudson 1987). في ظل نموذج التوازن المحايد ، يمكن اعتبار تقديرات & rho على أنها مقدار إعادة التركيب المطلوب في المجتمع لكل جيل لتوليد صعوبة التعلم المرصودة تقريبًا. بشكل عام ، يمكن اعتبارها مؤشرًا لقوة الارتباطات الأليلية ، مع قيم أصغر تتوافق مع LD الأكبر والعكس صحيح (Andolfatto and Przeworski 2000).

في الجدول 2 ، نقدم المتوسط ​​، التباين ، ونطاق تقديرين لـ & rho ، للمعلمات المطبقة على البشر و & # 061 10. الأول ، W 00 ، هو الحد الأقصى لتقدير الاحتمالية لـ & rho نظرًا لملخصين للبيانات : عدد الأنماط الفردانية المميزة في العينة والحد الأدنى لعدد أحداث إعادة التركيب ، وفقًا لتقدير اختبار الأمشاج الأربعة (Wall 2000). التقدير الثاني ، H 01 ، هو مقدر احتمالية مركب يعتمد على تكوينات نوع التوظيف في أزواج من المواقع متعددة الأشكال (هدسون 2001). في ظل نموذج التوازن المحايد ، يكون كلا المقدرين قريبين من غير متحيزين (الجدول 2). بالمقارنة ، فإن نموذج المسح الانتقائي القياسي يؤدي إلى انخفاض حاد في W 00 ، أو ما يعادله ، زيادة ملحوظة في مستويات LD (Przeworski 2002 Kim and Nielsen 2004). لوحظ هذا الانخفاض في القيمة المقدرة & rho أيضًا من خلال النظر في متوسط ​​H 01 ، ولكن ليس متوسطه ، حيث يتم تشويه الأخير بواسطة القيم المتطرفة العرضية.

في المتوسط ​​، يكون لتثبيت الأليل المفيد تأثيرًا أقل على تقديرات & rho (أي تأثير أضعف على LD) عند f & # 061 0.05 مقارنة بنموذج المسح الانتقائي القياسي. كتوضيح ، بالنسبة لهذه المعلمات ، فإن الوسيط W 00 يساوي 1.0 بدلاً من 0.0 والوسيط H 01 & # 061 2.6 بدلاً من 1.6. علاوة على ذلك ، هناك تباين أكبر في مستويات LD: Var (W 00) & # 061 2.34 مقابل 0.90 لـ f & # 061 0.05 و f & # 061 1 / (2 N) ، على التوالي. (لا يُرى هذا التأثير مع H 01 ، ربما لأن المقدر منحاز إلى الأعلى عندما تحتوي العينة على نسبة عالية من الأليلات النادرة وتظهر هذه الحالة في كثير من الأحيان تحت نموذج المسح الانتقائي القياسي J.D Wall ، unpubl. obs.).

على الرغم من التباين المتزايد في تقديرات W 00 تحت نموذج حيث f & # 061 0.05 ، فإن النسبة المئوية الأعلى 97.5 من W 00 لا تزال أقل بكثير من المتوقع في ظل نموذج توازن محايد. يشير هذا إلى أن استخدام W 00 كإحصاء اختبار قد يوفر قوة كبيرة لاكتشاف استبدال مفيد ، حتى عندما تكون f 1 / (2 N). لسوء الحظ ، فإن استخدام W 00 كإحصاء اختبار يتطلب تقديرًا دقيقًا لـ & rho ، والذي نادرًا ما يكون متاحًا. علاوة على ذلك ، فإن تأثير الاستبدال المفيد على صعوبة التعلم يتبدد بسرعة (الجدول 2 Przeworski 2002 Kim and Nielsen 2004).

كملخص بديل لأنماط صعوبة التعلم ، قمنا بجدولة كل من عدد الأنماط الفردية المتميزة وتماثل النمط الفرداني لعمليات المحاكاة الموضحة في الجدول 2. في جميع الحالات ، كانت عمليات المسح الانتقائية باستخدام f & # 061 1 / (2 N) أقل تنوعًا في النمط الفرداني من عمليات المحاكاة المماثلة باستخدام f & # 061 0.05 ، حتى عند تصحيح الاختلافات في مستويات التنوع وترددات الأليل (النتائج غير معروضة). تتوافق هذه النتائج بشكل عام مع تلك الموصوفة لتقديرات & rho ، حيث يبدو أن نموذج المسح المعياري يؤدي إلى زيادة أكبر في مستويات LD مقارنة بالنموذج حيث f & # 061 0.05. يبقى أن يتم التحقيق فيما إذا كانت هذه الملاحظة تُعمم على ملخصات صعوبة التعلم الأخرى ، وعلى وجه الخصوص ، ما إذا كان هناك جانب من جوانب صعوبة التعلم قد يساعد في تمييز الاختيار على التباين القائم مقابل الطفرات الجديدة.

الترددات التي يفضل عندها الأليلات

كما توضح هذه النتائج ، فإن توقيع الاختيار الاتجاهي على تعدد الأشكال الحالي يعتمد بشكل حاسم على قيمة f. لسوء الحظ ، هناك القليل من الأدلة التجريبية التي تشير إلى القيم التي قد تكون معقولة للسكان الطبيعيين. للحصول على بعض الإحساس بما يمكن توقعه ، أخذنا في الاعتبار نموذجًا تنجم فيه جميع البدائل المفيدة عن اختيار الاتجاه على التباين الدائم في مجتمع توازن محايد ، وسألنا عن توزيع f في ظل هذه الظروف (للحصول على اشتقاق ذي صلة ، انظر Hermisson) و Pennings 2005).

نفترض أولاً أن الانتقاء الإيجابي يعمل على الأليل المشتق. في نموذجنا ، يتم اختيار أليل محايد عشوائيًا من طيف تردد التوازن المحايد. قم بالإشارة إلى تردد الأليل المشتق بواسطة x ، المحصور في & # 0911/2 N ، 1 & ناقص 1/2 N & # 093. دالة كثافة الاحتمال (pdf) لـ x تتناسب مع 1 / x (راجع Ewens 2004). منذ 1/2 N (2 N & minus1) / 2 N dx / x & # 061 ln (2 N & ناقص 1) ، فإن pdf لتردد الأليل المشتق هو (x) & # 061 & # 091 x ln (2 N & ناقص 1) & # 093 & ناقص 1. لذلك يتم استخلاص الأليل المحايد من (x) ، ويفضل لاحقًا بالمزايا الانتقائية الجينية s. بالنظر إلى الأليل عند التردد x الذي يحتوي على معامل انتقائي s ، فإن احتمال التثبيت تقريبًا (1 & ناقص e & ناقص 4 Nsx) / (1 & ناقص e & ناقص 4 Ns) (راجع Ewens 2004). مشروطًا بالتثبيت ، فإن pdf للتردد f ، P (x) ، لذلك يتناسب مع احتمال تثبيت أليل محايد تم اختياره عشوائيًا تقريبًا يعرض الشكل 5 (x) و P (x). تشير المقارنة بين الاثنين إلى تحول نحو الأليلات عالية التردد في P (x) بالنسبة إلى (x). يمكن فهم ذلك بسهولة: بالنسبة لمعامل الاختيار الثابت ، تقل احتمالية إصلاح الأليلات النادرة. وبالتالي ، بشرط التثبيت ، تكون نسبة الأليلات النادرة أصغر. مع زيادة قوة الانتقاء ، يضعف التأثير على التكييف عند التثبيت ، ويصبح التوزيعان أكثر تشابهًا.

المعنى الضمني هو أنه إذا كان الانتقاء الاتجاهي يعمل بشكل متكرر على التباين الدائم والاختيار في المجموعات الطبيعية قويًا ، فإن توزيع f سيشابه التباين المحايد في السكان الأسلاف. لذلك يتنبأ هذا النموذج البسيط بأن الانتقاء الاتجاهي في teosinte ، السلف البري للذرة ، سوف يميل إلى إنتاج التوقيع القياسي لمسح انتقائي ، لأن طيف تردد الأليل ينحرف نحو الأليلات النادرة (Wright et al. 2005). في المقابل ، في المجموعات البشرية الأوروبية ، يبدو أن هناك زيادة في أليلات التردد المتوسط ​​في المناطق المحايدة المفترضة (على سبيل المثال ، Frisse et al. 2001 Akey et al. 2004). بافتراض أن الأمر نفسه كان صحيحًا في بداية الاختيار ، فقد يكون التكيف مع الموائل الجديدة أكثر احتمالًا لإشراك الأليلات بتردد ملموس ، مما أدى إلى مجموعة فرعية من المناطق الجينومية ذات التنوع المنخفض وزيادة الأليلات ذات التردد المتوسط.

حتى الآن ، افترضنا أن الانتقاء يفضل الأليل المشتق. اعتمادًا على كيفية تغير معاملات الانتقاء مع البيئة ، قد يكون من الواقعي افتراض أن الأليل الذي يصبح مفيدًا ، A ، من المرجح بنفس القدر أن يكون مشتقًا أو متوارثًا. إن pdf لتردد أليل الأسلاف هو & # 091 (1 & ناقص x) ln (2 N & ناقص 1) & # 093 & minus1. وبالتالي ، فإن توزيع التردد لأليل محايد تم اختياره عشوائيًا يتناسب مع P (x) بينما (x) متماثل حول 0.5 ، يتم إزاحة P (x) باتجاه قيم تردد أعلى. لذلك ، في هذا السيناريو ، سيعمل الاختيار في الغالب على الأليلات التي يكون ترددها قريبًا من واحد والتي هي أسلاف. عندما يحدث ذلك ، فإن مسار A من واحد إلى f إلى واحد سيؤدي إلى اختناق قصير وخفيف للغاية لفئة الأليلات. في ظل وجود إعادة التركيب ، فإن هذا التشابه بين المسح وتقليل حجم السكان ليس مثاليًا (Barton 1998) ، ولكنه يشير إلى أن الاستبدال المفيد لأليل الأسلاف لن يكون له تأثير أساسي على أنماط التباين في المواقع المرتبطة. علاوة على ذلك ، فإن أي توقيع انتقائي موجود سيكون من الصعب تمييزه عن تأثيرات تاريخ السكان ، خاصة في الأنواع (مثل البشر) التي يعتقد أنها عانت من اختناقات حديثة. وهكذا ، حتى لو كان الانتقاء يحتمل بشكل متساوٍ أن يفضل الأليلات السلفية والمشتقة ، فإن الحلقات التي تتضمن أليلات مشتقة فقط ستكون قابلة للاكتشاف بسهولة.

يتطلب تحديد الأهداف الانتقائية من بيانات تعدد الأشكال توصيفًا دقيقًا لتأثيرات الانتقاء الطبيعي. حتى الآن ، استرشدت هذه الجهود بنموذج مبسط يفترض ، من بين العديد من الافتراضات الأخرى ، أن التكيفات تأتي من خلال الانتقاء الاتجاهي على أليل واحد ناشئ حديثًا. ومع ذلك ، تشير كل من البيانات التجريبية والاعتبارات النظرية إلى أن الانتقاء قد يعمل في كثير من الأحيان على طفرات مستقلة متعددة أو على أليل واحد موجود بالفعل في السكان. بالتركيز على السيناريو الأخير ، نجد أن الاختيار الاتجاهي في منطقة إعادة الاتحاد يمكن أن يؤدي إلى أنماط تعدد الأشكال التي تختلف بشكل ملحوظ عن التوقيع المتوقع بموجب النموذج القياسي ، عندما يتجاوز التردد الذي يصبح فيه الأليل مفيدًا 1 / (2 نانوثانية).

من غير الواضح عدد المرات التي يتم فيها استيفاء هذا الشرط ، ولكن النظر في هذا السيناريو قد يساعد في توضيح أنماط التباين في المواقع المرشحة. كتوضيح ، Akey et al. (2004) استخدم نهج معدل الاكتشاف الخاطئ لتحديد المناطق الجينية التي تم رفض التطور المحايد لها بموجب مجموعة من الافتراضات الديموغرافية المختلفة. حدد المؤلفون ثمانية مواقع على أنها مهمة في الأمريكيين الأوروبيين وليس في الأمريكيين من أصل أفريقي ، مما دفعهم إلى اقتراح أن السكان الأوروبيين قد اختبروا مؤخرًا اختيارًا للاتجاه استجابةً لموائل جديدة. ومن المثير للاهتمام ، أن ثلاثة من المرشحين الثمانية لديهم قيم إيجابية حادة لـ Tajima & # 039s D (ABO ، ACE2 ، و IL1A Akey et al. 2004). من بين هؤلاء ، يُظهر ABO و IL1A أيضًا مستويات عالية بشكل غير عادي من التنوع ، وربما يتوافق مع إجراء موازنة الاختيار. ولكن في ACE2 ، إنزيم تحويل الأنجيوتنسين 1 & # 8211 ، ليس فقط تاجيما & # 039s D إيجابيًا بشدة (& # 0431.854) ولكن التنوع ينخفض ​​(نسبة التنوع الأوروبي الأمريكي إلى التنوع الأمريكي الأفريقي هو 11 من 132 جينًا شملهم الاستطلاع) . يصعب التوفيق بين هذين الجانبين من البيانات مع نماذج المسح الانتقائي القياسية أو نماذج الاختيار الموازنة ، لكنهما متسقتان مع تنبؤات الاختيار الاتجاهي بشأن التباين الدائم. وبالمثل ، فقد حددت إحدى الأوراق البحثية الأولى التي طبقت منهج رسم خرائط الرحلات على D. melanogaster منطقتين من الكروموسوم X كأهداف مفترضة لعملية اكتساح انتقائية حديثة في المجموعات السكانية الأوروبية (Harr et al.2002). تم تخفيض مستويات تعدد الأشكال في هذه المناطق ، لكن قيمة تاجيما & # 039 s كانت موجبة لأكثر من نصف الأجزاء المتسلسلة. قد يكون أحد التفسيرات هو أن الاختيار الإيجابي قد عمل على أليل يفصل بالفعل بتردد ملموس في السكان الأسلاف. هذه الأمثلة موحية فقط ، لكنها تسلط الضوء على القوة التفسيرية المحتملة لنموذج اختيار أكثر واقعية. للسماح لهذا النموذج من اختيار الاتجاه على التباين الدائم أن يتم توصيفه أو استخدامه للاستدلال ، قمنا بتطبيقه في إطار برنامج SELSIM (Spencer and Coop 2004) وجعلنا هذا الإصدار متاحًا على pritch.bsd.uchicago.edu/ software.html.

كخطوة تالية ، سيكون من المفيد توصيف التأثير على بيانات تعدد الأشكال للاختيار الاتجاهي على طفرات متعددة ومستقلة في الموقع. على الرغم من عدم اليقين الكبير الذي يحيط بالعدد الدقيق للأصول المستقلة ، يبدو أن هذا السيناريو ينطبق على مقاومة البيريميثامين في طفيلي الملاريا (روبر وآخرون ، 2004 والمراجع الواردة فيه). وبالمثل ، يبدو أن النمط الظاهري منخفض الصفيحة في تجمعات المياه العذبة من أسماك أبو شوكة ثلاثية الشوكات يرجع إلى طفرتين مستقلتين على الأقل في الموقع الرئيسي (Colosimo et al. 2005). بشكل أكثر عمومية ، بافتراض عدم وجود تداخل بين الأليلات ، فمن المحتمل أن يكون هذا النمط من الانتقاء على التباين الدائم مرجحًا عندما يكون الانتقاء ضعيفًا أو يكون معدل الطفرة السكانية للفئة المفضلة ، 4 N ، مرتفعًا (Hermisson and Pennings 2005). لذلك تتنبأ نتيجة Hermisson and Pennings بأن التكيفات في الأنواع ذات الحجم السكاني الفعال الأكبر ، N ، من المرجح أن تشتمل على أليلات متعددة من أصول مستقلة. يقترح أيضًا أن توقيع الانتقاء في موضع ما سيعتمد على العمارة الجينية للنمط الظاهري على سبيل المثال ، بالنسبة لمعامل اختيار ثابت ، من المتوقع أن يترك فقدان الوظيفة التكيفية توقيعًا مميزًا من اكتساب الوظيفة ، لأن المزيد من الطفرات يمكن أن يحققها (Hermisson and Pennings 2005). يمكن اختبار هذه التخمينات بمجرد تمييز توقيع الاختيار على أليلات متعددة.

بالإضافة إلى النظر في أنماط الاختيار الأكثر عمومية ، قد يكون من المهم تضمين افتراضات ديموغرافية أكثر واقعية (على سبيل المثال ، Slatkin and Wiehe 1998 Beaumont and Balding 2004). سلطت العديد من الدراسات الضوء على صعوبة التمييز بين التأثيرات الانتقائية والديموغرافية (Nielsen 2001 Przeworski 2002 Lazzaro and Clark 2003). تظل هذه نقطة حاسمة: على سبيل المثال ، الأنماط في كل من ACE2 والمواقع المرشحة التي حددها Harr et al.(2002) يمكن أن يعكس العمليات الديموغرافية المعقدة التي لم يأخذها المؤلفون في الاعتبار بدلاً من التكيف في موقع مرتبط. ومع ذلك ، فإن فهم كيفية تأثير الافتراضات الديموغرافية البديلة على توقيع الاختيار على نفس القدر من الأهمية (على سبيل المثال ، Slatkin and Wiehe 1998 Beaumont and Balding 2004). في النهاية ، الهدف ليس التمييز بين نماذج الاختيار مقابل الديموغرافيا المعقدة ولكن بين نماذج الاختيار والديموغرافيا مقابل الديموغرافيا وحدها. على وجه الخصوص ، لتحديد التكيفات استجابة لتغيرات المناخ والتحولات الحيوية الأخرى ، نحتاج إلى تحديد بصمة الاختيار الإيجابي في المجموعات السكانية التي يتم تنظيمها وتختلف في الحجم بمرور الوقت. خلافًا لذلك ، فإننا نخاطر بارتكاب خطأ في مواضع التطور المحايدة لأهداف اختيار الاتجاه وفقدان الأهداف الفعلية التي يتم فيها تشويه توقيع التكيف بشكل لا يمكن التعرف عليه.

نشكر B. Griffiths على المناقشات المفيدة و N. Barton و M. Nachmann والمراجعين لتعليقاتهم على المخطوطة. يتم دعم GC من قبل المعاهد الوطنية للصحة بمنحة HG002772 إلى J.K.

آكي ، جي إم ، إم إيه إيبرل ، إم جي رايدر ، سي إس كارلسون ، إم دي شرايفر ، دي إيه نيكرسون ، وإل كروجلياك. 2004. شكل تاريخ السكان والانتقاء الطبيعي أنماط التباين الجيني في 132 جينًا. بلوس بيول. 2: e286

أندولفاتو ، ب. ، وإم برزيورسكي. 2000. خروج على نطاق الجينوم عن النموذج المحايد القياسي في المجموعات الطبيعية من ذبابة الفاكهة. علم الوراثة. 156: 257 & # 150268. [اقتباس في PubMed]

أكوادرو ، سي إف ، في باور دومونت ، إف إيه ريد. 2001. الاختلاف على مستوى الجينوم في الإنسان وذبابة الفاكهة: مقارنة. بالعملة. رأي. جينيه. ديف. 11: 627 & # 150634. [اقتباس في PubMed]

بارتون ، إن إتش. 1998. تأثير التنزه على سلاسل الأنساب المحايدة. جينيه. الدقة. 72: 123 # 150133.

بومونت ، إم إيه ، ودي جي بالدينج. 2004. تحديد الاختلاف الجيني التكيفي بين السكان من مسح الجينوم. مول. ايكول. 13: 969 & # 150980. [اقتباس في PubMed]

Bersaglieri ، T. ، P. C. Sabeti ، N. Patterson ، T. Vanderploeg ، S.F Schaffner ، J. A. Drake ، M. Rhodes ، D.E Reich ، and J.N Hirschhorn. 2004. التواقيع الجينية لانتقاء إيجابي قوي حديث في جين اللاكتيز. أكون. جيه هوم. جينيه. 74: 1111 & # 1501120. [اقتباس في PubMed]

Cherry، J.L 2003. الاختيار في مجموعة سكانية مقسمة مع الانقراض المحلي وإعادة الاستعمار. علم الوراثة. 164: 789 & # 150795. [اقتباس في PubMed]

كولوسيمو ، بي إف ، كيه إي هوسمان ، إس بالابهادرا ، جي فياريال جونيور ، إم ديكسون ، ج. غريموود ، جيه شموتز ، آر إم مايرز ، د. 2005. تطور متوازي واسع الانتشار في أبو شوكة عن طريق التثبيت المتكرر لأليلات Ectodysplasin. علم. 307: 1928 & # 1501933.

كووب ، جي ، و آر سي غريفيث. 2004. استدلال الأجداد على أشجار الجينات قيد الاختيار. النظرية. بوبول. بيول. 66: 219 & # 150232. [اقتباس في PubMed]

Ewens، W. J. 2004. علم الوراثة الرياضية للسكان. Springer Verlag ، نيويورك.

فاي ، جي سي ، وسي آي وو. 2000. التنزه تحت الاختيار الدارويني الإيجابي. علم الوراثة. 155: 1405 & # 1501413. [اقتباس في PubMed]

فريس ، إل ، آر آر هدسون ، إيه بارتوشيفيتش ، جيه دي وول ، جيه دونفاك ، وأيه دي رينزو. 2001. التحويل الجيني والتواريخ السكانية المختلفة قد تفسر التناقض بين تعدد الأشكال واختلال التوازن في الارتباط. أكون. جيه هوم. جينيه. 69: 831 & # 150843. [اقتباس في PubMed]

جلينكا ، إس ، إل أوميتو ، إس موسيت ، دبليو ستيفان ، دي لورينزو. 2003. الديموغرافيا والانتقاء الطبيعي شكلا التباين الجيني في ذبابة الفاكهة السوداء: نهج متعدد المواقع. علم الوراثة. 165: 1269 & # 1501278. [اقتباس في PubMed]

Griffiths، R.C. 2003. الطيف الترددي للطفرة ، وعمرها ، في نموذج الانتشار العام. النظرية. بوبول. بيول. 64: 241 & # 150251. [اقتباس في PubMed]

هامبلين ، إم تي ، وأيه دي رينزو. 2000. الكشف عن بصمة الانتقاء الطبيعي في البشر: دليل من موقع فصيلة دافي. أكون. جيه هوم. جينيه. 66: 1669 & # 1501679. [اقتباس في PubMed]

هامبلين ، إم تي ، إي إي تومسون ، وأيه دي رينزو. 2002. التوقيعات المعقدة للانتقاء الطبيعي في موقع فصيلة دافي. أكون. جيه هوم. جينيه. 70: 369 & # 150383. [اقتباس في PubMed]

Harr، B.، M. Kauer، and C. Schlotterer. 2002. Hitchhiking mapping: استراتيجية لرسم الخرائط الدقيقة على أساس السكان للطفرات التكيفية في Drosophila melanogaster. بروك. ناتل. أكاد. علوم. الولايات المتحدة الأمريكية. 99: 12949 & # 15012954. [اقتباس في PubMed]

هرمسون ، ج ، وبي إس بينينغز. 2005. المسح الناعم: الجينات الجزيئية للتكيف من التباين الجيني الدائم. علم الوراثة. 169: 2335 & # 1502352. [اقتباس في PubMed]

Hudson، R. R. 1987. تقدير معامل إعادة التركيب لنموذج السكان المحدود دون اختيار. جينيه. الدقة. 50: 245 & # 150250. [اقتباس في PubMed]

Hudson، R. R. 1990. علم الأنساب الجيني وعملية الاندماج. ص. 1 & # 8211 44 ​​in D. Futuyma and J. Antonovics، eds. استطلاعات أكسفورد في علم الأحياء التطوري. جامعة أكسفورد. الصحافة ، أكسفورد ، المملكة المتحدة

Hudson، R. R. 2001. توزيعات العينات ثنائية الموقع وتطبيقها. علم الوراثة. 159: 1805 & # 1501817. [اقتباس في PubMed]

هدسون ، آر آر ، وإن.إل.كابلان. 1988. عملية الاندماج في النماذج مع الاختيار وإعادة التركيب. علم الوراثة. 120: 831 & # 150840. [اقتباس في PubMed]

إينان ، هـ ، و واي كيم. 2004. نمط تعدد الأشكال بعد الانتقاء الاصطناعي القوي في حدث التدجين. بروك. ناتل. أكاد. علوم. الولايات المتحدة الأمريكية. 101: 10667 & # 15010672. [اقتباس في PubMed]

كابلان ، إن إل ، آر آر هدسون ، سي إتش لانجلي. 1989. أعيد النظر في تأثير & # 8220hitchhiking & # 8221. علم الوراثة. 123: 887 & # 150899. [اقتباس في PubMed]

كارلين ، إس ، و إتش إم تايلور. 1981. دورة ثانية في العمليات العشوائية. المطبعة الأكاديمية ، سان دييغو ، كاليفورنيا.

Kauer ، M.O. ، D. Dieringer ، و C. Schlotterer. 2003. شاشة تغير الأقمار الصناعية الصغيرة للاختيار الإيجابي المرتبط بـ & # 8220 في إفريقيا & # 8221 توسيع موطن ذبابة الفاكهة السوداء. علم الوراثة. 165: 1137 & # 1501148. [اقتباس في PubMed]

كايسر ، إم ، إس براوير ، إم ستونكينج. 2003. مسح الجينوم لاكتشاف المناطق المرشحة المتأثرة بالانتقاء الطبيعي المحلي في التجمعات البشرية. مول. بيول. Evol. 20: 893 & # 150900. [اقتباس في PubMed]

كيم ، واي. ، ور. نيلسن. 2004. اختلال التوازن في الارتباط كتوقيع على عمليات مسح انتقائية. علم الوراثة. 167: 1513 & # 1501524. [اقتباس في PubMed]

كيم ، واي ، و دبليو ستيفان. 2002. الكشف عن بصمة محلية للتواصل الجيني على طول كروموسوم معاد التركيب. علم الوراثة. 160: 765 & # 150777. [اقتباس في PubMed]

لازارو ، ب.ب. ، وأ.ج.كلارك. 2003. علم الوراثة الجزيئية للجينات الببتيدية المضادة للبكتيريا المحفزة في ذبابة الفاكهة السوداء. مول. بيول. Evol. 20: 914 & # 150923. [اقتباس في PubMed]

لوين ، ر ، و آر إيه فولي. 2004. مبادئ التطور البشري. دار نشر بلاكويل ، أكسفورد ، المملكة المتحدة

لي ، دبليو إتش ، ول.أ.سادلر. 1991. تنوع النوكليوتيدات المنخفض في الإنسان. علم الوراثة. 129: 513 & # 150523. [اقتباس في PubMed]

ماينارد سميث ، جي إم ، وجي هيغ. 1974. تأثير الجينات الملائمة. جينيه. الدقة. 23:23 و # 15035. [اقتباس في PubMed]

مورياما ، إي إن ، وجي آر باول. 1996. تباين الحمض النووي النووي غير المحدد في ذبابة الفاكهة. مول. بيول. Evol. 13: 261 & # 150277. [اقتباس في PubMed]

ناير ، إس ، جيه تي ويليامز ، إيه بروكمان ، إل بايفون ، إم مايكساي ، بي إن نيوتن ، جي بي جوثمان ، إف إم سميثويس ، تي تي هين ، إن جي وايت ، إف نوستين ، وتي جي أندرسون. 2003. مسح انتقائي مدفوع بعلاج البيريميثامين في طفيليات الملاريا في جنوب شرق آسيا. مول. بيول. Evol. 20: 1526 & # 1501536. [اقتباس في PubMed]

نيلسن ، ر. 2001. الاختبارات الإحصائية للحياد الانتقائي في عصر علم الجينوم. الوراثة. 86: 641 & # 150647. [اقتباس في PubMed]

نيلسن ، آر ، سي بوستامانتي ، إيه جي كلارك ، إس جلانوسكي ، تي بي ساكتون ، إم جيه هوبيز ، إيه فليديل ألون ، دي إم تانينباوم ، دي سيفيلو ، تي جي وايت ، جي جي سنينسكي ، إم دي آدامز ، إم كارجيل. 2005. مسح للجينات المختارة إيجابيا في جينومات البشر والشمبانزي. بلوس بيول. 3: 976 & # 150985.

Nordborg، M. 2001. Coalescent Theory. ص. 179 & # 8211212 in D.J Balding، M. Bishop، and C. Cannings، eds. كتيب علم الوراثة الإحصائي. جون وايلي وأولاده ، ويست ساسكس ، المملكة المتحدة

أور ، هـ. أ ، وأ. ج. بيتانكورت. 2001. Haldane & # 039 s غربال والتكيف مع التباين الجيني الدائم. علم الوراثة. 157: 875 & # 150884. [اقتباس في PubMed]

Payseur، B. A.، A. D. Cutter، and M.W Nachman. 2002. البحث عن دليل على الاختيار الإيجابي في الجينوم البشري باستخدام أنماط تقلب الساتل الميكروي. مول. بيول. Evol. 19: 1143 & # 1501153. [اقتباس في PubMed]

Przeworski، M. 2002. توقيع الاختيار الإيجابي في المواقع المختارة عشوائيًا. علم الوراثة. 160: 1179 & # 1501189. [اقتباس في PubMed]

برزيورسكي ، إم ، آر آر هدسون ، وأيه دي رينزو. 2000. تعديل التركيز على التباين البشري. اتجاهات الجينات. 16: 296 & # 150302. [اقتباس في PubMed]

راي ، إن ، إم كورات ، وإلي إكسكوفير. 2003. التنوع الجزيئي داخل الديم في التوسع المكاني للسكان. مول. بيول. Evol. 20: 76 & # 15086. [اقتباس في PubMed]

روبر ، سي ، آر بيرس ، إس ناير ، بي شارب ، إف نوستين ، وتي أندرسون. 2004. انتشار الملاريا المقاومة للبيريميثامين عبر القارات. علم. 305: 1124

سانتياغو ، إي ، وأ.كاباليرو. 2005. التباين بعد مسح انتقائي في مجموعة سكانية مقسمة. علم الوراثة. 169: 475 & # 150483. [اقتباس في PubMed]

Schofl ، G. ، و C. Schlotterer. 2004. أنماط التباين في السواتل الدقيقة بين الكروموسومات X والجسيمات الذاتية تشير إلى تواتر مرتفع للطفرات المفيدة في D. simulans غير الأفريقية. مول. بيول. Evol. 21: 1384 & # 1501390. [اقتباس في PubMed]

Simonsen ، K.L ، G.A Churchill ، و C.F Aquadro. 1995. خصائص الاختبارات الإحصائية للحياد لبيانات تعدد أشكال الحمض النووي. علم الوراثة. 141: 413 & # 150429. [اقتباس في PubMed]

سلاتكين ، إم ، وتي ويهي. 1998. التنزه الوراثي في ​​مجموعة سكانية مقسمة. جينيه. الدقة. 71: 155 & # 150160. [اقتباس في PubMed]

سبنسر ، سي ، وجي كوب. 2004. SELSIM: برنامج لمحاكاة البيانات الوراثية السكانية مع الانتقاء الطبيعي وإعادة التركيب. المعلوماتية الحيوية. 20: 3673 & # 1503675. [اقتباس في PubMed]

ستيفان ، دبليو ، تي إتش إي ويهي ، إم لينز. 1992. تأثير الاستبدالات المختارة بقوة على تعدد الأشكال المحايد: نتائج تحليلية على أساس نظرية الانتشار. النظرية. بوبول. بيول. 41: 237 & # 150254.

Storz ، J.F ، B.A Payseur ، و M.W Nachman. 2004. مسح الجينوم لتنوع الحمض النووي في البشر يكشف عن أدلة على عمليات مسح انتقائية خارج إفريقيا. مول. بيول. Evol. 21: 1800 # 1501811. [اقتباس في PubMed]

سوانسون ، دبليو جيه 2003. التطور التكيفي للجينات وعائلات الجينات. بالعملة. رأي. جينيه. ديف. 13: 617 & # 150622. [اقتباس في PubMed]

تاجيما ، ف. 1989. الطريقة الإحصائية لاختبار فرضية الطفرة المحايدة عن طريق تعدد أشكال الحمض النووي. علم الوراثة. 123: 585 & # 150595. [اقتباس في PubMed]

تيشيما ، ك.م ، وإم برزورسكي. 2005. اختيار الاتجاه على أليلات الهيمنة التعسفية. علم الوراثة في الصحافة.

Wall، J. D. 2000. مقارنة بين مقدرات معدل إعادة التركيب السكاني. مول. بيول. Evol. 17: 156 & # 150163. [اقتباس في PubMed]

واترسون ، ج. أ. 1975. حول عدد مواقع الفصل في النماذج الجينية دون إعادة التركيب. النظرية. بوبول. بيول. 7: 256 # 150276. [اقتباس في PubMed]

Whitlock، M. C. 2003. احتمالية التثبيت والوقت في مجموعات سكانية مقسمة. علم الوراثة. 164: 767 & # 150779. [اقتباس في PubMed]

رايت ، إس آي ، آي في بي ، إس جي شرودر ، إم ياماساكي ، جي إف دويبلي ، إم دي مكمولين ، وبي إس غاوت. 2005. آثار الانتقاء الاصطناعي على جينوم الذرة. علم. 308: 1310 & # 1501314.

يانغ ، زد ، وجي بي بيلوسكي. 2000. الأساليب الإحصائية للكشف عن التكيف الجزيئي. اتجاهات Ecol. Evol. 15: 496 & # 150503. [اقتباس في PubMed]

الجدول 1. المتوسط ​​والتباين والمدى لـ Tajima & # 039s D في ظل نموذج توازن محايد ، ونموذج مسح انتقائي قياسي ، ونموذج للاختيار الموجب الاتجاهي حيث f & # 061 0.05. تم تشغيل ما مجموعه 10 4 عمليات محاكاة لـ 100 كروموسوم ، مع N & # 061 10 4 و s & # 061 0.05. الموقع المحدد هو 10 كيلو بايت من المنطقة المحايدة التطور البالغة 10 كيلو بايت. مع الموضع المحايد ، معدل الطفرة السكانية & ثيتا & # 061 10 & ناقص 3 لكل زوج أساسي ومعدل إعادة التركيب السكاني & # 061 4 Nr & # 061 10 & ناقص 3 لكل زوج أساسي. T هو الوقت منذ تثبيت الأليل النافع. لاحظ التباين الكبير في قيم D عند f & # 061 0.05

الجدول 2. المتوسط ​​، والتباين ، ونطاق مقدرات & rho تحت نموذج توازن محايد ، ونموذج مسح انتقائي قياسي ، ونموذج للاختيار الموجب الاتجاهي حيث f & # 061 0.05. قيم المعلمات هي نفسها كما في الجدول 1. تم تقديم مقدرين: W 00 (Wall 2000) و H 01 (Hudson 2001). تم تقدير احتمالات W 00 على شبكة من 171 قيمة ، تتراوح من صفر إلى 100 ، وتلك الخاصة بـ H 01 على شبكة من 197 قيمة تتراوح من صفر إلى 200

تين . 1. علم الأنساب المحتمل لستة كروموسومات في موضع محايد مرتبط بموقع وصل فيه الأليل المفيد ، A ، إلى التثبيت. في هذا المثال ، ثبت A للتو في المجتمع (في الوقت T & # 061 0) ، لذا فإن جميع السلالات تحمل الأليل المفضل. بالعودة إلى الوراء في الزمن ، يُفضل A من T إلى t s ثم يتطور بشكل محايد من t s (عندما يكون عند التردد f) إلى t m. تظهر مسارات المرحلتين المحددة والمحايدة باللونين الأسود والرمادي ، على التوالي. يتم تصوير علم الأنساب المتحد للكروموسومات الستة بخطوط متقطعة ، بينما يشار إلى أحداث إعادة التركيب بين الطبقات الأليلية بأسهم مائلة. تحدث معظم الأحداث المتماسكة عندما يكون الأليل A بتردد منخفض. نظرًا لأن A يتطور بشكل محايد من t s إلى t m ، فإن وقت إقامته أطول مما سيكون عليه في ظل عملية مسح قياسية ، مما يوفر فرصة أكبر لإعادة التركيب. لاحظ ، في هذا المثال ، أن أحدث سلف مشترك لم يتم الوصول إليه منذ 2500 جيل

تين . 2. متوسط ​​مستويات التنوع كدالة للمسافة من الموقع المحدد لقيم مختلفة لـ f ، وهو التردد الذي يفضل عنده الأليل أولاً. يتم تلخيص مستويات التنوع من خلال المتوسط ​​& pi (متقطع) ، & ثيتا W (رمادي) و & ثيتا H (أسود). في ظل نموذج التوازن المحايد ، تعد جميع الإحصائيات الثلاثة تقديرات غير متحيزة لـ & ثيتا ، معدل طفرة السكان. (أ) معايير معقولة للبشر. تم تشغيل ما مجموعه 10 4 عمليات محاكاة لـ 100 كروموسوم ، باستخدام N & # 061 10 4 ، s & # 061 0.05 ، و & theta & # 061 & rho & # 061 10 & minus3 لكل زوج أساسي (& rho & # 061 4 Nr انظر طرق تعريفات أخرى للمعلمات). الوقت منذ تثبيت الأليل المفيد هو صفر. تحت نموذج التوازن المحايد ، E (& pi) & # 061 E (& theta W) & # 061 E (& theta H) & # 061 1 لكل كيلو قاعدة. (ب) المعلمات المعقولة ل Drosophila melanogaster. تم إجراء ما مجموعه 10 4 عمليات محاكاة لـ 100 كروموسوم ، باستخدام N & # 061 10 6 ، s & # 061 0.01 ، & theta & # 061 0.01 لكل زوج أساسي ، و & rho & # 061 0.1 لكل زوج أساسي. الوقت منذ تثبيت الأليل المفيد هو صفر. تحت نموذج التوازن المحايد ، E (& pi) & # 061 E (& theta W) & # 061 E (& theta H) & # 061 1 لكل 100 نقطة أساس

تين . 3. مستويات التنوع في نافذة منزلقة 5 كيلوبايت (تزداد كل 1 كيلوبايت) على طول التسلسل تحت نموذج التحديد الاتجاهي بـ f & # 061 0.05 ، ونموذج المسح الانتقائي القياسي ، ونموذج التوازن المحايد (من الصف العلوي إلى الصف السفلي) ، على التوالى). يتم توفير أربعة أمثلة محاكاة لكل نموذج (انظر طرق للحصول على تفاصيل المحاكاة). يظهر الموضع على طول التسلسل (بالكيلوباس) على المحور السيني ، بينما تظهر قيم & pi (الخط الصلب) و & ثيتا W (الخط المتقطع) لكل كيلو قاعدة على المحور ص. تحت نموذج التوازن المحايد ، E (& pi) & # 061 E (& theta W) & # 061 1 لكل كيلو قاعدة. تم تشغيل كل محاكاة باستخدام 100 كروموسوم ، N & # 061 10 4 و s & # 061 0.05. الموقع المحدد في الموضع 0 و & theta & # 061 & rho & # 061 0.001 لكل زوج أساسي. الوقت منذ تثبيت الأليل المفيد هو صفر

تين . 4. طيف تردد الأليل تحت نموذج الانتقاء الاتجاهي باستخدام f & # 061 0.05 ، ونموذج المسح الانتقائي القياسي ، ونموذج التوازن المحايد (من الصف العلوي إلى الصف السفلي ، على التوالي). يتم توفير خمسة أمثلة محاكاة لكل نموذج (انظر طرق للحصول على تفاصيل المحاكاة). على المحور السيني توجد ترددات الأليل (في 10 خانات) وعلى المحور الصادي نسبة المواقع بتردد أليل معين. تم تشغيل كل محاكاة باستخدام 100 كروموسوم N & # 061 10 4 و s & # 061 0.05. الموقع المحدد هو 10 كيلو بايت من المنطقة المتطورة بشكل محايد و & # 061 & rho & # 061 10. الوقت منذ تثبيت الأليل المفيد هو صفر

تين . 5. توزيع ترددات الأليل مشروطة بالتثبيت في المجتمع. نفترض أن الانتقاء يعمل على أليل مشتق محايد سابقًا. يظهر باللون الرمادي الداكن طيف تردد الأليل للأليلات المتعادلة في مجموعة تزاوج عشوائية ذات حجم ثابت. في اللون الرمادي الفاتح ، يكون توزيع ترددات الأليل مشروطًا بتثبيت الأليل النافع. في هذا المثال ، N & # 061 10 4 و 4 Ns & # 061 200. كما يمكن رؤيته ، بشرط التثبيت ، فإن توزيع ترددات الأليل يحتوي على نسبة أقل من الأليلات النادرة


شاهد الفيديو: القوانين الاحصائية لانتقال الصفات الوراثية - 04 مورثة مرتبطة بصبغي جنسي. كيف تجيب على التمارين (كانون الثاني 2022).