معلومة

هل يمكنني إجراء تحليل جيني للسكان من بروتين غير مكتمل؟

هل يمكنني إجراء تحليل جيني للسكان من بروتين غير مكتمل؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

لدي مجموعة بيانات من تسلسلات Fasta. هذه البروتينات ليست كاملة (تحتوي تسلسلاتي على 700 نيوكليوتيد ، بينما تحتوي التسلسلات الكاملة على 1725 نيوكليوتيد) أود أن أعرف ما إذا كان بإمكاني إجراء تحليل جيني للسكان منها (مثل اختبار TAJIMA-D) وما شابه ذلك.


يعتمد الأمر كثيرًا على نوع التحليل الذي تريد إجراؤه. بالنسبة لـ Tajima's D ، كل ما ستحتاجه هو تسلسل نوكليوتيد واحد في عينة من الأفراد ، لذا نعم يمكنك ذلك. سواء جاء التسلسل من جين أو أي تسلسل آخر أم لا ، لا علاقة له بما إذا كان بإمكانك حساب Tajima's D (على الرغم من أن نوع التسلسل سيؤثر على الأرجح على D الناتج).


نقص التنوع في البحث الجيني مشكلة

رسم توضيحي لكيمبرلي كارني / خدمة فريد هاتش الإخبارية

عندما تم الانتهاء من مشروع الجينوم البشري في عام 2003 ، أشار إليه كبير الباحثين الدكتور فرانسيس كولينز ، رئيس المعاهد الوطنية للصحة الآن ، على أنه "المسودة الأولى لكتاب الإنسان عن الحياة".

منذ ذلك الحين ، اعترف كولينز ، والعلوم بشكل عام ، بأنه كان الخام المسودة الأولى لأن معظم المساهمات "كتبها" أشخاص من أصل أوروبي.

تم تسليط الضوء مرة أخرى هذا الأسبوع على نقص التنوع في أبحاث علم الوراثة - التي تمت دعوتها مؤخرًا في مجلات مثل Cell وتمت تغطيتها على برنامج PBS - من خلال تحليل شامل متعدد المراكز من قبل مجموعة من الباحثين ، بقيادة علماء الوراثة وعلماء الأوبئة والإحصائيين الحيويين في فريد هاتشينسون مركز ابحاث السرطان. تم نشر النتائج التي توصلوا إليها يوم الأربعاء في مجلة نيتشر.

قام الاتحاد ، المسمى PAGE (اختصارًا للعمارة السكانية باستخدام علم الجينوم وعلم الأوبئة) ، بتحليل بيانات ما يقرب من 50000 مشارك أمريكي من أصول غير أوروبية لتحديد ، من بين أمور أخرى ، ما إذا كان من الممكن تعميم نتائج مشروع الجينوم البشري عبر الأسلاف مجموعات.

الجواب المختصر: لا يستطيعون.

وجد هذا التحليل الجديد المزيد من الأدلة على أن الدراسات الجينومية واسعة النطاق - المستخدمة في كل شيء بدءًا من تطوير الأدوية إلى اكتشاف مخاطر إصابة الفرد بالأمراض - تحتاج إلى تضمين مجموعات سكانية متنوعة ومتعددة الأعراق لتمثيل مخاطر الأمراض المرتبطة بالوراثة بدقة في جميع السكان. إن عدم القيام بذلك أمر مضلل وخطير.

Fred Hutch & # 39s Dr. Ulrike & # 34Riki & # 34 Peters ، أحد كبار العلماء في مشروع PAGE. سلط المشروع البحثي متعدد المراكز طويل الأمد الضوء على نقص التنوع في البحث الجيني في ورقة جديدة. صورة ملف فريد هاتش

قال الدكتور أولريك "ريكي" بيترز ، المدير المساعد لقسم علوم الصحة العامة في فريد هاتش وكبير العلماء في مشروع PAGE. "نظهر التحيز ونثبت أنه يمكن تصحيح ذلك من خلال دراسة الأقليات غير الأوروبية."

قال الدكتور كريس كارلسون من The Hutch ، وهو مؤلف كبير آخر ، إن فريق PAGE كان يحاول أساسًا تحديد ما إذا كان من الممكن استقراء درجات المخاطر الجينية أو الجينية الحالية (درجة تستند إلى متغيرات المخاطر الجينية المستخدمة للتنبؤ بخطر الإصابة بالمرض) من الأشخاص من أصل أوروبي. بدقة للأقليات.

وقال: "إذا كنت ستحصل على الجيل التالي من الطب وتشتق درجات المخاطر متعددة الجينات ، فيجب أن تكون درجات المخاطر هذه دقيقة بنفس القدر بغض النظر عن الأصل الجيني للفرد". "وهم ليسوا كذلك.

& quot؛ تثبت دراستنا من خلال تحليل بيانات حقيقي واسع النطاق أن درجات المخاطر هذه أقل من أداء السكان غير الأوروبيين. هذا ما يجعل هذه الورقة مهمة ".

بيانات غير كاملة ... عن الجميع

اعتمد مشروع الجينوم البشري على التسلسل الجيني لحفنة من المتطوعين ، معظمهم من أصل أوروبي ، لذلك فمن المنطقي أن البيانات الأولية كانت محدودة. من وجهة نظر علمية ، فإنه يمثل مشكلة كبيرة - خاصة وأن دراسات الارتباط على مستوى الجينوم ، أو GWAS ، تستمر في جمع البيانات بشكل أساسي من نفس السكان بالضبط.

وفقًا لبحث موثق جيدًا في Nature وفي أماكن أخرى ، فإن حوالي 78 بالمائة من البيانات المستخدمة في GWAS تأتي من أشخاص من أصل أوروبي. لكن هذه المجموعة بالذات تشكل 16 في المائة فقط من سكان العالم.

نظرًا لأن جينومنا يتغير ويتطور باستمرار استجابة للإشارات البيئية والبيولوجية ، فهناك دائمًا تباين جيني من شخص لآخر ومن السكان إلى السكان. بعض المتغيرات الجينية غير مهمة تمامًا ، والبعض الآخر يمكن أن يكون له تأثير عميق على صحة الشخص (فكر في اضطرابات جين واحد ، أو اضطرابات مندلية مثل مرض هنتنغتون).

في كثير من الأحيان ، يمكن أن تؤدي التغييرات الطفيفة في مئات أو حتى آلاف الجينات إلى زيادة خطر - أو الحماية من - مرض معين. تعد دراسات GWAS ، التي تحدد الطفرات الجينية أو المتغيرات المرتبطة بالمرض ، أساسًا للتحقيقات في بيولوجيا السمات المعقدة وتطوير الأدوية وحتى الإرشادات السريرية.

ولكن إذا كانت البيانات الجينية المستخدمة في هذه الدراسات مقصورة على مجموعة سكانية واحدة - الأشخاص من أصل أوروبي - فإنها تفتقد مجموعة كبيرة من المتغيرات الجينية ، إما لأنها غائبة في الأشخاص من أصل أوروبي أو لأنها موجودة ، ولكن فقط في ترددات منخفضة.

كان الدكتور تشارلز كوبربيرج ، رئيس برنامج الإحصاء الحيوي في فريد هاتش ، مؤلفًا بارزًا آخر في الدراسة المنشورة حديثًا. صورة ملف فريد هاتش

وهذا يعني أن العلاجات والأدوية التي تم تطويرها على أساس تلك المتغيرات ستعمل على الأرجح بشكل أفضل مع الأشخاص الذين يتشاركون نفس الأصل. ودرجات المخاطر متعددة الجينات ، المستخدمة لحساب المخاطر الجينية لأمراض القلب والأوعية الدموية والسكري وفقر الدم المنجلي والسرطان وأمراض أخرى ، هي أقل قيمة - وأقل دقة - لشرائح كبيرة من السكان.

قال الدكتور تشارلز كوبربيرج ، رئيس برنامج الإحصاء الحيوي في Hutch و مؤلف كبير آخر. "لذا فإن التوقعات أكثر دقة بالنسبة للأوروبيين."

الأمر الأكثر إثارة للقلق: هذا التحيز أصبح الآن مستقرًا في النظام ويمكن أن يضر المزيد من الناس من خلال تفاقم التفاوتات القائمة بين الأمراض والرعاية الصحية.

قالت ستيفاني بين ، عالمة فريق هاتش ، والتي عملت أيضًا في الدراسة: "على الرغم من وجود بيولوجيا مشتركة ، إلا أن النماذج الحالية غير دقيقة". "وهم كذلك أكثر غير دقيق إذا لم تكن من أصل أوروبي. عليك أن تدرس الكل السكان لرؤية الأشياء ذات الصلة الكل السكان. "

استكمال الصفحة

تأسس اتحاد PAGE قبل عقد من الزمان وبتمويل من المعهد الوطني لبحوث الجينوم البشري التابع للمعاهد الوطنية للصحة ، ويجمع اتحاد PAGE مجموعات كبيرة من المشاركين في الدراسة لاستخراج نتائج عالية القوة فيما يتعلق بـ "الهندسة الوبائية" لدينا ، أي الأشخاص الأكثر عرضة للإصابة بأي مرض أو مشكلة صحية ، أو من يمكن حمايتهم منها ، بسبب تركيبتهم الجينية الفريدة.

استخدمت PAGE مجموعات من عدد قليل من الدراسات الكبيرة لهذا التحليل ، بما في ذلك مبادرة صحة المرأة ودراسة / دراسة صحة المجتمع من أصل لاتيني (HCHS / SOL) ومجموعة متعددة الأعراق مصدرها كاليفورنيا وهاواي (MEC) و BioMe ™ BioBank.

إجمالًا ، مثلت المجموعة 22،216 شخصًا من أصل إسباني / لاتيني ، 17299 أمريكيًا أفريقيًا 4680 آسيويًا 3940 من سكان هاواي الأصليين 652 أمريكيًا أصليًا و 1052 فردًا عرفوا بأنفسهم على أنهم آخرون.

قام فريق PAGE بتشغيل GWAS من 26 نمطًا ظاهريًا سلوكيًا وسريريًا منفصلاً ، أو سمات ، ضمن المشاركين البالغ عددهم 50000 متعدد الأعراق لمعرفة كيف أثر السلالة الجينية لكل شخص على كل منها. تضمنت السمات كل شيء من الطول إلى نسبة الخصر إلى الورك إلى مستوى الأنسولين الصائم إلى عدد خلايا الدم البيضاء إلى البروتين الدهني عالي الكثافة أو منخفض الكثافة (المعروف أيضًا باسم HDL و LDL) إلى استهلاك القهوة.

باستخدام أداة قاموا بإنشائها تُعرف باسم مصفوفة التنميط الجيني متعدد الأعراق (MEGA) ، تمكن الباحثون من اكتساب فهم بيولوجي أعمق للأساس الجيني للعديد من الأمراض المعقدة ، بما في ذلك مرض السكري والسكتة الدماغية والسمنة وأمراض القلب والأوعية الدموية. كما قاموا بإنشاء مخطط لتحليل الارتباطات الجينية في مجموعات سكانية متنوعة تمضي قدمًا وحددوا 27 ارتباطًا جديدًا لمتغير السمات.

قال بيترز: "كما توقعنا ، من خلال فحص المجموعات السكانية الممثلة تمثيلاً ناقصًا سابقًا ، وجدنا ارتباطات جديدة خاصة بالأصول ، مما يعزز فهمنا للبنية الجينية للسمات ويؤكد أهمية تضمين مجموعات سكانية متنوعة في هذه الدراسات".

فريد هاتش العالمة ستيفاني بين فريد هاتش صورة الملف

كيف تختلف الأمراض في السكان

وجد العلماء أحد هذه المتغيرات في جين HBB ، والذي يوفر تعليمات لصنع بيتا جلوبين ، وهو أحد مكونات بروتين الهيموجلوبين الأكبر. يُعرف HBB بدوره في فقر الدم المنجلي وقدرته على التأثير على أداء بعض فحوصات HbA1c المستخدمة لاختبار التحكم في الجلوكوز في مرض السكري.

اكتشف الباحثون المتغير في الهسبانكيا / اللاتينيين ، بينما تم الإبلاغ عنه قبل ذلك فقط في الأمريكيين من أصل أفريقي.

وكتبوا في ورقتهم البحثية أن هذا يعني أن إجراء الاختبارات على ذوي الأصول الأسبانية / اللاتينيين باستخدام هذا البديل قد يؤدي بالممارسين إلى الاعتقاد الخاطئ بأن المريض قد حقق السيطرة على الجلوكوز ، مما يزيد من خطر الإصابة بمضاعفات النوع الثاني من مرض السكري.

بروتين C التفاعلي أو CRP - علامة حيوية موجودة في الدم تستخدم للكشف عن الأمراض والحالات المرتبطة بالالتهابات وتشخيصها وعلاجها (مثل العدوى ، الذئبة ، التهاب المفاصل الروماتويدي ، إلخ) - كان مثالاً آخر يمكن أن تظهر فيه نتائج الاختبارات الشائعة منحرف في بعض السكان.

قال Bien ، عالم فريق Hutch: "أولئك الذين ينحدرون من أصول أفريقية هم أكثر عرضة لأن يحملوا متغيرًا جينيًا يخفض مستوى بروتين سي التفاعلي لديهم". "لذلك قد تكون مصابًا بالتهاب المفاصل الروماتويدي ، لكن مستويات بروتين سي التفاعلي لديك أقل من معايير التشخيص ، مما يعني أنه لن يتم وصف الدواء الذي تحتاجه. كما هو الحال مع HBA1c ، قد تعتقد أنه ليس لديك مرض أساسي. لكن في الواقع لديك متغير جيني يخفي أو يشوه هذا المرقم الحيوي المعين ".

بعبارة أخرى ، من المحتمل أن تضر دراسات GWAS غير المكتملة بشرائح كبيرة من السكان.

قال كوبربيرج: "يمكن للدراسات على مستوى الجينوم مع مجموعات سكانية متنوعة أن تساعد في تكافؤ الفرص في الممارسة السريرية وتوسيع نطاق وصول الطب الدقيق إلى الأفراد الذين لم يتم تضمينهم بخلاف ذلك".

قال فريد هاتش الدكتور كريس كارلسون ، مؤلف كبير آخر في الورقة الجديدة: صورة ملف فريد هاتش

أشار كارلسون إلى النتائج متعددة السمات كمثال رئيسي على أهمية البيانات الجينية الدقيقة.

وقال: "قد لا يكون التنبؤ الجيني لمستويات الكوليسترول أو الطول أمرًا بالغ الأهمية في العيادة ، لأنه يمكنك قياس هذه الصفات بسرعة وبتكلفة زهيدة". "لكن هذه السمات توفر نظرة ثاقبة حول مدى جودة أداء نماذج المخاطر الجينية للأمراض التي لا تحتوي حاليًا على مؤشرات حيوية جيدة ، بدءًا من أمراض المناعة الذاتية إلى السرطان."

تم اكتشاف معظم المتغيرات الجينية التي تم تقييمها في المشروع في الأوروبيين ، لذلك بدون مزيد من التقييم في غير الأوروبيين ، يؤدي استخدام هذه المتغيرات في نموذج جيني إلى تنبؤات أضعف لدى غير الأوروبيين.

قال كارلسون: "عبر 26 سمة ، في المتوسط ​​، كان حجم التأثير حوالي 58 بالمائة في الأمريكيين من أصل أفريقي". "لذا في المتوسط ​​، فأنت تتوقع دقة أقل في هذه الأقلية من السكان مقارنة بالأمريكيين الأوروبيين."

قال الباحثون إن هذا تحيز يحتاج إلى تصحيح ويمكن تصحيحه.

فكر في: الاستمرارية الجينية

كالعادة ، يقدم العلم منظورًا جيدًا.

قال بيترز: "في مجتمع متنوع حديث مثل الولايات المتحدة ، يعتبر الأصل الجيني سلسلة متصلة". "عليك أن تتبنى ذلك وتستخدمه للمساعدة في الكشف عن رؤى علمية جديدة."

ضمن هذه السلسلة المتواصلة ، كل واحد منا هو فرد فريد ، له مخاطر فردية خاصة بنا.

قال كارلسون: "هناك مكونات اجتماعية وجينية على حد سواء للتفاوتات الصحية بين الأقليات". "ولكن عندما يتعلق الأمر بعلم الوراثة حول كيفية تفسير Hba1c للمريض ، فالأمر لا يتعلق بما إذا كنت أمريكيًا من أصل أفريقي أو من أصل إسباني أو أوروبي. يتعلق الأمر بما إذا كنت حاملًا لفقر الدم المنجلي.

قال: "إذا كنا سنقوم بالطب الفردي ، فنحن بحاجة إلى معرفة الاختلاف الجيني المهم". "ونحن بحاجة إلى دراسة هذه العوامل الوراثية في جميع السكان."


مراجع

تشو ، ب. وآخرون. تفشي الالتهاب الرئوي المرتبط بفيروس كورونا جديد من أصل محتمل للخفافيش. طبيعة سجية https://doi.org/10.1038/s41586-020-2012-7 (2020).

Lu، R. et al. التوصيف الجينومي وعلم الأوبئة لفيروس كورونا الجديد 2019: الآثار المترتبة على أصول الفيروس وربط المستقبلات. لانسيت https://doi.org/10.1016/S0140-6736(20)30251-8 (2020).

هوفمان ، هـ وآخرون. ترتبط القابلية للإصابة بالعدوى التي يحركها بروتين فيروس السارس التاجي S بالتعبير عن الإنزيم المحول للأنجيوتنسين 2 ويمكن منع العدوى بواسطة مستقبلات قابلة للذوبان. بيوتشيم. بيوفيز. الدقة. كومون. 319, 1216–1221 (2004).

لي ، دبليو وآخرون. ترتبط بروتينات S الخاصة بفيروس كورونا البشري NL63 وفيروس كورونا المتلازمة التنفسية الحادة الوخيمة بالمناطق المتداخلة في ACE2. علم الفيروسات 367, 367–374 (2007).

لي ، دبليو وآخرون. المستقبلات والمحددات الفيروسية لتكيف السارس - التاجي مع الإنزيم المحول للأنجيوتنسين 2. EMBO J. 24, 1634–1643 (2005).

تشاو ، واي وآخرون. تنميط تعبير الحمض النووي الريبي أحادي الخلية لـ ACE2 ، المستقبل المفترض لـ Wuhan 2019-nCoV. bioRxiv. https://doi.org/10.1101/2020.01.26.919985 (2020).

روث ، سي وآخرون. انتقال عدوى 2019-nCoV من اتصال بدون أعراض في ألمانيا. إنجل. جيه ميد. https://doi.org/10.1056/NEJMc2001468 (2020).

اتحاد GTEx. التحليل التجريبي للتعبير الوراثي عن الأنسجة (GTEx): تنظيم الجينات المتعددة الأنسجة في البشر. علم 348, 648–660 (2015).

أوتون ، إيه وآخرون. مرجع عالمي للتنوع الجيني البشري. طبيعة سجية 526, 68–74 (2015).

تاليون ، د. وآخرون. تسلسل 53831 جينومًا متنوعًا من برنامج NHLBI TOPMed. bioRxiv https://doi.org/10.1101/563866 (2019).

تباين استخدام التبغ في التعبير الجيني لـ ACE2 ، مستقبل 2019-nCov. قم بالطباعة المسبقة على https://doi.org/10.20944/preprints202002.0051.v1 (2020).

إيماي وآخرون. يحمي الإنزيم المحول للأنجيوتنسين 2 من فشل الرئة الحاد الوخيم. طبيعة سجية 436, 112–116 (2005).


نتائج

ميندالنمط الظاهري متحولة

الأصلي ميند متحولة تم إنشاؤها بواسطة طفرات الأشعة السينية في معهدنا في الخمسينيات [13]. أبرز ما يميز ميند النباتات هي بلاستوكرون قصير ، أي معدل أسرع لبدء الأوراق. تمتلك المسوخ في المتوسط ​​أوراقًا أكثر بمرتين من نباتات الأنواع البرية نتيجة لظهور الأوراق بشكل أسرع (الشكل 1). علاوة على ذلك ، يتم تقليل أطوال القصبة الداخلية في المتحولة. على الرغم من العدد الأكبر من interode (ثمانية إلى تسعة في متحولة عكس أربعة إلى خمسة في النوع البري) ، ينخفض ​​ارتفاع النبات بحوالي الثلث في ظل الظروف الحقلية ، ولكن ليس في الدفيئة (الشكل 1 د). بصرف النظر عن التباعد ، يتغير شكل الأوراق أيضًا في الطفرة: الأوراق أضيق وأكثر انتصابًا مقارنة بالنوع البري. خصائص إضافية ميند عبارة عن عدد متزايد من الحراثة (الفروع الخضرية الناشئة عن الإنشائات الجانبية) والمسامير الأقصر (الشكل 1 ب ، الملف الإضافي 1: الشكل S1).

الخصائص المظهرية لـ ميند النباتات. (أ) المسوخ (على اليمين) لديها عدد أكبر بكثير من العقد مقارنة بالنوع البري (يسار) وتظهر عادة نمو شبه قزم. (ب) يتم تقليل طول الأذن في ظل ظروف الحقل (يسار: نوع بري ، يمين: متحولة). (ج) يكون تكوين الأوراق في مراحل النمو المبكرة أسرع في ميند نباتات (يمين) مقارنة بالنوع البري (يسار). (د) النباتات المتحولة (على اليمين) المزروعة في ظل ظروف الدفيئة لديها عدد أكبر من السلاسل الداخلية دون النمط الظاهري المتقزم. يتم عرض النوع البري إلى اليسار.

تعيين تردد أليل

اعتمدنا إستراتيجية مشابهة لطرق ShoreMap [5] و MutMap [8] التي تفحص التوزيع على مستوى الجينوم لتردد الأليل في مجموعات النمط الظاهري لـ F2 تم تطويرها عن طريق تجاوز متحولة إلى نمط وراثي من النوع البري (ملف إضافي 2: الشكل S2). ذرية صليب بين ميند نبات مع نبات من النوع البري من الصنف (cv.) تم تقليد Barke للحصول على F2 عدد سكانها 100 فرد. ال ميند الأليل المنفصل في هذه المجموعة كصفة متنحية أحادية المنشأ (19 طفرة ، 81 نباتًا من النوع البري ، χ 2 = 1.92 ، ص القيمة = 0.17). تم دمج الحمض النووي من 18 نباتًا متحورًا و 30 نباتًا من الأنواع البرية التي تم اختيارها عشوائيًا في مجموعتين ، والتي خضعت لالتقاط exome وتسلسل عالي الإنتاجية لاحقًا على Illumina HiSeq2000 ، مما أسفر عن 82 مليون و 70 مليون 2 × 100 زوج من القراءة للطفرة و برك من النوع البري ، على التوالي. تم تعيين القراءات على مجموعة بندقية الجينوم بالكامل (WGS) للسيرة الذاتية. تم اكتشاف Barke [23] وتعدد أشكال النوكليوتيدات المفردة (SNPs). كشف تصور ترددات الأليل في مواضع SNP على طول الخريطة الفيزيائية والجينية للشعير عن ذروة حادة واحدة على الذراع الطويلة للكروموسوم 5H ، حيث زاد تواتر الأليل الطافر إلى أكثر من 95٪ وانخفض إلى حوالي 30٪ في النوع البري حمامات (الشكل 2 أ). لاحظ أن النسبة بين عدد النباتات غير المتجانسة في ميند من المتوقع أن يكون موضع وعدد تلك المتماثلة اللواقح للأليل wildtype 2: 1 في الجزء الأكبر من نوع wildtype. تم تحويل SNPs المحددة في الفاصل الزمني من 80 إلى 110 سم في خريطة [21] إلى فحوصات علامة واحدة (ملف إضافي 3: الجدول S2). رسم الخرائط الجينية في F2 أكد السكان أن هذه العلامات مرتبطة ارتباطًا وثيقًا بـ ميند النمط الظاهري (الشكل 2 ب).

رسم الخرائط بالتسلسل. (أ) يتم عرض تردد الأليل البديل بالنسبة لمرجع بارك في مجموعتي الالتقاط على طول الخريطة الفيزيائية والوراثية المتكاملة للشعير [23]. (ب) تم تحويل عشرة SNPs من الفواصل الزمنية المستهدفة إلى علامات CAPS والتنميط الجيني على F بأكمله2 تعيين السكان. يشار إلى عدد المؤتلفات بين العلامات (المحور العلوي) ومواضع الواسمات في مجموعة WGS المثبتة وراثيًا [24] (المحور السفلي). تظهر contigs التسلسل الذي يحتوي على عمليات حذف مفترضة كبيرة (& gt150 bp) كمستطيلات رمادية اللون. (ج) قراءة عمق MND (MLOC_64838.2) في مجموعتي الالتقاط. تظهر مواقع exons اثنين من MND في WGS contig 49382 كمستطيلات خضراء. في الجزء السفلي ، يتم عرض عدد قراءات التسلسل لكل موضع أساسي لمجموعة متحولة (حمراء) وتجمع من النوع البري (أسود). نظرًا لوجود نبات واحد متغاير الزيجوت تم تضمينه بشكل خاطئ في الكتلة الطافرة ، فإن MND موجود أيضًا في تغطية قراءة منخفضة في مجموعة متحولة. لاحظ أن أعلى ذروة تغطية تقع في الإنترون القصير (130 نقطة أساس) من MND نظرًا لعدد أكبر من مجسات الالتقاط الزائدة في نهايتي exons.

يحدد تحليل عمق القراءة الجين المحتمل المحتمل

نظرًا لأن الطفرات في الأشعة السينية تؤدي عادةً إلى عمليات حذف كبيرة [26] ، فقد استفسرنا عن بيانات التسلسل الخاصة بنا لأهداف التقاط exome التي تغطيها قراءات التسلسل في تجمع النوع البري ، ولكن ليس في مجموعة الطافرات. كما يتم إعطاء نماذج الجينات وأهداف التقاط exome كتنسيق على تجميع WGS للسيرة الذاتية. Morex ، تم تعيين القراءات مرة أخرى على هذا التجميع وتم حساب تغطية القراءة في كل موضع أساسي وتم حساب متوسطها عبر فترات زمنية مغطاة متجاورة تتوافق مع أهداف الالتقاط. كشفت فحوصات Marker أننا قمنا بتضمين نبات متغاير الزيجوت في الكتلة الطافرة ، وهو ما أكده تحليل النمط الظاهري لـ F المقابل.3 أسرة. وبالتالي ، توقعنا عددًا صغيرًا من قراءات التسلسل في ميند الموضع في البركة الطافرة الناشئة عن الزيجوت الوحيد المتغاير. على نطاق الجينوم ، حددنا 435 فترة زمنية (contigs تسلسل بندقية الجينوم الكامل الذي يحمل أهداف التقاط exome ذات الصلة) والتي كانت على الأقل 150 نقطة أساس واستوفيت معاييرنا المريحة إلى حد ما للحذف المحتمل (ملف إضافي 4: الجدول S3). من بين هذه الأهداف ، تم تعيين 18 هدفًا بواسطة POPSEQ [24] إلى الفاصل الزمني المحدد على نطاق واسع (5H ، 80 سم - 110 سم) ، تم تعيين 278 إلى مناطق أخرى من الجينوم و 139 لم يتم تعيينها. من بين جميع الفواصل الزمنية البالغ عددها 435 ، تم وضع 48 على contigs لتجميع WGS للسيرة الذاتية. Morex [23] مع جينات عالية الثقة متوقعة. كل هذه الجينات باستثناء اثنين لها تعليق توضيحي وظيفي. من بين contigs التي تحمل أهداف الالتقاط المحذوفة افتراضيًا والمترجمة إلى الفاصل الزمني المستهدف ، حمل ستة جينات عالية الثقة (الشكل 2 ب ، الجدول 1). واحدة من هذه ، تم تثبيت contig 49382 عند 96 سم في خريطة POPSEQ [24] وبالتالي فهي الأقرب إلى ذروة تردد الأليل (97 ٪) في الكتلة المتحولة عند 97 سم (ملف إضافي 5: الجدول S1). علاوة على ذلك ، احتوت contig 49382 منطقتين محذوفتين افتراضيًا ، من بينها أطول فترة تم اكتشافها. لاحظ أن الحذف الكبير الفردي يفضل أن يظهر على شكل عدة فواصل زمنية محذوفة أصغر لأن التقاط exome يستهدف فقط exons المنفصلة ، ولا يتم تمثيل الإنترونات في المتحولة ولا في النوع البري. تتداخل المناطق المحذوفة في contig 49382 مع اثنين من exons للجين عالي الثقة MLOC_64838.2 المشروح باسم "Cytochrome P450" (الشكل 2 ج). كان هذا الجين هو الجين الوحيد الذي تم التنبؤ به في contig 49382. وقد حدد بحث بلاست لتسلسل البروتين ضد جينومات الأرز والأرابيدوبسيس أعضاء من عائلة CYP78A من إنزيمات السيتوكروم P450. يُعرف أحد هذه الجينات ، وهو الأرز CYP78A11 ، باسم PLASTOCHRON1 (PLA1) [27]. كالأرز جيش التحرير الشعبى الصينى النمط الظاهري (بدء سريع للأوراق ، انخفاض حجم الورقة ، وارتفاع النبات) يشبه الشعير إلى حد كبير ميند، اعتبرنا MLOC_64838.2 مرشحًا واعدًا.

يؤكد تحليل المسوخ أن MLOC_64838.2 هو HvMND

نجح تضخيم PCR للمرشح في الأصناف Morex و Barke ، لكنه فشل في MHOR474 المتحولة. على النقيض من ذلك ، تمكنا من تضخيم الجينات التي كان من المتوقع أن تكون قريبة من MLOC_64838.2 من خلال العلاقة الخطية مع العشب النموذجي ديستاتشيون Brachypodium[28] وتم ترسيخها وراثيًا في فترة رسم الخرائط. حدد فحص مجموعة TILLING (استهداف الآفات المحلية في الجينوم) [18] 20 متحولة EMS مترادفة و 17 متحولة مع تغييرات غير مترادفة. تم اختيار متحولة واحدة تحمل SNP (G261A) أدت إلى كودون توقف سابق لأوانه في حالة متغايرة الزيجوت (الجدول 2) للتحقق من التأثيرات المظهرية. من بين نسل هذا النبات ، كان هناك 15 نباتًا متغاير الزيجوت ، واثنان متماثلان للأليل من النوع البري ، وخمسة متماثلة اللواقح للأليل الطافر. أظهرت جميع النباتات الطافرة متماثلة اللواقح (وهذه فقط) عددًا متزايدًا بشكل ملحوظ من السلاسل الداخلية ، وهي خاصية ميند النمط الظاهري (الشكل 3 أ ، ب). علاوة على ذلك ، تم تمييز إدخال سطرين بومان شبه متساوي المنشأ على أنهما ميند تم تعيين (BW520 و BW522) على ذراع الكروموسوم 5HL سابقًا [17]. كشف تسلسل Sanger لـ MLOC_64838.2 في BW520 عن SNP واحد غير مترادف في تسلسل الترميز. لا يمكن تضخيم الجين في BW522 ، بينما كانت جميع الجينات المخلوية موجودة (الجدول 3). لقد طلبنا 37 عملية إدخال متحولة من بنك نورديك جين (NordGen) والتي تم وصفها على أنها ميند. كشفت إعادة ترتيب مرشحنا في هذه السطور عن أربعة تغييرات في الأحماض الأمينية ، و 16 رمز توقف سابق لأوانه ، وتعطل واحد في موقع لصق ، وحذف واحد بمقدار 107 نقطة أساس في exon الثاني ، وستة عمليات حذف كاملة (ملف إضافي 6: الجدول S4). عندما نمت في الدفيئة ، أظهرت جميع المسوخات ميند النمط الظاهري (الشكل 3 ج-هـ). لقد اعتبرنا هذا العدد الكبير من الآفات الجزيئية الموجودة في عدة مجموعات متحولة مستقلة كدليل قاطع على أن فقدان وظيفة MLOC_64838.2 يكمن وراء ميند النمط الظاهري ويسمى هذا الجين باسم HvMND.

ميند المسوخ. TILLING المسوخ (ب) باستخدام كودون الإيقاف المبكر داخل جينات MND ، يُظهر بدء ورقة أسرع بكثير مقارنة بالنوع البري (أ). ميند طفرات في نفس الخلفية الجينية (السيرة الذاتية كريستينا) مع تغيير حمض أميني واحد (ج)، حذف كامل للجينات (د)، وكودون توقف سابق لأوانه (هـ). نوع الطفرة لا يؤثر على شدة ميند النمط الظاهري تحت ظروف الاحتباس الحراري. يتم عرض مكانة النمو الكاملة (على اليسار) والحرث الفردي المعزول (على اليمين) لكل نبات في (ج ، د ، هـ).

MND هو عضو في فصيلة CYP78A من إنزيمات السيتوكروم P450

MND هو عضو في عائلة CYP78A من إنزيمات السيتوكروم P450. وجدنا أربعة جينات CYP78A في مجموعة بندقية الجينوم الكاملة للشعير (الشكل 4). رغم ذلك ميند يقلد النمط الظاهري جيش التحرير الشعبى الصينى، MND ليس أخصائي تقويم لـ PLA1. يقع أخصائي تقويم MND في الأرز ، Os09g09g3594 ، في منطقة تركيبية على كروموسوم الأرز 9 [28] ويظهر هوية 75٪ مع MND على مستوى البروتين. لا يحتوي PLA1 على أخصائي تقويم واضح في الشعير (الشكل 4) ، ولكنه يحتوي على ما يقرب من 54 ٪ من هوية تسلسل الأحماض الأمينية لـ MND واثنين من الجينات CYP78A الأخرى ، MLOC_68312.1 و MLOC_68718.1. نظرًا لأن PLA1 لديه أطباء تقويم في الذرة والأرابيدوبسيس (الشكل 3) ، فقد يكون أحد أطباء تقويم العظام القديم من PLA1 قد فقد في نعمة النسب بعد انقسامه عن الأرز والذرة. تمشيا مع هذه الفرضية ، لم نجد أخصائي تقويم PLA1 في الشعير ، أسلاف القمح ، T. urartu و الزهره. توشي، و B. ديستاتشيون.

التحليل الوراثي لجينات CYP78A. تم إنشاء شجرة سلالة مكونة من 38 تسلسلًا بروتينيًا لـ CYP78A من أنواع مختلفة باستخدام MEGA5. يتم إعطاء أسماء الأنواع المختصرة قبل معرفات الجينات: Aegilops tauschii (AET) ، A. thaliana (آث) ، B. ديستاتشيون (دينار بحريني) ، فولغار (Hv) ، أرز أسيوي (نظام التشغيل) ، T. urartu (Tu) ، زيا ميس (Zm). يتم إعطاء أسماء الجينات بعد المعرفات إذا كانت متوفرة. الجين CYP75B1 TT7 من A. thaliana تم استخدامه كمجموعة خارجية. تم تطبيق طريقة bootstrap لاختبار الدلالة الإحصائية للفروع. يتم عرض النسبة المئوية للأشجار المكررة التي تتجمع فيها الأصناف المرتبطة معًا في اختبار التمهيد (1000 نسخة متكررة) بجوار الفروع. تم انهيار الفروع مع دعم التمهيد غير الكافي (& lt50٪) للحصول على شجرة إجماع.

بحثنا عن ملف تعريف التعبير HvMND وجينات الشعير الأخرى من عائلة CYP78A في الأنسجة الثمانية التي فحصها الاتحاد الدولي لتسلسل جينوم الشعير [23]. تم العثور على التعبير عن الجينات CYP78A في جميع الأنسجة ، مع وجود جينات مختلفة من الأسرة أكثر وفرة في الأنسجة المختلفة (الشكل 5). من بين الجينات الأربعة CYP78A ، HvMND كان الأكثر انتشارًا في كل مكان ، حيث تم التعبير عنه في جميع العينات ، على الرغم من أنه تم اكتشاف تعبير ضعيف فقط في الحبوب النامية بعد 15 يومًا من التخليق.

التعبير عن MND وثلاثة آخرين CYP78A جينات الشعير. تُعطى وفرة النسخ على هيئة شظايا لكل كيلو قاعدة من exon لكل مليون قراءة تم تعيينها (FPKM) عبر ثمانية أنسجة مختلفة أو مراحل نمو مختلفة. تم اعتبار الجين معبرًا عنه إذا كانت قيمته FPKM أعلى من عتبة 0.4 [23] (مميزة بخط رمادي). جميع البيانات مأخوذة من [23].

خريطة مادية لـ ميندالمكان

قد تكون هناك مخاوف بشأن التطبيق العام لاستراتيجيتنا لمشاريع الاستنساخ الأخرى القائمة على الخرائط. تم تسهيل عزل MND من خلال الحقائق التي مفادها أن PLA1 المتماثل في أرز الأنواع النموذجية يتميز جيدًا وأن النمط الظاهري لـ PLA1 بالضربة القاضية المسوخ مرايا ميند. علاوة على ذلك ، إذا لم يتم تمثيل MND في مساحة هدف التقاط exome ، فلا يمكن تحديد مرشح واضح. في هذه الحالة ، تم تأكيد توزيع تردد الأليل عن طريق التعيين الجيني للعلامات التي تم تطويرها من في السيليكو كانت المتغيرات ستحدد فقط الفترة الزمنية المستهدفة لإخضاعها لمزيد من التدقيق. كما تم اقتراحه سابقًا ، يجب أن تتجنب الخريطة الفيزيائية للشعير على مستوى الجينوم بشكل أساسي الحاجة إلى إنشاء خرائط مادية محلية عن طريق الاستنساخ المستند إلى الخرائط لتحديد الجينات المرشحة [29]. يمكن استخدام بيانات تسلسل مسح BAC المرتبطة بالخريطة المادية للشعير [23] لربط متواليات الواسمات أو الجينات المرشحة مع contigs الفيزيائية ، والتي يمكن بعد ذلك ترتيب مسارات التبليط الدنيا [29]. وبالتالي ، كان نيتنا اختبار ما إذا كانت المعلومات التي قدمتها تجربة التسلسل المنفصل المجمعة كافية لتحديد اتصال فعلي للخريطة الفيزيائية على مستوى الجينوم لتحديد منطقة الموضع المستهدف وتحديد الجين المرشح.

وضعنا هذه الاستراتيجية موضع التنفيذ لاسترداد الخريطة المادية حول موقع MND (الشكل 6). كانت الخطوات الرئيسية نحو هذا الهدف هي تحديد contigs BAC للخريطة الفيزيائية لجينوم الشعير التي تؤوي MND بالإضافة إلى العلامات المرافقة لها ، وتسلسل مسارات التبليط الدنيا (MTPs) لهذه contigs وإجراء تحليل تسلسل تكاملي للتنبؤ بنماذج الجينات على BAC تجميعات التسلسل. أولاً ، حددنا من خلال عمليات البحث بلاست موارد التسلسل المدمجة في الخريطة المادية للشعير [23] كونتينا ببصمات الأصابع ، contig_45097 و contig_46058 ، والتي تضم اثنين من الجينات التي يوجد بها أخصائيو تقويم العظام. براشيبوديوم كانت أقرب جيران لتقويم العظام في MND ، وكذلك علامات الفصل والمحاطة البعيدة M4 و M5. وبالمثل ، تم العثور على contig_1020 لإيواء العلامة M3 ، التي تحيط بها MND في الاتجاه القريب. لم نعثر على تسلسلات BAC ذات تشابه كبير مع MND. هذا ليس غير متوقع حيث أن 1.1 جيجا بايت فقط من معلومات التسلسل الجينومي (حوالي 20٪ من جينوم الشعير) يتم توفيرها مباشرة بواسطة الخريطة المادية للشعير (6278 استنساخ متسلسل BAC ، متواليات نهاية BAC) [23]. ومع ذلك ، تم تحديد BAC الذي يؤوي MND والمخصص لبصمات الأصابع contig_45097 من خلال فحص مكتبة BAC.

خريطة مادية لـ ميند المكان. (أ) تحمل بصمات الأصابع (FP) علامات مرافقة ومشتركة للفصل (مثلثات) بالإضافة إلى جين MND (الماس). الخريطة المادية ليست متجاورة بين contigs 1020 و 45097. يوجد شريط مقياس لجميع اللوحات في الأعلى. (ب) BACs المتسلسلة. تم وضع BACs وفقًا لإحداثيات FPC الخاصة بهم [23]. (ج) نماذج الجينات وتقويم العظام براشيبوديوم الجينات. المسارات (من أعلى إلى أسفل) تحدد مواضع (1) نماذج الجينات الموجودة في كليهما من جديد تنبؤات مع نماذج جينات أوغسطس و IBSC (جينات IBSC الخضراء - عالية الثقة (HC) ، جينات IBSC الزرقاء - الثقة المنخفضة (LC)) (2) نماذج الجينات التي تنبأ بها أوغسطس فقط (3) نماذج الجينات التي تنبأ بها IBSC (أخضر - جينات HC زرقاء - جينات LC) (4) متعامدة براشيبوديوم الجينات ، يتم إعطاء آخر أربعة أرقام فقط من معرف الجين Bradi4g3xxxx. (د) تم اكتشاف SNPs عن طريق تسلسل exome والمثبت في تسلسل BAC بخطوط عمودية.

بعد ذلك ، قمنا بتجميع MTPs لهذه contigs الثلاثة (الشكل 6 أ) من خلال تسلسل 38 BACs (الشكل 6 ب ، الملف الإضافي 7: الجدول S5) على Illumina HiSeq2000. تم تجميع BACs الفردية لجودة "المرحلة 1" ، أي تسلسلات كونتيج غير مرتبة. أكدت عمليات البحث الشاملة ضد الكل لـ BLAST لتجميعات BAC اتصال contigs 46058 و 45097 بالإضافة إلى التداخل بينهما. لم يتداخل Contig_1020 مع أي منهما. تم وضع العلامات M4 و M5 على سقالة متسلسلة متجاورة ، مما مكننا من تقدير نسبة تقريبية بين المسافة المادية والوراثية في موقع MND بحوالي 740 كيلو بايت لكل سم.

في الخطوة التالية ، تم توقع نماذج الجينات (الشكل 6 ج) على تكرار تجميعات BAC المقنعة باستخدام ملف البداية ومن خلال محاذاة النماذج الجينية المحددة في مجموعة Morex WGS [23]. بشكل عام ، تم تحديد 98 نموذجًا جينيًا غير مكرر على تسلسل BAC. تم العثور على خمسة وعشرين جينًا بكلتا الطريقتين ، تم توقع 35 جينًا فقط البداية ومن المحتمل أن تمثل الجينات الخادعة. تم تضمين 38 جينًا فقط في شرح IBSC ، وتم تصنيف الغالبية (23 جينًا) منها على أنها نسخ منخفضة الثقة ، وهي أيضًا جينات خادعة أو أجزاء جينية مفترضة. كان ترتيب الجينات على علاقة خطية إلى حد كبير براشيبوديوم مع بعض عمليات إعادة الترتيب الطفيفة (الشكل 6 ج). مكننا Synteny من توجيه contig_1020 بالنسبة إلى contigs الآخرين.

أخيرًا ، حاولنا تقدير حجم الفجوة المتبقية بين contigs 1020 و 45097 التي تم بصمات الأصابع وإيجاد BACs الإضافية التي قد تسدها. كـ 10 براشيبوديوم الجينات بين Bradi4g 35770 و Bradi4g35860 مفقودة ، والفجوة بين contigs 1020 و 45097 قد يصل حجمها إلى عدة مئات من الكيلوبات ، أو الفجوة صغيرة وقد تمثل منطقة تفتقر إلى العلاقة الخطية بين الشعير و براشيبوديوم. لقد ربطنا كونتيج WGS الذي يحمل أخصائيو تقويم الشعير لـ "المفقودين" براشيبوديوم الجينات لإنهاء تسلسل BACs التي كانت جزءًا من اثنين من contigs المادي القصير (45219 و 45903) بأحجام 227 و 236 كيلو بايت (الجدول 4). تحمل هذه contigs تقويمات Bradi4g35840 و Bradi4g35800 ، مما يدعم العلاقة الخطية الشاملة بشكل أكبر مع براشيبوديوم في هذه المنطقة الجينومية. علاوة على ذلك ، تسلسل نهاية BAC واحد (HF198106) يتعلق بـ contig_45219 متطابق مع هوية عالية (هوية 99.9٪ أكثر من 755 نقطة أساس) إلى متتابعين BAC من contigs_45097 ، مما يشير إلى أن هذين التلامسين FP قد يتداخلان.

باختصار ، وفقًا للقرار الجيني الذي توفره 100 نبات F2 ، لم نتمكن من الحصول في خطوة واحدة على سقالة تسلسل فيزيائي واحد لاستنساخ BAC المتداخلة من MND الموضع بين علامتي مرافقة الأقرب. ومع ذلك ، قد يتم إغلاق الفجوة المتبقية عن طريق تسلسل MTP لاثنين من contigs FP الإضافيين المحددين بناءً على معلومات التخليق المحفوظة إلى Brachypodium. علاوة على ذلك ، فإن زيادة الدقة الجينية بشكل كبير إلى عدة آلاف من الانقسام الاختزالي ، كما هو مطلوب غالبًا في الشعير ، قد يسمح بحل إعادة التركيب بين العلامة M4 و MND الجين ، والذي من شأنه أن يؤدي إلى الهبوط بعلامات مرافقة على سقالة كونتيج واحدة من BAC توفرها الخريطة المادية للشعير. وبالتالي ، على الرغم من الموارد الجينومية المتقدمة المتاحة الآن للشعير ، قد لا تزال هناك حاجة لعملية تكرارية تتضمن أكثر من جولة واحدة من تحليل تسلسل وتداخل MTP للحصول على خريطة مادية متجاورة لموقع مرشح.


كيف يمكن لعلم الجينوم الميكروبي أن يعلم البيئة المجتمعية؟

السكان هم وحدات أساسية في علم البيئة والتطور ، ولكن هل يمكننا تحديدها للبكتيريا والعتائق بطريقة ذات مغزى بيولوجي؟ هنا ، نراجع سبب صعوبة التعرف على التركيب السكاني في الميكروبات وكيف تسمح لنا التطورات الحديثة في قياس تدفق الجينات المعاصر بتحديد المجموعات السكانية المحددة بوضوح بين مجموعات الجينومات وثيقة الصلة. يمكن أن تنشأ مثل هذه البنية من تدفق الجينات التفضيلي الناجم عن التعايش والتشابه الجيني ، وتحديد السكان على أساس الآليات البيولوجية. لقد أظهرنا أن وحدات تدفق الجينات هذه معزولة وراثيًا بشكل كافٍ لانتشار تكيفات محددة ، مما يجعلها أيضًا وحدات بيئية تتكيف بشكل مختلف مقارنة بأقرب أقربائها. نناقش الآثار المترتبة على هذه الملاحظات لقياس التنوع البكتيري والأثري في البيئة. نظهر أن الوحدات التصنيفية التشغيلية المحددة بواسطة تسلسل الجينات 16S rRNA لها دقة رديئة بشكل محزن بالنسبة للمجموعات السكانية المحددة بيئيًا وتقترح مجموعات أحادية النواة من جينات بروتين الريبوسوم المتطابقة تقريبًا كإجراء بديل لرسم الخرائط السكانية في الدراسات البيئية المجتمعية التي تستخدم الميتاجينوميات. هذه الأساليب القائمة على السكان لديها القدرة على توفير الوضوح المطلوب بشدة في تفسير التنوع الميكروبي الهائل في الميكروبيوم البشري والبيئي.

هذه المقالة جزء من موضوع موضوع "التحديات المفاهيمية في بيئة المجتمع الميكروبي".

1 المقدمة

خذ أي كتاب علم أحياء تمهيدي وستجد على الأرجح التطور مُعرَّفًا على أنه تغيير في التركيب الجيني للسكان. نظرًا لتعريفها كممثلين متعايشين محليًا للأنواع ، فإن المجموعات السكانية ، في الممارسة العملية ، هي أيضًا وحدات التنوع التي يتم استخدامها عندما نرغب في قياس تنوع الأنواع لتقييم التفاعلات البيئية بالإضافة إلى استقرار النظام البيئي ومرونته [1]. ومع ذلك ، بالنسبة للميكروبات ، كان من الصعب تحديد المجموعات السكانية [2] ، ونحن نستخدم وحدات عشوائية من التنوع لقياس التركيب الجيني للمجتمعات [3]. ترجع هذه الصعوبة في تحديد السكان ، بالطبع ، إلى غياب مفهوم الأنواع ذات المعنى البيولوجي للبكتيريا والعتائق [3-6]. بدون مجموعات سكانية محددة بوضوح ، يصعب الإجابة على العديد من الأسئلة الأساسية في البيئة المجتمعية. على سبيل المثال ، هل تؤدي الاضطرابات إلى تغييرات في التركيب الوراثي داخل العشائر أو إلى دوران الأنواع؟ يُعد التمييز بين هذه الاحتمالات سؤالًا ذا مغزى لأن التحولات في التركيب الوراثي داخل مجموعة ما قد تكون أقل إزعاجًا للشبكات البيئية من التغييرات بالجملة في تكوين الأنواع. في الواقع ، يقع هذا السؤال في صميم فهم ديناميكيات المجتمعات الميكروبية الرئيسية ، بما في ذلك الميكروبيوم البشري.

وبالتالي ، فإن تحديد المجموعات البكتيرية والأثرية ، ومن خلال الأنواع الممتدة ، هو مسعى مهم لبيئة المجتمع ، ولكن هل يمكننا القيام بذلك؟ هل التنوع الميكروبي منظم في وحدات طبيعية يمكننا أن ننسب إليها خصائص ذات مغزى بيولوجي؟ على وجه التحديد ، هل تنظم العمليات التطورية الأساسية الأنماط الجينية المتعايشة في وحدات يمكن من خلالها أن تنتشر التكيفات على وجه التحديد ، مما يؤدي إلى ظهور وحدات بيئية ذات ديناميكيات مختلفة بشكل واضح؟ إذا تمكنا من تحديد المجموعات الميكروبية بهذه الطريقة ، فقد نتمكن من تطبيق النظرية التطورية والبيئية الغنية التي تم تطويرها للحيوانات ومجموعات النباتات [7،8] ، إذا لم يكن الأمر كذلك ، فقد نحتاج إلى نظرية ومقاربات مختلفة اختلافًا جوهريًا [2] .

هنا ، نستكشف مسألة ما إذا كانت البكتيريا منظمة في مجموعات جينية محددة بوضوح ومختلفة بيئيًا. نجادل أنه على الرغم من أن إعادة التركيب البكتيرية والأثرية ، سواء المتجانسة أو غير المتجانسة ، أحادية الاتجاه وغير متجانسة ، فإن البنية البيئية والاختيار لديها القدرة على هيكلة تدفق الجينات بشكل كافٍ لظهور الوحدات المتمايزة بيئيًا. نناقش بعد ذلك سبب بقاء التعرف على مثل هذه الوحدات أمرًا صعبًا للغاية ونوضح أنه من خلال تقدير تدفق الجينات الحديثة جدًا فقط ، يتم بالفعل استرداد الوحدات المتطابقة لتدفق الجينات والبيئة.على الرغم من أن هناك حاجة إلى العديد من الأمثلة الأخرى ، فقد تكون هذه الوحدات هي المكافئ البكتيري والأثرى للمجموعات السكانية وقد يساهم تحديدها في نهاية المطاف في حل مشكلة الأنواع الميكروبية. نختتم برسم الآثار المترتبة على قياس التنوع الهادف بيولوجيًا في البيئة.

2. هل يجب أن نتوقع العثور على مجموعات محددة بوضوح بين البكتيريا والعتائق؟

على الرغم من أن تدفق الجينات يحتمل أن يكون مختلطًا بمعنى أن أي ميكروب يمكنه ، من حيث المبدأ ، مشاركة الجينات مع أي جينات أخرى [٩.١٠] ، إلا أنه يحتاج فقط إلى هيكلة كافية للسماح بالتكيفات التفضيلية بالانتشار من أجل السكان كوحدات بيئية محلية تظهر [11 ، 12]. ضع في اعتبارك أن السكان ، الذين يشغلون موطنًا محددًا ، يتكونون من أفراد يتعرضون لضغوط انتقائية مماثلة لأنهم يتعايشون ويقومون بوظائف مماثلة (الشكل 1). قد تكون هذه الموائل جزيئات عضوية صغيرة في التربة أو البيئات المائية ، أو أكثر من المسطحات المائية ذات الخصائص الفيزيائية والكيميائية المحددة [13-15]. ومع ذلك ، فإن المفتاح هو أن الموائل دائمًا ما تكون غير مكتملة وسريعة الزوال ، وأنها تسمح لمجموعة فرعية من السكان داخل المجتمع بزيادة الوفرة من خلال النمو التفضيلي [13 ، 16 - 18]. نتيجة لذلك ، يكون لدى السكان النشطين احتمال أكبر لمشاركة المواد الجينية لأن معدلات إعادة التركيب المتماثل تنخفض بشكل كبير مع اختلاف التسلسل [19،20] وتضمن جمعيات الموائل الدقيقة التفضيلية معدلات لقاء أعلى (الشكل 1).

الشكل 1. يتشكل حجم تدفق الجينات بين المجموعات الميكروبية في الغالب من خلال التشابه الجيني والتداخل البيئي للسلالات الفردية التي تشكل تلك المجموعات السكانية. في حين أن كفاءة إعادة التركيب المتماثل تتناقص بشكل كبير مع اختلاف التسلسل ، تزداد احتمالية النقل مع زيادة الاتصال الجسدي بين السلالات التي تشغل منافذ فيزيائية مماثلة. (نسخة ملونة على الإنترنت.)

هذا اللقاء المتزايد وإعادة التركيب للأنماط الجينية المتنامية بنشاط له عواقب مهمة في خلق التماسك البيئي والحفاظ عليه [12]. إذا نشأ تكيف داخل مجموعة سكانية ، فسوف ينتشر بسهولة أكبر داخل السكان ، بسبب مزيج من تدفق الجينات التفضيلي وزيادة اللياقة في الأنماط الجينية التي تحمل التكيف [11]. بعبارة أخرى ، اعتمادًا على التوازن بين قوة الانتقاء ومعدل إعادة التركيب ، قد ينتشر التكيف عبر السكان عن طريق مسح انتقائي [12 ، 21]. إذا كان التكيف مفيدًا لمجموعات سكانية أخرى تتعايش مع بعضها البعض ، فإن ميزة اللياقة التي يتمتع بها لمجموعة سكانية معينة تكون قصيرة العمر لأن نقل الجينات الأفقي من المحتمل أن يجعلها متاحة لمجموعات سكانية أخرى [22]. ومع ذلك ، يمكن أن يكون السيناريو مختلفًا تمامًا إذا ارتبطت المقايضات بنقل التكيف ، مما يعني أنه قد لا يعمل بشكل جيد في خلفية جينومية أو بيئية مختلفة [12 ، 23 ، 24]. إذا كانت هذه هي الحالة ، فقد يظل التكيف متعلقًا بالسكان أو الأنواع لفترة أطول ويفرض التمايز البيئي. يمكن للمقايضات أيضًا أن تبدأ عملية الانتواع إذا كانت الأنماط الجينية التي تحمل التكيف أكثر ملاءمة في موطن جديد ولكن بدرجة أقل في موطن الأجداد [12 ، 23]. قد يؤدي هذا التأثير إلى الفصل المادي وبالتالي حاجز تدفق الجينات بين السكان الناشئين [12،25].

غالبًا ما يصعب تحديد المقايضات التي تمت مناقشتها أعلاه لأنها تتطلب فحص مجموعات سكانية تم تحديدها مؤخرًا. من بين الأنواع الأكثر تباينًا ، تراكمت العديد من التغييرات الجينية وفُقدت عادةً لتحديد السمة المرتبطة بالمقايضة. أحد الأمثلة الواضحة يأتي من مجموعات بكتيرية تم تحديدها مؤخرًا في المحيط [26]. حدد نهج الجينوم المقارن مجموعتين من السكان من الضمة الحلقية التي تم توزيعها بشكل تفاضلي في عينات المحيطات ، أحدها مرتبط بجزيئات عضوية والآخر مرتبط بالعيش الحر. احتوت كلتا المجموعتين على مناطق الجينوم التي تميزها ، بما في ذلك المناطق التي تحتوي على تنوع نيوكليوتيد أقل بكثير ، مما يشير إلى اكتساح أخير لأليل معين ، بالإضافة إلى المناطق التي أظهرت وجود الجين التفاضلي كما هو متوقع من الإضافات أو الخسائر الخاصة بالسكان الحديثة. ارتبطت بعض هذه الأليلات والجينات المتمايزة بشكل واضح بتكوين الأغشية الحيوية والتعلق بها ، مما أدى إلى فرضية أن القدرة على الارتباط بالجسيمات إما ضاعت أو اكتسبت في أحد المجموعات السكانية [26].

تم تأكيد فرضية التكيف التفاضلي هذه القائمة على الاختلافات الجينية الملحوظة لاحقًا من خلال الملاحظات السلوكية لممثلي المجموعتين التي اقترحت مقايضة التنافس والتشتت [27]. تم استخدام الموائع الدقيقة لإنشاء منظر بيئي يشبه الظروف في المحيط حيث تمثل الجزيئات الصغيرة موطنًا يمكن للبكتيريا أن تلتصق به وتؤدي إلى تحلل المادة العضوية الصلبة [١٣ ، ١٦]. تخلق عملية التحلل نفسها موطنًا سريع الزوال من بقع من المواد العضوية الذائبة لأن البكتيريا المرتبطة بها تعمل على تحلل البوليمرات العضوية خارج الخلية أسرع مما يمكنها استيراد منتجات التكسير إلى الخلية [16]. تتشكل سحابة من أحادي أو قليل القسيمات حول الجسيم بالانتشار ، ويمكن للبكتيريا المتحركة أن تستهلك هذه المادة [28]. عندما تم محاكاة مثل هذه الظروف في نظام ميكروفلويديك ، ظهر أن المجموعتين تتكيفان بشكل مختلف مع الموارد الصلبة والمذابة ، على التوالي. بينما استجاب أحدهما بالالتصاق بالجزيئات والنمو في الأغشية الحيوية ، كان الآخر قادرًا على التشتت الفعال بين الجسيمات ، واكتشافها بسرعة والسباحة نحو جسيمات جديدة [27]. يشير هذا إلى أن المجموعة الأخيرة تتكيف بالفعل بشكل أفضل مع استغلال بقع المغذيات سريعة الزوال والقابلة للذوبان ، بينما تلتزم المجموعة الأولى بتدهور المادة العضوية الصلبة. على الرغم من صعوبة إثباته ، فقد تم الاستدلال عليه من المقارنة الجينية أن هذه الاختلافات السلوكية كانت متورطة في عملية الانتواع لأن التكيفات التفاضلية تمثل مقايضة بيئية لا يمكن أن تتعايش بسهولة في الجينوم.

على الرغم من أن المثال أعلاه يوضح قوة الجينوميات السكانية جنبًا إلى جنب مع أخذ العينات البيئية على نطاق واسع ، إلا أن اكتشاف مثل هذه المجموعات السكانية التي تم تحديدها مؤخرًا كان مصادفة مع ذلك. وقد ساعد في ذلك حقيقة أن الجين المشفر للبروتين المستخدم كعلامة للتمييز بين العزلات كان مرتبطًا في البداية بمنطقة المسح ، وبالتالي تميز بوضوح بين هاتين المجموعتين [26]. في معظم الحالات ، لا يمكن استنتاج التركيبة السكانية بداهة وبدلاً من ذلك ، يتطلب هذا الاستدلال نهجًا يتم فيه تعيين قدر من التنوع على عينات بيئية. سنحدد بعد ذلك أسباب صعوبة التعرف على حدود السكان أو الأنواع بين البكتيريا والعتائق بناءً على المعلومات الجينية وحدها.

3. لماذا من الصعب تحديد السكان؟

في مقال رأي حديث ، حدد روشا [2] التحديات في الجينات السكانية البكتيرية (والأثرية) في ضوء نظرية التطور المحايدة. واحدة من أهم المشاكل هي أنه كان من المستحيل تقريبًا تحديد موضوع الدراسة بسبب طبيعتها الغامضة. تم تقديم حجج مماثلة في وقت سابق لحدود الأنواع [29]. لوحظ هذا الغموض في أشجار النشوء والتطور ذات المواقع المتعددة عبر الجينوم لأنها تؤدي إلى طبولوجيا مختلفة. وهذا يعني أنه على الرغم من ملاحظة التجميع ، إلا أنه غير متسق عند النظر في جينات مختلفة ، مما يعكس تاريخها التطوري المتباين [29 ، 30]. حتى أن ورقة بحثية حديثة جادلت أن إعادة التركيب كانت مختلطة جدًا بين الإشريكية القولونية يعزل أنه لا توجد شجرة أغلبية ، على الرغم من أنه ، للمفارقة ، يتم إنتاج شجرة مماثلة دائمًا عند حساب المتوسط ​​على مناطق الجينوم الأكبر المختلفة [31]. من المحتمل أن يكون هذا مشكلة عندما ، كما هو الحال في العديد من طرق تقدير إعادة التركيب ، تتم مقارنة الجينات الفردية بشجرة الإجماع التي من المفترض أن تعكس التاريخ النسيلي (أو الإطار النسيلي) للسكان. بشكل عام ، تشير هذه الملاحظات إلى أن طرق علم الوراثة يمكن أن تواجه مشاكل في تحديد المجموعات والأنواع.

قد تكمن المشكلة في طرق علم الوراثة في أنها تتكامل على مدى أطر زمنية تطورية طويلة جدًا لتكون مفيدة في التمايز السكاني. على وجه الخصوص ، بين المجموعات السكانية التي تم تحديدها مؤخرًا ، فقط جزء صغير جدًا من الجينوم يدعم التمييز بينهما [26]. يتضح هذا جيدًا في تحليل اثنين تم تحديده مؤخرًا V. cyclitrophicus السكان ، حيث كان لكل منطقة جينومية مشتركة كان لها تاريخ تطوري فريد خاص بها ، وظهر كلا المجموعتين مختلطين تمامًا [26]. هذه مفارقة واضحة: كيف يمكن إعادة التركيب عبر الحدود السكانية بينما تتم ملاحظة عمليات المسح الخاصة بالسكان؟ تكمن الإجابة في المقاييس الزمنية التي تتكامل فيها مقارنات النشوء والتطور. عندما تم ابتكار طريقة لتحليل أحدث أحداث إعادة التركيب فقط ، كانت هذه أكثر تكرارا بين السكان. يشير هذا إلى أنه في حين أن المجموعتين تشتركان في تاريخ مشترك من إعادة التركيب ، فإن أحدث أحداث إعادة التركيب بعد الاختلاف السكاني كانت خاصة بالسكان [26].

حتى أن العديد من الطرق المصممة لقياس إعادة التركيب قد تعاني من مشكلة مماثلة تتمثل في التكامل على الأطر الزمنية التطورية التي تكون طويلة جدًا لالتقاط أحداث التكاثر. لقد أجرينا مؤخرًا تجربة بسيطة حيث قمنا بمحاكاة اندفاعة من إعادة التركيب بين مجموعة من الجينومات المستنسخة التي تتطور بطريقة أخرى ولاحظنا كيف تتحلل إشارة إعادة التركيب مع تراكم الطفرات [32]. عندما تم تحليل إعادة التركيب بطريقتين مختلفتين تعتمدان على تحديد الخلايا المثلية ، لا تزال هناك إشارة كبيرة بعد فترة طويلة من إنهاء تدفق الجينات. ويرجع ذلك إلى أن الخلايا المتجانسة يتم محوها ببطء فقط من خلال عملية الطفرات العشوائية ، بحيث تتكامل الأساليب التي تعتمد على قياسها على مدى فترات طويلة من الزمن ولا تلتقط فقط عملية إعادة التركيب المعاصرة. يصبح هذا التكامل على مدى الأطر الزمنية الطويلة مشكلة عندما تتم مقارنة المجموعات السكانية أو حتى الأنواع المرتبطة ارتباطًا وثيقًا ويقترح أن الأساليب القادرة على تحليل تدفق الجينات الأكثر حداثة ضرورية لاستعادة السكان أو حدود الأنواع بشكل صحيح [32].

4. هل يمكننا تقدير تدفق الجينات في سياق التركيبة السكانية المعاصرة؟

إذا لم تتمكن الأساليب الحالية من استعادة الأنواع أو حدود السكان ، فهل هناك بديل يمكنه تحديد هذه الحدود بشكل صحيح؟ لقد اقترحنا مؤخرًا مثل هذه الطريقة التي تعتمد على قياس قوة التجانس لإعادة التركيب بين جينومين وهي قادرة على تحديد نقل الجينات الأحدث بكثير من الطرق الأخرى [32]. هذه الطريقة ، التي تسمى المجموعات السكانية كمجموعات نقل الجينات (PopCOGenT) ، تختلف عن غيرها ، من حيث أنها تقدر نقل الجينات مؤخرًا عبر مناطق الجينوم المتطابقة المشتركة (الشكل 2). نظرًا لأن مثل هذه المسارات المتطابقة بين جينومين متقاربين يمكن أن تنشأ عن طريق الوراثة الرأسية أو نقل الجينات الأفقي ، فإن PopCOGenT يميز الاثنين باستخدام نموذج بسيط للميراث العمودي (النسيلي). إذا تباعد جينومان نسليًا عن طريق التراكم الطفري دون إعادة التركيب ، فسيكون لهما طول مميز وتوزيع تكراري لمناطق متطابقة يمكن تقديرها بواسطة نموذج بواسون لتعدد أشكال النوكليوتيدات المفردة [32]. يمكن أن يكون الإثراء الكبير في مناطق متطابقة فوق هذا التوقع بمثابة تقدير لنقل الجينات (الشكل 2). تتحلل إشارة نقل الجينات بترتيب من حيث الحجم خلال الوقت الذي يستغرقه تشعب الجينوم بنسبة 0.1٪ ، وبالتالي يمكن أن يوفر PopCOGenT مقياسًا أكثر معاصرة لنقل الجينات من الطرق الأخرى [32].

الشكل 2. طريقة "التجمعات كمجموعات من نقل الجينات" (PopCOGenT) تقدر مقدار نقل الجينات الأفقي الأخير عن طريق قياس توزيع أطوال التسلسلات المتطابقة التي يتقاسمها أي جينومين. بمقارنة هذا التوزيع بنموذج فارغ للتطور النسيلي (1) ، يحدد PopCOGenT "تحيز النقل" بسبب نقل الجينات الأفقي. بعد توقف النقل الأفقي بين الجينومات ، يتحلل تحيز النقل هذا بسرعة بسبب تراكم الطفرات. (نسخة ملونة على الإنترنت.)

الأهم من ذلك ، يمكن استخدام مقياس نقل الجينات الذي يوفره PopCOGenT لبناء شبكة لفحص كيفية إعادة التركيب هياكل التنوع الجيني (الشكل 3). في المثال الموضح في الشكل 3 ، تُظهر الجينومات الفردية كميات مختلفة من تدفق الجينات فيما بينها. تشكل بعض العزلات مجموعة معزولة بشكل واضح ، بينما تظل العزلات الأخرى مرتبطة بتدفق جيني كبير ، ومع ذلك يتم تنظيمها بشكل أكبر في مجموعات فرعية أكثر ضعفًا. كما هو مفصل أدناه ، يمكن ملاحظة هذه المجموعات الفرعية من خلال تطبيق خوارزمية تجميع بسيطة على شبكة تدفق الجينات الخام. علاوة على ذلك ، نظرًا لأن PopCOGenT يعمل مع المحاذاة الزوجية ، فإنه يمكنه مقارنة جميع المناطق المشتركة ، بغض النظر عما إذا كانت مشتركة بين جميع العزلات عبر مجموعة سكانية. وبهذه الطريقة ، يمكن أخذ المادة الجينية المشتركة مؤخرًا في كل من الجينوم الأساسي والمرن في الاعتبار ، أي في تكملة الجينات التي يتم مشاركتها من قبل جميع أو مجموعات فرعية من العزلات في مجموعة سكانية ، على التوالي.

الشكل 3. يحدد PopCOGenT السكان من خلال محاذاة الجينوم الكامل الزوجي لعزل أو جينومات أحادية الخلية مشتقة من البيئة. غالبًا ما يكون من غير الواضح كيفية تجميع السلالات معًا في مجموعات ذات مغزى بيولوجيًا من أشجار النشوء والتطور المصنوعة من محاذاة جينوم متعددة أو جينات علامة متسلسلة (على اليسار). علاوة على ذلك ، لا يمكن للتنوع في أشجار النشوء والتطور هذه إلا أن يصور التاريخ التطوري للمناطق الجينومية الأساسية. من خلال إجراء المحاذاة الزوجية ، يقدر PopCOGenT نقل الجينات عبر جميع المناطق المشتركة بين أي جينومين ويحدد بنية السكان دون الاعتماد على فواصل هوية صارمة (وسط). في حين أن بعض المجموعات السكانية منفصلة تمامًا عن المجموعات الأخرى عن طريق تدفق الجينات ، يظل البعض الآخر مترابطًا ، ويتم الكشف عن التركيبة السكانية الأساسية من خلال التكتل الذي يحدد المجموعات الفرعية للسلالات المتصلة على نطاق واسع (يمين). يمكن اعتبار مجموعات الجينوم المعزولة شبيهة بالأنواع بسبب الخصائص التي تشترك فيها مع متطلبات تعريف مفهوم الأنواع البيولوجية للعزل الجيني. (نسخة ملونة على الإنترنت.)

عند تطبيقه على العديد من أنظمة النماذج البكتيرية والأثرية التي تم تقدير التركيب السكاني لها (باستخدام الجينوميات السكانية جنبًا إلى جنب مع البيانات البيئية والفسيولوجية) ، كان PopCOGenT قادرًا على تلخيص التوقعات الأصلية [32]. تمثل أنظمة النموذج هذه اختبارًا حاسمًا ، حيث ثبت أن كل منها يشتمل على مجموعات شقيقة مرتبطة ارتباطًا وثيقًا تتميز بخصائص متماسكة ، بما في ذلك الديناميكيات التفاضلية في العينات البيئية. عندما تم استخدام PopCOGenT لبناء شبكة تدفق الجينات بين الجينومات من هذه الأنظمة النموذجية ، تم تنظيم الشبكة الخام في مجموعات تدفق الجينات التي كانت متوافقة إلى حد كبير مع الوحدات الجينية والبيئية المحددة مسبقًا.

لم يكن لهذه المجموعات الأولية في شبكة تدفق الجينات الخام أي صلة بمجموعات أخرى من هذا القبيل ، مما يشير إلى أن تدفق الجينات الأخير بين العديد من المجموعات البيئية لا يمكن اكتشافه بشكل أساسي [32]. ومع ذلك ، عندما تم تطبيق خوارزمية تجميع بسيطة ، تم الكشف عن الهيكل الإضافي في بعض الحالات ، أي مجموعات فرعية من تدفق الجينات المخصب داخل التي تحافظ على تدفق بعض الجينات فيما بينها. لخصت هذه المجموعات الفرعية أيضًا نموذجين من المجموعات السكانية المتباينة مؤخرًا في V. cyclitrophicus و Sulfulobus icelandicus [26،33] ، مما يشير إلى أن PopCOGenT يمكنه تحديد المجموعات الناشئة بشكل صحيح مفصولة بانقطاع تدفق الجينات الأضعف [32]. تألفت إحدى مجموعات البيانات أيضًا بشكل أساسي من جينومات تم تضخيمها من خلايا مفردة من البكتيريا الزرقاء في المحيط. بروكلوروكوكس. عادة ما يصعب مقارنة جينومات الخلية الواحدة بالطرق التقليدية لأنها غير مكتملة في مناطق عشوائية. ومع ذلك ، يمكن لـ PopCOGenT التعامل مع المعلومات غير الكاملة لأنها تعتمد على المقارنات الزوجية طالما أن التداخل الكافي بين الأزواج متاح. ما يشكل معلومات كافية لا يزال سيئ الاستكشاف ويمكن أيضًا بسهولة الخلط بين مجموعات البيانات عن طريق تلويث الحمض النووي الذي يمكن تسجيله على أنه وصلات نقل الجينات بين الجينومات غير ذات الصلة. ومع ذلك ، فإن القدرة على تنفيذ الجينوميات السكانية باستخدام جينومات أحادية الخلية وبالتالي الزراعة الجانبية تمثل ميزة محتملة لـ PopCOGenT. بشكل عام ، تشير ملاحظة المجموعات والمجموعات الفرعية بين الجينومات ذات الصلة الوثيقة إلى أنه يمكن استخدام تقديرات تدفق الجينات وحدها لفرضية الوحدات الجينية والبيئية. ومع ذلك ، كيف يمكننا التأكد من تحديد الحدود الصحيحة بين هذه الوحدات؟

5. كيف يمكننا اختبار ما إذا كانت التركيبة السكانية المتوقعة ذات مغزى بيولوجي؟

للإجابة على هذا السؤال ، نعود إلى الحجة القائلة بأنه لكي تكون الوحدات الجينية والبيئية متطابقة ، يجب أن تكون التكيفات قادرة على الانتشار بطريقة خاصة بالنوع أو السكان. وبالتالي ، فإن الاختبار الحاسم هو ما إذا كانت هناك خصائص تميز المجموعات السكانية الشقيقة الأكثر ارتباطًا. كلا المثالين لنماذج الانتواع V. cyclitrophicus و S. Islandicus تشير إلى أنه يمكن تحديد هذه الخصائص [26 ، 33]. لذلك ، قمنا بتوسيع منطق تحليل تدفق الجينات لتحديد الأليلات والجينات التي اكتسحت بطريقة خاصة بالسكان [32] (الشكل 4). قمنا بإعادة التحليل Ruminococcus gnavus الجينوم المعزول من الأفراد الأصحاء وكذلك مرضى داء كرون والتهاب القولون التقرحي [34]. أظهر تطبيق PoCOGenT شبكة متصلة بثلاث مجموعات فرعية ، اثنان منها تم أخذ عينات منها بشكل كافٍ لاختبار التكيف في شكل أليلات أو جينات خاصة بالسكان [32]. لكي تظهر هذه التعديلات مؤخرًا من خلال عمليات المسح الخاصة بالسكان ، يجب أن تُظهر تنوعًا أقل بكثير في الأليلات أو الجينات التي تشفرها مقارنة بمتوسط ​​تنوع النوكليوتيدات عبر جينومات السكان.

الشكل 4. تتمثل الوظيفة الرئيسية للعشائر والأنواع التي تم تحديدها بواسطة تدفق الجينات في أنها الوحدات الأساسية التي من خلالها تشع الصفات التكيفية وتنتشر. عندما يتم الحصول على الأليلات من قبل مجموعة سكانية (إما من خلال طفرة دي نوفو أو اكتساب أفقي من قريب بعيد) ، يمكن نقل هذه الأليلات إلى أعضاء آخرين من نفس المجموعة عن طريق إعادة التركيب المتماثل. علاوة على ذلك ، إذا كانت هذه السمات توفر فائدة خاصة بمكانة معينة تزيد بشكل كبير من ملاءمة مضيفها ، فسوف ترتفع إلى مستوى التثبيت في تلك المجموعة السكانية بسبب الاختيار. وبالتالي ، فإن السمة المميزة لهذه المناطق عند مقارنة الجينومات هي تنوع النوكليوتيدات المتناقص محليًا في الموقع المحدد. تعتبر مراقبة هذه المناطق التي خضعت لعمليات المسح الانتقائية الأخيرة تأكيدًا مفيدًا على أن التركيب السكاني المتوقع له معنى بيولوجي. في الواقع ، تمنع التجمعات السكانية العشوائية باستمرار تحديد المناطق التي تم اجتياحها.

عندما تم تطوير خط أنابيب لتحديد مناطق الجينوم ذات تنوع النيوكليوتيدات المنخفض بشكل ملحوظ مقارنة بمتوسط ​​السكان (الشكل 4) ، تم تحديد العديد من الأليلات في الجينوم الأساسي والجينات في الجينوم المرن والتي تميز بين المجموعتين [32]. كانت جميع هذه المناطق غير مرتبطة وموزعة عبر الجينوم ، مما يشير إلى أنها نشأت بشكل مستقل عن بعضها البعض. لا يمكن شرح العديد من هذه الأليلات والجينات ، ولكن العديد من البروتينات السطحية المشفرة ، مما يشير إلى أنها تشارك في شكل من أشكال التواصل مع البيئة. لذلك ، تشير هذه النتائج إلى أن تدفق الجينات متحيز بدرجة كافية بطريقة خاصة بالسكان للسماح بالتكيفات بالانتشار عن طريق إعادة التركيب وتعمل بمثابة تأكيد قوي على تحديد الوحدات البيئية الصحيحة.

6. كيف يمكن أن تتطور التركيبة السكانية في ظل نقل الجينات الأفقي؟

كيف يمكن التوفيق بين ملاحظة العناقيد المحددة بوضوح في تدفق الجينات المعاصر وبين ملاحظات نقل الجينات الأفقي التي يطلق عليها ، في بعض الحالات ، اسم "المتفشي" [35]؟ هناك أدلة وفيرة على وجود امتصاص وإدماج مستمر لمواد وراثية متباينة في الجينومات البكتيرية والبدئية [25]. وهذا يعني أن كل خلية قد تحتوي في أي وقت على جينات تم اكتسابها مؤخرًا من أي عدد من الميكروبات الأخرى. على الرغم من أن مثل هذا الدمج للجينات المتباينة سيؤثر على التجميع التطوري للعزلات ، إلا أنه لن يعطل شبكة تدفق الجينات بشكل كافٍ لإخفاء البنية السكانية إذا كان تدفق الجينات داخل السكان أعلى بكثير من بين ، كما نقترح هنا. علاوة على ذلك ، إذا كان تدفق الجينات عشوائيًا إلى حد ما ، فسوف يربط السلالات بين السكان بطريقة عشوائية إلى حد ما ، بحيث تكون الروابط غير منظمة إلى حد ما. في الواقع ، قد تُفقد العديد من الجينات المكتسبة بسرعة إلى حد ما إذا كانت ، كما يبدو مرجحًا ، ضارة بشكل طفيف على الأقل بالجينوم المتلقي [11]. ومن ثم ، فإن المجموعات السكانية وربما الأنواع هي في الواقع وحدات غامضة بسبب النقل الأفقي للجينات ، ولكن هذا الغموض لا يمنع تعريفها كوحدات بيئية إذا كان تدفق الجينات متحيزًا بشكل كافٍ نحو إعادة التركيب داخل السكان للسماح بالتكيفات بطريقة معينة.

يمكن لأخذ عينات ثابتة من المواد الجينية من مصادر مختلفة ، في الواقع ، توفير المادة الخام للتكيف [11]. على الرغم من أنه من المقبول على نطاق واسع أن الابتكار التطوري يمكن أن ينشأ عن طريق الإضافة الأفقية للجينات في الجينوم ، فإن المدى الذي نشأت فيه حتى عمليات مسح الأليلات أفقياً بدلاً من الطفرة داخل السكان كان مفاجئًا في تحليلنا الأخير للتمايز مؤخرًا. المجرة السكان نوقشت أعلاه. تم الحصول على الغالبية العظمى من الأليلات التكيفية التي تمكنا من تحديدها أفقيًا من مصادر متباينة [32]. وبالمثل ، فإن الإشعاع التكيفي الذي يميز بين مجموعات بكتيريا المحيط ذات الصلة الوثيقة بأشكال فيزيائية مختلفة من عديد السكاريد نفسه ، كان مبنيًا على ديناميكيات اكتساب وفقدان الجينات [36]. حتى النسخ المتعددة من ليات عديد السكاريد نفسها نشأت عن طريق النقل بدلاً من الازدواجية ، بما في ذلك بعض الإنزيمات التي كانت موجودة في ما يصل إلى سبع نسخ لكل جينوم. تتوافق هذه الملاحظات مع التحليل السابق للجينومات المتنوعة التي أظهرت أيضًا ازدواجية الجينات داخل نفس الجينوم لتكون نادرة في الميكروبات [37]. هذا اختلاف جوهري عن حقيقيات النوى ، حيث تكون الازدواجية شائعة وينشأ الابتكار التطوري عن طريق طفرة داخل الجينوم [38].

7. ما هي المحاذير المحتملة لتوقعات التركيبة السكانية؟

بالنظر إلى أن النتائج حتى الآن توضح وجود مجموعات تدفق جينية معزولة للغاية بشكل مدهش ، فهل هناك سيناريوهات محتملة حيث يمكن أن يخفي النقل الأفقي أو يمحو البنية السكانية؟ لا يزال هذا الجانب سيئ الاستكشاف ، ولكن يمكن على الأقل تخيل العديد من السيناريوهات. معدلات إعادة التركيب بين الميكروبات متغيرة للغاية [32،39] ، وإذا كانت منخفضة جدًا ، فإن إدخال مجموعة أكبر من الجينات من مجموعة سكانية أخرى قد يخلق رابطًا قويًا مع مجموعة فرعية من الجينومات في السكان قيد الدراسة ، مما يؤدي إلى إرباك تحليل التركيبة السكانية . السيناريو الأكثر ترجيحًا هو مجموعة سكانية ذات معدلات إعادة تركيب منخفضة تتلقى عنصرًا وراثيًا متحركًا كبيرًا (MGE) يخضع للاختيار الإيجابي في كل من السكان المتبرعين والمتلقين ، وبالتالي يربط جزءًا كبيرًا من الجينوم. قد تنشأ مثل هذه الحالة ، على سبيل المثال ، إذا تحرك بلازميد مقاوم للمضادات الحيوية عبر ميكروبيوم تحت اختيار مضاد حيوي قوي. لذلك يُنصح باختبار التركيبة السكانية مع أو بدون MGEs ، أو لتضمين الجينومات ذات الصلة الوثيقة من العينات التي لم تخضع للعلاج بالمضادات الحيوية. علاوة على ذلك ، من الممكن أن يكون هناك مجموعتان مرتبطتان من السكان يشغلان فجأة مكانين متشابهين بسبب بعض التغيرات البيئية. قد يسمح هذا التغيير في التواجد المشترك بزيادة تدفق الجينات ، خاصةً إذا كان قيد الاختيار ، ويؤدي إلى الاحتقار كما تم افتراضه بالنسبة للبعض. كامبيلوباكتر الأنواع في الميكروبيوم الحيواني [40]. على الرغم من أن هذه الأنواع من المواقف قد تؤدي إلى بنية سكانية أقل وضوحًا من تلك التي تم تحديدها في أنظمة النماذج التي قمنا بتحليلها ، إلا أن أنماط تدفق الجينات ذات صلة بيولوجيًا وقد تؤدي إلى فرضيات مثيرة للاهتمام حول الاختيار البيئي.

نشدد على أن أي تنبؤ بالبنية السكانية يمثل فرضية في حد ذاته ويحتاج إلى تحليل دقيق لأنه قد يتأثر بأخذ العينات وعوامل أخرى. ومع ذلك ، فإننا نعتقد أنه إذا كانت المجموعات السكانية تحمل توقيعات على تكيفات محددة ، مثل عمليات المسح الخاصة بالجينات (الشكل 4) ، فإنها تعمل كأحد أقوى الأدلة الممكنة على أن السكان المتوقعين يمثلون وحدة بيئية وبالتالي الوحدة الأكثر صلة ببيئة المجتمع. .

8. ما هي الخصائص الرئيسية للمجموعات التي يحددها تدفق الجينات؟

إحدى السمات البارزة للمجموعات التي تم تحديدها هنا هي أنها تحتوي على تنوع نيوكليوتيدات منخفض نسبيًا في الجينوم الأساسي ، أي في الجينات المشتركة بين الجميع. عادة ما تكون جينومات كل من البكتيريا والعتائق التي تم تحليلها حتى الآن متشابهة بنسبة تزيد عن 98٪ في تسلسل النيوكليوتيدات داخل السكان ، وهو ما يتوافق مع البيانات التي تم الحصول عليها من نهج مختلف للتنبؤ ببنية السكان [41]. من شأن هذا التشابه العالي أن يضمن أيضًا أن إعادة التركيب المتماثل داخل المجموعات السكانية يظل فعالًا ، حيث يتحلل معدله أضعافًا مضاعفة مع اختلاف التسلسل [19 ، 20]. وتجدر الإشارة أيضًا إلى أن هذه القيم المنخفضة تتوافق تمامًا مع تنوع النيوكليوتيدات داخل الأنواع الحيوانية والنباتية. على سبيل المثال ، تختلف الجينومات البشرية بنسبة 0.2٪ على الأكثر من مواقع النيوكليوتيدات مقارنةً بالجينوم البشري المرجعي [42].

إذا تم اعتبار المجموعات السكانية المحددة من خلال تدفق الجينات كممثلين محليين للأنواع ، فسيتم تحديدها بشكل أكثر تحديدًا من تلك الناتجة عن مقارنة متوسط ​​هوية النوكليوتيدات (ANI) ، والتي أصبحت أساسًا لتعريف الأنواع الشائع [43 ، 44] . عندما تتم مقارنة ANI عبر مجموعات متنوعة من الجينومات ، عادة ما يكون هناك حد أدنى يتم ملاحظته عند حوالي 95٪ من ANI ، وهي حدود الأنواع المفترضة [44]. ومع ذلك ، ربما لا تتوافق هذه الحدود مع حدود السكان أو الأنواع لأسباب مشابهة لتلك التي تم التعبير عنها أعلاه فيما يتعلق بحدود السكان المقدرة ببعض طرق إعادة التركيب. بمجرد أن ينخفض ​​تدفق الجينات بسبب الانتواع ، فإن التشابه الجيني بين الأنواع الناشئة سوف يتحلل لأن إعادة التركيب لم يعد يعمل كقوة تجانس [25]. ومع ذلك ، فإن هذا الاضمحلال هو عملية بطيئة ، وسيستغرق وصول إشارة التشابه الجيني إلى الحد الأدنى وقتًا طويلاً [32]. ومن ثم ، قد تقع حدود السكان أو الأنواع ضمن قيمة التشابه البالغة 95٪ ، والأهم من ذلك ، قد لا يمكن التعرف على المجموعات السكانية المحددة حديثًا لأن جينوماتها لم تتباعد بشكل كافٍ ، مما يخفي الارتباطات البيئية أو المرضية كما تم توضيحه مؤخرًا [26 ، 32 ، 45] . ومن ثم ، في حين أنها جذابة لبساطتها ، فمن المشكوك فيه ما إذا كانت الحدود الدنيا لـ ANI يمكن أن تحدد حدود الأنواع ذات المعنى البيولوجي.

ومن الخصائص المهمة الأخرى للمجموعات السكانية التي يحددها تدفق الجينات أن بقايا عموم الجينوم كبيرة الحجم [46]. أي ، على الرغم من ارتباط الجينومات ارتباطًا وثيقًا عبر الجينات المشتركة ، فإنها تعرض عددًا كبيرًا من الجينات غير المشتركة. تظل العديد من هذه الجينات بدون توضيح وبالتالي فإن دورها في بيولوجيا السكان غير واضح. ومع ذلك ، هناك عدد متزايد من الأمثلة التي تُظهر أن الجينوم المرن قد يكون ، جزئيًا على الأقل ، خاضعًا لانتقاء يعتمد على التردد السلبي ، وهو شكل من أشكال الاختيار حيث تقل ملاءمة النمط الجيني حيث يصبح أكثر تواترًا في السكان [ 46]. قد يكون هذا التأثير قويًا بشكل خاص للتفاعل بين الكائنات الحية مثل إنتاج الصالح العام والافتراس. على سبيل المثال ، تبين أن إنتاج بعض الأنماط الجينية للحديد الحديدي مصحوب بتطور الغشاشين الذين يفتقرون إلى جينات الإنتاج لكنهم يحتفظون بجينات الامتصاص [47 ، 48]. علاوة على ذلك ، غالبًا ما تُنزل المستقبلات الفيروسية والجينات الدفاعية إلى الجينوم المرن ، مما يشير إلى أنها لا يمكن أن ترتفع إلى وفرة عالية بين السكان كحماية ضد فيروسات معينة تقتل السكان [46،49،50]. أخيرًا ، هناك أيضًا دليل متزايد على أن مناطق الجينوم المرنة هذه يمكن تقاسمها بشكل تفضيلي داخل السكان من خلال إعادة التركيب المتماثل للمناطق المحيطة بحيث تكون العديد من المناطق المرنة جزءًا من بيولوجيا السكان بدلاً من اكتسابها بشكل متكرر.

9. ما هي الآثار المترتبة على قياس التنوع في البيئة؟

إن نهج افتراض بنية السكان على أساس تدفق الجينات متبوعًا باختبار الفرضية من خلال تحديد عمليات المسح الخاصة بالسكان يسمح بنهج إيكولوجي عكسي يتنبأ بالوحدات البيئية من المعلومات الجينية وحدها [32،51]. بهذه الطريقة ، يمكن أن يوفر النهج إطارًا غير متحيز لتحديد المتغيرات المهمة التي تدفع التنويع في التجمعات الميكروبية من خلال تسليط الضوء على الأليلات والجينات تحت اختيار قوي. وبالتالي ، يوفر هذا النهج عدسة فريدة لتحديد المساحة الميكروبية المتخصصة التي لا تعرف القدرة على القياس الدقيق لمكان سقوط السلالات على طول التدرجات البيئية. بالطبع ، تعتمد الرؤى المباشرة في التمايز البيئي بناءً على أي مقاربات جينية بشكل كبير على دقة التعليقات التوضيحية للجينات ، والتي تعد حاليًا غير مكتملة في أحسن الأحوال. لكن نهج البيئة العكسية يمكن أن يساعد أيضًا في صياغة فرضيات للجينات ذات الصلة التي تحتاج إلى مزيد من التوصيف من خلال مناهج أخرى مثل علم الوراثة الجزيئي أو التحليل الهيكلي ، وبالتالي قد يساعد في بناء نهج أكثر تنظيماً نحو حل مشكلة التعليقات التوضيحية المنتشرة في كل مكان.

تعد المواقع قيد الاختيار مفيدة بشكل خاص لتقييم وفرة السكان في العينات البيئية لأن تنوعها داخل السكان منخفض بشكل استثنائي ، في حين أن التنوع بين السكان أعلى بكثير لأن الأدلة حتى الآن تشير إلى أن معظم المواقع نشأت عن طريق نقل الجينات الأفقي من مصادر متباينة [ 32]. تعني هذه الخصائص أنه يمكن اكتشاف مواقع المسح بدقة عالية في العينات البيئية ، كما أن انتشارها في جميع أنحاء جينوم الكائنات المؤتلفة يضيف قوة إحصائية في تقييم وفرة السكان في المجتمعات المعقدة. وفقًا لذلك ، توفر metagenomes بندقية الصيد للحمض النووي المستخرج من المجتمعات الميكروبية طريقة ملائمة للتقييم الكمي لوفرة مواقع متعددة في عينات متعددة. ومع ذلك ، فإن هذا النهج محدود الاستخدام إذا كانت المجموعات السكانية المستهدفة نادرة في بيئتها. يمكن أيضًا أن تكون مواقع الاجتياح أهدافًا للمقايسات عالية الدقة مثل تفاعل البوليميراز الرقمي المتسلسل الذي يسمح للباحثين بقياس وفرة السكان في عينات مختلفة بسرعة إذا كانت هناك حاجة إلى حساسية أكبر. يمكن أن تكون هذه المناطق أيضًا أهدافًا للفلورة فى الموقع تحقيقات التهجين لتصور بشكل مباشر كيف يتم توزيع المجموعات السكانية ذات الصلة الوثيقة بشكل مختلف في البيئة. نتصور أن هذا سيسمح باختبار أكثر استهدافًا للجمعيات البيئية الدقيقة التي تتجاوز بكثير كفاءة الأساليب البيئية التقليدية المتقدمة ، والتي غالبًا ما تعتمد على رسم خرائط للمجموعات الميكروبية على متغيرات بيئية خشنة ثم استخدام الجينوميات للعثور على الاختلافات المحتملة [12].

كيف تقارن المجموعات السكانية التي يحددها تدفق الجينات بالقياس التقليدي للتنوع الميكروبي بواسطة تسلسل الجين 16S rRNA الذي يستخدم غالبًا لرسم خرائط التجمعات الميكروبية على العينات البيئية؟ للإجابة على هذا السؤال ، نستخدم مثالاً من عملنا حيث حددناه اهتزاز البكتيريا في التعايش السكاني في مياه المحيطات. نجد عادةً حوالي 20 مجتمعًا متعايشًا تم تحديده في الأصل من خلال أخذ العينات البيئية الدقيقة للعزلات ، وتسلسل جينات واسمات البروتين وتطبيق النمذجة الرياضية لربط التنوع الجيني بالبنية البيئية [52-55]. تم تأكيد هذه التنبؤات السكانية مؤخرًا من خلال تحليل تدفق الجينات الأبسط بكثير [32] مما يتيح المقارنة المباشرة لأحد جينات واسم البروتين (hsp60) مع شظايا جينية مختلفة من الرنا الريباسي 16S المستخدمة لتحديد وحدات التصنيف التشغيلية (OTUs) لقدرتها على التمييز بين الوحدات البيئية في العينات.

تُظهر هذه المقارنة دقة منخفضة بشكل مزعج لجينات الرنا الريباسي 16S عند مقارنتها بالسكان المحدد بواسطة تدفق الجينات (الشكل 5). لا سيما علامات 16S rRNA المستخدمة عادةً في تسلسل الإنتاجية العالية لها دقة صفرية بشكل أساسي للسكان الإيكولوجيين. بالنسبة للجين كامل الطول ، هذا أفضل قليلاً فقط ، مما يدل على أن الانتواع يفوق بكثير دقة جينات الرنا الريباسي 16S. هذا يعني أن الجين لديه معلومات محدودة للغاية عندما يتعلق الأمر بالديناميات البيئية للسكان في العينات البيئية ، وقد يخفي التسلسل الفريد العديد من المجموعات السكانية المتمايزة بيئيًا ، وهو تأثير من الواضح أنه يصبح أسوأ كلما تم تعريف OTU على نطاق أوسع من حيث تباعد التسلسل.

الشكل 5. يمكن أن تميز مجموعات تسلسل الجينات 16S الرنا الريباسي 0-7 من 14 متميزة بيئيا اهتزاز تعتمد المجموعات السكانية على طول التسلسل والقطع العنقودي ، بينما تعتمد المجموعات في hsp60 يمكن أن يميز الجين الواسم الكل أو الكل تقريبًا. يعتمد علم التطور على 52 بروتين ريبوسوم متسلسل. يشير المربع المظلل إلى أنه يمكن تمييز الصنف بشكل فريد مع طول الجين المحدد وطريقة التجميع ، بينما يشير المربع الأبيض إلى أن الصنف يتم دمجه مع تصنيف واحد آخر على الأقل ، في مجموعة جينية واحدة على الأقل. يتم اشتقاق أوصاف توزيع الموائل من التحليل الكمي لتوزيعات السكان عبر ثلاث مجموعات عينات مختلفة بواسطة Preheim وآخرون. [54]. تم استبعاد الأصناف بدون أوصاف الموائل من هذا التحليل بسبب أخذ العينات المحدود. (نسخة ملونة على الإنترنت.)

بالنظر إلى أن التنبؤ بالبنية السكانية عن طريق تدفق الجينات يتطلب عزلات أو جينومات أحادية الخلية ، فهل هناك بديل يمكن تطويره لتحديد الأنواع والتعداد السكاني في الميتاجينوم؟ يحتمل نعم. إحدى السمات المثيرة للاهتمام للمجموعات السكانية التي حددناها هي أنه تم تقريبها جيدًا من خلال متواليات بروتين ريبوزومي متطابقة تقريبًا [32،45]. على الرغم من أنه حتى بالنسبة إلى هؤلاء ، يمكن إخفاء بعض الهياكل بسبب الانتواع السريع ، إلا أن هذه الجينات يمكن أن تكون مع ذلك بمثابة وكيل أكثر دقة لبنية السكان. ما إذا كانت هذه الملاحظة تنطبق على نطاق أوسع عبر العديد من الأصناف ، يجب استكشافها في مجموعات بيانات أكبر [56] ، ولكن الأهم من ذلك ، يمكن استخراج بروتينات الريبوسوم المتطابقة من مجموعات البيانات الميتاجينومية وبالتالي تحليل ديناميكياتها بسهولة [57]. لذلك ، نوصي باستهداف البروتينات الريبوسومية عندما تكون ديناميكيات الأنواع والأعداد ذات أهمية في العينات الميتاجينومية.

10. ملاحظات ختامية

إن تحديد المجموعات السكانية كمجموعات تدفق الجينات التي هي أيضًا وحدات بيئية له آثار كبيرة على علم الأحياء الدقيقة ، الذي عانى طويلًا من التعريف الغامض للسكان [2]. نقترح أن التدفق الجيني الأخير الذي تم قياسه من مجموعات الجينومات وثيقة الصلة يمكن أن يحدد بوضوح حدود السكان حتى في المراحل المبكرة نسبيًا من التمايز. تتميز هذه المجموعات بالأليلات والجينات التي اكتسحت مؤخرًا للتثبيت ، مما يشير إلى أن الاختيار الإيجابي يمكن أن ينشر التكيفات بطريقة محددة وحصرية. يوفر تحديد عمليات المسح الخاصة بالجينات الثقة في حدود السكان ويخلق فرضيات للتكيفات الحديثة التي تميز السكان عن بعضهم البعض. ومن ثم ، يمكن اعتبار هذه المجموعات السكانية وحدات مُحسَّنة بشكل تكيفي من البكتيريا والعتيقة مكافئة لكيفية النظر إلى المجموعات السكانية في علم البيئة الكلي والتطور. هذه المجموعات السكانية لها أهمية عندما نريد دراسة البيئة المجتمعية ، لأنها تسمح بتحديد أكثر دقة للارتباطات بالعوامل الحيوية وغير الحيوية.

أخيرًا ، بالنظر إلى أن العديد من المجموعات المحددة هنا تظهر درجة عالية جدًا من العزلة الجينية ، فمن المغري استدعاء مفهوم الأنواع البيولوجية ، الذي يفترض أن الأنواع هي مجموعات معزولة تكاثريًا من الكائنات الحية [58]. ومع ذلك ، نشدد على أن تحليلات البكتيريا والعتائق المقدمة هنا تعتبر في المقام الأول الكائنات الحية التي تتعايش أو تعيش في مواقع منفصلة متصلة بالهجرة العالية. كما أوضحنا هنا ، قد يتم فرض العزلة الجينية لمثل هؤلاء السكان عن طريق الاختيار. ومع ذلك ، فإن سمة العديد من الأنواع هي أنها تتكون من مجموعات منفصلة جغرافيًا مرتبطة بدرجات مختلفة من تدفق الجينات. كيف تؤثر هذه البنية على ترسيم العناقيد يظل سؤالًا مفتوحًا ، ولكن هذا سيكون مهمًا لتحديده في السعي وراء مفهوم الأنواع ذات المغزى بيولوجيًا للبكتيريا والعتائق.


الاستنتاجات

في الختام ، يسلط هذا العمل الضوء على التحديات التي نواجهها في تشخيص فقر الدم المنجلي غير المبرر. لقد استخدمنا BrS كنموذج للموت المفاجئ غير المبرر في القلب الطبيعي هيكليًا. نظهر أن تحديد الخلل الجيني في الضحية لا يعادل تقديم تشخيص واضح. قدمت العيوب الوراثية التي تم تحديدها تشخيصًا محتملاً لـ BrS و LQTS و CPVT و ARVC. يؤكد التسلسل المتوازي بشكل كبير أنه ليس من الممكن دائمًا تحديد النمط الظاهري من البيانات الجينية. قد يكون تضمين التحليلات الوظيفية عاملاً حاسماً لتعيين تشخيص محدد ، ولكن هذا غير ممكن في المعدل الحالي لاكتشاف التباين. لذلك ، أدى إدخال تقنية NGS إلى المزيد من الأسئلة دون إجابة مقارنة بعصر ما قبل NGS. كان هذا تحديًا متوقعًا يظهر دائمًا في هذه الأساليب عندما يتم استجواب قوائم كبيرة من الجينات. تعطي عملية التسلسل لهذه الجينات كميات هائلة من البيانات التي يجب تخزينها وتحليلها وتفسيرها بيولوجيًا وسريريًا. لا يزال التشخيص الجيني عن طريق NGS يمثل تحديًا لأن تطبيقه على التشخيص السريري يتطلب أولاً جهدًا دوليًا لفهم أفضل لأهمية الاختلافات الجينية النادرة المكتشفة.أحد الأهداف الرئيسية للعمل الحالي هو تقييم قابلية تطبيق NGS للتشخيص السريري (والطب الشرعي). بعد تحليل نتائجنا ، يبدو من الصعب تقييم هذا الهدف وهو ممكن فقط من منظور مألوف. ومع ذلك ، حتى مع توفر الأقارب لتوسيع دراسة الفصل ، لا يزال من الصعب تقدير التشخيص الجيني. يعد اكتشاف المتغيرات الجينية النادرة والمفترضة والمفترضة في العديد من الجينات التي لم تكن مرتبطة سابقًا بـ BrS نتيجة منطقية للدراسة. يحتاج ارتباط تلك الجينات بالمرض إلى مزيد من التقييم عن طريق الدراسات الوظيفية وتكرارها في مجموعات مختلفة قبل اعتبارها قاطعة وراثيًا للتشخيص السريري. هناك عدة أسباب تدعم أن الجينات الموصوفة أعلاه ينبغي اعتبارها جينات مرشحة لأغراض البحث من أجل فهم أفضل للآليات الجينية الكامنة وراءها. يتضمن هذا السبب دور البروتينات المشفرة بواسطة هذه الجينات ، أو التردد المنخفض أو عدم وجود الاختلافات الجينية في عموم السكان ، وتقييم إمراضها المحتملة. في السيليكو وعند الإمكان ، مع إجراء تحليل الفصل. تشير هذه الحقائق إلى الدور الممرض للتنوع الجيني المكتشف. ومع ذلك ، يتم اعتبارهم VUS بعد تطبيق الخوارزمية ، ويرجع ذلك أساسًا إلى عدم وجود دراسات وظيفية وتحليل النمط الوراثي في ​​مجموعات مألوفة مختلفة. من الشائع أن المتغيرات النادرة تظل مثل VUS. تتوافق هذه الملاحظة مع خصائص الأمراض ذات الاختراق غير الكامل والتعبير المتغير الملحوظ. للتأكد من الدور الممرض للاختلافات المكتشفة ، يلزم وجود ارتباطات بين النمط الجيني والنمط الظاهري في مجموعات أخرى مألوفة كجزء من الجهود الدولية لزيادة فهم طيف الطفرة الكامن وراء BrS. في هذا الاتجاه ، تم نشر تحليل GWAS (موجود بالفعل) من اتحادات دولية بما في ذلك العديد من مجموعات BrS ويجري أيضًا تطويرها في الوقت الحاضر. ستؤدي هذه النتائج إلى توضيح وفتح آفاق بحثية جديدة ليتم تقييمها ،

كان التقدم التكنولوجي أسرع من قدرتنا على تطبيقه في المجال السريري. إن البنية الجينية من حيث الجينات المعنية والمتغيرات الجينية النادرة والشائعة والعوامل المعدلة تخلق شبكة قرارات معقدة لا يمكن كشفها إلا من خلال تفسير سريري وجيني دقيق في سياق عائلي. هذا يعزز الحاجة إلى تحقيق عائلي دقيق وشامل ، ولكن أيضًا أهمية التعامل مع البيانات من قبل خبراء في هذا المجال ، وذلك لفهم القيمة ولكن أيضًا قيود اختبارات NGS هذه.


محاكاة التطور لفهم التبديل الجيني الخفي

باستخدام عمليات المحاكاة الحاسوبية المبنية على افتراضات معقولة والتي أجريت تحت رقابة دقيقة ، يمكن لعلماء الأحياء الحسابية تقليد الظروف البيولوجية الحقيقية. بدءًا من السكان المؤسسين الأصليين (المرحلة القديمة) ، يمكنهم تطوير السكان على مدى عدة آلاف من الأجيال لتطوير مرحلة وسيطة ، ثم تطوير ذلك الجيل عدة آلاف من الأجيال لتطوير مرحلة مشتقة. الائتمان: © 2021 KAUST Anastasia Serin

تطور بعض الكائنات الحية مفتاحًا داخليًا يمكن أن يظل مخفيًا لأجيال حتى يتسبب الإجهاد في حدوثه.

تكشف المحاكاة الحاسوبية للخلايا التي تتطور على مدى عشرات الآلاف من الأجيال سبب احتفاظ بعض الكائنات بآلية تبديل غير مستخدمة تعمل تحت ضغط شديد ، وتغير بعض خصائصها. يعد الحفاظ على هذا المفتاح "المخفي" إحدى وسائل الكائنات الحية للحفاظ على درجة عالية من استقرار التعبير الجيني في ظل الظروف العادية.

تكون يرقات دودة الطماطم ذات اللون القرنفل خضراء في المناطق الأكثر دفئًا ، مما يجعل التمويه أسهل ، ولكنها سوداء في درجات الحرارة الباردة حتى تتمكن من امتصاص المزيد من ضوء الشمس. تسمى هذه الظاهرة ، الموجودة في بعض الكائنات الحية ، التحول الظاهري. عادةً ما يتم إخفاء هذا التبديل استجابةً للتغيرات الجينية أو البيئية الخطيرة.

درس العلماء عادةً هذه العملية من خلال التحقيق في التغييرات التي مرت بها الكائنات الحية في ظل ظروف مختلفة على مدى أجيال عديدة. منذ عدة سنوات ، على سبيل المثال ، قام فريق بتربية أجيال من يرقات دودة التبغ ذات القرنين لمراقبة وإحداث تغيرات في اللون مشابهة لتلك التي حدثت في أقارب دودة الطماطم.

يقول شين جاو ، عالِم الأحياء الحاسوبية في جامعة الملك عبدالله للعلوم والتقنية: "عندما تُبنى المحاكاة الحاسوبية على افتراضات معقولة وتُجرى تحت رقابة دقيقة ، فإنها أداة قوية جدًا لمحاكاة الوضع الحقيقي". "يساعد هذا العلماء على ملاحظة وفهم المبادئ التي يكون من الصعب جدًا ، أو من المستحيل ، مراقبتها من خلال تجارب المعمل الرطب."

صمم عالم الأبحاث في كاوست وغاو هيرويوكي كواهارا محاكاة حاسوبية لتطور 1000 كائن حي مجهري لاجنسي. تم إعطاء كل كائن حي نموذج دائرة جينية لتنظيم التعبير عن بروتين معين X.

طورت المحاكاة السكان على مدى 90 ألف جيل. كان لدى السكان المؤسسين الأصليين دوائر جينية متطابقة غير متغيرة وتطوروا على مدى 30000 جيل ، يطلق عليهم مجتمعة السكان القدامى ، في ظل ظروف مستقرة. تعرضت الأجيال الثلاثين ألف التالية ، المسماة بالسكان المتوسطين ، لبيئات متقلبة تغيرت كل 20 جيلًا. آخر 30.000 جيل ، السكان المشتقون ، تعرضوا لبيئة مستقرة.

كان لدى الأفراد في المجموعات السكانية القديمة والمشتقة ، الذين تطوروا في بيئات مستقرة ، مستويات التعبير الجيني التي تم تحسينها لتحقيق الاستقرار. لكنهم كانوا مختلفين: لم يكن استقرار السكان القدامى ينطوي على تبديل النمط الظاهري ، في حين أن السكان المشتق منهم فعلوا ذلك. يشرح كوهارا أن الاختلاف ينبع من السكان الوسيطين ، حيث تم تفضيل التبديل من أجل التعامل مع الظروف المتقلبة.

تشير عمليات المحاكاة إلى أن مجموعات الكائنات الحية تحافظ على آلية التبديل الخاصة بها على مدى فترة طويلة من الاستقرار البيئي من خلال التطور التدريجي للمفاتيح ذات العتبة المنخفضة ، والتي تتحول بسهولة في الظروف المتقلبة إلى مفاتيح التبديل عالية العتبة عندما تكون البيئة أكثر استقرارًا.

يقول كوهارا إن هذا أسهل من العودة إلى حالة غير متغيرة من خلال تحولات طفرية صغيرة. يقول كوهارا: "بدلاً من ذلك ، ننتهي بنوع من التحويل الظاهري" الخفي "الذي يعمل كمكثف تطوري ، يخزن الاختلافات الجينية ويطلق أنماطًا ظاهرية بديلة في حالة حدوث اضطرابات كبيرة".

يخطط الفريق بعد ذلك لاستخدام المحاكاة الحاسوبية لدراسة أنظمة بيولوجية أكثر تعقيدًا مع التعاون أيضًا بشكل تفاعلي مع الباحثين الذين يجرون تجارب معمل رطب. هدفهم هو تطوير الأطر النظرية التي يمكن التحقق من صحتها تجريبيا.

المرجع: & # 8220 الصيانة الثابتة للمفاتيح المخفية كاستراتيجية لزيادة استقرار التعبير الجيني & # 8221 بواسطة Hiroyuki Kuwahara و Xin Gao ، 14 يناير 2021 ، علوم الطبيعة الحسابية.
DOI: 10.1038 / s43588-020-00001-y


أساليب

بيان الأخلاق

تم جمع العينات السريرية بموجب البروتوكولات المعتمدة من قبل لجان الأخلاقيات في كلية الطب في بلانتير ، ملاوي ، وجامعة ماريلاند ، بالتيمور. تم تقديم الموافقة الخطية المستنيرة من قبل المشاركين في الدراسة أو الأوصياء عليهم.

تصميم الدراسة والعينات

تم جمع عزلات الطفيليات من المشاركين في دراسة أترابية طولية أجريت في منطقة شيخواوا في جنوب ملاوي. تم وصف تفاصيل حول المشاركين وإجراءات الدراسة مسبقًا من قبل Buchwald وآخرون [29]. باختصار ، تمت متابعة 120 طفلاً وبالغًا إلى مركز مفيرا الصحي مصابين بالملاريا غير المعقدة بين يونيو 2014 ومارس 2015 شهريًا على مدار عامين. تم جمع عينات الدم في كل زيارة شهرية وجميع الزيارات غير المجدولة حيث أبلغ الأفراد إلى المركز الصحي بأعراض الملاريا. في كل زيارة ، تم تشخيص الطفيليات في الدم عن طريق الفحص المجهري و PCR. تم إنشاء البيانات التي تم تحليلها في هذه الدراسة من كريات خلايا الدم الحمراء التي تم جمعها من عدوى الملاريا المصحوبة بأعراض غير معقدة والتي تم تحديدها أثناء المتابعة السلبية. كان متوسط ​​طفيليات الدم للعدوى المأخوذة كما هو محدد بواسطة الفحص المجهري 21،960 طفيلي / ميكرولتر وتراوحت من 0 طفيلي / ميكرولتر (ولكنها إيجابية باختبار تشخيصي سريع) إلى 241،260 طفيليًا / ميكرولتر. تم التأكد من أن جميع العينات إيجابية ص. المنجلية بواسطة PCR. لضمان تضمين العدوى المستقلة فقط في التحليل ، تم استبعاد الإصابات داخل فرد مفصول بـ & lt14 يومًا. تم استخلاص الحمض النووي من كريات خلايا الدم الحمراء بطريقة زين أبادي وآخرون [68]. تم تخصيب الحمض النووي المستخرج من أجل الحمض النووي للطفيلي باستخدام نهج تضخيم الجينوم الكامل الانتقائي الأمثل الذي وصفه شاه وآخرون [65].

تسلسل الجينوم الكامل

تم إنشاء مكتبات DNA الجينومية للتسلسل باستخدام مجموعة إعداد مكتبة KAPA (Kapa Biosystems ، Woburn ، MA). تم تجزئة الحمض النووي (≥ 200 نانوغرام) باستخدام Covaris E210 إلى

200 نقطة أساس. تم إعداد المكتبات باستخدام نسخة معدلة من بروتوكول الشركة المصنعة. تمت تنقية الحمض النووي بين التفاعلات الأنزيمية وتم اختيار حجم المكتبة باستخدام حبات AMPure XT. تم تقييم المكتبات من حيث التركيز وحجم الشظايا باستخدام مقايسة الحساسية العالية للحمض النووي على LabChip GX (Perkin Elmer ، Waltham ، MA). تم أيضًا تقييم تركيزات المكتبة بواسطة qPCR باستخدام مجموعة أدوات قياس مكتبة KAPA. تم تجميع المكتبات وتسلسلها لاحقًا على Illumina HiSeq 4000 (Illumina ، سان دييغو ، كاليفورنيا) لإنشاء قراءة نهائية مزدوجة بمقدار 150 نقطة أساس.

قراءة الخرائط واتصالات SNP

تم تحليل بيانات التسلسل عن طريق تعيين ملفات fastq الأولية إلى الجينوم المرجعي 3D7 باستخدام Bowtie2 [69]. تمت معالجة ملفات خريطة المحاذاة الثنائية (BAM) باتباع سير عمل GATK Best Practices للحصول على قراءات جاهزة للتحليل [70،71]. تم استخدام Bedtools [72] لإنشاء تقديرات التغطية والعمق من القراءات المعالجة ، وتم اتباع سير عمل GATK Best Practices للاتصال المتغير [70،71]. تم استخدام Haplotype Caller لإنشاء ملفات تنسيق استدعاء متغير جينومي (GVCF) لكل عينة وتم إجراء اتصال SNP مشترك (GATK v3.7). تمت إزالة المتغيرات إذا كانت تفي بمعايير التصفية التالية: ثقة / جودة متغيرة حسب العمق (QD) & lt 2.0 ، انحياز حبلا (FS) & gt 60.0 ، مربع متوسط ​​الجذر لجودة التعيين (MQ) & lt 40.0 ، مجموع تصنيف جودة الخرائط (MQRankSum ) & lt -12.5 ، قراءة مجموع رتبة الموضع (ReadPosRankSum) & lt -8.0 ، الجودة (QUAL) & lt 50. تمت إزالة المواقع المتغيرة التي تحتوي على & gt20٪ من الأنماط الجينية المفقودة والعينات مع & gt30٪ بيانات مفقودة بالإضافة إلى ذلك باستخدام vcftools. تمت إزالة المتغيرات أيضًا إذا لم يكن الأليل الصغير موجودًا في عينتين على الأقل. تم استخدام الجينوم الأساسي فقط لمزيد من التحليل ، والذي تم تحديده مسبقًا من خلال استبعاد المناطق التيلوميرية والوسطى شديدة التغير من الجينوم [73]. كانت النسبة المئوية المتوسطة للجينوم الذي تمت تغطيته بـ 20 قراءة 88.9٪ [65]. بعد تطبيق مرشحات مراقبة الجودة ، تم استدعاء 55970 تعدد الأشكال في الجينوم الأساسي ، بما في ذلك 22177 تعدد الأشكال غير المترادفة ، بمتوسط ​​11.6 متغيرًا يسمى لكل جين.

تعريف الحالة المناعية

تم تحديد درجة المناعة ضد الملاريا السريرية بناءً على نسبة العدوى المصحوبة بأعراض من الجميع ص. المنجلية الالتهابات التي عانى منها كل مشارك في الدراسة على مدار الدراسة التي استمرت عامين. لحساب التعرض ، تم استبعاد الأفراد الذين يعانون من أقل من خمسة إصابات إجمالية ، بما في ذلك الالتهابات المصحوبة بأعراض وعديمة الأعراض ، من التحليل. تم استخدام النسبة المتوسطة للعدوى المصحوبة بأعراض كقطع لتصنيف الأفراد إلى مجموعات مناعة أعلى وأقل. لم يسمح لنا حجم العينة المحدود لدراستنا بتصنيف الحالة المناعية كمتغير ترتيبي.

تعقيد العدوى والتمايز الجيني

تم تضمين إصابة واحدة فقط من كل فرد في المقارنات بين مجموعات المناعة العالية والمنخفضة. تم اختيار العدوى بناءً على القرب من متوسط ​​توزيع تواريخ أخذ العينات لتقليل التباين الزمني. تم استخدام DEploid-IBD [39] لتقدير نسبة كل استنساخ داخل العدوى. تم تعريف العدوى بدون استنساخ سائد (أي حيث كان للنسخة الأغلبية تكرارًا و 60٪ داخل العدوى) على أنها عدوى معقدة وتم استبعادها من تحليل المصب. بالنسبة للعينات المتبقية ، تم استدعاء الأليل الرئيسي في مواضع غير متجانسة الزيجوت إذا كان الأليل مدعومًا بنسبة 70 ٪ من القراءات بخلاف ذلك ، تم ترميز النمط الجيني على أنه مفقود. تم استخدام اختبار Wilcoxon-Mann-Whitney لتقييم الاختلافات في وتيرة استنساخ الأغلبية في العدوى من مجموعتي المناعة.

تم استخدام Vcftools [74] لتقدير Weir و Cockerham Fشارع في مواقع متغيرة غير مترادفة ثنائية الأليلات. تم تحديد الدلالة باستخدام 10000 تبديل ، حيث تمت إعادة أخذ عينات السكان المرصودة دون استبدال. لتحديد تأثير إجراء التحليل بناءً على الأليل السائد في مواقع biallelic ، أجرينا أيضًا التحليل باستخدام مواقع multiallelic وجميع الأليلات داخل العدوى. بالرغم ان Fشارع كانت القيم أعلى بشكل عام في التحليل باستخدام أليلات متعددة مقارنة بالتحليل باستخدام أليل رئيسي واحد ، كما تم تمييز المواقع التي تم تمييزها بشكل كبير في التحليل بناءً على الأليل الرئيسي بشكل كبير في التحليل حيث تم أيضًا تضمين الأليلات الثانوية. تم تقدير تنوع النوكليوتيدات في مواقع متباينة بشكل كبير باستخدام أدوات vcftools [74]. تم استخدام PlasmoDB (v44) [22] لتحديد الجينات التي تحتوي على تعدد الأشكال المتباينة.

في جميع حالات العدوى متعددة النسيلة ، تمت مقارنة الحيوانات المستنسخة الرئيسية والثانوية (المحددة بترددات الاستنساخ التي تم الحصول عليها من DEploid-IBD [39]) ، بشرط أن يكون تكرار الاستنساخ أقل من 80٪ وأكبر من 10٪ (n = 23). في كل موقع غير مرادف ، تم تقدير نسبة العينات ذات الأليلات غير المتطابقة من الحيوانات المستنسخة الرئيسية والثانوية. ثم تمت مقارنة نسبة عدم التطابق بين المواقع المتمايزة بشكل كبير وجميع المواقع المتغيرة المتبقية من الجينوم. ال ص- تم تقدير القيمة من خلال إجراء اختبار Wilcoxon-Mann-Whitney لتحديد ما إذا كان هناك فرق كبير في عدم التطابق بين الحيوانات المستنسخة في مواقع مختلفة عكس المواقع المتغيرة على نطاق الجينوم المتبقي.

تحليل العدوى المزدوجة

تم تضمين الأفراد الذين لديهم بيانات تسلسل الجينوم الكامل للطفيلي من عدوى عرضية على الأقل تحدث بفاصل 14 يومًا على الأقل في مقارنة العدوى التي تحدث داخل نفس المضيف بالعدوى التي تحدث في مضيفين مختلفين. تم تضمين المواقع متعددة الأليلات في تحليل العدوى المزدوجة ، على عكس تحليلات التمايز الجيني. تضمنت المجموعة "ضمن" جميع أزواج الطفيليات التي تم جمعها في نقاط زمنية مختلفة من نفس الفرد. "بين المجموعة" ، تضمنت جميع أزواج الطفيليات من أفراد مختلفين. تم تضمين ما مجموعه 116 عينة في هذا التحليل. احتوت المجموعة الداخلية على 124 زوجًا من العينات ، واحتوت المجموعة الواقعة بين المجموعة على 6546 زوجًا من العينات. بالنسبة لجميع الأزواج ، تمت مقارنة الحالة الأليلية في كل موقع وتم تقدير نسبة الأزواج ذات الحالات الأليلية غير المطابقة حسب الموقع (موضح في الشكل 3). تم حساب الفرق بين المجموعة الداخلية والمجموعة البينية بطرح نسبة الأزواج ذات الحالات الأليلية غير المتطابقة لكل موقع. ال ص-تم تقدير القيمة عن طريق إجراء اختبار z أحادي الجانب باستخدام الفرق في نسبة الأليلات غير المتطابقة بين المجموعتين. تم استخدام PlasmoDB [22] لتحديد الجينات التي تحتوي على SNPs ذات الأهمية.

التنوع العالمي في clag8

تم استخدام بيانات الإصدار 5.1 من مشروع MalariaGEN Pf3K [52] لتقدير التنوع العالمي في هذه الجينات المحددة في هذه الدراسة. تتضمن مجموعة بيانات Pf3K بيانات تسلسل الجينوم الكاملة من 2512 عينة تم جمعها في مواقع متعددة في آسيا وأفريقيا. تم أيضًا تضمين البيانات [53،54] من 156 عزلة إضافية من بابوا غينيا الجديدة في التحليل. تم استخدام VaxPack (https://github.com/BarryLab01/vaxpack) للتحليل الجيني للسكان على مستوى العالم. تم استخدام GATKv4.0 للاتصال البديل. تمت إزالة العينات التي تحتوي على قواعد غامضة. تم تحويل SNPs Singleton مرة أخرى إلى مرجع لمنع المتغيرات الإيجابية الخاطئة. تم حساب تنوع النيوكليوتيدات و Tajima's D لجميع المواقع متعددة الأشكال بشكل منفصل لكل دولة لديها حجم عينة أكبر من 50. تم استخدام طريقة Templeton و Crandall و Sing (TCS) [75] على PopArt [76] لإنشاء شبكة النمط الفرداني باستخدام SNPs غير مترادفة. تم التنبؤ بمنطقة اضطراب البروتين ومناطق حاتمة الخلية B باستخدام PlasmoSIP [62]. تم تقدير ترددات النمط الفرداني للمنطقة الطرفية C في العزلات الملاوية من مجموعات المناعة المختلفة للمواقع غير المترادفة باستخدام DnaSP v6 [77].


مقدمة

على الرغم من طوفان مجموعات البيانات المكتسبة مع فحص الاضطرابات الجينية عالية الإنتاجية (HT-GPS) ، فإن وظيفة عدد كبير من الجينات البشرية لا تزال غير مفهومة جيدًا (Dey وآخرون، 2015). علاوة على ذلك ، فإن علم الوجود الجيني (GO) ، وهو التعليق التوضيحي الأكثر شمولاً وتنظيمًا لوظائف الجينات ، يقتصر إلى حد كبير على نوع الخلية ووظائف الجينات المستقلة عن السياق (Huntley وآخرون، 2015). ومع ذلك ، فإن وظيفة الجينات سياقية للغاية ، حتى بالنسبة للكائنات أحادية الخلية (Radivojac وآخرون، 2013 ليبرالي وآخرون، 2014). لذلك ، هناك حاجة ملحة لطرق جديدة تسمح باكتشاف الجينات الوظيفية المعتمدة على البيانات والمعتمدة على السياق بناءً على أنماط ظاهرية أكثر تعقيدًا للكائنات متعددة الخلايا.

على الرغم من أن HT-GPS أثبت أنه طريقة قوية لاكتشاف وظائف الجينات الجديدة ، إلا أن تحليل مجموعات البيانات هذه ظل مهمة صعبة. ويرجع ذلك إلى تعقيد الأنماط الظاهرية التي يمكن أن يؤدي إليها اضطراب جين واحد ، حيث يمكن للجين أن يشارك في وظائف مختلفة بمقاييس مختلفة. تعتمد هذه الوظائف على توطين منتج الجين في الخلية (على سبيل المثال ، السيتوبلازم مقابل النواة لعوامل النسخ) ، حالة دورة الخلية (على سبيل المثال ، G1 ، G2 أو S المرحلة) ، نوع الخلية ، الخلية والتفاعلات بين الخلية والخلية المكروية وظروف العلاج (سيرو وآخرون، 2015). لا تمثل خطوط أنابيب التحليل الحالية القائمة على التجميع غير الخاضع للإشراف هذه العوامل بشكل عام. وبالتالي ، يصعب تفسير المجموعات المظهرية الناتجة لأنها قد تتكون من أنماط فرعية مختلفة (Yin وآخرون، 2013 سايلم وآخرون، 2014). غالبًا ما يتم تجنب هذه التحديات ، لا سيما في الشاشات القائمة على الصور ، من خلال تحليل جزء صغير فقط من المعلومات الموجودة في مجموعات بيانات HT-GPS (سينغ وآخرون، 2014) مما يقلل إلى حد كبير من إمكاناتهم.

تم تطبيق التعلم الآلي الخاضع للإشراف بنجاح في العديد من دراسات HT-GPS (Held وآخرون، 2010 نيومان وآخرون، 2010 شريف وآخرون، 2010 سوليفان وآخرون، 2018 ايراسلان وآخرون، 2019). أحد الحلول الجذابة لمعالجة نقص التعليقات التوضيحية المظهرية هو استخدام المعرفة البيولوجية الحالية لبناء أنظمة ذكية يمكنها تحديد السمات والأنماط الظاهرية ذات الصلة وظيفيًا.يخضع هذا النهج للإشراف الضعيف لأن المعرفة الحالية لا يمكن أن توفر سوى تسميات صاخبة (Dutta وآخرون، 2020). تم تطبيق الأساليب التي تستخدم التعليقات التوضيحية الوظيفية الحالية بنجاح لاستدلال نشاط المسارات (Schubert وآخرون، 2018) بالإضافة إلى التنبؤ بوظائف البروتين من أنواع بيانات متعددة بما في ذلك تسلسل البروتين وهيكله ، ونسالة ، بالإضافة إلى تفاعلات البروتين والبروتين وشبكات التعبير الجيني المشترك (Radivojac وآخرون، 2013 داي وآخرون، 2015 جيانغ وآخرون، 2016). بالإضافة إلى ذلك ، تم القيام بعمل رائد في استنتاج علم الوجود الجيني المستند إلى البيانات في الخميرة (Kramer وآخرون، 2014 Yu وآخرون، 2016 أماه وآخرون، 2018). ومع ذلك ، على حد علمنا ، لم يتم تطبيق هذا النهج في سياق مجموعات بيانات HT-GPS واسعة النطاق في الكائنات متعددة الخلايا حيث يكون التكرار الجيني والتعقيد الظاهري أعلى بكثير.

التقييم المنهجي لمجموعات الجينات في السياقات البيولوجية المختلفة عن تلك التي من المعروف أنها تعمل فيها يمكن أن يكشف عن رؤى قيمة في تنظيم النظم البيولوجية. على سبيل المثال ، أدوار الجينات في سياق التطور ، مثل تطوير الأديم المتوسط ​​(MSD) ، والذي يتضمن تنسيق هجرة الخلايا والالتصاق الخلوي وتنظيم الهيكل الخلوي من خلال إشارات TGFβ و WNT ، غالبًا ما يتم تحريرها في سياق سرطان القولون والمستقيم ( كلينوسكا وآخرون، 1994 مكماهون وآخرون، 2010 كيكر وآخرون، 2016). لذلك ، فإن تحديد التواقيع المظهرية المرتبطة بجينات MSD المضطربة قد يلقي الضوء على كيف يمكن أن يساهم عدم تنظيم جينات MSD في تطور سرطان القولون والمستقيم.

يمكن توضيح أهمية توصيف وظائف الجينات المعتمدة على السياق من خلال الأدلة المتزايدة على دور المستقبلات الشمية في أمراض مثل السرطان (لي وآخرون، 2019). تشكل المستقبلات الشمية أكبر عائلة جينية في البشر (

400 جين) تم اكتشافها عام 1991 في الخلايا العصبية الحسية. ومع ذلك ، فإن وظائفها في الأنسجة غير الحسية غير مفهومة جيدًا (Maßberg & Hatt ، 2018). إن التحقيق في تشابه الأنماط الظاهرية لاضطراب المستقبلات الشمية مع اضطراب برامج الجينات المعروفة من شأنه أن يتيح اكتشاف وظائفها في أنواع الأنسجة المختلفة.

هنا ، نقترح KCML ، إطار عمل جديد لاكتشاف المعرفة الآلي من HT-GPS واسع النطاق. تم تصميم KCML لمراعاة التأثيرات المظهرية متعددة الاتجاهات والتي تخترق جزئيًا لفقدان الجينات. نطبق هذا الإطار على ثلاث مجموعات بيانات كبيرة الحجم تم إنشاؤها بواسطة طرق مختلفة ، مع وصف الأنماط الظاهرية على المستويات الجزيئية والخلوية والأنسجة ، وإظهار أنها تتفوق في الأداء على خطوط أنابيب التحليل الحالية. نقوم بتحليل النمط الظاهري لتنظيم الخلية الذي يحدده KCML ويربط بالجينات المشروحة بمصطلح تطوير الأديم المتوسط ​​(MSD). تتضمن تنبؤات KCML العديد من الجينات في مسارات إشارات TGFβ و WNT بالإضافة إلى العديد من المستقبلات الشمية. من خلال تحليل تكاملي مع بيانات التعبير الجيني لمرضى سرطان القولون والمستقيم ، نتحقق من صحة الرابط بين التعبير عن المستقبلات الشمية وإشارات TGFβ و WNT ونبين أن التعبير عن بعض المستقبلات الشمية يمكن أن يقسم نتائج مرضى سرطان القولون والمستقيم من الدرجة الأولى. باختصار ، KCML هو إطار عمل مرن ومنهجي لتحليل مجموعات بيانات HT-GPS بشكل شامل وتحديد السياق والوظائف الجينية المعتمدة على الأنسجة.


محتويات

شرح الكتاب

هذا "الكتاب المدرسي" تفاعلي ، مما يعني أنه على الرغم من أن كل فصل يحتوي على نص ، إلا أنه يحتوي أيضًا على محتوى HTML5 تفاعلي ، مثل الاختبارات القصيرة والمحاكاة ومقاطع الفيديو التفاعلية والصور ذات النقاط الفعالة القابلة للنقر. يتلقى الطلاب ملاحظات فورية عندما يكملون المحتوى التفاعلي ، وبالتالي يمكنهم التعلم والتحقق من فهمهم كل ذلك في مكان واحد. ما زلت أعتبر هذا الكتاب المدرسي ثقيلًا إلى حد ما في النص وسيستمر في جعله أكثر محتوى تفاعليًا!

تمثل الصورة الموجودة على الغلاف إنشاء هذا الكتاب. لقد قمت بسحب معظم المحتوى من المصادر المفتوحة ، وقمت بتعديلها ، وإضافة أسئلة ، والآن أقدمها لك لتستخدمها!

اخترت المحتوى ليتماشى مع دورتين أقوم بتدريسهما: التطبيقات البيئية والعضوية والتطبيقات الطبية الحيوية. تُعرف الوحدة الأولى الطلاب بالعلوم ، والتي يستخدمها كلا الدورتين. تغطي الوحدة 2 المحتوى الضروري لفهم آثار الحفظ (الموضوع الأساسي للدورة هو التخلص من الانقراض) ، وتركز الوحدة 3 على البروتينات حتى يتمكن الطلاب من فهم الآثار المترتبة على تعديل الحمض النووي (الموضوع الأساسي هو كريسبر).

يرجى استخدام هذا الكتاب كما تراه مناسبًا لصفوفك. إنني أتطلع إلى سماع كيفية جعل هذا الكتاب أكثر فائدة في المستقبل!


شاهد الفيديو: كل شئ عن البروتين ماهي البروتين كيفية استخدام هل البروتين تسبب العقم (يوليو 2022).


تعليقات:

  1. Ephraim

    مماثل هل هناك شيء؟

  2. Mezishakar

    أنا آسف ، ولكن ، في رأيي ، ترتكب أخطاء. دعونا نحاول مناقشة هذا. اكتب لي في PM.

  3. Medus

    أعتقد أنك مخطئ. أنا متأكد. يمكنني الدفاع عن موقفي. أرسل لي بريدًا إلكترونيًا إلى PM ، سنتحدث.

  4. Quincy

    لقد اشترك خصيصًا في المنتدى ليقول شكرًا لك على الدعم.

  5. Yomi

    هناك عيوب أخرى أيضًا



اكتب رسالة