معلومة

تسلسل ChIP لتعديل هيستون لا يتفق مع RNA-seq للتعبير


لدي ChIP-seq لـ H3K79me2 و H3K36me3 وبيانات RNA-seq للعينات المعالجة وغير المعالجة. هذان الهيستونان يميزان الجينات النشطة. دعنا نقول ، من الناحية النظرية ، يجد المتصل الذروة مواقع تفاضلية في الجين A لكل من تعديلات هيستون هذه. ومع ذلك ، عندما أقوم بتشغيل أدوات تحليل RNA-seq (مثل edgeR أو DESeq2) ، لا يتم تمييز هذا الجين على أنه معبر عنه بشكل تفاضلي (حسنًا ، له قيمة FDR> 0.05).

قد يكون هناك العديد من الأسباب الفنية لطرق تحليل RNA-seq لعدم العثور على هذا الجين كما يتم التعبير عنه تفاضليًا بسبب

  1. في الحقيقة لا يتم التعبير عنه بشكل تفاضلي
  2. أو لم يتم التعبير عنها بشكل تفاضلي بما يكفي للأدوات لاكتشافها

ومع ذلك ، فأنا مهتم أكثر بالجانب البيولوجي. إذا حددت هيستونان الجين A على أنه نشط في العينات المعالجة ، فمن المتوقع أن يتم التعبير عنه في RNA-seq. ما هي الآلية التي يمكن أن تؤدي إلى نتيجة أنه على الرغم من أن الجينات يتم تمييزها على أنها نشطة بواسطة الهستونات ، فلن يتم التعبير عنها بشكل تفاضلي في RNA-seq؟


من الصعب استخلاص أي نتيجة دون مزيد من التجارب. قد يكون هناك العديد من العوامل الأخرى التي تمنع التعبير عن الجين بما في ذلك عوامل مثل منظمات ما بعد النسخ. بعض تعديلات هيستون مثل تلك التي ذكرتها هي أيضًا مشبوه بعض الشيء ويمكن أن تكون هناك تعديلات ثنائية التكافؤ أيضًا. ومع ذلك ، إذا كان هناك سبب قوي للتكهن بأن هذه العلامات مرتبطة بالقمع ، فيمكنك تجربة ما يلي:

  1. يمكنك التحقق من عدد الجينات الموجودة التي لا يتوافق تعبيرها مع علامات هيستون. إذا كان هذا لعدد صغير من الجينات ، فيمكنك التحقق منها بشكل منفصل. استخدم اختبارًا إحصائيًا للتحقق من أهمية الارتباط بين علامة هيستون والتعبير. إذا كان الخلاف واسع الانتشار ، فأقترح عليك تكرار RNAseq (أسهل وأرخص من تكرار ChIP-seq). راجع للشغل ، كيف كانت صفات القراءة؟ بناءً على ذلك ، يمكنك تحديد التجربة التي تحتاج إلى التكرار. سيساعدك التكرار على معرفة ما إذا كانت الملاحظة صحيحة بالفعل (نسخة بيولوجية) ؛ ربما ينتهي بك الأمر أيضًا إلى استنتاج أن هذه العلامات مشبوه في الواقع.

  2. إذا أظهرت بعض الجينات عدم توافق ، فقم فقط بإجراء تفاعل البوليميراز المتسلسل في الوقت الحقيقي لهذه الجينات. يعتبر RT-PCR أكثر حساسية وهناك تقنية أخرى للقياس الكمي جيدة على أي حال. استخدم أيضًا بعض الجينات المتوافقة في التجربة.


ChIP-seq ليس مثاليًا. حتى بين التكرارات التقنية ، تحصل على قدر لا بأس به من التباين ، خاصة بالنسبة للعلامات الواسعة مثل تلك التي تستخدمها. من غير المألوف رؤية الأشخاص يستخدمون H3K79me2 و H3K36me3 لتحديد ما إذا كان الجين معبرًا أم لا. يعد استخدام H3K4me3 و H3K27ac أو H3ac طريقة أكثر شيوعًا لتمييز مروجي الجينات المنسوخة.

40 جينًا متعارضًا لن يقلقني كثيرًا ما لم يكن لديك حقًا قراءات منخفضة لأي مجموعة من تجارب التسلسل. اقتراح @ WYSIWYG لاستخدام RT-PCR للتحقق من بيانات RNA-seq لعدد قليل من الجينات هو اقتراح جيد.


تكشف ChIP-seq و RNA-seq للبراعم الشجرية المعقدة والمنخفضة الوفرة عن الديناميكيات المشتركة للكروماتين والتعبير أثناء سكون برعم الكرز الحلو

يعد تسلسل الكروماتين المناعي (ChIP-seq) تقنية قوية لدراسة التفاعلات بين البروتينات ، مثل الهيستونات أو عوامل النسخ والحمض النووي. هذه التقنية مع تسلسل الحمض النووي الريبي (RNA-seq) هي أداة قوية لفهم العمليات البيولوجية في حقيقيات النوى بشكل أفضل. لقد طورنا بروتوكولًا مدمجًا لـ ChIP-seq و RNA-seq لبراعم الأشجار (Prunus avium L. ، برونوس بيرسيكا L دفعة ، Malus x domestica بورخ.) التي تم اختبارها أيضًا بنجاح نبات الأرابيدوبسيس thaliana و خميرة الخميرة. تحتوي براعم الأشجار على مركبات فينولية تتداخل سلبًا مع استخراج ChIP و RNA. بالإضافة إلى حل هذه المشكلة ، تم تحسين بروتوكولنا للعمل على كميات صغيرة من المواد. علاوة على ذلك ، تتمثل إحدى مزايا هذا البروتوكول في أن عينات ChIP-seq متشابكة بعد التجميد السريع ، مما يجعل من الممكن العمل على الأشجار التي تنمو في الحقل وأداء ChIP-seq و RNA-seq على نفس مادة البداية . مع التركيز على البراعم الخاملة في الكرز الحلو ، استكشفنا الرابط بين مستوى التعبير وإثراء H3K4me3 لجميع الجينات ، بما في ذلك الارتباط القوي بين إثراء H3K4me3 في MADS-BOX المرتبط بشكل دائم 5 (بافدام 5) الموقع ونمط تعبيره. سيسمح هذا البروتوكول بتحليل ديناميكيات الكروماتين والنسخة في براعم الأشجار ، ولا سيما أثناء تطورها واستجابتها للبيئة.


منظر نصي لدورة الخلية البشرية

تمت دراسة التعبير الجيني للحالة المستقرة عبر دورة الخلية على نطاق واسع. ومع ذلك ، فإن تنظيم الجينات النسخية وديناميكيات تعديل هيستون في مراحل دورة الخلية المختلفة غير معروفة إلى حد كبير. من خلال تطبيق مزيج من تسلسل التشغيل النووي العالمي (GRO-seq) ، وتسلسل RNA (RNA-seq) ، وتسلسل رقاقة تعديل هيستون (ChIP-seq) ، قمنا بتصوير مشهد نسخي شامل في G0 / G1 ، G1 / S و M من خلايا سرطان الثدي MCF-7. الأهم من ذلك ، حدد تحليل GRO-seq و RNA-seq جينات مختلفة تنظم دورة الخلية ، مما يشير إلى وجود فجوة بين النسخ والتعبير عن الحالة المستقرة أثناء دورة الخلية. ومن المثير للاهتمام ، أننا حددنا الجينات التي تم نسخها بنشاط في المرحلة M المبكرة والتي تكون أطول في الطول وذات تعبير منخفض ويصاحبها زيادة عالمية في ميثيل هيستون 3 ليسين 4 النشط (H3K4me2) وتعديلات هيستون 3 ليسين 27 أستلة (H3K27ac). بالإضافة إلى ذلك ، حددنا 2،440 من الحمض النووي الريبي المعزز المنظم لدورة الخلية (eRNAs) التي ترتبط ارتباطًا وثيقًا بالنسخ النشط التفاضلي ولكن ليس بمستويات التعبير المستقرة عبر دورة الخلية. توقع تحليل الحافز لـ eRNAs الديناميكية عامل يشبه Kruppel 4 (KLF4) كمنظم رئيسي لانتقال G1 / S ، وتم التحقق من صحة هذا التحديد تجريبيًا. مجتمعة ، تميز تحليلنا المشترك بملف تعريف النسخ وتعديل هيستون لدورة الخلية البشرية وتحديد التوقيعات النسخية الديناميكية عبر دورة الخلية.

الكلمات الدالة: تنظيم النسخ الوراثي لدورة الخلية GRO-seq الوليدة RNA.

بيان تضارب المصالح

الكتاب تعلن أي تضارب في المصالح.

الأرقام

تحديد GRO-seq و RNA-seq مختلف ...

تحدد GRO-seq و RNA-seq الجينات المختلفة المنظمة لدورة الخلية. ( أ ) رسم توضيحي للنسخ ...

نسخ نشط في وقت مبكر M ...

النسخ النشط في مرحلة مبكرة. ( أ ) تجميع نسخ تفاضلية ...

الزيادة العالمية في H3K4me2 و ...

الزيادة العالمية في إشارات H3K4me2 و H3K27ac في المرحلة M. ( أ…

تحديد دورة الخلية- eRNAs المنظمة. (...

تحديد دورة الخلية- eRNAs المنظمة. ( أ ) سير العمل لتحديد eRNAs الخاصة بدورة الخلية والمرحلة ...

KLF4 ينظم eRNAs والهدف ...

ينظم KLF4 eRNAs والجينات المستهدفة للتحكم في انتقال G1 / S. ( أ )…


المواد والأساليب

مجموعة من العينات الأولية من جامعة جونز هوبكنز

تم الحصول على عينات أنسجة الورم الأولية من مجموعة من 47 مريضًا يعانون من سرطان الخلايا الحرشفية المرتبط بفيروس الورم الحليمي البشري ، كما هو موضح سابقًا (13). للمقارنة ، تم الحصول على أنسجة مخاطية صحية من البلعوم الفموي من عينات جراحية رأب البلعوم (UPPP) من 25 عنصر تحكم غير مصاب بالسرطان (13). تم جمع جميع عينات الأنسجة من الأنسجة الأساسية لجونز هوبكنز (JHU) بموجب بروتوكول مجلس المراجعة المؤسسية (IRB) المعتمد (NA_00036235) بعد الحصول على الموافقة الخطية المستنيرة من جميع الأشخاص. يسمح هذا البروتوكول أيضًا باستخدام أنسجة الورم لتطوير نموذج PDX. هذه الدراسة مؤهلة للإعفاء بموجب سياسة وزارة الصحة والخدمات الإنسانية الأمريكية لحماية الأفراد [45 CFR 46.101 (b)] (رقم دراسة IRB هو NA_00036235). يتم توفير تفاصيل إضافية في المواد والطرق التكميلية.

خطوط الخلية

تم توفير خطوط الخلايا البشرية HPV + HNSCC UM-SCC-047 و UPCI-SCC-090 من قبل الدكتور توماس كاري (جامعة ميشيغان ، آن أربور ، ميتشيغن) والدكتورة سوزان غولين (جامعة بيتسبرغ ، بيتسبرغ ، بنسلفانيا) ، على التوالي . يتم توفير تفاصيل إضافية في المواد والطرق التكميلية.

الكشف عن فيروس الورم الحليمي البشري

تم استخدام أربع منهجيات مستقلة للتحقق من حالة فيروس الورم الحليمي البشري في جميع عيناتنا: فى الموقع التهجين من أجل HR-HPV ، وتلطيخ ICH لـ p16 ، واكتشاف qRT-PCR لـ HPV DNA ، والكشف المستند إلى RNA-Seq للتعبير عن فيروس الورم الحليمي البشري. يتم توفير تفاصيل إضافية في المواد والطرق التكميلية.

اختيار العينات لتحليل ChIP-Seq

تم استخدام عينتين من فيروس الورم الحليمي البشري + OPSCC من مجموعة الأورام الأولية بجامعة جونز هوبكنز (13) لتحضير الجيل الأول (F1) من طرز PDX ، PDX1 و PDX2 ، باستخدام إجراءات xenografting الموصوفة في المراجع. 6 و 15 لتحليل ChIP-Seq. تم جمع بيانات RNA-Seq لهذه PDXs باستخدام الأساليب وإجراءات التطبيع الموصوفة سابقًا (13). للتأكد من أن نماذج PDX كانت مشابهة لعينات الورم التي تم اشتقاقها منها ، قمنا بمقارنة ملف تعريف التعبير الجيني RNA-Seq بملف تعريف الأنسجة الأبوية المقابلة. كانت معاملات ارتباط بيرسون 0.83 لـ PDX1 و 0.9 لـ PDX2 ، وكلاهما ص كانت القيم أقل من 10 -16. كانت هذه النتيجة متسقة مع ملاحظاتنا السابقة بأن الملفات الشخصية عالية الإنتاجية في عينات HNSCC PDX كانت أكثر تشابهًا مع أنسجة الورم الأبوي أكثر من عينات الورم الأخرى أو خطوط الخلايا (6). أجرينا أيضًا تحليل ChIP-Seq على سطرين خلية HPV + HNSCC (UM-SCC-047 و UPCI-SCC-090) وعينتين UPPP (UPPP1 و UPPP2) ، حيث كانت كلتا عينات UPPP من نفس مجموعة JHU (13) . UPPP هو الإجراء الجراحي الوحيد الذي يتم إجراؤه في منطقة الفم والبلعوم في الأفراد الأصحاء ، والذي يسمح بجمع أنسجة الفم والبلعوم من مرضى غير مصابين بالسرطان كعناصر تحكم ، بما يتوافق مع دراسات الجينوم السابقة لـ HNSCC (16-18). أيضًا ، كانت عينات UPPP التي تم اختيارها للدراسة هنا مماثلة للجنس والعرق والعرق والتدخين وحالة الشرب لتلك الخاصة بعينات HPV + HNSCC المختارة لتحليل ChIP-Seq (الجدول التكميلي S1). مكنت هذه المطابقة للأورام والضوابط من استنتاج الاختلافات الخاصة بالورم في بنية الكروماتين ، بغض النظر عن التأثيرات الخاصة بالأنسجة على بنية الكروماتين.

علامات هيستون المستخدمة في تحليل ChIP-Seq

تم اختيار تعديلات هيستون H3K4me3 و H3K9ac و H3K9me3 و H3K27ac لتحليل ChIP-Seq. تم اختيار H3K4me3 و H3K9ac و H3K27ac لأنها كانت متورطة بشدة في تنظيم التعبير الجيني (19). تم اختيار علامة H3K9me3 القمعية كعنصر تحكم سلبي.

حفظ العينات

نمت الخلايا إلى 80٪ التقاء. احتوى كل تحضير ترسيب مناعي (IP) على 4 × 10 6 خلايا. تم التحقق من رقم الخلية بواسطة Cellometer Auto T4 (Nexcelom Bioscience). تم أخذ الخلايا القابلة للحياة من المزرعة مباشرة إلى تجارب ChIP. عند جمع عينات الأنسجة ، تمت إزالة المواد غير المرغوب فيها مثل الدهون والمواد الميتة من العينة. ثم تم تجميد الأنسجة في النيتروجين السائل للمعالجة اللاحقة. للحصول على أفضل نتائج للكروماتين ونتائج ChIP ، استخدمنا 25 ملغ من الأنسجة لكل ترسيب مناعي. تُترك الأنسجة المجمدة لتذوب على الجليد وتم تحديد الكتلة بالوزن.

الارتباط المتبادل بين البروتين والحمض النووي

تم تحضير ChIP-DNA باستخدام SimpleChIP Enzymatic Chromatin IP Kit # 9005 (تقنية تشوير الخلية) الذي تم تطويره مؤخرًا باتباع بروتوكول الشركة المصنعة مع تعديلات خاصة بالعينة في نوكلياز المكورات الدقيقة وخطوات صوتنة. تم استخدام 10 × PBS pH 7.4 من Quality Biological Inc. حيثما يشار إلى PBS.

MNase / صوتنة

تم هضم العينات بواسطة كل من نوكلياز المكورات الدقيقة و صوتنة. تم تحسين هذه العملية بالإضافة إلى ذلك واتبعها الرحلان الكهربائي للهلام لضمان القص المنتظم للحمض النووي عبر الجينوم. يتم توفير تفاصيل إضافية في المواد والطرق التكميلية.

تم استخدام كميات متساوية من الكروماتين لكل خطوة IP مع أداء استثنائي (XP) mAbs تم التحقق من صحته لتطبيق ChIP (تقنية تشوير الخلية). تمت إضافة mAbs الأرانب في تخفيف خاص بناءً على تركيز محسن تم تقييمه عبر مجموعة متنوعة من mAbs التجارية. تم استخدام تخفيف 1:50 للأجسام المضادة H3K4me3 (9751) ، H3K9ac (9649) ، H9K9me3 (13969) وتخفيف بنسبة 1: 100 للأجسام المضادة H3K27ac (8173) لعزل مقاطع الحمض النووي المرتبطة بتعديل هيستون الفردي. استخدمنا 1:50 إجمالي الجسم المضاد H3 (4620) المخفف كعنصر تحكم إيجابي و 1: 250 أرنب طبيعي مخفف IgG (2729) كعنصر تحكم سلبي. تم استخدام شاكر حاضنة 3527-5 (Lab-Line) أثناء الشطف. تمت تنقية ChIP-DNA وقياسها باتباع بروتوكول مجموعة ChIP. تم استخدام الجزء 1/50 (2٪) من نفس الكروماتين لكل عينة (PDX1 ، PDX2 ، UPPP1 ، UPPP2 ، UM-SCC-047 ، UPCI-SCC-090) لاستخراج الحمض النووي لتخطي خطوات تخصيب الجسم المضاد وكان كذلك تستخدم لـ qRT-PCR والتسلسل كعنصر تحكم في الإدخال.

الوقت الحقيقي الكمي PCR

خضع ChIP-DNA لـ qRT-PCR باستخدام نظام PCR سريع الوقت الحقيقي TaqMan 7900HT (النظم البيولوجية التطبيقية) وفقًا لتوصيات الشركة المصنعة. استخدمنا مختبر Johns Hopkins القياسي 10 × PCR Buffer (20) ، dNTPs (Bioline) ، FAM (Thermo Fisher Scientific). الاشعال والتحقيقات المصممة في منطقة المروج من المعبر عنها بنشاط جابده و RPL10 الجينات ، و 3 نهاية النسخ المكبوتة ZNF333 الجين (انظر الجدول التكميلي S2 للحصول على التفاصيل المرجع 19). تم تحليل كل عينة في ثلاث نسخ وخضعت لدورة واحدة مدتها 10 دقائق عند 95 درجة مئوية ، و 50 دورة من 15 ثانية 95 درجة مئوية / 60 ثانية 60 درجة مئوية. تم تحديد كمية تخصيب الطي النسبي للهيستونات المختلفة في العينات الفردية في ثلاث نسخ بالنسبة لعينة الإدخال 2 ٪ باستخدام 2 −ΔΔ ج ر طريقة (21).

تسلسل الجينوم الكامل ChIP-DNA والتطبيع

تم صوت ChIP-DNA للعينة الفردية / الجسم المضاد وعناصر التحكم في المدخلات الخاصة بهم ، وتم إصلاحها نهائيًا ، وربطها بمحولات تسلسل SOLiD P1 و P2 التي تفتقر إلى مجموعات 5 فوسفات ، باستخدام NEBNext DNA Library Prep Set for SOLiD وفقًا للبروتوكول الموصى به من الشركة المصنعة (NEB ). تمت ترجمة المكتبات بعد ذلك باستخدام Platinum Taq. تم تسلسل ChIP-DNA في جوهر الجينوم التجريبي والحاسبي في جامعة جونز هوبكنز بتغطية تسلسل مستهدف تبلغ حوالي 45.000.000 × وقراءات نهائية مقترنة تبلغ 150 نقطة أساس. تم استخدام Illumina CASAVA 1.8.2 لتحويل ملفات BCL إلى ملفات FASTQ باستخدام المعلمات الافتراضية (22). تم استخدام Bowtie 2.2.1 لتعيين القراءات المزدوجة إلى الجينوم المرجعي البشري hg19 باستخدام المعلمات الافتراضية وتم استخدام samtools 0.1.19 لتحويل ملفات SAM وفرزها وفهرستها (23). تم استخدام حزمة IGVTools الخاصة بوظيفة العد لإنشاء ملف بيانات مقسم باستخدام المعلمات الافتراضية. MACS (تحليل قائم على النموذج لخوارزمية ChIP-Seq ، الإصدار 1.4.2) يسمى ChIP-Seq peaks لكل علامة وكل عينة باستخدام DNA المدخلات في تلك العينة كعنصر تحكم (24). تم استدعاء قمم ChIP-Seq مهمة إذا كانت ذروة نموذج MACS ص القيم أقل من عتبة 10 6 ، وتم تمثيل هذه القمم كفواصل جينومية. ال رابطة الدول المستقلة- تم استخدام نظام التعليق التوضيحي للعنصر التنظيمي (CEAS) لربط هذه الفواصل الجينومية بالجينات (25).

تحليل DiffBind لبيانات ChIP-Seq

لمقارنة قمم ChIP-Seq لعينات مختلفة وتعديلات مختلفة ، استخدمنا حزمة R / Bioconductor DiffBind (26). تم استخدام ملفات سرير MACS للعينات الست وعلامات هيستون H3K4me3 و H3K9ac و H3K27ac و H3K9me3 كمدخلات باستخدام الكود في الملف التكميلي S1. استخدمنا DiffBind فقط لحساب معاملات الارتباط الزوجي على مستوى الجينوم بين جميع أزواج إشارات ChIP-Seq الممكنة (إجمالي 24 × 24).

تصور كامل لتخصيب الجينوم ChIP-Seq على مناطق الجينوم

تم إدخال إثراء الطي المحسوب باستدعاءات MACS إلى deepTools (27) للتصور. تم استخدام وظائف خريطة الحرارة DeepTools لتصور إثراء ChIP-Seq أضعاف 1.5 - + 1.5 كيلو بايت حول مواقع بدء النسخ (TSS) لجميع الجينات المعروفة. تم أيضًا إنشاء ملفات تعريف متوسطة لإثراء ChIP-Seq في نفس المنطقة 1.5– + 1.5 كيلو بايت حول TSS باستخدام أداة التعريف في أدوات deepTools.

تحديد الجينات الخاصة بالأمراض المرتبطة بقمم ChIP-Seq

سعينا للحصول على قائمة الجينات ذات التغطية الخاصة بالمرض من بيانات ChIP-Seq لكل علامة هيستون. للحصول على هذه الجينات ، قمنا بمقارنة قوائم جينات إخراج CEAS لبيانات ChIP-Seq في كل عينة. على وجه التحديد ، أجرينا اختلافات محددة لتحديد قوائم الجينات ذات تغطية ChIP-Seq في 5 مناطق UTR كانت خاصة إما بالورم أو العينات العادية لكل علامة هيستون (الجداول التكميلية S3 – S6). للحصول على قائمة الجينات العادية المحددة ، قمنا بتقييد المجموعات على الجينات التي تمت مشاركتها بواسطة كل من عينات UPPP ولم تكن موجودة في أي خط خلية سرطانية أو عينة PDX. للحصول على قوائم الجينات الخاصة بالورم ، قمنا بتقييد المجموعات على الجينات التي تمت مشاركتها بواسطة كل من خطوط الخلايا السرطانية أو بواسطة كل من PDXs ولم تكن موجودة في أي عينة UPPP. أنشأنا شروحًا إضافية لقائمة الجينات الخاصة بالورم في كل من PDXs وخطوط الخلايا والجينات الخاصة بالورم فقط في PDXs. تم إنشاء قوائم الجينات هذه باستخدام الكود الموجود في الملف التكميلي S2 وتم ترحيلها لتحليل بيانات RNA-Seq لتحديد العواقب الوظيفية للجينات الخاصة بالمرض.

تحليل مجموعة الجينات

قامت وظيفة MSigDB (28) "التحقيق في مجموعات الجينات" بإجراء تحليل مسار للجينات الخاصة بالمرض لكل علامة هيستون H3K4me3 و H3K27ac (الجدولان التكميليان S3 و S4). تم إجراء تحليل مجموعة الجينات في هذا البرنامج باستخدام مجموعات جينات Hallmark باستخدام اختبار فرط هندسي (الجداول التكميلية S7 – S10).

ارتباط الجينات المخصبة H3K27ac مع مجموعات الجينات المعروفة الأخرى HPV + HNSCC

تم استخدام حزمة R / Bioconductor GeneOverlap لربط مجموعة الجينات الخاصة بالمرض لـ H3K27ac (29 ، 30). تم تطبيق اختبار مجموعة الجينات Wilcoxon من جانب واحد أيضًا لتقييم إثراء جين H3K27ac الخاص بالمرض مع الأوزان المستمرة لمصنف الجينات لأنواع فرعية HPV + HNSCC من المرجع. 29.

تطبيع وتحليل RNA-Seq

تم الحصول على تعدادات مستوى الجينات من بيانات RNA-Seq من خط أنابيب RSEM V2 لأطلس جينوم السرطان (TCGA المرجع 3) كما هو موضح في المرجع. 13. تم إنشاء خرائط الحرارة لبيانات RNA-Seq للجينات الخاصة بالأمراض (المدرجة في الجداول التكميلية S3-S6) لكل علامة هيستون. استخدم التجميع الهرمي غير الخاضع للإشراف في خرائط الحرارة مسافات اختلاف كيندال-تاو. أظهر العمل السابق أن هذه المسافة حددت التباين النسبي لمحات التعبير الجيني (14) ، مما مكنها من تحديد عدم تنظيم التعبير الجيني عن طريق مناطق الكروماتين المفتوحة في هذه الدراسة.

تحليل تقلب التعبير المعلوماتية الحيوية لخلل تنظيم RNA-Seq في قمم ChIP-Seq الخاصة بالأنسجة

افترضنا أن التغييرات في بنية الكروماتين مكنت من تغييرات التعبير في الجينات مع تغطية ChIP-Seq في 5 مناطق UTR. ومع ذلك ، لا تزال الآليات التنظيمية الأخرى المستندة إلى التعديلات اللاجينية (مثل ربط عامل النسخ ، وتضخيم رقم النسخ ، وما إلى ذلك) مطلوبة لتغيير التعبير الجيني. وبالتالي ، فإن تغيرات التعبير في الجينات مع تغطية ChIP-Seq الخاصة بالورم عند 5 ′ UTR ستكون أكثر تنوعًا من تغيرات التعبير في الجينات ذات تغطية ChIP-Seq الخاصة بالطبيعية. تمشيا مع هذه الفرضية ، استخدمنا خوارزمية خلل التنظيم الجيني لمجموعة EVA لتحديد مقياس الاختلاف النسبي (على سبيل المثال ، وكيل التباين) لملفات تعريف التعبير الجيني في الورم والعينات الطبيعية باستخدام إحصائيات نظرية U (14). قمنا بتطبيق خوارزمية EVA في حزمة R / Bioconductor GSReg على بيانات RNA-Seq لمجموعات الجينات المحددة بواسطة تعديلات الكروماتين الخاصة بالمرض (الملف التكميلي S2).

كشف تكامل فيروس الورم الحليمي البشري بواسطة MapSplice

تم إجراء الكشف باستخدام MapSplice (31) ، والذي تم تشغيله بخيار تحديد الاندماجات على بيانات RNA-Seq. كان المرجع للقراءات التي سيتم تعيينها عبارة عن وهم تم إعداده من جينوم بشري مشترك وجينوم HPV16. بهذه الطريقة ، كان موقع التكامل الفيروسي مرئيًا باعتباره اندماجًا لكروموسوم بشري وجينوم فيروس الورم الحليمي البشري. لقد اعتبرنا الجينوم الفيروسي متكاملًا إذا كان هناك على الأقل ثلاثة أزواج متنافرة (حيث يتم تعيين أحد طرفي الطرف المزدوج للقراءة على الجينوم الفيروسي ، وزوج رفيقه المرتبط بالجينوم البشري) وقراءة واحدة مقسمة (حيث يكون أحد طرفيها). امتدت قراءة النهاية المزدوجة إلى الوصلة الفيروسية البشرية ، وتم تعيين زوج رفيقها إما إلى جينوم الإنسان أو فيروس الورم الحليمي البشري). تدعم هذه القراءات السبع الإجمالية التكامل في نفس المكان ، وفقًا لتحليلنا الأخير (32). يتم توفير تفاصيل إضافية في المواد والطرق التكميلية.

تحديد معززات النسخ

كانت قمم MACS لـ H3K27ac مدخلات إضافية لبرنامج تحليل تصنيف المعززات الفائقة (ROSE) (33) لإجراء مكالمات محسّنة لكل عينة. طبقنا هذه الخوارزمية لدمج قمم H3K27ac من MACS وصنفنا القمم المدمجة الناتجة على أنها معززات.


المواد والأساليب

ثقافة الخلية وتزامن دورة الخلية

تمت زراعة خلايا U2OS في DMEM (Gibco) و 10٪ FBS. تمت زراعة خلايا RPE1 في DMEM-F12 (Gibco) و 10 ٪ FBS. تم تحضين الخلايا عند 37 درجة مئوية و 5٪ من ثاني أكسيد الكربون2. تمت مزامنة الخلايا باستخدام علاجات الثيميدين والنوكودازول. تم جمع الخلايا الانقسامية عن طريق الاهتزاز الانقسامي. تم استخدام A-485 (10 ميكرومتر Tocris) لتثبيط مستويات H3K27ac. انظر المواد التكميلية للحصول على وصف مفصل.

تألق مناعي

نمت الخلايا على أغطية زجاجية وثابتة بنسبة 4٪ بارافورمالدهيد في برنامج تلفزيوني لمدة 5 دقائق في درجة حرارة الغرفة. تم نفاذ الخلايا الثابتة باستخدام PBS بارد يحتوي على 0.5 ٪ Triton X-100 لمدة 5 دقائق. تم حظر الخلايا بنسبة 1 ٪ من مساحة سطح الجسم في برنامج تلفزيوني لمدة ساعة واحدة عند درجة حرارة الغرفة وتم تحضينها في الجسم المضاد الأولي في حاجز عازل طوال الليل عند 4 درجات مئوية ، متبوعًا بجسم مضاد ثانوي لمدة ساعة واحدة عند درجة حرارة الغرفة. ثم تم تلطيخ الخلايا لفترة وجيزة بـ 1 ميكروغرام / مل Hoechst 33342 (مجسات جزيئية H-1399) في برنامج تلفزيوني وتم تركيبها في VectaShield (مختبرات Vector). تم الحصول على الصور في مجهر متحد البؤر زايس LSM710. تم تحليل الصور وإعدادها للعرض في برنامج فوتوشوب.

عزل الكسور النووية والهيولية

تم إعادة تعليق الخلايا في محلول ناقص التوتر (أنابيب 5 ملي مولار عند درجة الحموضة 8 ، 85 ملي كلوريد الصوديوم ، 0.5٪ NP-40 ، مثبط البروتياز) لمدة 10 دقائق على الجليد ، متبوعًا بالطرد المركزي عند 500ز لمدة 10 دقائق عند 4 درجات مئوية. تم نقل وحفظ المادة الطافية التي تحتوي على الجزء السيتوبلازمي. تم إعادة تعليق الحبيبات في محلول تحلل (50 ملي مولار Hepes عند درجة الحموضة 7.9 ، 5 ملي MgCl2، 0.2٪ Triton X-100 ، 20٪ جلسرين ، 300 ملي كلوريد الصوديوم ، مثبط الأنزيم البروتيني) لمدة 30 دقيقة على الجليد ، تليها الطرد المركزي عند 12000ز لمدة 20 دقيقة عند 4 درجات مئوية. تم جمع المادة الطافية على أنها جزء نووي.

عزل الهيستون والنشاف الغربي

لاستخراج هيستون ، تم تكييف البروتوكول من العمل السابق (شيشتر وآخرون ، 2007). باختصار ، بعد عزل النوى ، تم استخلاص الهستونات القابلة للذوبان باستخدام 0.2 مولار هيدروكلوريد ، متبوعًا بترسيب TCA / الأسيتون. لتحليل اللطخة الغربية ، تم حل عينات البروتين في المواد الهلامية SDS-PAGE ونقلها إلى أغشية PVDF (Millipore). تم حظر الأغشية باستخدام 5٪ لبن في TBST (0.25٪ توين 20 ، 20 ملي مولار تريس عند درجة الحموضة 8.0 ، 137 ملي مول كلوريد الصوديوم) واحتضانها بالأجسام المضادة الأولية طوال الليل عند 4 درجات مئوية. بعد ثلاث عمليات غسل لمدة 5 دقائق في TBST ، تمت إضافة الجسم المضاد الثانوي المترافق مع HRP لمدة ساعة واحدة عند درجة حرارة الغرفة. تم تصور الأغشية بواسطة SuperSignal West Pico أو كاشف Femto (Thermo Fisher Scientific).

الأجسام المضادة

تم شراء الأجسام المضادة التالية من المصادر التجارية المشار إليها: anti-H3K4me3 (Abcam ab8580) ، و anti-H3K4me1 (Abcam ab8895) ، و anti-H3K27ac (Abcam ab4729) ، و anti-CTCF (Active Motif 61311) ، و anti-spike-in ( Active Motif 61686) ، و anti-α-Tubulin (Sigma T5168) ، و anti-Histone H3 (تشوير الخلية 4499) ، و anti-H3S10p (تشوير الخلية 3377).

رقاقة تسلسل

تم ربط الخلايا (5 × 10 6) مع 1 ٪ فورمالديهايد لمدة 10 دقائق ، وتم إجراء ChIP-seq كما هو موضح سابقًا (Toyama et al. 2019). تم تنفيذ Spike-in وفقًا لبروتوكولات البائعين (Active Motif). باختصار ، تمت إضافة 50 نانوغرام من الكروماتين المسنن (الحافز النشط 53083) إلى 25 ميكروغرام من كروماتين U2OS أو RPE1 للاحتضان مع 2 ميكروغرام من الأجسام المضادة المتصاعدة مع 5 ميكروغرام من مضاد H3K4me3 ، ومضاد H3K4me1 ، ومضاد H3K27ac ، أو الأجسام المضادة لـ CTCF. تم إنشاء مكتبات الحمض النووي باستخدام مجموعة إعداد Kapa Hyper لمنصات Illumina (Kapa Biosystems). تم ترتيب المكتبات في نظام NextSeq 500 (Illumina). راجع المادة التكميلية للحصول على معلومات مفصلة حول تحليل البيانات ، بما في ذلك المحاذاة والتطبيع واستدعاء الذروة ، رابطة الدول المستقلة- تحديد الموارد وتحليل الحافز واختبار معامل ارتباط بيرسون.

تسلسل التحكم في Spike-in و EU-RNA-seq

تم تحضير عناصر تحكم وعينات ارتفاع البيوتينلاتيد لعينة EU-RNA-seq كما هو موصوف سابقًا (Palozola et al. 2017). باختصار ، تم تمييز خلايا U2OS بالنبض بـ 0.5 ملي مولار في الاتحاد الأوروبي لمدة 35 دقيقة عند 37 درجة مئوية. تم حصاد إجمالي الحمض النووي الريبي باستخدام Trizol (Ambion) وتنقيته باستخدام miRNeasy (Qiagen). تم إجراء تفاعل النقر لاقتران البيوتين مع الحمض النووي الريبي المسمى بالاتحاد الأوروبي باستخدام مجموعة التقاط RNA الوليدة Click-iT (Invitrogen). تمت إضافة اثنين من الحمض النووي الريبي المضاد الحيوي إلى 1.5 ميكروغرام من كل عينة من المعالجة الحيوية (0.36 نانوغرام من عنصر التحكم رقم 1 و 0.036 نانوغرام من عنصر التحكم رقم 2). تم سحب البيوتين - الاتحاد الأوروبي - الحمض النووي الريبي ، بما في ذلك أدوات التحكم في الارتفاع ، باستخدام حبات مغناطيسية مغلفة بالستربتافيدين. للتحقق من صحة عناصر التحكم في ارتفاع البيوتين- RNA ، تم إنشاء (كدنا) باستخدام مجموعة تركيب SuperScript VILO (كدنا) (Invitrogen) متبوعًا بـ qPCR. للتسلسل ، تم إنشاء مكتبات (كدنا) باستخدام نظام تعدد الإرسال FFPE RNA-seq البشري Ovation. تم إجراء تسلسل متعدد الأطراف على أداة NextSeq 500 (Illumina). راجع المادة التكميلية للحصول على معلومات مفصلة حول تحليل البيانات ، بما في ذلك المحاذاة والتطبيع وتحديد التسلسل الهرمي للتعبير الجيني وتحليل تخصيب GO.

تم إجراء Hi-C باستخدام الطريقة الموضعية كما هو موضح سابقًا (Rao et al. 2014). باختصار ، تم ربط خلايا U2OS (2 × 10 6) مع الفورمالديهايد. تم هضم الكروماتين باستخدام إنزيم تقييد MboI (NEB) ، وتم تخليصه بيوتين- ATP (تقنيات الحياة) ، ثم تم ربطه بـ T4 DNA ligase (NEB). تم تنقية الحمض النووي وقصه باستخدام جهاز Covaris LE220 (Covaris). تم سحب تفاعلات الحمض النووي الحيوي مع Dynabeads MyOne Streptavin T1 Beads (تقنيات الحياة) وتسلسلها في نظام تسلسل NovaSeq 6000 (Illumina). راجع المواد التكميلية للحصول على معلومات مفصلة حول تحليل البيانات.

أرقام الانضمام

رقم انضمام Gene Expression Omnibus لبيانات ChIP-seq و EU-RNA-seq و Hi-C المبلغ عنها في هذه الدراسة هو GSE141139.


الملخص

تشير مجموعة مقنعة من الأدبيات ، استنادًا إلى الجيل التالي من الترسيب المناعي للكروماتين وتسلسل الحمض النووي الريبي لمناطق دماغ المكافأة ، إلى أن تنظيم المشهد اللاجيني من المحتمل أن يكمن وراء تعاطي المخدرات والإدمان المزمن. من الأهمية بمكان الآن تطوير استراتيجيات حسابية مبتكرة للغاية للكشف عن آليات النسخ التنظيمية ذات الصلة التي قد تكمن وراء الأمراض العصبية والنفسية. لقد قمنا بتحليل تنظيم الكروماتين للتضفير البديل ، والذي يتورط في التعرض للكوكايين في الفئران. وصفت الأدبيات الحديثة التضفير البديل الذي ينظمه الكروماتين ، مما يشير إلى وظيفة جديدة لإعادة النمذجة العصبية الوراثية التي يسببها الدواء. ومع ذلك ، فإن مدى الارتباط على مستوى الجينوم بين تعديلات هيستون معينة والربط البديل لا يزال غير مستكشف. لمعالجة هذا الأمر ، قمنا بتطوير مناهج حسابية جديدة لنمذجة العلاقة بين التضفير البديل والتعديلات اللاحقة للترجمة هيستون في النواة المتكئة (NAc) ، وهي منطقة مكافأة في الدماغ. باستخدام الأساليب الإحصائية الكلاسيكية والتعلم الآلي للجمع بين بيانات ChIP-Seq و RNA-Seq ، وجدنا أن تعديلات هيستون المحددة مرتبطة بقوة بجوانب مختلفة من الربط التفاضلي. H3K36me3 و H3K4me1 لهما أقوى ارتباط مع التضفير مما يشير إلى أنهما يلعبان دورًا مهمًا في التضفير البديل في أنسجة المكافأة في الدماغ.


أساليب

المواد النباتية

تم إجراء تجارب ChIP-seq E. غرانديز استنساخ TAG0014 (Mondi Tree Improvement Research ، KwaMbonambi ، جنوب إفريقيا). تم أخذ عينات من كاشطات DSX من الرامات البالغة من العمر سبع سنوات والتي تنمو في تجربة استنساخية في KwaMbonambi ، مقاطعة كوازولو ناتال ، جنوب إفريقيا في سبتمبر 2012 (أوائل الربيع). تم تقشير اللحاء على ارتفاع الثدي لكشف أنسجة DSX لشخصين ، V5 و V11. تم كشط 1-2 مم بشكل خفيف وموحد باستخدام ماكينة حلاقة ، وعصرها برفق من النسغ الزائد وتجميدها على الفور في النيتروجين السائل. تم تخزين العينات عند -80 درجة مئوية حتى الاستخدام.

تثبيت الكروماتين والعزل والصوتنة

تمت تنقية النوى كما وصفها كوفمان وآخرون. [44] ، مع بعض التعديلات. تم طحن أنسجة DSX المجمدة باستخدام نموذج A 11 مطحنة تحليلية أساسية (IKA ، ألمانيا) متبوعة بالطحن الدقيق في النيتروجين السائل باستخدام ملاط ​​ومدقة. تم إصلاح كل خمسة جرامات من أنسجة DSX المجمدة والأرضية في محلول مؤقت سعة 25 مل M1 مكمل بـ 1٪ فورمالديهايد و 1 مم EDTA و 1 ملي ميثان ميثان سلفونيل فلوريد (PMSF) على الجليد لمدة 30 دقيقة. تم إخماد التثبيت باستخدام 1/10 حجم 1.25 مولار جلايسين لمدة 5 دقائق على الجليد ، متبوعًا بإضافة محلول M1 بدون الفورمالديهايد إلى 50 مل. تم ترشيح المعلق من خلال شبكة نايلون 60 ميكرومتر مبللة بمخزن مؤقت M1 ، وتغيير المرشح مرة واحدة على الأقل لكل 50 مل معلق ، ومرة ​​أخرى من خلال شبكة نايلون مزدوجة 60 ميكرومتر. بعد الطرد المركزي عند 1000 × ز لمدة 20 دقيقة (4 درجات مئوية) ، تم تعليق الحبيبات في المخزن المؤقت M2 المثلج بسعة 25 مل يحتوي على 1 ملي مولار PMSF وكوكتيل مثبط البروتياز الكامل (CPIC Roche) ، بالطرد المركزي عند 1000 × ز لمدة 10 دقائق عند 4 درجات مئوية ومعلق في المخزن المؤقت M3 المثلج بسعة 25 مل مع 1 ملي مولار PMSF و CPIC. بعد الطرد المركزي بالمثل لمدة 10 دقائق ، تم تعليق الحبيبات النووية

1.5 مل عازلة صوتية تحتوي على 1 ملي PMSF و CPIC. تم إجراء صوتنة على 250 ميكرولتر من الكروماتين الخام لكل أنبوب 1.5 مل على الجليد باستخدام مسبار Branson Sonifier 450 مع 20 نبضة لمدة 10 ثوانٍ عند الإعداد 1 ، و gt30 ثانية على الجليد بين النبضات. تم خلط العينات كل عشر دورات. بعد صوتنة ، تم طرد العينات مرتين عند 16000 × ز (10 دقائق ، 4 درجات مئوية) ومخزنة عند -80 درجة مئوية.

مقايسة نوكلياز المكورات الدقيقة (S7)

تم طحن أنسجة DSX المجمدة (2 جم) إلى مسحوق ناعم في نيتروجين سائل. تم عزل النوى كما هو موضح أعلاه ، باستثناء ارتباط الفورمالديهايد وإضافة المخزن المؤقت الصوتي. تمت إعادة تعليق الحبيبات النووية الخام في محلول عازل بهضم 350 ميكرولتر [66] يحتوي على 400 ميكروغرام من RNase A. تم تقسيم العينات بالتساوي إلى أربعة أنابيب واحتضانها بـ 0 أو 5 أو 10 أو 20 وحدة من نوكلياز S7 (روش) عند 37 درجة مئوية لـ 15 دقيقة. تم إنهاء التحلل المائي بـ 5 ملي مول EDTA. تم تحليل النوى باستخدام 0.5 ٪ من SDS وطردها (20000 × ز، 5 دقائق) للمسح. تمت تنقية الحمض النووي القابل للذوبان باستخدام مجموعة تنقية Nucleospin PCR (Macherey-Nagel ، Düren ، ألمانيا).

استخلاص البروتين وتحليل اللطخة الغربية

تمت تنقية النوى وفقًا لطريقة كوفمان وآخرون. [44] ، مع بعض التعديلات. تم طحن DSX في النيتروجين السائل وتم تعليقه في المخزن المؤقت M1 الذي يحتوي على 1 ملي مولار من PMSF و 1 ملي مولار EDTA عند 5 مل لكل جرام من الأنسجة ، لمدة 30 دقيقة. تم ترشيح المعلق مرتين من خلال شبكة نايلون 60 ميكرومتر ويتم تكويرها عند 1000 × ز (20 دقيقة ، 4 درجات مئوية). تم إعادة تعليق الحبيبات في محلول مؤقت سعة 5 مل M2 مكمل بـ 1 ملي مولار من PSMF و CPIC ، معاد تكويره (1000 × ز, 10 min, 4°C) and resuspended in 250 ul M3 buffer containing 1.7 M sucrose and CPIC. The suspension was overlaid on 1.5 ml 1.7 M sucrose in M3 buffer and centrifuged for 40 min at 16,000 × ز (4°C). The pellet was resuspended in 1 ml M3 to wash, re-pelleted (12,000 × ز, 5 min, 4°C) and the remaining pellet resuspended in 1 pellet volume of extraction buffer (10 mM sodium phosphate buffer pH 7.0, 150 mM NaCl, 0.1 mM EDTA, 5% glycerol, 10 mM β-mercaptoethanol, 0.1 mM PMSF, CPIC). The pellet was briefly sonicated with a Branson 450 sonicator (30s, 10% power output) and gently vortexed for 30 min at 4°C. Soluble protein in the supernatant from two rounds of centrifugation (16 000 × ز, 10 min, 4°C) was quantified using the Qubit Protein Assay Kit (Invitrogen), subjected to denaturing electrophoresis on a 12% SDS-PAGE gel and transferred to a nitrocellulose membrane using the semidry method. Blots were blocked with 5% nonfat milk, probed with 1:2000 dilution of anti-H3K4me3 antibody (Millipore #07-473) overnight (4°C) and incubated with horseradish peroxidase-conjugated goat anti-rabbit secondary antibody (Cappel Laboratories Inc., PA). Blots were treated with SuperSignal West Pico Chemiluminescent substrate (Thermo Scientific, Rockford, IL) and developed with CL-XPosure film (Thermo Scientific).

Chromatin immunoprecipitation, DNA amplification and sequencing

A minimum of 3 μg E. grandis DSX chromatin was incubated with 1 μg anti-H3K4me3 antibody (Millipore #07-473), or 1 μg naïve mouse IgG2 أ (sc-3878, Santa Cruz Biotechnology, CA) as negative control, overnight at 4°C. Chromatin immunoprecipitation was performed as described by Adli & Bernstein [45] using 40 μl protein A-agarose beads, 25% slurry (sc-2001, Santa Cruz Biotechnology, CA). After crosslink reversal and DNA purification, the ChIP DNA was quantified with the Qubit HS dsDNA kit (Invitrogen). A minimum of 1 ng ChIP or input DNA was amplified according to the protocol of Adli & Bernstein [45], with modifications. We replaced the use of Sequenase v.2.0 DNA polymerase (Affymetrix, CA) with Bsu DNA polymerase, large fragment (NEB, MA), and substituted the corresponding Sequenase reaction buffer with NEB Buffer 2. We used 2 U of Bsu DNA polymerase per pre-amplification cycle, extended the pre-amplification extension time to 20 min and used 32 pmol P1 primer. Both the pre-amplification and PCR reactions were supplemented with 50 ng/μl tRNA. We applied a generic ExoSAP cocktail by adding 0.5 U rAPID alkaline phosphatase (Roche Applied Science, Ltd) and 5 U بكتريا قولونية Exonuclease I (NEB), incubating at 37°C for 30 min and heat-inactivating the enzymes at 80°C for 20 min. For the Phusion PCR reactions we used 4 ul 10 mM dNTPs and 0.5 ul Phusion DNA polymerase per 50 ul reaction. PCR extension time was reduced to 5 s. Amplified DNA was digested with BciVI to yield 3’ adenosine overhangs 20 ng template was ligated to Illumina primers for library preparation and DNA sequencing (Beijing Genome Institute, Hong Kong), generating 50 nt paired-end sequences.


ChIP-seq for histone modification not in agreement with RNA-seq for expression - Biology

Excuse me? A few days ago I read a paper "Histone modification levels are predictive for gene expression" (PNAS (2010), 107, 2926-2931). It proposed a linear model predicting gene expression levels from the combination of different histone modifications, such as H3K4me3, H3K27me3, etc. The predictor variables were of the form log(Nj+aj), where Nj representing the number of tags of modification j in each promoter region (4001bp surrounding TSS), and aj was a pseudocount to make the logarithm be defined when Nj was zero. The authors didn't refered to normalize Nj. But when I read another paper titled "Computational inference of mRNA stability from histone modification and transcriptome profiles" (Nucleic Acids Res (2012), 40(14):6414-23), which also involving a linear model, the authors used the normalized read coverage of histone modification as the predictor variable. These authors said "the read coverage of each histone modification in the 15 regions (read count per bp) was calculated and normalized according to the sequencing library size". The former paper didn't say normalization, but the latter one said to normalize. I'm wondering why there is such a difference and in what condition, a normalization should be performed.

Hope some one to give some help. Thank you so much!

My 2c: I mostly rely on edgeR which takes raw counts over regions of interest and uses normalisation factors as an offset in the model instead of adjusting the counts directly. Competing popular methods use the library size to adjust fragment counts, so the 'right' answer depends on the specific model and biological question.

If you want advice from more reputable statisticians working on these interesting and important issues, they are more likely found on (eg) the Bioconductor list or perhaps seqanswers than this Galaxy forum - so if you don't get a good answer here, perhaps try there.


مناقشة

We have shown that the levels of histone modifications at a promoter proximal region are well correlated to the expression of genes. Other studies classified the promoters for each modification into groups (17, 26), e.g., modification X is present or absent. Discretization ought to have two beneficial effects, namely the reduction of noise and parameters. Although discretization is necessary in some modeling approaches to reduce the number of parameters, e.g., learning a Bayesian network (26), in our approach, it increases the number of parameters, because one has to choose at least one threshold for each modification in addition to the slopes in the linear regression model. If discretization is indeed beneficial for modeling gene expression, we expect that the results of a discrete model should be better than a corresponding continuous model. Thus, we compared full models incorporating either the levels directly (continuous model) or a binary classification of them (discrete model). Although the correlation is not significantly different (Fig. 2أ and Fig. S5أ), the mean squared error (MSE) increased from 1.54 for the continuous model to 1.71 for the discrete model. The same is true for the best three-modification continuous and discrete models. Here, the discrete model is only able to reproduce the general trend in expression values and thus has a higher MSE (MSE = 1.84 Fig. S5ب) than the continuous model (MSE = 1.68, which is even lower than the MSE for the full discrete model Fig. S5ج). We conclude that discretization has no beneficial effect on the prediction accuracy and argue that in our modeling framework discretization is not necessary and is even reducing the predictive power at the cost of increasing the number of parameters.

We demonstrated that only a few histone modifications are necessary to faithfully model gene expression. This finding can be understood if one assumes that the histone modifications belong to different groups, whose members are either involved in transcription or not. The modifications within the transcription-related groups provide almost the same information and our approach selects one representative modification. Alternatively, the selected histone modifications are involved in distinct steps during the transcription cycle. For example, they could recruit activities that are required to enable RNA pol II to progress from an initiating to an elongating state. In the light of the “Histone Code Hypothesis,” the latter idea is very attractive, but we would have much more confidence in supporting this idea if we were able to reproduce our results using an equally rich dataset in a preferentially independent cell type, which to our knowledge is currently not available.

We used three sets of promoters, namely all, LCPs, and HCPs to identify “important” modifications. Upon analyzing all promoters, we found that H2BK5ac, H3K27ac, H3K79me1, and H4K20me1 are overrepresented in models giving rise to the highest prediction accuracy in CD4+ T-cells. A recent study identified a common set of 17 modifications (mainly acetylations), referred to as the backbone. These modifications colocalize and their levels are well correlated (17). Genes with all of these backbone modifications present tend to be expressed, suggesting that either all or a subset of them are involved in transcription. Our analysis revealed only two of these modifications, H3K27ac and H2BK5ac, are important for modeling gene expression. This indicates that the remaining backbone modifications carry either redundant information or are less important for gene expression. Furthermore, the other two important modifications, H3K79me1 and H4K20me1, have been shown to be enriched in highly expressed genes, along with the modification backbone (17). This observation is in line with the idea that H3K79me1 and H4K20me1 are also involved in transcription. Thus, we conclude that our approach identified histone modifications which are likely to be key players in the transcriptional process.

We identified different sets of modifications important for modeling gene expression driven by LCPs or HCPs. In LCPs, we found that H3K4me3 and H3K79me1, while in HCPs H3K27ac and H4K20me1, were identified. These assignments can be reproduced using RNA-seq (27) instead of the microarray data, suggesting that a possible measurement bias due to the microarray technology is not a major factor. The prediction accuracy for modeling RNA-seq derived expression values is even higher (ص = 0.81 Fig. S6أ) than the one using microarray expression data (ص = 0.77). The results of the overrepresentation analysis for all, HCPs, and LCPs are comparable between the RNA-seq and microarray-derived expression values. The only difference was that only H4K20me1, H3K27ac, and H2BK5ac, but not H3K79me1, are identified as being overrepresented in best scoring linear models for all promoters. However, when analyzing best scoring models for LCPs, H3K79me1 clearly comes up as overrepresented (Fig. S6بد).

The reason for the difference in the important histone modifications in LCPs and HCPs is unclear, but indicates that different regulatory mechanisms act on these two promoter types. A possible clue for the function of the selected modifications is provided by the localization analysis (Fig. 3ج). H3K4me3, H3K27ac, and H2BK5ac have the highest levels at the promoter, with the highest peak around 100 base pairs downstream of the TSS. H3K79me1 is enriched along the gene body, and H4K20me1 shows two distinct patterns: a peak close to the promoter at a similar position to H3K4me3 and H3K27ac, and an enrichment across the gene body region. The localization of these histone modifications suggests that H3K27ac, H2BK5ac, H3K4me3, and H4K20me1 function during transcription initiation and/or promoter clearance, whereas H3K79me1 and H4K20me1 are involved in transcription elongation.

Although for H3K4me3 a function during transcription initiation has been proposed (e.g., ref. 14 and references therein), a similar function has not been established for H3K27ac. A possible action of H3K27ac might be to prevent the repressive trimethylation of the same residue, because H3K27ac and H3K27me3 are mutually exclusive. Alternatively, H3K27ac itself could be recognized by a protein complex required for transcription. H3K79me1 is almost absent at the TSS and its levels increase in the gene body, indicating that it is involved in transcription elongation, in line with previous observations (28, 29). The functions of H2BK5ac and H4K20me1 in general, and in particular during transcription, are not well understood.

Because we showed that histone modification levels are predictive of the gene expression levels in CD4+ T-cells, we further investigated whether this is a universal property which holds true for other cell types. We were able to successfully predict expression of genes in CD36+ and CD133+ cells, using histone modification data measured in these cells and model parameters trained on CD4+ data. Significantly, the prediction accuracy does not depend strongly on the level of change in expression in different cell types. Thus, our results establish the idea that the relationships between histone modification and gene expression are general. Furthermore, they underscore that the histone modifications and the transcriptional process are tightly connected to each other. We want to emphasize that our analysis as well as the data do not allow for deciding whether the histone modifications are cause or consequence of transcription, because the uncovered relationships are correlative in nature and therefore inherently undirected. However, our results imply that the histone modifications are very close to RNA pol II in the regulatory network controlling its activity. Whether they are upstream and/or downstream has to be elucidated in further experimental studies.

In summary, we have shown that the relationships between histone modification and transcription are well reproducible across different cell types. Furthermore, we singled out a small number of modifications, which together can account for a large portion of the expression variance. Whether these modifications play a crucial role during transcription, or whether they are representatives for groups of equally important modifications has to be clarified by further experimental studies. Regardless of which scenario turns out to be true, we can pinpoint a small number of modifications whose levels at the promoter can be used to infer gene expression and hence provide some information about the transcriptional process, which reduces the experimental effort to study the relationship between histone modifications and transcription.


دعم المعلومات

S1 Fig. Distribution of H3K27me3, H3K27ac, and H3K36me3 in م. oryzae Guy11.

(A) and (B) Violin plots illustrating genome-wide distribution of domains (A) and ChIP signals (B) of H3K27me3, H3K27ac, and H3K36me3 in Guy11 wide type growing under في المختبر complete medium. Letters above the violin plots indicates the significance.

S2 Fig. Distribution of histone modifications at H3K27 across diverse types of transposable elements in م. oryzae.

(A) and (B) ChIP signals of H3K27me3 and H3K27ac from MACS2 peak calling across transposable elements (TE) families (A) and subfamilies (B). ChIP-Seq data were collected from م. oryzae Guy11 wild type growing under في المختبر complete medium. The number of TEs for each group is shown above each violin plot. Letters above the violin plots indicate the significant difference among groups based on ANOVA and Tukey’s HSD test.

S3 Fig. Phylogenetic and homology matrix analysis of PRC2 core components in different organisms.

(A) Neighbor-joint tree of selected PRC2 core components generated by MEGA X with 1000 bootstrap replications. The protein domains are predicated by SMART and visualized by TBtools. The sequences used for analysis included MoKmt6 (MGG_00152), MoSuz12 (MGG_03169) and MoEed (MGG_06028) from م. oryzae FgKmt6 (FGSG_15795), FgSuz12 (FGSG_04321), and FgEed (FGSG_15909) from F. graminearum FfKmt6 (FFUJ_00719), FfSuz12 (FFUJ_09784) and FfEed (FFUJ_12272) from F. fujikuroi NcSet7 (NCU07496), NcSuz12 (NCU05460), and NcEed (NCU05300) from ن. crassa Ezh2 (NP_001190176.1), Ezh1 (NP_001308008.1), Suz12 (NP_056170.2) and Eed (AAC23685) from ح. العاقل ه (ض) (NP_001137932.1), Su(z)12 (NP_730465.1), and Esc (NP_477431.1) from د. ميلانوجاستر. (B) Homology matrix analysis of م. oryzae PRC2 core components with PRC2 homologs in different organisms as described above. Numbers indicate protein coverage and identity.

S4 Fig. Homologous recombination strategy was used for generating deletion mutants.

(A) Homologous recombination was used for gene knockout. ±1 kb gene flanking region (black lines) was amplified for targeting gene of interest. The gene coding region was replaced with hygromycin resistant cassette (HPH) for single knockout or geneticin resistant cassette (G418) for double knockout. Inside primer pair (blue arrow) was used for testing the presence/absence of gene of interest in transformants. Outside primer pair (yellow arrow) was used for testing whether there is correct resistant cassette integration in transformants. Green lines indicate upstream and downstream sequences of interested gene and red lines indicate upstream and downstream sequences of the resistant cassette. (ب) ΔMokmt6, ΔMoeed، و ΔMosuz12 were confirmed by PCR amplifications with inside and outside primers.

S5 Fig. The complemented strains were screened by PCR.

The complementation for ΔMokmt6, ΔMosuz12 و Δmoeed was screened by inside and outside primers. Amplifications with inside primers suggested the success in re-introducing the original gene back to the deletion mutants.

S6 Fig. Loss of H3K27me3 leads to dynamics of H3K27ac and H3K36me3 at whole genome level.

Heatmap illustrating pairwise Pearson correlation coefficiency of ChIP signals of H3K27me3, H3K27ac, H3K36me3 between Guy11 wild type (WT) and mutant ΔMokmt6 lacking H3K27me3.

S7 Fig. Loss of H3K27me3 leads to re-distribution of H3K27ac and H3K36me3.

Heat maps visualizing profiles of ChIP signals for H3K27me3, H3K27ac and H3K36me3 across transposable elements (TEs) in Guy11 wild type (WT) and mutant ΔMokmt6. Two clusters of TEs are generated by unsupervised k-means analysis and ranked according to their H3K27me3 enrichment from wild type grown في المختبر complete medium.

S8 Fig. The majority of downregulated genes in ΔMokmt6 are not marked by H3K27me3.

Venn diagram showing the overlap of genes downregulated in ΔMokmt6 and marked by H3K27me3 in Guy11 wild type.

S9 Fig. Expression profiles in wild type and ΔMokmt6 for genes that gained and lost H3K27ac in ΔMokmt6.

(A) Violin plot and (B) scatter plot showing gene expression profiles during في المختبر complete medium (CM) growth in wild type and ΔMokmt6 for 218 expressed genes that gained H3K27ac in ΔMokmt6. (C) Violin plot and (D) scatter plot showing gene expression profiles during في المختبر complete medium (CM) growth in wild type and ΔMokmt6 for 794 expressed genes that lost H3K27ac in ΔMokmt6. Letters above the violin plots indicate the significant difference among groups based on ANOVA and Tukey’s HSD test.

S10 Fig. Expression profiles in wild type and ΔMokmt6 for genes that lost H3K36me3 in ΔMokmt6 متحولة.

(A) Violin plots and (B) scatter plot showing the expression profiles during في المختبر complete medium (CM) growth in wild type and ΔMokmt6 for 321 expressed genes that lost H3K36me3 in ΔMokmt6. Letters above the violin plots indicate the significant difference among groups based on ANOVA and Tukey’s HSD test.

S11 Fig. Comparison of gene expression profiles under a combination of genotypes and growth conditions.

(A) Venn diagram showing the number and overlap of genes that only gained H3K27ac, only lost H3K36me3 or had both changes occur in the ΔMokmt6 mutant compared to wild type under في المختبر complete medium (CM) growth. (B) Violin plots for the RNA-seq expression of wild type (WT_CM) and ΔMokmt6 (ΔMokmt6_CM) during في المختبر complete medium (CM) growth for the gene sets from (A). Letters above the violin plots indicate the significant difference among groups based on ANOVA and Tukey’s HSD test.

S12 Fig. MoGcn5 is involved in mediating majority of H3K27ac in م. oryzae.

(أ) ΔMogcn5 و ΔMokmt6ΔMogcn5 were confirmed by PCR amplification with inside and outside primers. (B) The anti-H3K27ac was used for detecting the global level of H3K27ac in the samples and anti-H3 was used as loading control. Signal intensities were measured by ImageJ.

S13 Fig. The double mutant ΔMokmt6ΔMogcn5 has abnormal growth and conidia morphology.

(A) Colony morphology of wild type and ΔMokmt6ΔMogcn5 on complete medium agar (CM) at 12 days. (B) Colony diameters measured at 12 days. The growth rates were determined to be significantly different (**, ص <0.01) between wild type and ΔMokmt6ΔMogcn5 compared using student’s t-test. (C) Representative conidial morphology of wild type (WT), ΔMokmt6, ΔMogcn5، و ΔMokmt6ΔMogcn5 collected after growth on rice polish agar. Bar = 20 μm.

S14 Fig. Single mutants ΔMokmt6, ΔMogcn5 caused reduced symptoms on rice, while ΔMokmt6ΔMogcn5 fails to cause disease.

(A) Representative blast lesions of rice leaves sprayed with wild type (WT), ΔMokmt6, ΔMogcn5, ΔMokmt6ΔMogcn5 and 0.25% gelatin (control). The photos were taken at 7 days post inoculation and show typical blast lesions during a compatible interaction. (B) Bar plots showing quantitative analysis of 14 independent infected rice leaves (n = 14) from two biological experiments, classified as described in [68]. The disease severity rating for each treatment was compared to the wild type infection and student’s t-test was used to determine statistically significant differences. **, ص <0.01 *, ص & lt0.05.

S15 Fig. Distinct gene expression pattern of effectors in H3K27me3-dependent and -independent manners.

Expression of effector gene SLP1 (A), MoCDIP5 (B), BAS1 (C), and MC69 (D). RNA-seq data are collected from wild type (WT) م. oryzae strain Guy11 growing under في المختبر complete medium (CM) and في بلانتا, and two mutants ΔMokmt6 و ΔMokmt6ΔMogcn5 growing in CM. The mutant ΔMokmt6 lacks H3K27me3 and the double mutant ΔMokmt6ΔMogcn5 lacks H3K27me3 and majority of H3K27ac. Letters above the violin plots indicate the significant difference among groups based on ANOVA and Tukey’s HSD test.

S16 Fig. Reproducibility of ChIP-seq data across biological replicates by pair-wise Pearson correction analysis.

ChIP-seq experiment were conducted on م. oryzae Guy11 wild type (WT) and the mutant ΔMokmt6 with absence of H3K27me3 growing in complete medium (CM). R represents biological replicates.

S17 Fig. Principal component analysis on RNA-Seq dataset.

RNA-Seq experiment was conducted on RNAs extracted from م. oryzae Guy11 wild type (WT) growing under في المختبر complete medium (CM) and في بلانتا, and two mutants ΔMokmt6 و ΔMokmt6ΔMogcn5 growing in complete medium. The mutant ΔMokmt6 lacks H3K27me3 and the double mutant ΔMokmt6ΔMogcn5 lacks H3K27me3 and majority of H3K27ac.


شاهد الفيديو: Jessie J sings I Have Nothing Live Performance 2018 by Whitney Houston! Amazing! (كانون الثاني 2022).