Informacja

15: Regulacja genów I – Klastrowanie ekspresji genów – Biologia

15: Regulacja genów I – Klastrowanie ekspresji genów – Biologia



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

15: Regulacja genów I - Klastrowanie ekspresji genów

ScPADGRN: Wstępnie uwarunkowane podejście ADMM do rekonstrukcji dynamicznej sieci regulacji genów przy użyciu danych sekwencjonowania jednokomórkowego RNA

Zarówno rozwój choroby, jak i różnicowanie komórek wiążą się z dynamicznymi zmianami, dlatego rekonstrukcja dynamicznych sieci regulacji genów (DGRN) jest ważnym, ale trudnym problemem biologii systemów. Dzięki najnowszym postępom technicznym w sekwencjonowaniu jednokomórkowego RNA (scRNA-seq), uzyskuje się duże ilości danych scRNA-seq dla różnych procesów. Jednak większość obecnych metod wnioskowania o DGRN z próbek zbiorczych może nie być odpowiednia dla danych sekwencji scRNA. W tej pracy przedstawiamy scPADGRN, nowatorską metodę wnioskowania DGRN wykorzystującą dane scRNA-seq z „szeregów czasowych”. scPADGRN łączy wstępnie uwarunkowaną metodę zmiennego kierunku mnożników z grupowaniem komórek w celu rekonstrukcji DGRN. Wykazuje zalety dokładności, solidności i szybkiej konwergencji. Ponadto przedstawiono ilościowy wskaźnik o nazwie Differentiation Gens’ Interaction Enrichment (DGIE) w celu ilościowego określenia wzbogacenia interakcji genów związanych z różnicowaniem. Na podstawie wyników DGIE odpowiednich podsieci wnioskujemy, że funkcje embrionalnych komórek macierzystych (ES) są najbardziej aktywne początkowo i mogą stopniowo zanikać z czasem. Siła komunikacji znanych genów przyczyniających się do różnicowania komórek wzrasta od komórek ES do komórek ostatecznie zróżnicowanych. Identyfikujemy również kilka genów odpowiedzialnych za zmiany w wynikach DGIE zachodzące podczas różnicowania komórek na podstawie trzech rzeczywistych zestawów danych dotyczących pojedynczych komórek. Nasze wyniki pokazują, że analizy pojedynczych komórek oparte na wnioskowaniu sieciowym w połączeniu z obliczeniami ilościowymi mogą ujawnić kluczowe regulatory transkrypcji zaangażowane w różnicowanie komórek i rozwój choroby.


Wstęp

W komórce istnieją różne rodzaje procesów, które współpracują ze sobą, aby wykonywać różne czynności. W zależności od składników i typów ich interakcji, ogólnie rzecz biorąc, mamy trzy rodzaje sieci biochemicznych na poziomie subkomórkowym: sieci metaboliczne, sieci transdukcji sygnału i sieci regulacyjne genów. Sieć regulacji genów (GRN) to sieć interakcji gen-gen, która rządzi ich ekspresją. Regulacja ekspresji genów jest ważna, ponieważ reguluje produkcję białka w komórce.

Wnioskowanie o sieciach regulacyjnych genów jest uważane za jeden z kluczowych problemów w biologii systemów [1, 2]. W ciągu ostatnich dwóch dekad nastąpił wykładniczy wzrost metod inżynierii odwrotnej do rekonstrukcji sieci [3–7]. Mimo że od ostatniej dekady wysokoprzepustowe techniki, takie jak mikromacierze i sekwencje RNA, umożliwiły dostępność danych dotyczących ekspresji genów, wnioskowanie sieciowe jest nadal uważane za trudny problem, biorąc pod uwagę takie czynniki, jak stochastyczność, szum pomiarowy, brakujące wartości ekspresji, ograniczony czas punktów itp. w danych wyrażenia [8]. Oprócz tych ograniczeń, szum wprowadzony z powodu technik o wysokiej przepustowości, takich jak mikromacierze DNA, w których dane mają wysoki stosunek szumu do sygnału, również stanowi przeszkodę we wnioskowaniu sieci i jest często pomijany podczas opracowywania tych metod inżynierii odwrotnej [9].

Ostatnio stosowano różne podejścia do wnioskowania o sieci z danych szeregów czasowych, takie jak modele ODE [10], sieci bayesowskie [11], modele graficzne Gaussa [12], sieci neuronowe [13] i metody teorii informacji [14]. Najnowsze przeglądy metod wnioskowania o sieciach regulacyjnych genów i ich ograniczeń podano w [15, 16]. Huynh-Thu i ​​in. [15] przedstawili wstępny przegląd tej dziedziny, najpierw przedstawiając tło podstawowych koncepcji biologicznych, a następnie wprowadzając różne podejścia wnioskowania w sposób skategoryzowany. Artykuł zawiera również linki do publicznie dostępnych narzędzi programowych do wnioskowania o sieci. Banf i in. [16] przedstawili przegląd metod wnioskowania GRN, ich ograniczeń i zastosowania na gatunkach roślin A. Thaliana. Artykuł koncentruje się również na różnych typach danych, które można wykorzystać do wnioskowania GRN, takich jak informacje o miejscu wiązania czynnika transkrypcyjnego, dane mapowania konformacji chromatyny oraz potrzeba integracji różnych zestawów danych w celu uzyskania bardziej adekwatnych wyników.

Dane dotyczące ekspresji mogą być mierzone w stanie ustalonym lub generowane jako szeregi czasowe. Ogólnie rzecz biorąc, podczas generowania danych szeregów czasowych, stan ustalony sieci jest zaburzony, a ewoluujące wartości wyrażeń są rejestrowane, aż sieć ponownie osiągnie stan ustalony. Ponieważ zbiory danych szeregów czasowych mają ewoluujące wartości ekspresji genów zarejestrowane w różnych momentach czasowych, uważa się, że dostarczają one więcej informacji o dynamice sieci bazowej niż dane ze stanu ustalonego. Związki przyczynowe między genami można wywnioskować tylko z danych szeregów czasowych. Wykazano, że podejście wnioskowania GENIE3 (oparte na danych w stanie ustalonym) słabo sprawdza się na danych szeregów czasowych [17]. Sugeruje to zatem, że podejście podjęte w procesie wnioskowania powinno wykorzystywać informacje z wielu punktów czasowych, aby lepiej uchwycić interakcje między genami.

W sieciach regulatorowych genów [18, 19] geny oddziałują ze sobą w celu wykonywania określonych funkcji komórki. Interakcje gen-gen to interakcje regulacyjne między genem regulatorowym (znanym również jako czynnik transkrypcyjny (TF)) a genem docelowym. Gen docelowy ulega ekspresji w zależności od aktywności genów regulujących. Interakcja między genem regulatorowym a docelowym genem może być aktywująca lub hamująca. Regulacja aktywująca przyspiesza wytwarzanie genu docelowego (i gen docelowy ulega ekspresji), podczas gdy regulacja hamująca spowalnia wytwarzanie genu docelowego nawet mniej niż został wyprodukowany (wyrażony) przy braku tego hamującego genu regulującego. Ogólnie rzecz biorąc, istnieje pewna stała syntezy związana z produkcją każdego genu docelowego. Dzięki temu gen może ulegać ekspresji (choć na bardzo niskim poziomie) nawet przy braku genu regulatorowego [7, 20]. Podobnie, z każdym genem związana jest pewna stała rozpadu. Jednak degradacja genów jest wolniejszym procesem niż synteza genów. Zatem w obecności regulacji hamującej wynik netto może być postrzegany jako degradacja genu docelowego [7, 20].

Dane dotyczące ekspresji genów mają postać ciągłych poziomów ekspresji genów. W regulacji genów gen regulatorowy pozostaje w formie nieaktywnej, dopóki nie osiągnie stężenia progowego. Dopiero gdy jego stężenie wzrośnie powyżej stężenia progowego, staje się aktywny [21]. Sigmoidalny kształt rzeczywistego oddziaływania w regulacji genów można interpretować jako funkcję skokową w jego logicznej abstrakcji [22]. Dlatego mechanizm regulacyjny genów można interpretować w postaci przełącznika, czyli ON lub OFF. W logicznej abstrakcji gen regulatorowy (lub TF) w stanie ON przyłącza się do DNA i inicjuje regulację genu docelowego. Tak więc gen docelowy po jego wytworzeniu przechodzi ze stanu OFF do ON. Dyskretyzacja danych szeregów czasowych pomaga w identyfikacji potencjalnych genów regulatorowych dla genu docelowego.

Naukowcy próbowali zbadać zachowanie sieci GRN na podstawie danych dyskretnych. Ito i in. [23] przeanalizowali jakościowo zachowanie GRN przy użyciu logicznej abstrakcji poziomów ekspresji genów przy użyciu dwóch stanów ON i OFF i wykorzystali przełączanie między dwoma stanami do uchwycenia zachowania GRN. Schaub i in. [24] wykorzystali wiele dyskretnych poziomów do reprezentowania stanu genu i modelowania niektórych aspektów systemów biologicznych, takich jak negatywna autoregulacja. Zatem logiczna abstrakcja wartości ciągłej ekspresji genów zachowuje jakościowe cechy dynamiki systemu, takie jak zachowanie oscylacyjne, stan ustalony i osiągalność [22]. Küffner i in. [25] zaproponowali model sieci Petriego z logiką rozmytą (PNFL) do wnioskowania GRN. PNFL to dyskretne podejście oparte na regułach, które przeprowadza symulacje w celu uzyskania dynamiki systemu wraz z jego topologią.

W niniejszym artykule przedstawimy dyskretne podejście systemowe do wnioskowania o numerach GRN podczas zajmowania się zagadnieniami hałasu i stochastyczności. Podejście oparte na systemie dyskretnym oznacza, że ​​podejście opiera się na systemie dyskretnym, w którym w danych istnieje policzalna liczba poziomów ekspresji genów.


Wyniki

Sekwencjonowanie, montaż i charakterystyka genomu

Genom twardego małża M. mercenaria zsekwencjonowano za pomocą odczytów Illumina, PacBio Single Molecule Real-Time (SMRT), genomiki 10X i sekwencjonowania Hi-C (dodatkowy plik 2: Tabela S1), co dało zestaw referencyjny 1,79 GB z kontigiem N50 = 1,77 Mb (dodatkowy plik 2: Tabela S2). Rozmiar M. mercenaria genom oszacowano na 1,78 GB (z heterozygotycznością 1,34%) na podstawie kanaliza -mer (dodatkowy plik 2: Tabela S3), która jest zbliżona do wielkości genomu oszacowanej za pomocą cytometrii przepływowej [30]. Sekwencjonowanie Hi-C zastosowano do pozycjonowania i orientacji 1541 rusztowań obejmujących 1,74 GB (rusztowanie N50 = 91,38 Mb) w 19 sąsiadujących chromosomach, zgodnych z liczbą haploidów (ryc. 1a, plik dodatkowy 4: ryc. S2 i plik dodatkowy 2: tabela S4). Zespół na poziomie chromosomu charakteryzował się wysoką integralnością i jakością, ponieważ ponad 95% odczytów krótkich wstawek Illumina można było z powodzeniem zmapować do zespołu (dodatkowy plik 2: Tabela S5). Ocena BUSCO wykazała 90,5% kompletności konserwowanych genów rdzeniowych (dodatkowy plik 2: Tabela S6), która jest porównywalna lub nieco niższa (prawdopodobnie ze względu na duży genom małża twardego, wysoki polimorfizm i wykorzystanie osobnika niewsobnego) niż w opublikowanych genomach dwuskorupowych.

Charakterystyka i analiza filogenetyczna genomu małży twardych. a Genomowy krajobraz twardego małża. Od zewnętrznych do wewnętrznych kółek: a, 19 chromosomów w skali Mb b, numer genu IAP na każdym chromosomie c, rozkład chromosomów 159 IAP, z zewnętrznymi i wewnętrznymi liniami wskazującymi odpowiednio nici sensowne i antysensowne. Każdy myślnik na marginesie koła reprezentuje kopię genu IAP d

h, odpowiednio gęstość transpozonów DNA, gęstość TE, gęstość powtórzeń, gęstość genów i gęstość GC w całym genomie, narysowane w 1 Mb nienakładających się oknach. b Skalibrowane w czasie drzewo filogenetyczne twardej małży w obrębie metazoan. Liczby na gałęziach wskazują liczbę genów zdobytych (+, zielony) i utraconych (−, czerwony). Pfu, Pinctada fucata Cvi, Crassostrea virginica mile/h, Modiolus philippinarum Afa, Azumapecten farreri Mja, Mercenaria mercenaria Rp, Ruditapes philippinarum Csq, Chryzomalon łuskowy Lgi, Lottia gigantea Bgl, Biomphalaria glabrata Aca, Aplysia californica Adu, Architeuthis dux Obi, Ośmiornica bimaculoides Cte, Capitella teleta Hro, Helobdella robusta Jestem, Apis mellifera Dja, muszka owocowa Hsa, Homo sapiens Bfl, Branchiostoma floridae Nve, Nematostella vectensis. C Top 10 rozszerzyło się i trzy najlepsze skurczone ścieżki, które zostały wzbogacone w twardy małż

Adnotacja przy użyciu EVidenceModeler łączącego przewidywanie ab initio, homologię z innymi gatunkami i dane sekwencyjne RNA zidentyfikowała 34 283 geny [31, 32] (dodatkowy plik 2: Tabela S7). Zestaw genów małży jest nieco większy niż większość małży zsekwencjonowanych do tej pory, ale podobny do ostrygi wschodniej Crassostrea virginica (34,596) i mniejszy niż małża Modiolus philippinarum (36 549). Ogólnie rzecz biorąc, genomy małży kodują więcej genów i wykazują wyższy polimorfizm niż genom ludzki (dodatkowy plik 2: Tabela S8). Elementy transpozycyjne (TE) stanowiły 49,11% genomu z transpozonem DNA (34,24%), długimi powtórzeniami końcowymi (LTR, 10,04%) i długimi elementami przeplatanymi (LINE, 7,17%) obejmującymi 3 główne klasy transpozonów (dodatkowy plik 2 : Tabela S9).

Rozbudowa domen związanych z apoptozą i sieci koekspresji

Aby określić pozycję filogenetyczną twardych małży, do grupowania rodzin genów wybrano dziewiętnaście genomów metazoan (ryc. 1b) z Cnidaria, Annelida, Mollusca, Arthropoda, Chordata i Vertebrata, co pozwoliło zidentyfikować 43 245 rodzin genów, w tym 237 rodzin jednokopiowych . Do analizy filogenetycznej metodą maksymalnego prawdopodobieństwa wykorzystano jednokopiowe geny z 19 genomów metazoan. Datowaliśmy czas rozbieżności twardego małża od najbliższego węzła (Ruditapes philippinarum) do około 178,9 mln lat (ryc. 1b). Od wspólnego przodka Heteroconchia do M. mercenaria229 rodzin genów rozszerzyło się o znaczne wzbogacenie w geny związane z odpowiedzią immunologiczną i szlakami apoptozy, takimi jak sygnalizacja receptora typu NOD, proteoliza za pośrednictwem ubikwityny i sygnalizacja TNF-kappa B (ryc. 1c, plik dodatkowy 3: tabela S10). Ekspansja rodzin genów związanych z odpornością i apoptozą sugeruje, że te rodziny genów są ważne dla adaptacji twardych małży.

Ponieważ apoptoza jest jedną z najbardziej rozbudowanych ścieżek w M. mercenaria, skupiliśmy się na dalszej analizie szlaku apoptozy, w tym regulacyjnych szlaków sygnalizacyjnych, takich jak sygnalizacja receptora typu NOD i szlaki sygnalizacyjne TNF-kappa B. Przeszukaliśmy domeny związane z apoptozą w genomie M. mercenaria i porównaliśmy nasze wyniki z wynikami uzyskanymi dla innych gatunków (ryc. 2), aby dalej scharakteryzować ekspansję genów związanych z apoptozą. Siedem domen kanonicznych związanych z apoptozą, BIR, TNF, DEATH, CARD2, TIR2 (receptor toll/interleukin 2), RING i Hsp70 zostało znacznie rozszerzony M. mercenaria i inne małże (ryc. 2). Współekspansja TNF i BIR w szczególności wspiera wzmocnioną regulację apoptozy, ponieważ u ludzi TNF i IAP (białko zawierające BIR) współdziałają w regulowaniu losu komórek. Na przykład, TNF moduluje różnorodne odpowiedzi komórkowe, w tym apoptozę i nekroptozę, poprzez liczne kompleksy sygnalizacyjne pochodzące z nadrodziny TNFR, z cIAPs jako integralną częścią, obejmującą rekrutację dalszych przetworników sygnału [11,12,13]. Liczba genów zawierających domenę BIR u małży twardych, 177 kopii, jest najwyższa (P <0,001) wśród wszystkich badanych śródstopiaków (ryc. 2). Znacząca ekspansja domen związanych z apoptozą u małży twardych i innych małży sugeruje, że małże mogą mieć silny i złożony zestaw genów regulujących apoptozę i stres komórkowy.

Dystrybucja domen białkowych Pfam związanych z apoptozą u mięczaków i innych śródstopiaków. Mja, Mercenaria mercenaria Rp, Ruditapes philippinarum Afa, Azumapecten farreri mile/h, Modiolus philippinarum Cvi, Crassostrea virginica Pfu, Pinctada fucata Csq, Chryzomalon łuskowy Lgi, Lottia gigantea Bgl, Biomphalaria glabrata Aca, Aplysia californica Adu, Architeuthis dux Obi, Ośmiornica bimaculoides Cte, Capitella teleta Hro, Helobdella robusta Jestem, Apis mellifera Dja, muszka owocowa Hsa, Homo sapiens Bfl, Branchiostoma floridae Nve, Nematostella vectensis. Skróty domen: Bcl-2, białka regulatorowe apoptozy, rodzina Bcl-2 CARD, domena rekrutacji kaspaz DED, domena efektorowa śmierci IAP, domena inhibitora apoptozy NACHT, domena występująca w białkach NAIP, CIITA, HET-E i TEP1 NB-ARC , adapter wiążący nukleotydy wspólny dla APAF-1, niektórych produktów genu R i CED-4 TIR, domeny receptora Toll/interleukiny 1 TNF, czynnika martwicy nowotworu TNFR, receptora czynnika martwicy nowotworu zf-C3HC4_3, palca cynkowego, typu C3HC4 (Palec serdeczny). Ekspansja w M. mercenaria lub Małże są oznaczone znaczącym, poprawionym P wartość (P < 0,001), z testów chi-kwadrat dla nadreprezentacji, przy użyciu wszystkich genów z adnotacjami jako tła. Kolor, od szarego do czerwonego, wskazuje ranking od dołu do góry

Aby zbadać rolę IAP we wrodzonej odpowiedzi immunologicznej twardych małży, przeprowadziliśmy analizę sieci koekspresji genów (WGCNA) na 39 transkryptomach z 10 narządów, koncentrując się na genach wykazujących zwiększoną łączność w hemolimfie, wątrobowo-trzustce i skrzelach, pierwotnych narządach w początkowej obronie przed patogenami. Najpierw zidentyfikowaliśmy 19 548 genów związanych z narządami, które ulegały zróżnicowanej ekspresji między dowolnymi dwoma narządami. Nasza analiza zidentyfikowała 11 modułów genów z brązowymi, czerwonymi i turkusowymi modułami wykazującymi istotną korelację odpowiednio z hemolimfą, wątrobowotrzustką i skrzela (ryc. 3a, b). Twarde małże wykazywały wyraźne sygnatury transkryptomiczne specyficzne dla narządów. Geny wyraźnie eksprymowane w hemolimfie są związane z kaskadami dopełniacza i krzepnięcia oraz szlakiem sygnalizacji TNF, a te sygnatury transkryptomiczne były wspólne z innymi mięczakami (dodatkowy plik 5: Fig. S3). W szczególności geny związane z apoptozą były intensywnie wzbogacone w transkryptomy hemolimfy i skrzeli (dodatkowy plik 5: ryc. S3 i dodatkowy plik 6: ryc. S4). W sieci koekspresji 20 najważniejszych szlaków KEGG wzbogaconych w geny eksprymowane specyficznie dla hemolimfy (geny modułu brązowego), szlaki apoptotyczne zostały połączone z sygnalizacją NF-kappa B, sygnalizacją TNF, sygnalizacją receptorów typu NOD i szlakami nowotworowymi. Odkrycia te wskazują, że interakcje między tymi szlakami tworzą sieć, która reguluje śmierć i przeżycie komórek, homeostazę komórkową i odporność u małży twardych (brązowy cień w pliku dodatkowym 6: ryc. S4). W 20 najbardziej wzbogaconych szlakach KEGG modułu brązowego wiele genów zostało oznaczonych jako IAP i wzbogaconych w szlaki apoptotyczne (29/45). IAP wykazały również rozległą i silną koekspresję z innymi genami w brązowym module przy odcięciu ważonego współczynnika korelacji > 0,35 (górne 3%) (dodatkowy plik 7: ryc. S5). To odkrycie wskazuje, że regulacja apoptozy może odgrywać ważną rolę w odpowiedzi immunologicznej u małży twardych.

Analiza sieci koekspresji genów specyficznych dla narządów u małży twardych, ze szczególnym uwzględnieniem potencjalnych genów odpowiedzi immunologicznej w hemolimfie. a Modułowa budowa sieci ekspresji genów dla 39 próbek. Te, jądro jaja, jajnik Ma, płaszcz Gi, skrzela Fo, stopa In, jelito Hep, wątrobowotrzustka St, żołądek Ad, przywodziciel Hem, hemolimfa. b Macierz korelacji między modułami a narządami. P wartość jest prezentowana w każdej komórce, a kolor wskazuje współczynnik korelacji

Rozszerzenie IAP poprzez duplikację tandemową i retropozycję

Niektóre z genów zawierających domenę BIR (ryc. 2) były niekompletne, a dalsza analiza zidentyfikowała 159 bona fide IAP (ryc. 1a i 4b), dając twardym małżom największy zidentyfikowany dotychczas repertuar genów IAP. Ekspansja rodziny IAP w małżach twardych wiązała się z wieloma zdarzeniami lokalnego powielania tandemowego i retropozycji. Ogromne duplikacje tandemowe zaobserwowano na chromosomach (Chr) 5, 6 i 7. Spośród 159 IAP 59 (37,1%) było gęsto powiązanych w macierzach tandemowych na Chr 5, podczas gdy 22 (13,8%) i 12 (7,6%) było tandemowo zduplikowane odpowiednio na Chr 6 i 7 (ryc. 1a). Przykładowa macierz zawiera 6 tandemowo replikowanych IAP zlokalizowanych przy 12280-12370 kilozasadach (kb) na Chr 5, transkrybowanych w tym samym kierunku bez innych genów pomiędzy nimi (ryc. 5a).

Architektury domenowe IAP z twardych małży (po lewej, zidentyfikowane w tym badaniu) i ludzi (po prawej, zmodyfikowane na podstawie Kocab et al. 2016) (a) drzewo filogenetyczne 159 IAP małży (b) dystrybucja architektur domenowych (C) i numer intronu z różnych kladów filogenetycznych (D)

Rozbieżność w profilu ekspresji zduplikowanych IAP u małży twardych. a Powielanie tandemowe sześciu punktów IAP w ciągu jednego roku

Region 90 kb, z rozbieżnością ekspresji między różnymi narządami i stadiami podczas ekspozycji powietrznej. b Selektywna presja na sześć zduplikowanych IAP. C Przewidywanie modelu genów dla sześciu zduplikowanych linii IAP reprezentuje introny, a prostokąty reprezentują egzony. Regiony kodujące różne domeny są odpowiednio pokolorowane. Liczby nad intronami wskazują fazę każdego intronu. D Granice domen znalezionych w IAP twardych małży

Oprócz duplikacji tandemowej znaczna część IAP (51, 32,1%) była pozbawiona intronów i wydawała się być losowo rozmieszczona w chromosomach (dodatkowy plik 8: Tabela S11), co wskazuje na retropozycję. Analizy filogenetyczne 159 IAP ujawniły 6 odrębnych kladów o niewielkich odległościach genetycznych i 4 inne geny poza tymi kladami. Klad 1 zawierał 49 IAP (ryc. 4b), z których 42 były bezintronowe i wykazywały podobną architekturę domen (jeden ekson kodujący BIR bez intronu), co sugeruje pęknięcie retropozycji ze wspólnego genu „rodzicielskiego”. W związku z tym spekulujemy, że zarówno duplikacja tandemowa, jak i retropozycja napędzały ewolucyjną ekspansję IAP w genomie małży twardych.

Pod względem mechanicznym duplikację genów mogą ułatwić powiązane TE. Analiza dystrybucji TE wykazała, że ​​transpozony DNA zostały znacząco wzbogacone (P < 0,01) wokół genów IAP (średnia gęstość = 0,12) w porównaniu z innymi genami w genomie (średnia gęstość = 0,05), podczas gdy inne typy TE (w tym LINE, LTR i SINE) nie wykazały znaczącej różnicy (dodatkowy plik 9: Ryc. S6). To odkrycie wskazuje, że transpozony DNA mogły odgrywać rolę w masowej ekspansji genów IAP w genomie twardych małży.

Częste tasowanie domen doprowadziło do zróżnicowania struktury IAP

Aby zrozumieć ewolucję IAP po duplikacji, sklasyfikowaliśmy architekturę domen IAP małży na siedem typów, A–G (ryc. 4a), na podstawie liczby kopii domen BIR i RING, które są kluczowe dla funkcjonowania IAP. W przypadku twardych IAP małży wykryto rozległe tasowanie domen. Jak ujawniła klasyfikacja architektury domeny i analiza filogenetyczna (ryc. 4b), IAP zgrupowane razem mogą pochodzić z tego samego genu przodka, a architektura domen różniła się w obrębie tego samego klastra. IAP Clam w tym samym kladu (2–5) składały się z 3 do 6 różnych typów architektury domen, przy czym każdy klad miał jedną dominującą architekturę domeny (> 50%) i różne proporcje typów pochodnych (36% do 43%) (ryc. 4c). Zróżnicowana struktura domen wynika z tasowania domen, tj. przez zyskanie lub utratę domen BIR/RING. Na przykład 6 tandemowo zduplikowanych IAP w regionie 90 kb na Chr 5 (ryc. 5a, plik dodatkowy 8: tabela S11), wyświetlało trzy typy architektur domen, C, F i G (ryc. 4a), wskazując tasowanie domeny miało miejsce podczas lub po duplikacji tandemowej.

Aby zbadać, jak wpłynęło tasowanie domen IAP struktury genu, zbadaliśmy strukturę intron-egzon domen BIR, RING, BIRC6 i UBA (ryc. 5d). Co ciekawe, każda domena wykazywała wysoce konserwatywne struktury intron-egzon. Podczas gdy domena RING była związana w jednym eksonie na końcu genu, większość IAP małży twardych (z wyjątkiem tych pochodzących z retropozycji) miała początkową domenę BIR, która obejmowała pierwsze dwa eksony. Po pierwszych dwóch egzonach kodujących BIR zawsze następował inny egzon oflankowany przez introny fazy 0 i fazy 1 (lub 2) (w nawiasach na ryc. 5c, d). To odkrycie sugeruje, że domena BIR wraz z kolejnym egzonem może być wstawiona do IAP jako moduł wieloegzonowy, lub podobne fazy flankujące i wewnętrzne intronowe pozwalały na „mieszanie i dopasowywanie” domen z puli budowy pojedynczego egzonu Bloki.

Aby określić, czy zduplikowane IAP doświadczyły innej presji selekcyjnej, obliczyliśmy stosunek podstawienia niesynonimicznego do synonimicznego (Ka/Ks) dla 6 tandemowo zduplikowanych IAP na Chr 5 (ryc. 5a). Ka/Ks wszystkich 6 zduplikowanych IAP było znacznie mniejsze niż 1 (P wartości wahają się od 0

9.74E−47, Ryc. 5b), wskazując, że były one funkcjonalnie ograniczone przez selekcję oczyszczającą. Zmienność Ka/Ks od 0,0817 do 0,4456 sugeruje, że zduplikowane geny doświadczyły różnych poziomów selekcji oczyszczającej, co może być ważne dla rozbieżności sekwencji i funkcji.

Rozbieżność funkcjonalna zduplikowanych IAP

Aby zrozumieć, w jaki sposób IAP reagują na stresory środowiskowe, wykonaliśmy sekwencje RNA w dniach 0, 8 i 16 po tym, jak dorosłe małże zostały poddane ekspozycji z powietrza. 632 geny były regulowane w górę, a 343 w dół w dniu 8, podczas gdy 506 w górę i 532 w dół w dniu 16. Warto zauważyć, że szlak apoptotyczny był jednym z najbardziej znacząco wzbogaconych szlaków w transkryptomach małży poddanych 8- lub 16-dniowej ekspozycji z powietrza. (ryc. 6c, d). Wskazuje to, że apoptoza była funkcjonalnie ważna dla utrzymania homeostazy, ponieważ ekspozycja w powietrzu powoduje obniżenie pH i poziomu tlenu, prowadząc do dysfunkcji homeostazy komórkowej. Wzbogacenie w geny związane z apoptozą przypisywano głównie ekspresji rodziny IAP: 17 z 27 genów o zróżnicowanej ekspresji (DEG) ze szlaku apoptozy to IAP w dniu 8, a 12 z 23 w dniu 16 (ryc. 6a , b). Oprócz ekspozycji z powietrza porównaliśmy również transkryptomy małży twardych poddanych działaniu wysokiej temperatury, niskiego poziomu tlenu i niskiego zasolenia. W sumie 134 IAP były różnie wyrażane pod wpływem co najmniej jednego stresora środowiskowego, a wśród 27 DEG wspólnych dla wszystkich stresorów trzy to IAP (dodatkowy plik 10: Ryc. S7). Wyniki te wskazują, że ponad 84% rozszerzonych IAP (134 z 159) jest zaangażowanych w reakcję na stres u twardych małży z niezwykłą swoistością, co podkreśla znaczenie ekspansji i dywersyfikacji IAP w reakcji na stres i adaptacji.

Odpowiedź transkryptomu małży twardych poddanych stresowi związanemu z ekspozycją na powietrze i rozbieżności ekspresji IAP. a, b Wykresy wulkaniczne genów o zróżnicowanej ekspresji (DEG) (8 dni vs 0 dni i 16 dni vs 0 dni). C, D, ścieżki KEGG wzbogacone w DEG (8 dni vs 0 dni i 16 dni vs 0 dni). mi, F Skoordynowana ekspresja IAP twardych małży między narządami i podczas ekspozycji powietrznej. IAP ze średnią FPKM < 0,1 zostały uznane za ciche i wykluczone

Powielone IAP wykazywały różne profile ekspresji, zarówno przestrzennie w różnych narządach, jak i czasowo podczas stresu środowiskowego, co sugeruje rozbieżność funkcjonalną i koordynację. Funkcjonalna rozbieżność jest implikowana nie tylko przez specyficzną dla danego narządu ekspresję różnych IAP (ryc. 6c), ale także przez zróżnicowaną odpowiedź lub wzorzec ekspresji członków IAP na określone stresory środowiskowe, czego przykładem jest zróżnicowana reakcja na ekspozycję z powietrza (ryc. 6d ) oraz rozbieżną czułość lub reakcję na różne stresory środowiskowe (dodatkowy plik 11: Ryc. S8), gdzie IAP z ekspresją hemolimfy (brązowy moduł WGCNA) wykazywały wyraźną rozbieżność ekspresji w odpowiedzi na różne stresory. IAP w kladu zielonym są wrażliwe na stres związany z ekspozycją w powietrzu, podczas gdy w kladu fioletowym są wrażliwe na niskie zasolenie, a w kladu niebieskim są wrażliwe na stres cieplny.

Zarówno na poziomie kladu, jak i w odniesieniu do typu strukturalnego (dodatkowy plik 12: rys. S9 i dodatkowy plik 13: rys. S10), ekspresja IAP w odpowiedzi na stres środowiskowy była bardzo zmienna. Ogólnie rzecz biorąc, IAP w kladach 2, 3 i 5 wykazywały podobną dynamikę ekspresji, ponieważ wszystkie były podwyższone, gdy małże zmagały się ze stresem termicznym, osmotycznym lub ekspozycją w powietrzu, ale z różnymi poziomami ekspresji i specyficznością narządową. W porównaniu z IAP w kladach 2, 3 i 5, te z kladu 4 były mniej wrażliwe na zmienne środowiskowe, a klad 6 wykazywał prawie przeciwne wzorce ekspresji. IAP o różnych typach strukturalnych (A

E) wykazywały również rozbieżne wzorce ekspresji, na przykład IAP typu D, które były szczególnie wrażliwe na stresory środowiskowe, wykazywały wyraźną specyficzność narządową: wysoką ekspresję w płaszczu i niską ekspresję w hemolimfie. W przeciwieństwie do tego, IAP typu B wykazywały podobną odpowiedź na stres środowiskowy, ale miały najwyższą ekspresję w hemolimfie. IAP typu E wykazały odwrotną tendencję do typu B i D w odpowiedzi na wiele stresorów.

Pojęcie zorganizowanej ekspresji po duplikacji jest wzmocnione przez sześć tandemowo zduplikowanych IAP na Chr 5 (ryc. 5a), które wykazały konstytutywną reakcję na ekspozycję w powietrzu i rozbieżną stronniczość ekspresji narządów: geny 5.357 i 3.578 osiągnęły najwyższe poziomy ekspresji w 8 dni po ekspozycja w powietrzu, 5,359 i 3,360 była wysoko wyrażona po 16 dniach, a 3,61 i 3,62 nie wykazywały istotnych zmian. W odniesieniu do zróżnicowanej ekspresji między organami, 5,357 wykazywało najwyższą ekspresję w skrzelach, 5,357

5,360 było wyraźnie nadeksprymowane w hemolimfie, podczas gdy 5,361 i 5,362 były wyrażane jednolicie.

Ewolucja repertuarów IAP wśród wielu typów

Aby zbadać ewolucyjne pochodzenie istniejących IAP, zastosowano podejście filostratygraficzne z wartością odcięcia E < e-10 w celu oszacowania wieku IAP i genów specyficznych dla narządów. Zdefiniowaliśmy 10 rang filogenetycznych (phylostrata) w oparciu o bazę danych taksonomii NCBI i używając pierwszego phylostratum (PS1) jako miejsca pochodzenia życia komórkowego (tj. najstarszych genów), a ostatniego phylostratum (PS10) jako badanej linii twardej małży (tj. najmłodsze geny). Geny narządowo-specyficzne w hemolimfie, wątrobianotrzustce i skrzelach wykazywały podobny wzór genowo-wiekowy, w którym tylko geny swoiste dla wątrobowo-trzustki zawierały zwiększony odsetek najstarszych (+11%) i zmniejszony odsetek najmłodszych (−9%). Większość rozszerzonych IAP twardych małży poprzedza powstanie metazoan (50%) i Bilateria (47%), podczas gdy jeden IAP (ID, Mme.02 g01599.1, oznaczony niebieskim trójkątem na ryc. 7a) pojawił się po raz pierwszy wraz z pojawieniem się eukariontów. Gen ten był unikalny pod względem struktury i wielkości przy długości 90,83 kb (dodatkowy plik 8: Tabela S11) i zawierał domenę BIR6 (typ G2 na Fig. 4a). Podobnie IAP ssaków, określany jako Apollon (4,88 kb i zawierający również domenę BIR6), strukturalnie różni się od klasycznych IAP swoistych dla metazoa i wykazuje homologię do białka u drożdży [33]. Nasze wyniki potwierdzają istnienie dwóch linii IAP, jedna to IAP zawierające BIR6, która jest starożytna i pochodzi z eukariontów, a druga linia to IAP zawierające BIR, które są wspólne dla organizmów wielokomórkowych [33].

Pochodzenie IAP małży twardych i ewolucja IAP w różnych liniach śródnaczodołowych. a Ewolucyjne pochodzenie IAP i genów narządowych u małży twardych. Analizy filostratygraficzne genów IAP (niebieski), swoistych dla hemolimfy (brązowy), swoistych dla wątroby i trzustki (czerwony) i swoistych dla skrzeli (turkusowy) w 10 filostratach. Uwzględniono tylko geny, dla których zwrócono co najmniej jedno znaczące trafienie BLAST (< e-10). b Ekspansja i kurczenie się repertuaru IAP w 18 gatunkach z różnych linii metazoa. Przypadki przyrostu i utraty genów są mapowane na drzewo gatunków, oznaczone odpowiednio zielonymi i czerwonymi liczbami. Liczby w żółtych ramkach wskazują przewidywany numer IAP przodków każdego węzła. Niebieski blok oznacza Bivalvia. mile/h, Modiolus philippinarum Pfu, Pinctada fucata Cvi, Crassostrea virginica Afa, Azumapecten farreri Mja, Mercenaria mercenaria Rp, Ruditapes philippinarum Aca, Aplysia californica Bgl, Biomphalaria glabrata Lgi, Lottia gigantea Csq, Chryzomalon łuskowy Adu, Architeuthis dux Obi, Ośmiornica bimaculoides Cte, Capitella teleta Hro, Helobdella robusta Jestem, Apis mellifera Dja, muszka owocowa Hsa, Homo sapiens Bfl, Branchiostoma floridae Nve, Nematostella vectensis. C Dystrybucja IAP o różnych architekturach domenowych w 19 gatunkach Metazoa. Gwiazdka wskazuje architektury domenowe rozszerzone w małżach ze znaczącym skorygowanym P wartość (P <0,0001) z testów chi-kwadrat dla nadreprezentacji, przy użyciu wszystkich genów z adnotacjami jako tła

Następnie zidentyfikowaliśmy nienaruszone IAP wśród 19 gatunków i wykorzystaliśmy ramy filogenetyczne, aby prześledzić ewolucyjne losy tych IAP w wielu typach zwierząt (ryc. 7b). Szacuje się, że najmłodszy wspólny przodek (MRCA) wszystkich śródstopiaków miał 13 IAP, podczas gdy sukcesywna ekspansja rodziny IAP prawdopodobnie wystąpiła u wspólnego przodka mięczaków i kolejnych linii. Nastąpiła znaczna ekspansja małży, która nie występowała u innych taksonów (niebieski blok na ryc. 7b). Ekspansja IAP małży była głównie specyficzna dla linii (ryc. 8), ponieważ paralogi w obrębie tego samego gatunku skupiały się razem, co sugeruje, że ich ekspansja nastąpiła po specjacji. Znacząca ekspansja IAP w wielu liniach małżowych implikuje zbieżną ewolucję wzmożonej regulacji apoptozy u stacjonarnych małży, które muszą radzić sobie ze stresem środowiskowym bez możliwości uniknięcia tego.

Analiza filogenetyczna IAP z Mercenaria mercenaria (Pani), Crassostrea virginica (Cvi), Crassostrea gigas (Cgi), Biomphalaria glabrata (Bgl) i Homo sapiens (Hsa) Dendrogram został wygenerowany przy użyciu analizy Bayesa z modelem substytucji WAG. Architektura domeny jest zdefiniowana na rys. 4a

Masowo namnożone IAP małży były zdominowane przez typy strukturalne domen B, C, F i G1 (ryc. 7c), które składają się z jednej lub dwóch domen BIR, sprzężonych lub niesprzężonych z domeną RING. Różniły się one znacznie od innych typów IAP (tj. A, D, E, G2 i G3), które mają mniej kopii (< 5) we wszystkich typach zwierząt. Dodatkowo, układ domen typów D, E i G3 mógł wystąpić poprzez wzmocnienie domeny (dodatkowy BIR), utratę (brak domeny RING) i kooptację (kooptacja PC4), podczas gdy typy H i I u ludzi są prawdopodobnie innowacjami strukturalnymi, które dokooptowały domeny CARD, NACHT, NOD2_WH i NLRC4_HD.


Wyniki i dyskusja

Tłumienie metabolicznych głównych regulatorów transkrypcji poprzedza akumulację lipidów podczas stresu ER

Akumulację lipidów można indukować w wątrobie przez wystawienie na działanie inhibitora N-glikozylacji tunikamycyny (TM) lub inhibitora proteasomów bortezomibu, lub przez nadekspresję nieprawidłowo sfałdowanego białka klienta ER, takiego jak czynnik krzepnięcia VIII [GenBank: <"typ": "entrez-nukleotyd","attrs":<"text":"NM_001161373.1","term_id":"238624181","term_text":"NM_001161373.1"> NM_001161373.1] (Rutkowski i in., 2008 Zhang i wsp., 2011 Chikka i wsp., 2013). Każda z tych terapii aktywuje albo UPR, albo zintegrowaną odpowiedź na stres i każda prowadzi do jakościowo podobnych zmian w ekspresji kluczowych genów metabolicznych w wątrobie. Te geny obejmują zarówno czynniki transkrypcyjne, jak i kofaktory zaangażowane w kontrolowanie metabolizmu, a także dalsze cele tych czynników, które kodują kluczowe enzymy funkcjonalne zaangażowane w katabolizm, anabolizm, magazynowanie i sekrecję lipidów (Rutkowski i wsp., 2008).

Organizacja czasowa tych zmian regulacyjnych genów przed i po rozpoczęciu akumulacji lipidów nie została przeanalizowana. Jest prawdopodobne, że najwcześniejsze z tych regulowanych zdarzeń są bezpośrednio mechanicznie połączone z UPR i/lub zintegrowaną reakcją na stres. Zbadaliśmy zatem przebieg czasowy akumulacji lipidów w wątrobie u myszy typu dzikiego w odpowiedzi na TM, który jest silniejszym induktorem stresu i stłuszczenia ER niż inne bodźce (Chikka et al., 2013). Monitorowaliśmy akumulację lipidów według trzech różnych kryteriów: akumulacja czerwieni oleistej O w kropelkach lipidów świeżo mrożonych skrawków wątroby (Rysunek ​ (Rysunek 1A) 1A) immunohistochemiczne wykrywanie adipoliny białka związanego z kropelkami lipidu (ADRP) [GenBank: <” type":"entrez-nukleotyd","attrs":<"text":"NM_007408.3","term_id":"116235488","term_text":"NM_007408.3"> NM_007408.3] (rysunek i #x200B (Figura 1B) 1B) i bezpośrednia biochemiczna ocena poziomów triglicerydów w wątrobie (Figura ​ (Figura 1C). 1C). Wyniki wszystkich trzech testów były podobne: zawartość lipidów w wątrobie wzrosła najbardziej znacząco w punkcie czasowym 8 godzin. Dlatego kluczowe genetyczne zdarzenia regulacyjne odpowiedzialne za zmianę metabolizmu lipidów prawdopodobnie wystąpią przed 8 godziną, podczas gdy te, które występują później niż 8 godzin po prowokacji, są bardziej prawdopodobnymi skutkami wtórnymi, które przyczyniają się stycznie do zaburzenia lipidów, jeśli w ogóle.

Stres ER powoduje znaczną akumulację lipidów w wątrobie w ciągu 8 godzin. (A) Myszy C57BL/6J poddano prowokacji 1 mg/kg TM przez wskazany czas, wątroby zamrożono w OCT, a lipidy wybarwiono czerwienią oleistą O. Słupek skali = 50 &x003bcm. (B) Taki sam jak (A), z wyjątkiem zawartości lipidów ocenianej przez barwienie immunohistochemiczne dla białka markera kropli lipidów ADRP. Skala = 50 μm. (C) Taki sam jak (A), z wyjątkiem zawartości triglicerydów zmierzono w teście kolorymetrycznym po ekstrakcji obojętnych lipidów. P < 0,001 przez jednokierunkową analizę ANOVA. n = 3 próbki na punkt czasowy. Słupki błędów tutaj i w innych miejscach oznaczają ± SDM.

Następnie zbadaliśmy czas aktywacji UPR i regulacji genów metabolicznych.TM doprowadziło do maksymalnego splicingu zależnego od IRE1α Xbp1 mRNA w ciągu 2 godzin ten splicing utrzymywał się przez 8 godzin, ale zmniejszał się w późniejszych punktach czasowych (Figura ​ (Figura 2A). 2A). Podobnie, każdy gen docelowy regulowany przez UPR był znacząco podwyższony o 2 godz., osiągnął szczyt w 4𠄸 godz., a następnie zmniejszył się (Figura ​ (Figura 2B). 2B). Geny te zależą w różnym stopniu od aktywności każdego z trzech szlaków UPR (Harding i wsp., 2003 Lee i wsp., 2003 Wu i wsp., 2007). To, że są one równomiernie podwyższone o 2 godziny, sugeruje, że każdy z trzech kanonicznych regulowanych przez UPR aktywatorów transkrypcyjnych 𠅊TF6α, ATF4 i XBP1— jest funkcjonalnie aktywny do tego bardzo wczesnego punktu czasowego.

Rozłożona supresja genów metabolicznych podczas stresu ER. (A) Spliced ​​(spl) i niespliced ​​(us) formy Xbp1 mRNA wykrywano metodą RT-PCR całkowitego RNA wyizolowanego z wątrób myszy traktowanych nośnikiem (veh) lub 1 mg/kg TM przez wskazany czas. Każdy pas przedstawia osobne zwierzę. Obraz jest wyświetlany w odwróconej formie czarno-białej dla większej przejrzystości wizualnej. (B) Ekspresję wskazanych genów docelowych UPR określono za pomocą qRT-PCR na zwierzętach pokazanych na (A), z Btf3 oraz Ppia używane jako kontrole normalizujące. Wyrażenie tutaj i na kolejnych rysunkach podane jest na dzienniku2 skala w stosunku do stanu traktowanego pojazdem. Tu i gdzie indziej, chyba że zaznaczono inaczej: * P < 0,05 # P < 0,1 przez uczniów o orientacji dwustronnej T-test. (C𠄿) Ekspresję genów metabolicznych oceniono metodą qRT-PCR jako in (B), a geny pogrupowano według punktu czasowego, w którym regulacja w dół (P < 0.1) został po raz pierwszy zaobserwowany. Wymieniono proces, w którym uczestniczy każdy gen.

Następnie przeanalizowaliśmy ekspresję genów zaangażowanych w metabolizm lipidów, w tym zarówno regulatorów transkrypcji, jak i kluczowych enzymów metabolicznych ograniczających tempo. Pogrupowaliśmy geny według punktu czasowego, w którym po raz pierwszy zostały one obniżone. Natychmiast zaobserwowaliśmy, że w przeciwieństwie do konwencjonalnych genów docelowych UPR, regulacja genów metabolicznych zachodziła etapami. Najwcześniej regulowana grupa obejmowała wybrane czynniki transkrypcyjne i kofaktory. Koregulator Pgc1b [GenBank: <"type":"entrez-nukleotyd","attrs":<"text":"NM_133249.2","term_id":"118131021","term_text":"NM_133249.2"> NM_133249. 2] był regulowany w dół o 2 godziny, chociaż nie po 4 godzinach (Figura ​ (Figura 2C), 2C), co sprawia, że ​​prawdziwy czas jego tłumienia jest niejednoznaczny. Natomiast o 4 h koregulator Pgc1a [GenBank: <"type":"entrez-nukleotyd","attrs":<"text":"NM_008904.2","term_id":"238018130","term_text":"NM_008904.2"> NM_008904. 2] oraz aktywatory transkrypcji Cebpa [GenBank: <"type":"entrez-nukleotyd","attrs":<"text":"NM_007678.3","term_id":"131886531","term_text":"NM_007678.3"> NM_007678. 3] i Ppara [GenBank: <"type":"entrez-nukleotyd","attrs":<"text":"NM_001113418.1","term_id":"164663879","term_text":"NM_001113418.1"> NM_001113418. 1] zostały stłumione (Figura ​ (Figura 2C). 2C). PGC-1β przyczynia się do lipogenezy, utleniania kwasów tłuszczowych oraz wytwarzania i wydzielania VLDL (Lee i wsp., 2003 Lin i wsp., 2003, 2005a,b Wolfrum i Stoffel, 2006), a PGC-1α przyczynia się do ostatnie dwa z tych procesów (Louet i wsp., 2002 Lin i wsp., 2005a Rhee i wsp., 2006). C/EBPα pełni ogólną rolę w homeostazie energetycznej, w tym metabolizmie lipidów i glukozy, podczas gdy PPARα jest głównym regulatorem utleniania kwasów tłuszczowych (Desvergne et al., 2006).

Geny regulowane w dół w późniejszych czasach, tj. po rozpoczęciu wyraźnej akumulacji lipidów, obejmowały zarówno regulatory transkrypcji, jak i geny niższego rzędu kodujące enzymy ograniczające szybkość w procesach metabolicznych, jak wskazano na Figurach 2D. Wyniki te sugerują, że PGC-1α, C/EBPα i PPARα (i prawdopodobnie PGC-1β) są najprawdopodobniej pierwszymi genami metabolicznymi lipidów regulowanymi przez stres ER. Co więcej, procesy za tymi czynnikami, a mianowicie utlenianie kwasów tłuszczowych oraz biogeneza i transport lipoprotein, są pierwszymi dotkniętymi mechanizmami regulacji genów. Ponadto, ponieważ geny lipogeniczne ulegają zmianie dopiero znacznie później (18 godzin), sugerują, że hamowanie lipogenezy jest wtórną konsekwencją stresu ER, być może pojawiającą się w wyniku negatywnego sprzężenia zwrotnego, gdy lipidy zaczynają się kumulować. Ponadto, mimo że splicing XBP1 jest indukowany przez stres ER, nie znaleźliśmy dowodów na to, że ekspresja genów lipogenicznych była stymulowany pod tymi warunkami.

Usunięcie ATF6α nasila supresję genu metabolicznego

Myszy pozbawione ATF6α, podczas gdy skądinąd pozornie normalne i zdrowe, wykazują dramatyczne stłuszczenie po prowokacji TM (Rutkowski i wsp., 2008 Yamamoto i wsp., 2010). Ten fenotyp jest zilustrowany przez barwienie ADRP na Figurze ​ Figura 3A 3A wynika z niemożności przywrócenia homeostazy ER po prowokacji. Dlatego doszliśmy do wniosku, że myszy te można wykorzystać do eksponowania zmian ekspresji genów regulowanych przez stres, które naprawdę leżą u podstaw dysregulacji lipidów, ponieważ zmiany te powinny być wzmacniane w Atf6α −/− zwierzęta. Drugą korzyścią tych zwierząt jest to, że można je wykorzystać do identyfikacji zmian ekspresji rzeczywiście reagujących na stres, a te, które wynikają z właściwości TM niezależnych od stresu w ER, nie będą się różnić między typem dzikim i typem dzikim. Atf6α −/− zwierząt, ponieważ uważa się, że ATF6α nie działa poza kontekstem stresu ER, a jego usunięcie nie zmienia widocznej aktywności farmakologicznej TM (Rutkowski et al., 2008).

Utrata Atf6α zaostrza stłuszczenie i długotrwałą supresję genów metabolicznych. (A) Dziki typ lub Atf6Myszy α−/− prowokowano 1 mg/kg TM lub nośnikiem przez 48 godzin i przeprowadzono immunobarwienie ADRP jak na Figurze ​ Figura 1. 1 . Skala = 50 μm. (B𠄿) Dziki typ lub Atf6Myszy α−/− prowokowano 1 mg/kg TM lub nośnikiem przez 34 godziny, a globalną ekspresję mRNA oceniano za pomocą mikromacierzy Affymetrix. Przedstawiono ekspresję wskazanych genów zdeterminowaną macierzą. Geny zostały ułożone w te same grupy, co na rycinie ​ ryc.2. 2 . Istotność statystyczną obliczono metodą dwustronnego ucznia T-test, porównujący ekspresję w traktowanych TM Atf6α −/− zwierząt przeciwko traktowanym TM zwierzętom typu dzikiego. n = 3 zwierzęta w grupie. (G) Myszy traktowano TM lub nośnikiem przez 48 godzin, jak w (A), a ekspresję wskazanych genów określono metodą qRT-PCR. Istotność określono jak w (B𠄿).

Podeszliśmy do tego celu, rzucając wyzwanie typom dzikim i Atf6α −/− zwierząt przez dłuższy okres (34 h) z TM, a następnie profilowanie globalnej ekspresji genów za pomocą mikromacierzy. Wybraliśmy to podejście po części dlatego, że wcześniej stosowaliśmy profilowanie mikromacierzowe do scharakteryzowania ekspresji genów w tych samych szczepach myszy po 8 godzinach prowokacji TM (Rutkowski i wsp., 2008). Przeprowadzenie drugiego badania na mikromacierzy z identycznym chipem genowym w późniejszym czasie zapewniłoby nam wyjątkową możliwość określenia, dla każdego genu w macierzy, jego ekspresji w dwóch różnych genotypach, w dwóch różnych schematach leczenia (podłoże i TM) w dwa różne razy.

Mając 8 różnych kombinacji warunków eksperymentalnych, przewidzieliśmy, że możemy zacząć identyfikować skupiska skoordynowanych genów regulowanych, w tym te geny metaboliczne, które najlepiej reagują na stres ER. Opierało się to na założeniu, że geny będące częścią wspólnego szlaku funkcjonalnego (w tym przypadku metabolizmu lipidów) powinny być regulowane w podobny sposób. Podejście to zostało zastosowane z dużym skutkiem w drożdżach, a ostatnio w hodowanych komórkach ssaków, w celu odsłonięcia wcześniej ukrytych elementów aparatu wydzielniczego i innych interesujących szlaków (Schuldiner i Weissman, 2013). Tutaj naszym celem było wywnioskowanie ukrytych regulatorów transkrypcji za pomocą czasowych wzorców ekspresji genów jako danych wyjściowych.

Wśród zbadanych genów metabolicznych żaden nie został podwyższony przez stres ER w żadnym z genotypów po 34 godzinach. Dwa geny – regulator lipogeniczny i cholesterologenny Srebf1 [GenBank: <"type":"entrez-nukleotyd","attrs":<"text":"NM_011480.3","term_id":"146134488","term_text":"NM_011480.3"> NM_011480. 3] i Srebf2 [GenBank: <"type":"entrez-nukleotyd","attrs":<"text":"NM_033218.1","term_id":"73661203","term_text":"NM_033218.1"> NM_033218. 1]— były w równym stopniu regulowane w dół w obu genotypach (ryc. 3D, E ). Jednak zdecydowana większość genów była wyrażana na normalnym lub prawie normalnym poziomie u zwierząt typu dzikiego, ale głęboko tłumiona w Atf6α −/− zwierząt (ryc. 3C𠄿). Profilowanie qRT-PCR próbki tych genów z niezależnego eksperymentu potwierdziło te odkrycia (Figura ​ (Figura 3G). 3G). Dane te są zgodne z poglądem, że ostry stres ER hamuje utlenianie kwasów tłuszczowych i biogenezę lipoprotein na poziomie ekspresji genów i nie stymuluje ekspresji genów lipogenicznych.

Funkcjonalnie powiązane grupy genów skupiają się czasowo

Posiadanie tych 8 różnych warunków eksperymentalnych umożliwiło nam porównanie globalnego zachowania ekspresji genów wątrobowych w odpowiedzi na stres ER we wczesnym i późnym czasie u normalnych zwierząt z tymi z upośledzonym UPR. Mapa cieplna pokazująca geny regulowane przez TM jasno pokazuje dwie obserwacje: Po pierwsze, różnice w ekspresji genów między dwoma genotypami były znacznie większe po 34 godzinach niż po 8 godzinach. Po drugie, po 34 godzinach, wiele genów powróciło do normalnej lub prawie normalnej ekspresji u zwierząt typu dzikiego, ale pozostało regulowanych lub stało się jeszcze bardziej regulowanych w tym samym kierunku, w Atf6α −/− zwierząt.

Każdy gen został następnie skategoryzowany w oparciu o to, czy był podwyższony, obniżony lub niezmieniony przez stres ER w typie dzikim i Atf6α −/− zwierząt po 8 lub 34 godzinach stresu. Tak więc gen może należeć do dowolnego z 81 (3 × 3 × 3 × 3) profili ekspresji. Przypisania dla wszystkich sond podano w Tabeli S1. Byliśmy w stanie przeanalizować geny w ten sposób po części, ponieważ bardzo niewiele genów różniło się podstawową (tj. nieakcentowaną) ekspresją między genotypami, prawie wszystkie zależne od genotypów zmiany w ekspresji były spowodowane przez TM, więc podstawowe różnice w ekspresji nie były mylące (Rutkowski i in., 2008).

Ponieważ Atf6α −/− zwierząt stało się bardziej stłuszczone niż zwierzęta typu dzikiego, geny, które nie były różnie wyrażane między tymi dwoma genotypami po 34 godzinach leczenia TM, nie były dalej badane, ponieważ jest mało prawdopodobne, aby były one głównymi czynnikami przyczyniającymi się do fenotyp stłuszczeniowy. Chociaż możliwe były 54 pozostałe kombinacje ekspresji (3 × 3 × 3 × 2), 90 procent genów należało do zaledwie 9 kategorii (A–I, Rysunek ​ Rysunek 4B). 4B). Każdej kategorii genów nadano następnie graficzną reprezentację wzorca ekspresji jej członków (Figury 4C–G). Dwie najbardziej zaludnione grupy genów (Grupy A i B) to te, na które stres nie miał wpływu po 8 godz. ani w przypadku genotypu, ani u zwierząt typu dzikiego po 34 godz., ale były one odpowiednio regulowane w górę lub w dół po 34 godz. h w Atf6α −/− zwierząt (rysunek ​ (rysunek 4E). 4E ). Wśród genów metabolicznych przedstawionych na rysunkach ​ Figures2, 2, ​ 3, 3, wiele z nich obejmuje grupę B i obejmują one geny kodujące enzymy ograniczające szybkość w każdym szlaku utleniania kwasów tłuszczowych—Acox1, kpt1a, oraz Cyp4a10 [GenBank: <"type":"entrez-nukleotyd","attrs":<"text":"NM_015729.3","term_id":"429484482","term_text":"NM_015729.3"> NM_015729. 3, <"type":"entrez-nukleotyd","attrs":<"text":"NM_013495.2","term_id":"162287141","term_text":"NM_013495.2"> NM_013495.2 , oraz <"type":"entrez-nukleotyd","attrs":<"text":"NM_010011.3","term_id":"227116293","term_text":"NM_010011.3"> NM_010011.3 ], które kontrolują odpowiednio utlenianie peroksysomalne, mitochondrialne i mikrosomalne. Ponieważ ekspresja tych genów nie jest zmieniona aż do późniejszego punktu czasowego, jest mało prawdopodobne, aby były one proksymalnie połączone z UPR, ale bardziej prawdopodobne jest, że reprezentują pośrednie skutki, na przykład supresji PPARα. Kolejne dwie najbardziej zaludnione grupy (Grupy C i D) obejmowały te geny, które były wcześnie regulowane w górę lub w dół w obu genotypach i których ekspresja powróciła do normalnego poziomu u zwierząt typu dzikiego po 34 godzinach, ale które pozostały regulowane w Atf6α −/− zwierząt. Wśród genów metabolicznych grupa D obejmowała koregulatory Pgc1a oraz Pgc1b. Ściśle spokrewnione z tymi grupami były grupy E i F, które obejmowały geny, które były wcześnie regulowane w górę lub w dół w obu genotypach i dla których regulacja ta została wzmocniona w Atf6α −/− zwierząt po 34 godz. Pozostałe dwa szybko regulowane geny metaboliczne, Cebpa oraz Ppara, zostały znalezione w grupie F.

Klastrowanie genów zgodnie z regulacją czasową w typie dzikim i Atf6α −/− zwierząt. (A) Ekspresja każdego zestawu sond na mikromacierzy Affymetrix opisanej na rycinie ​ Rysunek 3 3 została zagregowana z danymi dotyczącymi ekspresji z wcześniej opublikowanej identycznej macierzy porównującej ekspresję genów w typie dzikim i Atf6α −/− zwierząt 8 godzin po prowokacji nośnikiem lub 2 mg/kg TM (Rutkowski et al., 2008). Dla każdego punktu czasowego ekspresję określono za pomocą log2 skali w stosunku do zwierząt typu dzikiego, którym w tym czasie podawano nośnik. Tylko sondy pokazujące znaczące (P < 0,05) różnice w ekspresji (1,5-krotne lub ଐ,58 w logu2 skali) w co najmniej jednym z czterech z czterech warunków (typu dzikiego lub Atf6α −/− o 8 lub 34 h) są pokazane przez heatmapę, która uwzględnia

45 000 sond w macierzy. Stopień regulacji w górę lub w dół jest pokazany przez intensywność odpowiednio czerwonego lub niebieskiego zabarwienia. Każda kolumna przedstawia uśredniony poziom ekspresji wśród trzech zwierząt w grupie. (PNE) Każdy zestaw sond na macierzy został scharakteryzowany przez jego ekspresję na cztery następujące sposoby, z różnicami zdefiniowanymi jako > 1,5-krotne, P < 0,05: (1) wzrost, spadek lub niezmieniony u zwierząt leczonych TM typu dzikiego po 8 godz. w stosunku do leczonych nośnikiem typu dzikiego (2) wzrost, spadek lub niezmieniony w Atf6α−/− TM zwierząt traktowanych po 8 godz. w stosunku do traktowanych TM dzikiego typu (3) takie same jak (1) ale 34 godziny i (4) takie same jak (2) ale 34 godziny. Geny, które wykazały różnicę według kryterium (4), zostały podzielone na grupy w oparciu o ich zachowanie w odniesieniu do tych kryteriów, a liczba genów w dziewięciu najbardziej zaludnionych grupach jest pokazana w (B). Grupa genów, które zostały podwyższone przez stres ER u zwierząt typu dzikiego w obu punktach czasowych, ale były mniej podwyższone w AtfUwzględniono również 6α −/− zwierząt—tj. geny, które mogą być rozumiane jako bezpośrednio zależne od ATF6α—. (C) stanowi klucz do ilustracji wzorców ekspresji genów. (D–G) Wzór ekspresji dla każdej z grup genów pokazanych na (B). Należą do nich geny pokazane na Rysunku ​ Rysunek 2 2 (te, które nie należą do żadnej z tych grup są zilustrowane na Rysunku S1), a także geny zaangażowane w przetwarzanie białka ER znalezione w Grupie E. Dla genów reprezentowanych przez więcej niż jeden zestaw sond , pokazane jest zachowanie najczęściej reprezentowane i/lub najbardziej zgodne z danymi qRT-PCR.

Najbardziej interesowały nas grupy D i F, ponieważ reprezentowały te geny, które najprawdopodobniej są proksymalnie mechanistycznie połączone z sygnalizacją UPR, ponieważ były szybko regulowane przez stres ER i ponieważ ich długoterminowa ekspresja zbiegła się z utrzymującym się stresem ER i pogorszeniem akumulacja lipidów obserwowana w Atf6α −/− zwierząt. W szczególności grupa F była godna uwagi, ponieważ jej odpowiednik kohorta genów regulowanych w górę – grupa E – zawierała szereg genów, o których wiadomo, że są bezpośrednimi celami czynników transkrypcyjnych UPR i które w ten sposób są proksymalnie połączone z sygnalizacją UPR (Rysunek ​ (Rysunek 2D 2D).

Za słuszność tego podejścia poparła również grupa genów, które zostały podwyższone przez stres ER u zwierząt typu dzikiego w obu punktach czasowych, ale które nie były tak podwyższone w Atf6α −/− zwierząt w obu punktach czasowych (Figura ​ (Figura 4G). 4G). Te geny pasowałyby do oczekiwanego profilu bezpośrednich celów ATF6α. Chociaż w tej grupie było stosunkowo niewiele genów, obejmowały one te już opisane jako bezpośrednie cele ATF6α, w tym Erp72, P58 IPK , Erdj3, oraz Derl3 (Wu i in., 2007 Yamamoto i in., 2007). To odkrycie wspiera ideę, że współregulowane geny mogą być dyskryminowane na podstawie ich profilu ekspresji w tej konfiguracji.

Pomysł ten został wzmocniony analizą szlaków. Geny z każdej z dziesięciu grup (A–I i ATF6) zostały przeanalizowane pod kątem funkcjonalnego wzbogacenia szlaków Gene Ontology (GO) przy użyciu FunNet (Prifti et al., 2008). Jako dowód koncepcji, analiza szlaku genów grupy ATF6 dała „pofałdowaną odpowiedź białkową” jako najbardziej znacząco wzbogacony proces, którego można by oczekiwać od grupy obejmującej bezpośrednie cele ATF6α (rysunek ​ (rysunek 5A). 5A). Geny reprezentujące procesy istotne dla metabolizmu lipidów zostały wzbogacone we wszystkich grupach regulowanych w dół 𠅋, D, F i G—, ale nie we wszystkich grupach regulowanych w górę A, C, E, H i I (Figury 5B,C). Z drugiej strony, każda z uregulowanych w górę grup została wzbogacona w geny reprezentujące szlaki związane z syntezą, transportem i degradacją białek. Wiadomo, że aktywacja UPR podczas stresu ER zwiększa transkrypcyjnie maszynerię biogenezy białek komórkowych poprzez działanie głównych regulowanych przez UPR aktywatorów transkrypcyjnych XBP1, ATF4 i ATF6 (Harding i wsp., 2003 Lee i wsp., 2003 Wu i wsp., 2007).Ta analiza szlaku sugeruje zatem, że, przynajmniej w wątrobie, supresja genów zaangażowanych w metabolizm lipidów stanowi wspólne ognisko aktywacji UPR.

Funkcjonalnie powiązane geny skupiają się dzięki regulacji czasowej. (A𠄼) Każda z grup genów na rycinie ​ ryc.4 4 została poddana analizie ścieżki ontologii genów przy użyciu FunNet. Siedem najistotniejszych wzbogaceń szlaku zostało następnie uporządkowanych według liczby genów z tej grupy, które były szlakiem „„chity” i „ścieżki” z największą liczbą „chitów” wymienionych wyżej. Ze względu na przestrzeń pokazano pięć z tych siedmiu ścieżek z każdej grupy. W żadnym przypadku nie doszło do wzbogacenia procesu metabolizmu lipidów wśród podwyższonych grup genów. w (B), szlaki istotne dla metabolizmu lipidów są wymienione na czarno, a inne szlaki na szaro. w (C), szlaki związane z przetwarzaniem białek są zaznaczone na czarno.

Funkcjonalna analiza genomiczna identyfikuje HNF4α jako proksymalny regulator ekspresji genów metabolicznych podczas stresu ER

Chcieliśmy wykorzystać siłę statystyczną naszych porównań mikromacierzy w celu przewidzenia regulatorowych czynników transkrypcyjnych, których aktywność została zmieniona przez stres ER, które najprawdopodobniej będą proksymalnie mechanistycznie połączone z UPR. Aby to osiągnąć, poddaliśmy geny w każdej grupie analizie za pomocą oPOSSUM (Ho Sui i wsp., 2005), która przeszukuje region promotora/wzmacniacza każdego genu pod kątem miejsc wiązania konsensusowego czynnika transkrypcyjnego z bazy danych JASPAR CORE. Ustalając słuszność tego podejścia, geny w grupie ATF6 dały czynnik transkrypcyjny NFYA [GenBank: <"type":"entrez-nukleotyd","attrs":<"text":"NM_001110832.1","term_id": „161016830","term_text":"NM_001110832.1">> NM_001110832.1] jako jedyne statystycznie istotne trafienie (rysunek ​ (rysunek 6A). 6A ). Wiadomo, że ATF6α ulega dimeryzacji z NFYA w celu regulacji transkrypcji z promotorów zawierających elementy ERSE i ERSE II (Yoshida i wsp., 2000, 2001 Kokame i wsp., 2001). NFYA nie została wzbogacona o żadną inną grupę, co podkreśla specyfikę algorytmu.

Przewidywanie czynnika transkrypcji implikuje ELK4, HNF1α, NR2F1 i HNF4α jako ukryte węzły regulacyjne w zależnej od stresu wątrobowej regulacji genów. (A𠄼) Każda z grup genów na Ryc. ​ Ryc. 4 4 została poddana analizie jednomiejscowej oPOSSUM, która przeszukuje regiony regulatorowe (w tym przypadku � pz od miejsca startu transkrypcji) pod kątem potencjalnych miejsc wiązania czynników transkrypcyjnych zidentyfikowanych w Baza danych JASPAR CORE. Wyniki były ograniczone do Z- wynik > 10 i wynik Fishera < 0,01. (D) Dane z (C) zostały zwizualizowane za pomocą wtyczki BINGO do oprogramowania Cytoscape, biorąc pod uwagę tylko geny istotne dla metabolizmu lipidów, jak opisano w analizie GO. Przewidywane miejsca wiązania oPOSSUM pokazano za pomocą linii przerywanych, podczas gdy geny z potwierdzonymi miejscami wiązania HNF4α pokazano liniami ciągłymi.

Ponieważ geny zaangażowane w metabolizm lipidów zostały znalezione w grupach B, D, F i G, szukaliśmy trafień znalezionych w tych grupach, a nie innych, ze szczególnym naciskiem na grupy D i F, ponieważ grupy te zawierają geny wcześnie reagujące. Co ciekawe, miejsca wiązania dwóch czynników transkrypcyjnych—HNF4α i NR2F1 [GenBank: <"type":"entrez-nukleotyd","attrs":<"text":"NM_010151.2","term_id":"111185901" ,"term_text":"NM_010151.2"> NM_010151.2]—zostały wzbogacone w grupy B, D i F, ale nie w żadnej innej grupie (Rysunki 6B,C ). Czynniki te mają podobne konsensusowe miejsca wiązania (Kimura i wsp., 1993 Ellrott i wsp., 2002 Schmidt i wsp., 2010), wyjaśniając, dlaczego segregują one razem w tej analizie. To odkrycie sugeruje, że aktywność tych dwóch aktywatorów transkrypcyjnych jest zmieniona podczas stresu ER, ponieważ geny zawierające miejsca wiążące te czynniki są regulowane w dół przez stres ER, a ich regulacja w dół jest nasilana przez trwający stres obserwowany w Atf6α −/− myszy. Odwrotnie, grupy A, C i E zostały wzbogacone o geny z potencjalnymi miejscami wiązania ELK4, znane również jako białko pomocnicze SRF (SAP)-1 [GenBank: <"type":"entrez-nukleotyd","attrs":< "text":"NM_007923.2","term_id":"153792361","term_text":"NM_007923.2"> NM_007923.2].

Grupa I, obejmująca geny regulowane w górę przez długotrwały stres ER u zwierząt typu dzikiego i dalej regulowane w górę w Atf6α zwierząt −/−, został wzbogacony do wiązania przez CREB1 [GenBank: <"type":"entrez-nukleotyd","attrs":<"text":"NM_001037726.1","term_id" :"158966706","term_text":"NM_001037726.1">> NM_001037726.1], która ma wspólną sekwencję wiązania konsensusu z zlokalizowanym w ER czynnikiem transkrypcyjnym CREBH (Zhang i wsp., 2006). CREBH jest aktywowany przez proteolizę indukowaną m.in. przez stres ER i reguluje ekspresję genów odpowiedzi ostrej fazy oraz genów metabolicznych (Zhang i in., 2006, 2012 Luebke-Wheeler i in., 2008). W związku z tym geny w Grupie I mają profil oczekiwany dla celów CREBH, a mianowicie, że są one regulowane w górę przez stres ER i dalej regulowane w górę w Atf6α −/− zwierząt, u których stres ER jest zaostrzony. Jednak geny metaboliczne lipidów nie zostały wzbogacone w grupie I, a miejsce wiązania CREB1 nie zostało wzbogacone w grupach zawierających geny metaboliczne lipidów. Ponadto, inny niż gen kodujący składnik P amyloidu surowicy (Apcs) [GenBank: <"type":"entrez-nukleotyd","attrs":<"text":"NM_011318.2","term_id":"226958496","term_text":"NM_011318.2"> NM_011318 .2], większość genów kodujących białka ostrej fazy odpowiedzi (białka SAA, CRP, białka krzepnięcia i krzepnięcia itp.) nie była znacząco podwyższona w żadnym punkcie czasowym w żadnym z genotypów, co sugeruje, że aktywność CREBH podczas prawdziwy Stres ER (w przeciwieństwie do endotoksyn, cytokin prozapalnych lub innych bodźców) może być minimalny, a geny z grupy I mogą być regulowane przez inny czynnik z rodziny CREB.

ELK4 jest częścią rodziny czynników transkrypcyjnych trójskładnikowych czynników transkrypcyjnych (TCF), które oddziałują z czynnikiem odpowiedzi surowicy (SRF) (Dalton i Treisman, 1992). Nie opisano roli ELK4 w ekspresji genów wątrobowych, ani też nie powiązano ELK4 bezpośrednio ze stresem ER. Wykazano, że ELK4 jest aktywowany przez fosforylację zależną od JNK (Janknecht i Hunter, 1997), a JNK [GenBank: <"type":"entrez-nukleotyd","attrs":<"text":"NM_016700.4" ,"term_id":"225637490","term_text":"NM_016700.4"> NM_016700.4] jest aktywowane przez naprężenie ER (Urano i in., 2000). Tak więc spekulujemy, że aktywność ELK4 może być regulowana podczas stresu ER w wątrobie przez JNK lub inne kinazy MAP, aby promować ekspresję genów w grupach A, C i E. NR2F1, znany również jako COUP-TF, jest receptorem sierocym. Delecja prowadzi do okołoporodowej śmiertelności z rozległą dysregulacją różnicowania neuronów (Qiu i wsp., 1997). Jego funkcja w wątrobie jest mniej jasna, chociaż wykazano, że koaktywuje transkrypcję synergistycznie z HNF4α (Ktistaki i Talianidis, 1997 Yanai i wsp., 1999).

HNF4α jest najsilniej wyrażany w wątrobie, jelicie, nerkach i trzustce. Delecja jest śmiertelna podczas gastrulacji (Chen i wsp., 1994). Myszy ze specyficzną dla wątroby delecją HNF4α rozwijają stłuszczenie wraz z upośledzeniem ApoB oraz Mttp ekspresja i produkcja VLDL (Hayhurst i wsp., 2001). Uśpienie HNF4α przez wątrobę przez dostarczanie adenowirusa spowodowało stłuszczenie i upośledzenie wytwarzania VLDL, wraz z zasadniczo jednorodnie zmniejszoną ekspresją wielu genów zaangażowanych w metabolizm lipidów, w tym wiele z opisanych tutaj (Yin i wsp., 2011). Zatem utrata HNF4α odzwierciedla wiele metabolicznych zmian genetycznych lipidów, które są indukowane przez stres ER. Nadekspresja HNF4α w pierwotnych hepatocytach spowodowała regulację w górę wielu z tych samych genów, choć nie Srebf1 ani Srebf2 (Yin i in., 2011). Ten wyjątek jest godny uwagi, ponieważ Srebf1 oraz Srebf2 wyróżniają się wśród analizowanych tutaj genów metabolicznych, ponieważ ich regulacja w dół jest nie zaostrzył się po 34 godz. w Atf6α −/− myszy (Figury 3D,E). Miejsca wiązania HNF4α w genomie wątroby myszy zostały scharakteryzowane przez ChIP-seq (Schmidt et al., 2010), a geny w grupach B, D i F są potwierdzonymi celami HNF4α (Rysunek ​ (Rysunek 6D 6D) ).

Nasze wyniki, wraz ze znaną aktywnością HNF4α, przewidują, że stres ER prowadzi do zmniejszonej aktywności HNF4α i że występuje to jako wczesne zdarzenie w metabolicznej regulacji genów przez stres ER. Aby przetestować tę prognozę, przeanalizowaliśmy wiązanie HNF4α z miejscami zdefiniowanymi w ChIP-seq w regionach promotora/wzmacniacza trzech z czterech najwcześniejszych regulowanych genów metabolicznych i regulatorów transkrypcji Cebpa, Pgc1a, oraz Ppara (proksymalny Pgc1b promotor/wzmacniacz nie zawierał przewidywanego lub zwalidowanego miejsca wiązania HNF4α). Stwierdziliśmy, że traktowanie zwierząt TM przez 8 godzin nie zmieniło ani całkowitej ekspresji (Figura 'x200B (Figura 7A) 7A) ani lokalizacji jądra (Figura 'x200B (Figura 7B) 7B) HNF4α. Jednak zgodnie z naszymi przewidywaniami odkryliśmy, że wiązanie chromatyny HNF4α znacznie spadło w kilku miejscach w Cebpa oraz Pgc1a promotory po traktowaniu zwierząt TM (Figura ​ (Figura 7C). 7C). To zmniejszenie nie było jednolite, kilka miejsc w obrębie trzech promotorów wykazało niezmienione wiązanie HNF4α (Figura ​ (Figura 7A). 7A). Podsumowując, odkrycia te sugerują, że stres ER zmniejsza aktywność HNF4α w określonych miejscach genomu poprzez mechanizm, który jest niezależny od poziomu ekspresji HNF4α.

Zmniejszone wiązanie HNF4α w Cebpa oraz Pgc1a promotory podczas stresu ER. (A,B) Myszy typu dzikiego prowokowano 1 mg/kg TM przez 8 godzin, a ekspresję HNF4α oceniano metodą immunoblot (A) lub immunohistochemia (B). Skala = 50 μm. (C) Wiązanie HNF4α do regionów regulatorowych wskazanych genów oceniano metodą chromatyny-IP. Regiony podano względem miejsca startu transkrypcji i odpowiadają one regionom zidentyfikowanym przez analizę ChIP-seq (Schmidt i wsp., 2010). n = 3𠄴 zwierzęta na grupę. Typowe odzyskiwanie materiału genomowego w próbkach zawierających przeciwciało HNF4α mieściło się w zakresie 0,1𠄱 procent całkowitego wkładu. * P < 0,05 o T-test.


Metody

Analiza filogenetyczna i przewidywanie struktury genów

Wydedukowane sekwencje peptydowe dla członków nadrodziny insuliny obejmowały 20 z Mollusca, 30 z Ecdysozoa i 51 z Deuterostomia (dane uzupełniające 1). Domniemane ortologie między człowiekiem a ostrygą zostały zidentyfikowane przez wzajemne uderzenie najlepszego uderzenia z mi-wartość odcięcia 1e-5 56 . Sekwencje Pdx pobrano z NCBI (rysunek uzupełniający 3). Wielokrotne dopasowanie przeprowadzono za pomocą MAFFT 7.221 57 przy użyciu algorytmu L-INS-I i przyciętego przy użyciu TrimAl przy użyciu parametrów –gt 0,9 –st 0,001 –cons 40 58 . Drzewa filogenetyczne skonstruowano za pomocą RAxML 59 przy użyciu modelu ewolucyjnego LG + Gamma + Niezmienność i 1000 powtórzeń bootstrap. Do wizualizacji ustawienia wykorzystano UGENE 60. Dla sekwencji ILP ostryg 23 , peptydy sygnałowe przewidywano za pomocą SignalP 4.1 61 , łańcuchy dojrzałych peptydów przewidywano na podstawie sąsiednich par reszt zasadowych 62 . W celu wizualizacji dopasowania Pdx, kolory aminokwasów zakodowano zgodnie z ich stopniem zachowania ewolucyjnego i właściwościami fizykochemicznymi przy użyciu schematu kolorów Zappo z Jalview63.

Materiał zwierzęcy

Trzyletnie ostrygi pacyficzne (C. gigas) stosowane do qPCR i hybrydyzacji in situ, RNA-seq, ATAC-seq i klonowanie genów pochodziły z Oxford Covered Market, podobno zebrano ze szkockiego wybrzeża i aklimatyzowano w sztucznej wodzie morskiej w 16°C przez 7 dni przed użyciem. Ostrygi były karmione Spirulina proszek podczas hodowli. Identyfikację gatunku potwierdzono przez sekwencjonowanie mitochondrialnego genu oksydazy cytochromowej I. Tkanki od trzech osobników wycięto w celu uzyskania nogów wargowych, skrzeli, płaszcza, białego mięśnia przywodziciela, przezroczystego mięśnia przywodziciela, neuronu, serca, hemolimfy, męskiej gonady, żeńskiej gonady, wątrobowo-trzustki, żołądka i jelita do natychmiastowej ekstrakcji RNA.

Ekstrakcja RNA i qPCR

Całkowity RNA wyekstrahowano zgodnie ze standardowym protokołem TRIzol (Invitrogen, USA) i potraktowano DNazą I (Promega, USA). RNA od trzech osób równo zmieszano przed syntezą pierwszej nici cDNA za pomocą GoScript™ RT (Promega, USA) zgodnie z instrukcjami dostawcy. Podkłady do qPCR na ostrygach insulinopodobny geny, Pdx oraz jako kontrola wewnętrzna cgEF1a są podane w danych uzupełniających 4. Realtime qPCR został przeprowadzony na systemie Prime Pro 48 realtime qPCR (Techne, UK). Metodę 2 −ΔΔt zastosowano do obliczenia względnej oceny ilościowej (RQ) docelowych genów. Oprogramowanie R 64 zostało użyte do statystyk i kreślenia.

Test na chromatynę dostępną przez transpozazę

Aby utrzymać osmolarność, do inkubacji komórek ostryg przez cały czas zastosowano zmodyfikowaną sól fizjologiczną buforowaną fosforanem (MDPBS) firmy Dulbecco. Świeże fragmenty tkanki wątrobowo-trzustkowej inkubowano w 0,8 mg/ml kolagenazy P (Sigma, 11213857001) w temperaturze pokojowej przez 20 minut i delikatnie pipetowano co 5 minut w celu uwolnienia pojedynczych komórek. Zawiesinę komórek przefiltrowano przez 40 μm filtr do komórek (BD Falcon, USA), przeniesiono do nowej probówki i odwirowano przez 5 min przy 500 × g. Supernatant odrzucono, a osad zawieszono w MDPBS do analizy żywotności komórek i zliczania komórek. Dla każdej reakcji zebrano 50 000 komórek przy 1000 × g przez 5 min, 4°C. Reakcja transpozycji, oczyszczanie, konstrukcja biblioteki i oznaczanie ilościowe odbywały się według ustalonych metod65, w tym znakowania przy użyciu zestawu Nextera DNA (Illumina FC-121-1030) przez 30 minut w temperaturze 37 °C, amplifikacji znakowanego DNA przy użyciu NEB Next High-Fidelity 2X PCR Master Mix na 11 cykli. Jakość biblioteki oceniano za pomocą Agilent Tapestation.

Dwie próbki zsekwencjonowano przy użyciu odczytów sparowanych końców 40 pz na platformie Illumina NextSeq 500, co dało odpowiednio 43 i 17,5 miliona par odczytów. Odczyty zostały zmapowane za pomocą Bowtie 2 (v. 2.1.0) do C. gigas genom v.9 uzyskany z NCBI dając 79,8% i 74,8% odczytów sekwencjonowania odpowiednio zmapowanych do genomu jądrowego. Piki zostały wywołane dla każdej próbki przy użyciu MACS2 (wersja 2.1.1) przy użyciu parametrów „-nomodel-shiftsize 250-nolambda”. Zachowano tylko piki odzyskane w obu powtórzeniach i dłuższe niż 100 pz. Piki dalej filtrowano, aby usunąć regiony nakładające się z sekwencjami powtarzalnymi pochodzącymi z połączonego modelera przypisów powtórzeń (filtry RepeatModeler 66, DUST 67 i TRF 68), uzyskując w sumie 168 206 konsensusowych otwartych regionów chromatyny w całym genomie. Szczyty konsensusu przypisano genom oznaczonym przez C. gigas modele genów uzyskane z NCBI przy użyciu skryptu Homer (v.4.9) annotatePeaks.pl. Z tej adnotacji wywnioskowano otwarte regiony chromatyny odpowiadające proksymalnym i dystalnym przypuszczalnym elementom cis-regulacyjnym. Analizę TFBS przeprowadzono przy użyciu zestawu motywów Gimme (v.0.11.1) 69 . Macierze ważone pozycji (PWM) dla poszczególnych TFBS odpowiadających PDX1 (miejsca ludzkiego PDX1: M5712_1.02, M5713_1.02, M6415_1.02 i mysie miejsca Pdx1: M0976_1.02, M1952_1.02) uzyskano z internetowej biblioteki CIS-BP czynniki transkrypcyjne i ich motywy wiążące DNA na http://cisbp.ccbr.utoronto.ca 70 . Mysie i ludzkie PWM połączono w klastry za pomocą polecenia gimme cluster, aby uzyskać jeden uśredniony motyw klastra (miejsce konsensusu) „Pdx_Average_2”, który wynikał z grupowania 3 lokalizacji (Human M5713_1.02, Mouse M1952_1.02, Human M6415_1.02), drugi klaster składający się z pojedynczego motywu, który odpowiada podwójnemu miejscu dwóch motywów TAAT obok siebie (Human M5712_1.02) i trzeciego pojedynczego motywu odpowiadającego mniej widocznemu miejscu TAAT (Mysz M0976_1.02). Regiony tła zostały wygenerowane za pomocą polecenia „gimme background -random” za pomocą C. gigas genom jako odniesienie. Wartości progowe uzyskano na podstawie sekwencji tła przy użyciu polecenia gimme threshold z „fpr = 0,01” dla każdego z poszczególnych PWM i Pdx_Average_2 TFBS. TFBS zidentyfikowano za pomocą skanowania gimme przy użyciu wartości odcięcia uzyskanych z kroku „progu gimme” na wszystkich szczytach konsensusu. Zarówno Pdx_Average_2, jak i Pdx_M1952_1.01 PWM zidentyfikowały eksperymentalnie potwierdzone miejsca Pdx1 zlokalizowane w -1806 (TTCTAATTAC) na rusztowaniu737:266144-266153, ale nie rozpoznały flankujących zasad (odpowiednio 5′-T i C-3′). Ponadto wstępnie zgrupowany zestaw 623 motywów wygenerowanych z motywów CIS-BP (http://dx.doi.org/https://doi.org/10.6084/m9.figshare.1555851) 71 , strony TFBS (v .3), zastosowano do skanowania konsensusowego zestawu pików, jak opisano powyżej. Specyficzne miejsca Pdx1 nie zostały odzyskane przez żadne inne zgrupowane Homeodomeny PWM, potwierdzając specyficzność analizy.

Sekwencjonowanie RNA i analiza różnicowa ekspresji

Sekwencjonowanie RNA (RNAseq) przeprowadzono przy użyciu sekwencjonowania 75 bp paired-end (PE) na platformie Illumina HiSeq 4000 (Illumina, Inc., San Diego, CA, USA) z biblioteki TruSeq wątroby trzustki od tego samego osobnika, co użyto do ATAC- nast. Uzyskano łącznie 33,11 miliona odczytów PE z wydajnością 4880 Mb Q20. Dane analizowano wraz z opublikowanymi odczytami sekwencjonowania z dodatkowych narządów (w tym „gruczołu trawiennego”, potencjalnie takiego samego jak wątrobowo-trzustka) 23 . Surowe odczyty sekwencjonowania mapowano do genomu ostryg za pomocą HISAT2 i dalej przetwarzano za pomocą narzędzi StringTie i Ballgown72. Zliczenia zmapowanych odczytów zastosowano do identyfikacji genów o zróżnicowanej ekspresji przy użyciu edgeR73, a poziomy ekspresji genów określono ilościowo jako fragmenty na kilozasadę na milion zmapowanych odczytów (FPKM). Geny wzbogacone w wątrobę trzustki zostały zdefiniowane jako geny o wyższym poziomie ekspresji (P < 0,05) zarówno w „gruczole trawiennym”, jak i nowo pobranej próbce „wątrobotrzustki” w porównaniu z innymi narządami (mięsień przywodzicieli, nogogły wargowe, skrzela, hemolimfa, płaszcz, gonada męska i gonada żeńska).

Konstrukcje plazmidowe

Do generowania rybosondy amplifikowane fragmenty cgPdx (489 pb), cgMIP123 (608 pb), cgMIP4 (679 pb), cgMILP7 (359 pb) i cgILP (332 bp) sklonowano w pGEM-T easy (Promega, USA). Do oceny lokalizacji subkomórkowej, cgPdx sekwencja kodująca została zamplifikowana starterami zawierającymi XhoI witryny i zligowane do XhoItrawiony wektor pEGFP-N1 (Clontech, USA) w celu wygenerowania fuzji w ramce z EGFP (konstrukt pEGFP-Pdx). Do testów lucyferazy, nieoznakowane mPdx1, cgPdx (LOC105327390 74) i cgNeuroD (LOC105336755 75) plazmidy skonstruowano przez klonowanie do XhoI oraz Mlu miejsca w wektorze ekspresyjnym pSI (Promega, konstrukt USA pSI-mPdx1, pSI-cgPdx, pSI-cgNeuroD). Jako konstrukty reporterowe lucyferazy świetlika, odpowiadające regiony genomowe powyżej cgILP zostały zligowane do pGL4.23[luc2/minP] (Promega, USA konstrukty pGL-B1). Trzy krótkie wersje (dwie ze zmienionymi miejscami TAAT) zostały wygenerowane przez mutagenezę in vitro (konstrukty pGL-B2, pGL-B2M1 i pGL-B2M2, ryc. 4). Zmienione miejsca TAAT zostały wygenerowane przez zaprojektowanie niedopasowanych zasad w starterach pokrywających te miejsca. Podkłady podano w danych uzupełniających 4.

Synteza przeciwciał i ChIP-qPCR

Sekwencja kodująca peptydu cgPdx 1–160 została sklonowana do wektora pET-28a-SUMO i wyrażona w komórkach BL21(DE3). Rekombinowane białko znakowane SUMO oczyszczono za pomocą chromatografii powinowactwa Ni-NTA (Qiagen). Królicze przeciwciała poliklonalne anty-cgPdx, E9112 i E9113, zostały opracowane przez Abclonal (Wuhan, Chiny). Walidację przeciwciał przeprowadzono metodą western blotting na lizatach tkankowych wątrobowo-trzustki ostryg (rysunek uzupełniający 11). Pełna sekwencja kodująca cgPdx została sklonowana w ramce (patrz dane uzupełniające 4 dla starterów) ze znacznikiem V5 na C-końcu (pSF-CMV-Puro-COOH-V5, Oxford Genetics) i wyrażona w komórkach HEK293T. Następnie przeprowadzono Western blot z lizatem komórkowym w celu określenia masy cząsteczkowej cgPdx. Swoistość przeciwciał badano metodą western blotting na lizacie wątrobowo-trzustkowym ostryg, przeciwciała anty-PARP1 (ab32138, abcam, Szanghaj, Chiny) zastosowano jako kontrolę pozytywną. Testy ChIP przeprowadzono zgodnie ze standardowym protokołem (Abcam) z niewielkimi modyfikacjami. W skrócie, fragmenty tkanki wątrobowo-trzustkowej ostryg wycinano, zamrażano w ciekłym azocie i przechowywano w temperaturze -80 °C do czasu użycia. Pojedyncze komórki izolowano metodami opisanymi dla ATAC. Zebrane komórki sieciowano 1% formaldehydem przez 10 min w temperaturze pokojowej, a rozpuszczalną chromatynę otrzymaną po sonikacji inkubowano z przeciwciałami anty-cgPdx. Przeprowadzono dwa eksperymenty z ChIP z różnymi osobnikami.

Użyto 150 mg tkanki wątrobowo-trzustkowej z 10 μg przeciwciał. Białko A (Millipore, 16–661) zostało użyte do wytrącenia immunokompleksów chromatyny, które przemyto, a następnie oczyszczono DNA przy użyciu zestawu QIAquick PCR Purification Kit (Qiagen). Startery (dane uzupełniające 4) zostały zaprojektowane do badania qPCR ukierunkowanego na potencjalne miejsca wiązania Pdx przed trzema genami. DNA ChIP zastosowano następnie jako matrycę do analizy qPCR, z wynikami znormalizowanymi przez wejściowe DNA. Wzbogacenie fałdu obliczono zgodnie z powszechną metodą „sygnału ponad tłem” (ThermoFisher). Istotność średniej krotności wzbogacenia celu do 1 obliczono za pomocą jednej próbki T-test (jednostronny).

Hybrydyzacja in situ

Sondy znakowane digoksygeniną zsyntetyzowano z linearyzowanych konstruktów w kierunkach sensownym i antysensownym, stosowanych równolegle we wszystkich eksperymentach. Cała miękka tkanka ciała młodych ostryg (długość muszli 1–3 cm) została utrwalona w 4% paraformaldehydzie w PBS przez noc w 4°C. Tkanki przemywano dwukrotnie PBS i odwadniano przez szereg stopniowanych alkoholi przed przechowywaniem w 70% etanolu w -20 °C. W przypadku zatapiania wosku, tkanki przemywano 85% etanolem (15 min), 100% etanolem (3 × 15 min), benzoesanem metylu (3 × 15 min) i benzenem (1 min) przed przeniesieniem do stopionej parafiny (3 × 30 min ). Bloki zestalano w 4°C przez co najmniej 2 godziny, przycinano, mocowano i przechowywano przez noc (4°C) przed pocięciem na skrawki 10 μm. Skrawki następnie odwoskowano ksylenem i traktowano proteinazą K (1 μg/ml, 15 min) przed hybrydyzacją (50% dejonizowany formamid, 5x sól fizjologiczna cytrynian sodu, 0,1% Tween-20, 10% dodecylosiarczan sodu, 0,3 mg /ml RNA toruli, 50 μg/ml heparyny) z 50 ng/μl sondą w 65 °C, przez noc. Po przemyciu 0,2x roztworem soli fizjologicznej cytrynianu sodu i buforem kwasu maleinowego, sondy rybotropowe wykrywano przez inkubację z fragmentami Fab anty-DIG sprzężonymi z fosfatazą alkaliczną (1:4000 Roche Diagnostics, USA) w buforze blokującym Roche w 100 mM kwasie maleinowym (2 godz., temperatura pokojowa). Wywoływanie koloru prowadzono przez inkubację w NBT/BCIP (US Biological, Swampscott, MA). Skrawki przemyto wodą destylowaną, osadzono w glicerolu i zbadano przy użyciu mikroskopu świetlnego Leica MZ10F dzięki uprzejmości Microscope Services Ltd, Oxford.

Test lucyferazy

Komórki HeLa (ATCC, USA) i COS7 (dostarczone przez dr Qingfeng Yan, Zhejiang University, Zhejiang, Chiny) hodowano w zmodyfikowanej pożywce RPMI-1640 (HyClone, USA) uzupełnionej 10% inaktywowaną termicznie płodową surowicą bydlęcą (Gibco, USA) i penicylina-streptomycyna (Solarbio, Chiny), w wilgotnej atmosferze z 5% CO2 w 37 °C. Plazmidy transfekowano do komórek przy użyciu odczynnika Lipofectamine 3000 (Life Technologies, USA) zgodnie z instrukcjami dostawcy. Testy lucyferazy przeprowadzono na 24-studzienkowych płytkach z

250 000 komórek i 500 μl pożywki/studzienkę W sumie 0,5 μg DNA plazmidu ekspresyjnego pSI (poprzez dodanie pustych wektorów pSI, aby zachować stałe dla każdej transfekcji) transfekowano 0,2 μg plazmidów reporterowych serii pGL i 1 ng kontrolnego pRL-CMV Renilla plazmid lucyferazy (Promega, USA). W 24 h po transfekcji mierzono aktywność lucyferazy świetlika i Renilla przy użyciu systemu Dual-Luciferase Reporter Assay System (Promega, USA) w wielomodowym czytniku Varioskan Flash (Thermo Scientific, USA). Każdą transfekcję przeprowadzono w trzech powtórzeniach dla replikacji biologicznych, a studzienki podzielono na dwie, aby wygenerować replikacje techniczne. Studenckie T do określenia istotności różnic zastosowano test (dwustronny). 95% przedział ufności (CI) sumy między cgNeuroD i cgPdx/mPdx1 oszacowano na podstawie puli wszystkich możliwych kombinacji między względnymi wartościami lucyferazy z grup cgNeuroD i cgPdx/mPdx1. Istotność następnie obliczono metodą ładowania początkowego (n = 100 000), w którym wartości sumaryczne o tej samej wielkości próby co grupa (cgPdx/mPdx1+cgNeuroD) zostały losowo wybrane z puli sumarycznej.

Podsumowanie raportowania

Dalsze informacje na temat projektu badań są dostępne w podsumowaniu raportowania badań przyrodniczych, do którego link znajduje się w tym artykule.


Druker BJ, Talpaz M, Resta DJ, Peng B, Buchdunger E, Ford JM, Lydon NB, Kantarjian H, Capdeville R, Ohno-Jones S, Sawyers CL. Skuteczność i bezpieczeństwo swoistego inhibitora kinazy tyrozynowej BCR-ABL w przewlekłej białaczce szpikowej. N Engl J Med. 2001344:1031–7.

Koivunen JP, Mermel C, Zejnullahu K, Murphy C, Lifshits E, Holmes AJ, Choi HG, Kim J, Chiang D, Thomas R i in. Gen fuzyjny EML4-ALK i skuteczność inhibitora kinazy ALK w raku płuc. Clin Cancer Res. 200814:4275–83.

Storm EE, Durinck S, de Sousa e Melo F, Tremayne J, Kljavin N, Tan C, Ye X, Chiu C, Pham T, Hongo JA, et al. Celowanie w nowotwory okrężnicy PTPRK-RSPO3 sprzyja różnicowaniu i utracie funkcji komórek macierzystych. Natura. 2016529:97–100.

Tomlins SA, Rhodes DR, Perner S, Dhanasekaran SM, Mehra R, Sun XW, Varambally S, Cao X, Tchinda J, Kuefer R, et al. Rekurencyjna fuzja genów czynnika transkrypcyjnego TMPRSS2 i ETS w raku prostaty. Nauki ścisłe. 2005310:644-8.

Yoshihara K, Wang Q, Torres-Garcia W, Zheng S, Vegesna R, Kim H, Verhaak RG. Krajobraz i znaczenie terapeutyczne fuzji transkryptów związanych z rakiem. Onkogen. 201534:4845–54.

Mertens F, Johansson B, Fioretos T, Mitelman F. Pojawiająca się złożoność fuzji genów w raku. Nat Rev Rak. 201515:371–81.

Kuppers R, Dalla-Favera R. Mechanizmy translokacji chromosomowych w chłoniakach z komórek B. Onkogen. 200120:5580–94.

Davis CF, Ricketts CJ, Wang M, Yang L, Cherniack AD, Shen H, Buhay C, Kang H, Kim SC, Fahey CC i in. Somatyczny krajobraz genomowy chromofobowego raka nerkowokomórkowego. Komórka rakowa. 201426:319–30.

Vinagre J, Almeida A, Populo H, Batista R, Lyra J, Pinto V, Coelho R, Celestino R, Prazeres H, Lima L, et al. Częstotliwość mutacji promotora TERT w ludzkich nowotworach. Społeczność Nat. 20134:2185.

Groschel S, Sanders MA, Hoogenboezem R, de Wit E, Bouwman BAM, Erpelinck C, van der Velden VHJ, Havermans M, Avellino R, van Lom K i in. Pojedyncza rearanżacja wzmacniacza onkogennego powoduje równoczesną deregulację EVI1 i GATA2 w białaczce. Komórka. 2014157:369–81.

Zhang Y, Chen F, Fonseca NA, He Y, Fujita M, Nakagawa H, Zhang Z, Brazma A, Grupa PTW, Grupa PSVW i in. Analiza całego genomu 1220 nowotworów o wysokim pokryciu ujawnia setki genów zderegulowanych przez zmiany cis-regulacyjne za pośrednictwem rearanżacji. Społeczność Nat. 202011:736.

Yang L, Luquette LJ, Gehlenborg N, Xi R, Haseley PS, Hsieh CH, Zhang C, Ren X, Protopopov A, Chin L, et al. Różnorodne mechanizmy somatycznych zmian strukturalnych w genomach nowotworowych człowieka. Komórka. 2013153:919–29.

Chen K, Wallis JW, McLellan MD, Larson DE, Kalicki JM, Pohl CS, McGrath SD, Wendl MC, Zhang Q, Locke DP i in. BreakDancer: algorytm do mapowania zmienności strukturalnej genomu w wysokiej rozdzielczości. Metody Nat. 20096:677–81.

Alaei-Mahabadi B, Bhadury J, Karlsson JW, Nilsson JA, Larsson E. Globalna analiza somatycznych strukturalnych zmian genomowych i ich wpływ na ekspresję genów w różnych ludzkich nowotworach. Proc Natl Acad Sci USA 2016113:13768–73.

Seshagiri S, Stawiski EW, Durinck S, Modrusan Z, Storm EE, Conboy CB, Chaudhuri S, Guan Y, Janakiraman V, Jaiswal BS i in. Nawracające fuzje R-spondyny w raku okrężnicy. Natura. 2012488:660-4.

Stransky N, Cerami E, Schalm S, Kim JL, Lengauer C. Krajobraz fuzji kinaz w raku. Społeczność Nat. 20145:4846.

Tomlins SA, Mehra R, Rhodes DR, Smith LR, Roulston D, Helgeson BE, Cao X, Wei JT, Rubin MA, Shah RB, Chinnaiyan AM. Fuzje genów TMPRSS2:ETV4 definiują trzeci podtyp molekularny raka prostaty. Cancer Res. 200666:3396–400.

Gao Q, Liang WW, Foltz SM, Mutharasu G, Jayasinghe RG, Cao S, Liao WW, Reynolds SM, Wyczalkowski MA, Yao L i in. Fuzje sterowników i ich implikacje w rozwoju i leczeniu nowotworów u ludzi. Rep. komórki 201823:227–38 e223.

Zhang Y, Yang L, Kucherlapati M, Chen F, Hadjipanayis A, Pantazi A, Bristow CA, Lee EA, Mahadeshwar HS, Tang J i in. Kompendium nowotworowych genów zderegulowanych przez somatyczną rearanżację genomową w ponad 1400 przypadkach. Rep. komórki 201824:515–27.

Rao SS, Huntley MH, Durand NC, Stamenova EK, Bochkov ID, Robinson JT, Sanborn AL, Machol I, Omer AD, Lander ES, Aiden EL. Mapa 3D ludzkiego genomu w rozdzielczości kilozasad ujawnia zasady pętli chromatyny. Komórka. 2014159:1665–80.

Barros-Silva JD, Paulo P, Bakken AC, Cerveira N, Lovf M, Henrique R, Jeronimo C, Lothe RA, Skotheim RI, Teixeira MR. Nowi partnerzy fuzyjni 5′ ETV1 i ETV4 w raku prostaty. Neoplazja. 201315:720–6.

Cancer Genome Atlas N. Kompleksowa charakterystyka molekularna ludzkiego raka okrężnicy i odbytnicy. Natura. 2012487:330–7.

Johansen JS, Christensen IJ, Riisbro R, Greenall M, Han C, Price PA, Smith K, Brunner N, Harris AL. Wysokie stężenie YKL-40 w surowicy chorych na pierwotnego raka piersi wiąże się z krótkim czasem przeżycia bez nawrotów. Leczenie raka piersi. 200380:15–21.

Cintin C, Johansen JS, Christensen IJ, Cena PA, Sorensen S, Nielsen HJ. Surowica YKL-40 a rak jelita grubego. Br J. Rak. 199979:1494-9.

Pelloski CE, Mahajan A, Maor M, Chang EL, Woo S, Gilbert M, Colman H, Yang H, Ledoux A, Blair H i in. Ekspresja YKL-40 jest związana z gorszą odpowiedzią na promieniowanie i krótszym całkowitym przeżyciem w glejaku. Clin Cancer Res. 200511:3326–34.

Kang EJ, Jung H, Woo OH, Park KH, Woo SU, Yang DS, Kim AR, Lee JB, Kim YH, Kim JS, Seo JH. Ekspresja YKL-40 może być słabym markerem prognostycznym w tkance raka sutka. Guz Biol. 201435:277–86.

Padro M, Cobler L, Garrido M, de Bolos C. Regulacja w dół FUT3 i FUT5 przez shRNA zmienia ekspresję antygenów Lewisa i zmniejsza zdolność adhezji komórek raka żołądka. Biochim Biophys Acta. 18102011:1141-9.

Liang L, Gao C, Li Y, Sun M, Xu J, Li H, Jia L, Zhao Y. Oś miR-125a-3p/FUT5-FUT6 pośredniczy w proliferacji, migracji, inwazji i patologicznej angiogenezie komórek raka jelita grubego za pośrednictwem PI3K-Akt ścieżka. Śmierć komórki Dis. 20178:e2968.

Potapenko IO, Luders T, Russnes HG, Helland A, Sorlie T, Kristensen VN, Nord S, Lingjaerde OC, Borresen-Dale AL, Haakensen VD. Sygnatury ekspresji genów związanych z glikanami w podtypach raka piersi mają związek z przeżyciem. Mol Oncol. 20159:861–76.

Slebe F, Rojo F, Vinaixa M, Garcia-Rocha M, Testoni G, Guiu M, Planet E, Samino S, Arenas EJ, Beltran A, et al. Lipaza śródbłonkowa FoxA i LIPG kontrolują wychwyt zewnątrzkomórkowych lipidów do wzrostu raka piersi. Społeczność Nat. 20167:11199.

Rippe V, Drieschner N, Meiboom M, Murua Escobar H, Bonk U, Belge G, Bullerdiek J. Identyfikacja genu przegrupowanego przez aberracje 2p21 w gruczolakach tarczycy. Onkogen. 200322:6111–4.

Cancer Genome Atlas Research N. Zintegrowana charakterystyka genomiczna raka brodawkowatego tarczycy. Komórka. 2014159:676–90.

Kloth L, Belge G, Burchardt K, Loeschke S, Wosniok W, Fu X, Nimzyk R, Mohamed SA, Drieschner N, Rippe V, Bullerdiek J. Zmniejszenie ekspresji gruczolaka tarczycy (THADA) jest markerem odróżnicowania tkanki tarczycy . BMC Clin Pathol. 201111:13.

Panebianco F, Kelly LM, Liu P, Zhong S, Dacic S, Wang X, Singhi AD, Dhir R, Chiosea SI, Kuan SF i in. Fuzja THADA jest mechanizmem aktywacji IGF2BP3 i sygnalizacji IGF1R w raku tarczycy. Proc Natl Acad Sci USA. 2017114:2307–12.

Bujold D, Morais DA, Gauthier C, Cote C, Caron M, Kwan T, Chen KC, Laperle J, Markovits AN, Pastinen T i in. Portal danych Międzynarodowego Konsorcjum Epigenomu Człowieka. System Komórkowy 20163:496–9 e492.

Konsorcjum PE. Zintegrowana encyklopedia elementów DNA w genomie człowieka. Natura. 2012489:57-74.

Hou H, Yu X, Cong P, Zhou Y, Xu Y, Jiang Y: Six2 promuje niedrobnokomórkową komórkę raka płuc poprzez regulację transkrypcyjną i epigenetyczną E-kadheryny. Prolif komórki. 201952:e12617.

Wang CA, Drasin D, Pham C, Jedlicka P, Zaberezhnyy V, Guney M, Li H, Nemenoff R, Costello JC, Tan AC, Ford HL. Homeoproteina Six2 promuje przerzuty raka piersi poprzez transkrypcyjną i epigenetyczną kontrolę ekspresji E-kadheryny. Cancer Res. 201474:7357–70.

Wu DW, Lin PL, Wang L, Huang CC, Lee H. Oś YAP1/SIX2 jest wymagana dla agresywności guza za pośrednictwem DDX3 i oporności na cetuksymab w raku jelita grubego typu dzikiego KRAS. Teranostyka. 20177:1114–32.

Lederer M, Bley N, Schleifer C, Huttelmaier S. Rola białka wiążącego oncofetal IGF2 mRNA 3 (IGF2BP3) w raku. Rak nasienia Biol. 201429:3–12.

Kamburov A, Pentchev K, Galicka H, ​​Wierling C, Lehrach H, Herwig R. ConsensusPathDB: w kierunku pełniejszego obrazu biologii komórki. Kwasy nukleinowe Res. 201139:D712–7.

Dzień E, Poulogiannis G, McCaughan F, Mulholland S, Arends MJ, Ibrahim AE, Drogi PH. IRS2 jest kandydatem na onkogen kierujący na 13q34 w raku jelita grubego. Int J Exp Pathol. 201394:203-11.

Jia Y, Xie Z, Li H. Intergenicznie złożone chimeryczne RNA w raku. Trendy raka. 20162:475–84.

Matsumoto H, Koo SL, Dent R, Tan PH, Iqbal J. Rola nacieków zapalnych w potrójnie ujemnym raku piersi. J Clin Pathol. 201568:506–10.

Yang L, Lee MS, Lu H, Oh DY, Kim YJ, Park D, Park G, Ren X, Bristow CA, Haseley PS i in. Analiza rearanżacji genomu somatycznego w ludzkich nowotworach za pomocą sekwencjonowania całego egzomu. Am J Hum Genet. 201698:843–56.

Wang K, Singh D, Zeng Z, Coleman SJ, Huang Y, Savich GL, He X, Mieczkowski P, Grimm SA, Perou CM i in. MapSplice: dokładne mapowanie odczytów sekwencji RNA w celu wykrywania połączeń splice. Kwasy nukleinowe Res. 201038:e178.

Iyer MK, Chinnaiyan AM, Maher CA. ChimeraScan: narzędzie do identyfikacji transkrypcji chimerycznej w danych sekwencjonowania. Bioinformatyka. 201127:2903-4.

McPherson A, Hormozdiari F, Zayed A, Giuliany R, Ha G, Sun MG, Griffith M, Heravi Moussavi A, Senz J, Melnyk N, et al. deFuse: algorytm wykrywania fuzji genów w danych RNA-Seq guza. PLoS Comput Biol. 20117:e1001138.

Robinson JT, Thorvaldsdottir H, Winckler W, Guttman M, Lander ES, Getz G, Mesirov JP. Przeglądarka genomiki integracyjnej. Nat Biotechnol. 201129:24–6.

Subramanian A, Tamayo P, Mootha VK, Mukherjee S, Ebert BL, Gillette MA, Paulovich A, Pomeroy SL, Golub TR, Lander ES, Mesirov JP. Analiza wzbogacania zestawu genów: oparte na wiedzy podejście do interpretacji profili ekspresji całego genomu. Proc Natl Acad Sci USA. 2005102:15545-50.

Gu Z, Eils R, Schlesner M. Złożone mapy cieplne ujawniają wzorce i korelacje w wielowymiarowych danych genomicznych. Bioinformatyka. 201632:2847-9.

Canisius S, Martens JW, Wessels LF. Nowatorski test niezależności dla zmian somatycznych w raku pokazuje, że biologia napędza wzajemną wyłączność, ale przypadek wyjaśnia większość współwystępowania. Biol genomowy. 201617:261.

Atlas genomu raka: baza danych genotypów i fenotypów. Pobierz referencje


Dostępność danych i materiałów

Zestawy danych wygenerowane podczas obecnego badania są dostępne jako BioProject w National Center for Biotechnology Information pod numerem dostępu PRJNA616061 (https://dataview.ncbi.nlm.nih.gov/object/PRJNA616061). Zestawy danych mikromacierzy dziennej ekspresji genów Arabidopsis przedstawione w Tabeli 1 z pozycji [37] są dostępne w ArrayExpress pod numerem dostępu E-MEXP-1304 (https://www.ebi.ac.uk/arrayexpress/experiments/E-MEXP-1304/ ). Sekwencje DNA odpowiadające cis-motywy regulacyjne pozyskano z bazy danych PLACE w wersji 30.0 (pliki place.dat (https://www.dna.affrc.go.jp/PLACE/place_dat.shtml) oraz place.seq (https://www.dna. affrc.go.jp/PLACE/place_seq.shtml)). Sekwencje aminokwasowe białka uzyskano z Uniprot release 2015.01 (ftp://ftp.uniprot.org/pub/databases/uniprot/previous_releases/release-2015_01/). Domeny białkowe przewidywano na podstawie wersji Prosite 6.1 (ftp://ftp.expasy.org/databases/prosite/old_releases/prosite06_1.tar.bz2) i Pfam w wersji 9.0 (ftp://ftp.ebi.ac.uk/pub /bazy danych/Pfam/wydania/Pfam9.0/).

Geny/białka Arabidopsis z The Arabidopsis Information Resource (https://www.arabidopsis.org), wersja adnotacji TAIR10 (nazwa (unikalny identyfikator genu Uniprot numer dostępu)): LHY (AT1G01060 Q6R0H1), CCA1 (AT2G46830 P92973), RVE1 ( AT5G17300 F4KGY6), RVE2 (AT5G37260 F4K5X6), RVE4 (AT5G02840 Q6R0G4), RVE5 (AT4G01280 C0SVG5), RVE6 (AT5G52660 Q8H0W3), RVE7 (AT1G18330 B3H5A8), RVE5 (AT4G01280 C0SVG5), RVE6 (AT5G52660 Q8H0W3), RVE7 (AT1G18330 B3H5A8), RVE5G09R (QAT38) AT5G60100 F4JXG7), PRR4 (AT5G49240 Q9FJ16), PRR5 (AT5G24470 Q6LA42), PRR7 (AT5G02810 Q93WK5), PRR9 (AT2G46790 Q8L500), GI (AT1G22770 Q9SQI2), ELF3 (AT42804AT277AT25930 O) ), EF4L2 (AT1G72630 Q94BS8), EF4L3 (AT2G06255 Q8S8F5), EF4L4 (AT1G17455 Q570U6), LUX)/PCL1 (AT3G46640 F4J959), BOA (AT5G59570 F4J959), ZTL/ADO1 F4LKA5G572 , FKF1/ADO3 (AT1G68050 Q9C9W9).

Geny/białka z MaizeGDB (https://maizegdb.org/) dla wersji adnotacji o kukurydzy 5b oraz z Phytozome (https://phytozome.jgi.doe.gov/) dla wersji adnotacji o sorgo v3.1 i proso wyczyńcy v2.2 (nazwa (identyfikator unikalnego genu prosa z sorgo kukurydzianego)): LYL1 (GRMZM2G175227 + GRMZM2G175265 + GRMZM2G474769 Sobic.007G047400 Seita.6G055700), LYL2 (GRMZM2G014902 Sobic.007G0475701050M. 4G288100), RE6L1 (GRMZM2G135052 Sobic.010G004300 Seita.4G004600), RE6L2 (GRMZM2G170148 Sobic.010G223700 Seita.4G266800), RE6L3 (GRMZM2G057408 Sobic.010G223700 Seita.4MG2G266800), RE6L2 (GRMZM2G170148) Sobic.004G281800 Seita.1G272700), RE7L1 (GRMZM2G029850, Sobic.004G279300 Seita.1G275400), RE7L2 (GRMZM2G170322 Sobic.004G279300 Seita.1G275400), RE7L3 (GRMZM2G421212100G Seita.006G7192 Sobic.004G279300 Seita.1G275400) 7G212900), RE8L2 (GRMZM2G115070 Sobic.001G143100, Si038786m) RE8L1 (GRMZM2G415077 Sobic.001G143100 Si038786m) T1L1 (GRMZM2G148453 Sobic.004G216700 Seita.1G236100) T1L2 (GRMZM2G020081 Sobic.004G216700 Seita.1G236100) P37L1 (GRMZM2G005732 Sobic.006G057900 Seita.2G444300) P37L2 (GRMZM2G033962 Sobic.006G057900 Seita.2G444300), P59L2 (GRMZM2G488465 + GRMZM2G013913 Sobic.005G044400 Seita.8G040100), P59L1 (GRMZM2G135446 Sobic.005G044400 Seita.8G040100), P73L (GRMZM2G044400 Seita.8G040100), P59L1 (GRMZM2G135446 Sobic.005G044400 Seita.8G040100), P73L (GRMZM2G044400) , P95L2 (GRMZM2G367834 Sobic.002G275100 Seita.2G286100), GI1 (GRMZM2G107101 Sobic.003G040900 Seita.5G129500), GI2 (GRMZM5G844173 Sobic.003G040900 Seita.5G129500), GRM87520bic2G0.100 Sobic.009G257300 Seita.3G121000), EF4R1 (GRMZM2G382774 Sobic.001G340700 Seita.9G368100), EF4R2 (GRMZM2G359322 Sobic.001G340700 Seita.9G368100), EF4R3 (GRMZM5G840G877620094700),G4R2bic2 (GRMZM2G359322 Sobic.001G340700 Seita.9G368100) 2G 195800), LXL (GRMZM2G067702 Sobic.003G443600 Seita.5G468100), ZLL1 (GRMZM2G115914 Sobic.010G243900 Seita.4G249100), ZLL2 (GRMZM2G113244 Sobic.010G243900 Seita.4G2GR800M20008M7347004GLL714704GLL1 (ZLL) Sobic.004G042200 Seita.1G087300), FFL1 (GRMZM2G106363, Sobic.005G145300 Seita.8G146900), FFL2 (GRMZM2G107945 Sobic.005G145300 Seita.8G146900).


Metody

Materiały i zabiegi na stres

ten b. rapa odmianę Chiffu posadzono w komorze wzrostu w Instytucie Badawczym Roślin Oliwych Chińskiej Akademii Nauk Rolniczych w Wuhan w temperaturze 20 ± 2°C z 12 godzinami światła i 12 godzin ciemności. Korzenie pobrano z młodych siewek. Uzyskano świeże pąki kwiatowe, a pozostałe tkanki pobrano około 25 dni po kwitnieniu, w tym łodygi, liście, łuszczyny i nasiona. Przygotowano trzy biologiczne repliki każdej testowanej tkanki, pobierając próbki od trzech różnych osobników. Próbki szybko zamrożono w ciekłym azocie i przechowywano w -80°C do czasu izolacji RNA.

A b. rapa Do obróbki metali ciężkich użyto landrace (Wuxianzangcaizi). Zdrowe nasiona podobnej wielkości wyjałowiono powierzchniowo, osuszono, a następnie wykiełkowano w wysterylizowanej wilgotnej bibule filtracyjnej. Nasiona zaprawiano świeżą pożywką uzupełnioną 20 ml 15 mg/l CdCl2 lub 50 mg/l Pb (NO3)2 [36]. Nasiona potraktowane równą ilością wody destylowanej służyły jako kontrole. Do każdego zabiegu stosowano trzy powtórzenia po 50 nasion. Nasiona traktowane i kontrolne hodowano w ciemności przez 24 godziny w 22°C, a następnie hodowano podczas fotoperiodu (cykl 16 godzin światła/8 godzin ciemności) przez siedem dni. Pędy i korzenie sadzonek o podobnej wielkości zbierano oddzielnie i trzykrotnie przemywano wodą dejonizowaną. Próbki zamrożono w ciekłym azocie aż do ekstrakcji RNA.

Identyfikacja i analiza białek glioksalazy w b. rapa

Dostępy Pfam (http://pfam.sanger.ac.uk/) PF00903 dla GLYI i PF00753 dla GLYII zostały użyte do wyszukiwania ukrytego modelu Markowa (HMM) [34]. Cała sekwencja genomowa b. rapa został uzyskany z Brassica baza danych (BRAD, http://brassicadb.org/brad/) [35]. ten GLYI oraz GLYII geny wyekstrahowano z całej sekwencji genomowej zgodnie z opisami dostarczonymi przez Wang et al. [37].

Analizy lokalizacji chromosomów, struktur genów i duplikacji genów w BrGLYI oraz BrGLYII geny

Pozycje genomowe BrGLYI oraz BrGLYII geny włączone b. rapa chromosomy analizowano przy użyciu przeszukiwania BLASTn. ten BrGLYI oraz BrGLYII struktury genów analizowano za pomocą programu Gene Structure Display Server Program (GSDS, http://gsds.cbi.pku.edu.cn/index.php) [38]. Duplikacja BrGLYI oraz BrGLYII a ich pozycje zostały porównane między Arabidopsis oraz b. rapa subgenomów, jak opisano wcześniej [39].

Analiza sekwencji i budowa drzewa filogenetycznego

Do dopasowania aminokwasów (aa) zastosowano oprogramowanie Clustal X (ftp://ftp-igbrmc.u-strasbg.fr/pub/clustalX/). Analizę filogenetyczną skonstruowano w programie MEGA 5.05 metodą sąsiedztwa (NJ) i 1000 testów bootstrap [40].

Subkomórkowa lokalizacja przewidywanych białek GLYI

Lokalizacje subkomórkowe wszystkich przewidywanych białek BrGLYI i BrGLYII analizowano przy użyciu różnych narzędzi internetowych, tj. Wolf pSORT [41], TargeP i ChloroP [42].

Analiza sekwencji promotora

Aby przeanalizować elementy regulacyjne w BrGLYI oraz BrGLYII promotory, sekwencje 1,5 kb 5'-upstream z kodu inicjacji ATG uzyskano z BRAD i przeanalizowano przy użyciu baz danych PlantCARE (http://bioinformatics.psb.ugent.be/webtools/plantcare/html/) [40, 43] .

Analiza ekspresji genów

ten BrGLY ekspresję w tkankach korzenia, łodygi, liścia, kwiatu i łuszczyny 7-tygodniowej kapusty pekińskiej i kalusa (Chiifu-401-42) analizowano przy użyciu danych transkryptomów dostępnych online (http://www.ncbi.nlm.nih.gov /geo/zapytanie/acc.cgi?acc=GSE43245) [44]. Dane posłużyły do ​​wygenerowania heatmapy za pomocą pakietu Heat map Illustrator (HemI, http://hemi.biocuckoo.org/down.php) [45].

Aby ujawnić odpowiedź BrGLY geny stresu biotycznego w kapuście pekińskiej, ekspresja wszystkich BrGLYI oraz BrGLYII geny w odpowiedzi na infekcję patogenem analizowano przy użyciu raportowanych danych RNA-seq (http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE74044) [46].

Surowe dane uzyskane przy użyciu podejścia sekwencjonowania transkryptomu opartego na znacznikach wykorzystano do potwierdzenia odpowiedzi BrGLY genów stresu metalami ciężkimi, który był dostępny za pośrednictwem bazy danych GEO (http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE55264) [47].

Analizy RT-qPCR

Całkowity RNA wyizolowano przy użyciu zestawu do izolacji (BioTeke, RP3201). cDNA zsyntetyzowano przy użyciu zestawu do syntezy (TransGen Biotech), a RT-qPCR przeprowadzono zgodnie z opisem Li i in. [39]. Względne wyrażenie BrGLY został przeanalizowany z Aktyń jako gen porządkowy przy użyciu opisanej wcześniej metody [48]. Konkretne zaprojektowane startery są wymienione w Tabela S1.


PRZYSZŁE KIERUNKI I IMPLIKACJE KLINICZNE

Metylacja DNA różni się nie tylko między tkankami, ale także między regionami mózgu, między istotą szarą a istotą białą, a być może nawet między komórkami (Ladd-Acosta i inni, 2007 Ghosh i inni, 2010). Chociaż obecna technologia ogranicza naszą zdolność do rozróżniania wzorców metylacji specyficznych dla komórki, pojawienie się sekwencjonowania DNA nowej generacji dostarczyło potężnych narzędzi do badania wzorca metylacji DNA całego genomu z rozdzielczością pojedynczego nukleotydu (Meissner i inni, 2008 Lister i inni, 2009 Pop i inni, 2010). Wraz z rozwojem technologii koszt wykonywania analizy sekwencjonowania będzie spadał, co sprawi, że technologia stanie się bardziej dostępna. Ostatnie osiągnięcia techniczne pozwoliły na przeprowadzenie analizy metylacji DNA całego genomu nawet przy ilości próbki tak niskiej jak 150 ng (Popp i inni, 2010). Nieprawidłowe wzorce metylacji DNA obserwuje się w wielu różnych chorobach psychiatrycznych i neurologicznych. Przy spadających kosztach i możliwości przeprowadzania analizy metylacji całego genomu na ograniczonych ilościach tkanek, wkrótce będzie możliwe mapowanie wzorców metylacji DNA całego genomu z różnych regionów mózgu pacjentów z zaburzeniami neurologicznymi i psychiatrycznymi. Analiza tkanki nerwowej pacjentów psychiatrycznych pozwoli na nowe spojrzenie na etiologię chorób psychicznych i otworzy nowe drogi odkrywania leków i terapii celowanych.

Chociaż obecne protokoły umożliwiają naukowcom precyzyjną ocenę ilościową metylacji DNA przy rozdzielczości pojedynczego nukleotydu przy użyciu coraz mniejszych ilości tkankowych, wiele z najczęściej stosowanych metod profilowania i ilościowego oznaczania metylacji DNA, takich jak sekwencjonowanie wodorosiarczynu i testy enzymatyczne wrażliwe na metylację, są nie można odróżnić 5hmC od 5mC (Tahiliani i inni, 2009 Huang i inni, 2010). Kilka protokołów jest w stanie odróżnić 5hmC od 5mC w genomie: znakowanie końca CpG, a następnie chromatografia cienkowarstwowa (Tahiliani i inni, 2009) i wysokosprawnej chromatografii cieczowej (HPLC) z detekcją UV (Liutkeviciute i inni, 2009) lub tandemowa spektrometria mas (Globisch i inni, 2010 Le i inni, 2011). Hydroksymetylowane DNA można wzbogacić przeciwciałami specyficznie wiążącymi 5hmC lub biotynylacją zmodyfikowanych 5hmC, a wytrącone sekwencje można zidentyfikować za pomocą chipów mikromacierzy lub sekwencjonowania DNA (Szwagierczak i inni, 2010 Ficz i inni, 2011 Jin i inni, 2011 Pastor i inni, 2011 Wu i Zhang, 2011). Chociaż metody te mogą oznaczać ilościowo 5hmC i identyfikować sekwencje DNA, z którymi jest ono powiązane, nie osiągnięto rozdzielczości pojedynczej pary zasad. W celu wyjaśnienia dystrybucji genomowej i epigenetycznej roli 5hmC w mózgu, trzeba będzie opracować specyficzną dla locus metodę identyfikacji 5hmC.

Ponieważ inne wysokoprzepustowe techniki, w tym sekwencjonowanie RNA i immunoprecypitacji chromatyny (ChIP), stają się coraz bardziej dostępne dla naukowców, rośnie potrzeba integracji danych o wysokiej przepustowości. Obecnie metylacja DNA, modyfikacja histonów i miRNA są badane we względnej izolacji. Aby w pełni zrozumieć, w jaki sposób ekspresja genów jest regulowana w układzie nerwowym, przyszłe badania muszą uwzględniać epigenom jako całość. Analizując mechanizmy biologiczne, które pośredniczą w przesłuchaniu między tymi mechanizmami biologicznymi i integrując dane o wysokiej przepustowości, możemy rozpocząć badanie epigenomu jako całości. Wreszcie, aby w pełni zrozumieć, w jaki sposób epigenom reguluje ekspresję genów, przyszłe badania będą musiały odkryć mechanizmy biologiczne, które pośredniczą w zależnych od aktywności zmianach w epigenomicznym krajobrazie mózgu ssaków.


Obejrzyj wideo: mRNA Splicing (Sierpień 2022).