banner

Noticias

Sep 14, 2023

Variación del número de copias

Biología de las comunicaciones volumen 6, Número de artículo: 189 (2023) Citar este artículo

733 Accesos

2 Altmetric

Detalles de métricas

Las variaciones del número de copias (CNV) se han reconocido durante mucho tiempo como factores patogénicos para la enfermedad cardíaca congénita (CHD). Pocas CNV asociadas con CHD podrían interpretarse como un efecto de dosis debido a la interrupción de las secuencias de codificación. Evidencias emergentes han resaltado los roles reguladores de los ARN largos no codificantes (lncRNA) en el desarrollo cardíaco. Mientras que sigue sin explorarse si los lncRNA dentro de las CNV (CNV-lncRNA) podrían contribuir a la etiología de las CNV asociadas a la cardiopatía coronaria. Aquí construimos redes de coexpresión que involucran CNV-lncRNA dentro de CNV asociados con CHD y genes de codificación de proteínas utilizando los datos transcriptómicos del desarrollo de órganos humanos, y mostramos que CNV-lncRNA dentro de 10 de los CNV asociados con CHD no sindrómicos se agruparon en el módulo correlacionado cardíaco más significativo, y tenía una coexpresión altamente correlacionada con múltiples genes clave de CHD. HSALNG0104472 dentro de la región 15q11.2 se identificó como un concentrador CNV-lncRNA con expresión sesgada en el corazón y se validó experimentalmente. Nuestros resultados indicaron que HSALNG0104472 debería ser un efector principal responsable de los defectos cardíacos de la deleción 15q11.2 mediante la regulación de la diferenciación de los cardiomiocitos. Nuestros hallazgos sugirieron que los lncRNA de CNV podrían contribuir potencialmente a las patologías de una proporción máxima del 68,4 % (13/19) de las CNV asociadas a CHD no sindrómicas. Estos resultados indicaron que la explicación de la patogenia de las CNV asociadas a la cardiopatía coronaria debería tener en cuenta las regiones no codificantes.

La cardiopatía congénita (CHD) es la anomalía congénita más común en todo el mundo, con una incidencia de 6~13 en 1000 nacidos vivos1,2,3. A pesar de los avances en la corrección quirúrgica y la atención clínica que garantizan que la mayoría de los pacientes sobreviven hasta la edad adulta, la cardiopatía coronaria sigue siendo una de las principales causas de mortalidad relacionada con los recién nacidos. Las etiologías de la cardiopatía coronaria fueron multifacéticas. Hasta la fecha, ~20-30 % de los casos de CHD podrían identificarse con factores ambientales o genéticos, aunque ese número podría cambiar con la amplia aplicación de nuevos métodos de prueba, como la secuenciación de próxima generación (NGS)4,5. El mayor estudio de secuenciación de próxima generación de la cohorte de CHD indicó que las etiologías genéticas podrían identificarse en 1/3 de los pacientes con CHD; las variantes de novo (DNV) y las variantes autosómicas recesivas heredadas representan el 8 % y el 2 % de los pacientes, respectivamente6. Las variaciones del número de copias (CNV) son fuentes importantes de etiologías genéticas de CHD. Las CNV patogénicas se registraron en el 3% al 25% de los casos de CC sindrómica y en el 3% al 10% de los casos de CC aislada4. La patogenicidad de las CNV que involucran secuencias de codificación generalmente se interpretó en función de su efecto sobre la dosis de genes. A pesar del éxito de tal estrategia en muchas enfermedades, las patologías de la mayoría de las CNV asociadas a CC permanecieron indeterminadas4,5,7.

La organogénesis del corazón es un proceso complejo que implica la diferenciación, la especificación y la migración de múltiples linajes celulares, lo que requiere redes reguladoras de genes elaboradas inicializadas y gobernadas por factores de transcripción determinantes del linaje central (TF), incluidos NKX2-5, MESP1, GATA4, GATA6 y TBX55. . Durante las últimas dos décadas, muchos estudios han revelado que una gran fracción del genoma no codificante (las transcripciones primarias y las transcripciones procesadas cubren el 74,7 % y el 62,1 % del genoma humano, respectivamente) se transcribió8. Los ARN largos no codificantes (lncRNA), que se definen como transcritos de más de 200 nucleótidos sin potencial de codificación, emergen como componentes clave en las redes reguladoras de genes que controlan el destino celular durante el desarrollo8,9. Desde que se descubrió en ratones lncRNA Braveheart (Bhvt) asociado con el desarrollo cardiovascular10, se ha descubierto que docenas de lncRNA como Fendrr11, Chast12, HBL113, Uph14, Hdn15, BANCR16 e lncExACT117 están involucrados en procesos de desarrollo cardíaco en modelos celulares y animales. La CHD se caracteriza por su alta heterogeneidad genética, lo que hizo que el descubrimiento de lncRNA patogénicos fuera frustrantemente difícil. Sin embargo, se beneficiaron de las evidencias acumuladas que establecieron la sólida asociación de las CNV con la CHD, las CNV patogénicas recurrentes han proporcionado una fuente natural para vincular los lncRNA con los fenotipos de la enfermedad.

La mayoría de las CNV afectan regiones genómicas que abarcan lncRNA. La contribución de los lncRNA en la patogénesis relacionada con la CNV se ha implicado en varios estudios neurológicos. Meng et al. investigó los lncRNA dentro de 10 regiones CNV asociadas al riesgo de esquizofrenia e identificó DGCR5 dentro de 22q11.2 como un gen central que regula los genes relacionados con la esquizofrenia18. Alinejad-Rokny et al. identificaron 47 CNV recurrentes asociadas al trastorno del espectro autista y demostraron que los genes codificantes enriquecidos en el cerebro y los lncRNA estaban sobrerrepresentados en estas regiones19. Recientemente, un estudio de secuenciación del genoma completo basado en tríos de 749 probandos de CHD demostró un enriquecimiento de variantes de novo (DNV) no codificantes regulatorias potencialmente perturbadoras20, lo que enfatizó la importancia de las variaciones no codificantes en el estudio de CHD. Meerschaut et al. realizó una reevaluación retrospectiva de 138 CNV con patogenicidad desconocida y propuso la relevancia potencial de los elementos reguladores de genes no codificantes en la patogénesis de la cardiopatía coronaria relacionada con la CNV21. Considerando que, las contribuciones de lncRNAs ubicados en regiones CNV (CNV-lncRNAs) a las etiologías de CHD no se han evaluado sistemáticamente.

Presumimos que las CNV asociadas con CHD podrían alterar algunos, si no todos, los CNV-lncRNA, lo que, en consecuencia, desregularía sus genes objetivo y contribuiría a las etiologías de CHD. Para probar nuestra hipótesis, resumimos los CNV asociados con CHD recurrentes y recuperamos los CNV-lncRNA candidatos ubicados dentro de estas regiones. El perfil de coexpresión integrado de tales CNV-lncRNAs y genes codificadores de proteínas se construyó en base al análisis de red de coexpresión de genes ponderados (WGCNA)22 de datos transcriptómicos de desarrollo de órganos humanos de LncExpDB23. Identificamos dos módulos significativamente correlacionados con tejidos cardíacos, uno de los cuales mostró enriquecimiento de genes CHD conocidos. Se notó que los CNV-lncRNAs del 52,6 % (10/19) de todos los CNV asociados con CHD no sindrómicos se agruparon en el módulo cardíaco más significativo. El concentrador CNV-lncRNA HSALNG0104472 de este módulo estaba ubicado en la región 15q11.2, cuya eliminación se demostró previamente que estaba asociada con la conexión venosa pulmonar anómala total (TAPVC)24. Luego llevamos a cabo experimentos in vitro para validar el posible efecto regulador de HSALNG0104472 en los genes CHD conocidos y destacamos su papel potencial en el desarrollo cardíaco (Fig. 1).

Se resumieron 19 CC no sindrómicas recurrentes y 21 VNC asociadas a CC sindrómicas. Recuperamos los CNV-lncRNA candidatos que se ubicaron dentro de estas regiones y se expresaron durante el desarrollo del corazón en función de los datos transcriptómicos del desarrollo de órganos humanos (n = 313) de LncExpDB. b Se realizó un análisis de red de coexpresión génica ponderada (WGCNA) para caracterizar el perfil de coexpresión de CNV-lncRNA y genes codificantes de proteínas en función de los datos transcriptómicos del desarrollo de órganos humanos. Se realizaron análisis posteriores, incluidos análisis de vías, análisis de enriquecimiento y análisis de expresión diferencial, para identificar los módulos asociados a CHD y los CNV-lncRNA concentradores. Las redes reguladoras CNV-lncRNA-miRNA-mRNA también se identificaron en función de los datos de interacción de miRNA y el mecanismo molecular competitivo del ARN endógeno (ceRNA). c Las relaciones de coexpresión en el módulo negro no sindrómico asociado al corazón se validaron en base a conjuntos de datos de diferenciación de cardiomiocitos in vitro (n = 297) de LncExpDB. d El análisis de peso relativo (RWA) reveló funciones sólidas del concentrador CNV-lncRNA HSALNG0104472 en la regulación de varios genes clave de CHD. e Se realizaron experimentos in vitro para validar la regulación predicha del concentrador CNV-lncRNA HSALNG0104472.

Un total de 19 CNV, incluidas dos deleciones, seis duplicaciones y 11 deleciones/duplicaciones, se definieron como CNV asociadas a CHD no sindrómica recurrente (Fig. 2a; Tabla 1; Fig. 1a complementaria; y Tabla 1 complementaria)25,26,27,28, 29,30. Se utilizaron un total de 568 CNV-lncRNA candidatos que cumplían con el criterio junto con 19957 genes codificadores de proteínas para una mayor investigación (Datos complementarios 1). También ampliamos nuestro análisis a 21 CHD sindrómicas asociadas CNVs4 (Tabla complementaria 2). En comparación, la mayoría de las CNV asociadas con CHD sindrómica (19/21) eran deleciones, y las otras 2 CNV podrían ser deleción o duplicación (Figura complementaria 1b; Tabla complementaria 2). Cuatro CNV (deleción/duplicación 1q21.1, deleción/duplicación 8p23.1, deleción/duplicación 16p12.2 y deleción/duplicación 22q11.21) se asociaron con casos de cardiopatía coronaria sindrómica y no sindrómica (Fig. 2a).

a Se muestra la distribución de las CNV asociadas recurrentes no sindrómicas (n = 19) y sindrómicas (n = 21) en los cromosomas humanos. Los colores de las bandas representan tipos de casos de cardiopatía coronaria en los que se informaron CNV. Los colores de las fuentes representan tipos CNV. b Se identificaron módulos de coexpresión correlacionados positivamente con el corazón (r > 0,6, n = 2) (los módulos negro y verde oscuro) construidos con un conjunto de datos de desarrollo de órganos humanos (n = 313) (Datos complementarios 1). El eje y representa diferentes módulos de coexpresión CNV-lncRNA. Los valores del coeficiente de correlación de Pearson (r) con el tejido cardíaco se muestran en el eje x. Las líneas discontinuas rojas indican |r| = 0,6. Los tamaños de los nodos representan el recuento de CNV-lncRNA en cada módulo. Los colores de los nodos representan valores de −log10(Padj). El valor P ajustado se calculó con la función corPvalueStudent en el paquete WGCNA R. c Se muestran las anotaciones funcionales de los módulos de coexpresión positivamente correlacionados con el corazón (Datos complementarios 2). Las barras horizontales representan términos GO y los colores de las barras representan diferentes módulos de coexpresión CNV-lncRNA. Para cada módulo correlacionado positivamente con el corazón, los cinco términos GO principales (clasificados por Padj) se enumeran en el eje y. Los valores de −log10(Padj) se muestran en el eje x. La línea discontinua roja indica Padj de 0,05. d Clasificaciones de CNV-lncRNA en el módulo negro. Los recuentos de cada clase de CNV-lncRNA se muestran entre paréntesis. e Conservación de la secuencia de los CNV-lncRNA en el módulo negro (Datos complementarios 3).

WGCNA se realizó en los datos transcriptómicos de desarrollo de órganos humanos de LncExpDB para construir módulos de coexpresión que involucran genes de codificación de proteínas y CNV-lncRNA asociados a CHD no sindrómicos. Identificamos un total de 43 módulos de coexpresión, 34 de los cuales contenían 511 de los 568 candidatos CNV-lncRNA. Los 57 CNV-lncRNA candidatos restantes no se agruparon en ningún módulo de coexpresión (Datos complementarios 1). Además, 13 módulos contenían al menos un concentrador CNV-lncRNA con membresía de módulo (MM) ≥ 0.8 y P <0.05 (Datos complementarios 1). Luego calculamos los coeficientes de correlación de Pearson entre los módulos y los tejidos cardíacos (la información de rasgos cuantificados de las muestras se enumera en Datos complementarios 1) y revelamos que dos módulos (negro y verde oscuro) mostraron una correlación positiva significativa (r> 0.6, P <0.05; Figura 2b).

Los genes que codifican proteínas en dos módulos de coexpresión correlacionados con el corazón se utilizaron para implementar análisis de enriquecimiento funcional con las vías de Gene Ontology (GO) y Kyoto Encyclopedia of Genes and Genomes (KEGG). Notablemente, el módulo negro, que se correlacionó más significativamente con el corazón (r = 0,88, P = 3,20 × 10−104), se relacionó con el proceso del sistema muscular (Padj = 3,35 × 10−47, Padj representa el valor de P ajustado), músculo contracción cardíaca (Padj = 3,55 × 10−42), proceso cardíaco (Padj = 1,14 × 10−33), contracción cardíaca (Padj = 1,14 × 10−33) y desarrollo del tejido muscular (Padj = 3,04 × 10−32) (Fig. 2c). Estos genes también se enriquecieron en las vías KEGG de miocardiopatía hipertrófica (Padj = 7,62 × 10-13), miocardiopatía dilatada (Padj = 1,87 × 10-12), contracción del músculo cardíaco (Padj = 1,15 × 10-9), señalización adrenérgica en cardiomiocitos (Padj = 4,24 × 10−9) y miocardiopatía arritmogénica del ventrículo derecho (Padj = 3,97 × 10−7) (Datos complementarios 2). Los valores medios de expresión de CNV-lncRNA en las muestras de desarrollo del corazón (n = 50) para el módulo negro también se clasificaron a la vanguardia de los 34 módulos que contenían CNV-lncRNA (en el tercer puesto de 34, media tpm = 7,17; Datos complementarios 1). Con base en las ubicaciones genómicas relativas a los genes codificantes de proteínas vecinas, los lncRNA podrían clasificarse como intergénicos, intrónicos (sentido), intrónicos (antisentido), superpuestos (sentido), superpuestos (antisentido), sentido y antisentido31. Los lncRNA con sentido, intergénicos y antisentido representaron la mayoría de los CNV-lncRNA (28/30) en el módulo negro (Fig. 2d). La conservación de la secuencia de 30 CNV-lncRNA en el módulo negro se identificó de acuerdo con los datos de alineación de LncBook v2.032 (Fig. 2e; Datos complementarios 3). Una alta proporción de CNV-lncRNA contenidos en el módulo negro estaban altamente correlacionados con múltiples genes CHD bien caracterizados como HAND1, HAND2, NKX2-5, TBX5, GATA6 y MYH6 (Fig. 3a). Estos lncRNA se distribuyeron en el 52,6% (10/19) de las CNV asociadas a CHD no sindrómica recurrente (Fig. 3a). Además, también se calcularon las correlaciones de los módulos con la etapa de desarrollo y el sexo (Figura complementaria 2 y Datos complementarios 1, 2). De acuerdo con el locus genómico de CNV-lncRNA y los registros de CNV asociados a CHD no sindrómicos específicos, que incluían el fenotipo de los pacientes, identificamos 34 asociaciones potenciales entre CNV-lncRNA y los subtipos de CHD en el módulo negro (Fig. 3b y Datos complementarios 4 ).

a Las CNV asociadas no sindrómicas (n = 19), los CNV-lncRNA coexpresados ​​(n = 30, distribuidos en 10 CNV) y 12 genes CHD en el módulo negro correlacionado con el corazón se muestran en el diagrama de circos. Los colores de las CNV representan los tipos de CNV. Los colores de las líneas representan el coeficiente de correlación de Pearson (calculado con el conjunto de datos de desarrollo de órganos humanos, n = 313) de cada par de genes. Dos hub CNV-lncRNA en el módulo negro están en negrita. b Correlaciones entre CNV-lncRNAs y los subtipos de CHD en el módulo negro. Estas relaciones se identifican en función de la intersección de CNV-lncRNAs y CNVs asociados a CHD no sindrómicos (Datos complementarios 4).

Para investigar la asociación potencial entre los módulos de coexpresión correlacionados con el corazón y la CHD, realizamos pruebas hipergeométricas para análisis de enriquecimiento de estos módulos contra cuatro listas de genes relacionados con la CHD (Datos complementarios 5): un conjunto de 22 genes responsables de las causas monogénicas de la CHD aislada, un conjunto de 69 genes asociado con condiciones monogénicas con CHD5 sindrómico, un conjunto de 66 genes con variantes de pérdida de función (LOF) para CHD y un conjunto de 80 genes con variantes dañinas sin sentido (DMV) para CHD27. Los resultados indicaron que dos módulos (negro: P = 2,12 × 10−11 y salmón: P = 0,04) se enriquecieron para los genes CHD aislados; dos módulos (turquesa: P = 3,97 × 10−6 y blanco: P = 0,03) se enriquecieron para los genes CHD sindrómicos; tres módulos (rosa: P = 2,94 × 10−5, negro: P = 1,34 × 10−3 y turquesa: P = 6,27 × 10−3) se enriquecieron para los genes LOF CHD, y cinco módulos (negro: P = 5,62 × 10−5, rosa: P = 3,02 × 10−3, turquesa: P = 5,35 × 10−3, naranja: P = 6,78 × 10−3 y naranja oscuro: P = 0,05) se enriquecieron para los genes DMV CHD ( Datos complementarios 5). Es particularmente interesante que los módulos negro y turquesa enriquecieron significativamente tres de los cuatro conjuntos de genes CHD respectivamente (Fig. 4a-d y Datos complementarios 5). Además, encontramos que una cierta cantidad de vías, que estaban relacionadas con el desarrollo del corazón, estaban significativamente enriquecidas en módulos negros y turquesas, lo que sugiere una relación importante entre estos módulos y el desarrollo del corazón (Fig. 4e y Datos complementarios 2).

Se muestran dos módulos asociados al corazón, negro y turquesa, que enriquecieron significativamente tres de los cuatro conjuntos de genes de CHD. Se enumeran los genes Hub CNV-lncRNA y CHD en negro (a) y turquesa (b) módulos de coexpresión (Datos complementarios 1 y 5). Hub CNV-lncRNAs se resaltan con borde rojo. Los subconjuntos de genes CHD se indican en diferentes colores. Los tamaños de los nodos representan el valor de membresía del módulo genético (MM) en el módulo correspondiente (Datos complementarios 5). Se usó una prueba hipergeométrica para calcular la significación estadística del enriquecimiento de genes codificadores de proteínas coexpresados ​​en módulo negro (c) y turquesa (d) frente a cuatro conjuntos de genes CHD. Los conjuntos de genes CHD se indican en diferentes colores. Se mostró un enriquecimiento significativo (PH < 0,05, PH representa el valor de P hipergeométrico) con el valor de PH en letra roja. Los genes de codificación de proteínas que fueron para WGCNA (n = 19,957) se usaron como la lista de genes de fondo. e Vías relacionadas con el desarrollo cardíaco en los módulos negro y turquesa (Datos complementarios 2). El eje horizontal representa los términos GO. Los colores de los puntos indican diferentes módulos. El tamaño de los puntos representa los recuentos de genes de cada módulo involucrado en los términos GO correspondientes. Los valores de −log10(Padj) se muestran en el eje x. La línea discontinua roja indica Padj de 0,05.

El ARN endógeno competitivo (ARNce) ha sido reconocido como un mecanismo molecular importante que subyace a la expresión del ARNm regulada por la interacción lncARN-miARN. Anteriormente, identificamos con éxito redes reguladoras de lncRNA-miRNA-mRNA en tejidos cardíacos de pacientes con tetralogía de Fallot33 mediante la implementación de un método de inferencia causal34. En el presente estudio, también aplicamos este análisis a los datos transcriptómicos del desarrollo de órganos humanos (n = 313). Se identificaron un total de 10 CNV-lncRNA centrales que median redes ceRNA (Figura complementaria 3; Datos complementarios 6). Estos CNV-lncRNA distribuidos en el módulo amarillo (HSALNG0063477), módulo turquesa (HSALNG0112753, HSALNG0044817, HSALNG0006725), módulo grey60 (HSALNG0022874), módulo azul (HSALNG0110179) y módulo naranja (HSALNG0022140). HSALNG0096627, HSALNG0019873, HSALNG0044901 no se agruparon en ningún módulo de coexpresión y se etiquetaron en gris. Considerando que, ninguno de los genes CHD conocidos estuvo involucrado en estas redes de ceRNA. Además, los CNV-lncRNA y mRNA, que compartían una relación reguladora de esponja lncRNA-mRNA, rara vez se distribuían en el mismo módulo de coexpresión (Datos complementarios 1 y 6).

La CHD se presenta con frecuencia como síndrome, y se ha descubierto una contribución genética compartida para la CHD y otras anomalías, especialmente los trastornos del neurodesarrollo. Notamos que entre los genes CHD sindrómicos y no sindrómicos (n = 88; Datos complementarios 7), el 13,6 % (12/88) mostró una expresión máxima en tejidos cardíacos. Sorprendentemente, el 33,0 % (29/88) mostró la expresión máxima en los tejidos del cerebro y el cerebelo (cerebro: 19, cerebelo: 10, Datos complementarios 7). Se realizaron análisis de expresión diferencial para estos genes CHD e involucraron CNV-lncRNA entre el corazón (n = 50) y el cerebro (n = 87) muestras de desarrollo (Fig. 4 complementaria). Encontramos 21 genes regulados al alza en el corazón (|log2FoldChange | ≥ 1, Padj <0.05) y 8 genes regulados al alza en el cerebro en la lista de genes CHD conocidos (Fig. 5a-c; Datos complementarios 7).

Genes CHD regulados al alza (|log2FoldChange| ≥ 1, Padj < 0,05) en muestras de desarrollo de corazón (21 genes) y cerebro (8 genes) (muestras de corazón: n = 50, muestras de cerebro: n = 87) se muestran en el mapa de calor (a) . Para cada grupo, se muestran en el panel los términos del proceso biológico GO y Padj estadísticamente enriquecidos. Los gráficos circulares muestran el tipo de CHD relacionado de cada grupo de genes de CHD expresado diferencialmente (b). Los principales genes CHD expresados ​​​​diferencialmente ( c ) y CNV-lncRNA ( d ) para cada grupo están etiquetados en gráficos de volcanes (clasificados por log2FoldChange). Los ejes xey representan log2FoldChange (corazón frente a cerebro) y −log10(Padj), respectivamente. Los puntos rojos representan genes significativamente regulados al alza en el corazón (log2FoldChange ≥ 1, Padj < 0,05). Los puntos azules representan genes significativamente regulados al alza en el cerebro (log2FoldChange ≤ -1, Padj < 0,05). Los puntos grises representan genes que no se expresan diferencialmente. La línea discontinua roja horizontal y vertical indica Padj = 0.05 y |log2FoldChange| = 1, respectivamente. Los gráficos circulares al lado de cada grupo muestran la distribución de genes en módulos de coexpresión construidos por WGCNA sindrómico. Solo los módulos con la mayor proporción de genes de cada grupo están coloreados.

Además, incorporamos 21 CNV asociadas a CHD sindrómica para el análisis comparativo (Tabla complementaria 2). Con los mismos criterios que el análisis anterior, se seleccionaron 1500 CNV-lncRNA para WGCNA con los genes codificadores de proteínas 19957 (Datos complementarios 1). Se identificaron los módulos respectivos para CC sindrómica y no sindrómica (Datos complementarios 8). Luego probamos la correlación entre los módulos sindrómicos y siete órganos. El módulo marrón sindrómico (r = 0,73) con 57 CNV-lncRNA y el módulo magenta (r = 0,71) con 28 estaban altamente correlacionados con el cerebro, y el módulo verde sindrómico (r = 0,87) con 120 CNV-lncRNA estaba altamente correlacionado con el cerebelo (Fig. 6 y Datos complementarios 8). El módulo amarillo sindrómico (s-amarillo) debería corresponder al módulo negro no sindrómico: (1) El módulo s-amarillo mostró las correlaciones más altas con el tejido cardíaco (r_heart = 0,83) (Figs. 2, 6); (2) La mayoría (84,89%, 579/682) de los genes en el módulo negro no sindrómico aparecieron en el módulo s-amarillo (Datos complementarios 8); (3) Los genes en dos módulos se enriquecieron en las mismas funciones (Datos complementarios 8). Se identificaron los tipos de genes y la conservación de secuencias de CNV-lncRNA en módulos s-amarillo y s-turquesa (Figuras complementarias 5 y 6; y Datos complementarios 1 y 3). También se realizó un análisis de expresión diferencial para 1500 CNV-lncRNA entre las muestras de corazón y cerebro. Encontramos 221 CNV-lncRNA regulados al alza en el corazón (|log2FoldChange| ≥ 1) y 205 regulados al alza en el cerebro. (Fig. 5d y Datos complementarios 7). Para investigar más a fondo la relación entre la CHD y los trastornos del neurodesarrollo, describimos la distribución de los genes representativos relacionados con el trastorno del espectro autista35 y probamos su enriquecimiento en los módulos WGCNA sindrómicos. Los resultados indicaron que los genes codificadores de proteínas en los módulos sindrómicos turquesa (P = 7,66 × 10-14), marrón (P = 9,18 × 10-7) y púrpura medio3 (P = 6,96 × 10-4) se enriquecieron significativamente en el espectro autista genes relacionados con el trastorno (Datos complementarios 9). Fue interesante observar que el módulo turquesa no sindrómico (correspondiente a la turquesa s) enriqueció significativamente los conjuntos de genes del trastorno del espectro autista y CHD (Fig. 4d y Datos complementarios 5 y 9). Este módulo contenía una alta proporción de genes CHD sindrómicos y CNV-lncRNA regulados al alza en el cerebro, que estaban relacionados con el desarrollo de múltiples sistemas y el mantenimiento de la población de células madre (Fig. 5 y Datos complementarios 7).

El coeficiente de correlación de Pearson (r) entre 45 módulos de coexpresión y rasgos de muestra (tipos de tejido) se calcularon en WGCNA sindrómico (Datos complementarios 8). Solo se etiquetan las correlaciones significativas (|r| > 0,6, Padj < 0,05). Los colores representan el valor y la dirección del coeficiente de correlación. **Padj < 0,01.

De acuerdo con los análisis anteriores, HSALNG0104472 se identificó como un concentrador CNV-lncRNA (valor de membresía del módulo del módulo negro no sindrómico = 0.83; Datos complementarios 1) en el módulo negro no sindrómico correlacionado con el corazón (Fig. 2b), y mostró la mayoría expresión sesgada en las muestras de corazón en comparación con las muestras de cerebro (Fig. 5d y Datos complementarios 7). El análisis de peso relativo (RWA) también reveló sus importantes funciones en la regulación de varios genes clave de CHD (Fig. 7a y Datos complementarios 10). Además, la mayoría de estas relaciones de coexpresión entre HSALNG0104472 y genes CHD también se observaron en las células madre pluripotentes inducidas (iPSC) basadas en conjuntos de datos de diferenciación de cardiomiocitos in vitro (n = 297) (Fig. 7b; Fig. 7 complementaria; y Datos complementarios 11).

a Se muestra el peso relativo de CNV-lncRNA (n = 30) para genes CHD clave en el módulo negro no sindrómico (Datos complementarios 10). Los valores de peso relativo reescalado (como porcentaje de la varianza predicha en la variable de criterio atribuida a cada predictor, dentro del error de redondeo, los pesos reescalados de los predictores en una prueba suman 100%) se muestran en el eje y, que representan el efecto regulatorio. El valor medio de expresión (transcripciones por millón, tpm) de CNV-lncRNA en las muestras de corazón en desarrollo (n = 50) se muestra en el eje x. Las líneas discontinuas rojas indican el valor medio de cada eje. Los puntos rojos representan predictores significativos. Los puntos grises representan predictores no significativos. b Patrones de expresión de HSALNG0104472 y 8 genes CHD regulados predichos en el módulo negro no sindrómico durante la diferenciación in vitro de iPSC humanas a cardiomiocitos (n = 297) (Datos complementarios 11). Los ejes x e y representan la etapa de diferenciación de cardiomiocitos (día) y el valor medio de expresión (tpm) de cada etapa, respectivamente. La línea central representa un valor medio. Los límites de la caja representan los cuartiles superior e inferior. Los bigotes representan un rango intercuartílico de 1,5x. Los puntos representan valores atípicos.

La sobreexpresión y la eliminación de HSALNG0104472 se realizaron en la línea celular de cardiomiocitos humanos adultos (AC16). Nuestros resultados sugirieron que la eliminación de HSALNG0104472 afectó significativamente la expresión de 1310 genes codificadores de proteínas (|log2FoldChange| ≥ 1, Padj < 0,05), que se enriquecieron en vías como la regulación del desarrollo vascular y la regulación de la angiogénesis (Datos complementarios 12). Sin embargo, ninguno de los genes CHD, que se predijo que estarían regulados por los CNV-lncRNA, apareció en la lista de genes de expresión diferencial (Datos complementarios 12). Además, la sobreexpresión de HSALNG0104472 no mostró un efecto significativo sobre la expresión génica en las células AC16 (Fig. 8 complementaria).

Se realizó una eliminación exitosa de shRNA de HSALNG0104472 en iPSC, y la expresión de NKX2-5, ACTC1 y TBX20 se reguló significativamente a la baja (Figura complementaria 9a y Datos complementarios 13). Se observó un retraso en la aparición de cardiomiocitos latiendo en las iPSC inducidas in vitro con HSALNG0104472 (en el día 9) en comparación con los grupos de control (en el día 7) (Fig. 10 complementaria). La eliminación de shRNA de HSALNG0104472 en iPSC afectó significativamente el comportamiento de latido de los cardiomiocitos diferenciados (en el día 18). La frecuencia de golpes del grupo de derribo fue de 24 veces por minuto en contraste con 57 veces por minuto en el grupo de control. (Película complementaria 1 y 2). Se detectó una regulación negativa significativa de GATA6 (Fig. 9b complementaria y Datos complementarios 13). El efecto de eliminación de HSALNG0104472 en la diferenciación de cardiomiocitos se validó aún más mediante la transducción de un Silenciador inteligente que contiene ARN de interferencia pequeño y oligonucleótidos antisentido en iPSC después de la inducción de la diferenciación de cardiomiocitos (Fig. 8a). El análisis de citometría de flujo con el marcador de cardiomiocitos Troponina T cardíaca (cTnT) indicó que la eliminación de HSALNG0104472 redujo significativamente la eficiencia de diferenciación de los cardiomiocitos (P = 0,006; Fig. 8b, Figs. complementarias 11-16 y Datos complementarios 13). También validamos el efecto de eliminación de HSALNG0104472 en los cardiomiocitos diferenciados (en el día 18) mediante transfección transitoria. El ensayo inmunofluorescente de los cardiomiocitos indicó una reducción de la troponina cardíaca I (cTnI) y la falta de sarcómero miocárdico maduro como resultado de la reducción de HSALNG0104472 (Fig. 8c).

a Para los grupos de eliminación y control de HSALNG0104472, se capturaron 3 puntos temporales durante la diferenciación de iPSC humanas a cardiomiocitos. Barra de escala, 40 μm. b Para los grupos de eliminación y control de HSALNG0104472, se muestra la cuantificación de los cardiomiocitos (en el día 8 después de la inducción) que contienen troponina T cardíaca (cTnT) (Figuras complementarias 11-16 y Datos complementarios 13). Las barras de error muestran la media ± SD de tres experimentos biológicamente independientes. Se utilizó la prueba t de Student de dos colas para la comparación entre dos grupos. ** P < 0,01. c Inmunofluorescencia de marcadores de sarcómero cardiaco en cardiomiocitos inducidos. DAPI (azul), cTnl (rojo) y α-actinina (verde). Barra de escala, 15 μm. cTnl troponina cardiaca I.

Las CNV han sido reconocidas como causas importantes de CHD durante mucho tiempo. Dado que las CNV varían ampliamente en tamaño y siempre muestran múltiples efectos fenotípicos, la identificación del gen relevante o el intervalo crítico de una CNV patógena específica para la cardiopatía coronaria seguía siendo un desafío4. En las aplicaciones clínicas, una idea natural para interpretar la patogenicidad de las CNV serían los efectos de la dosis de genes resultantes de la interrupción de las secuencias de codificación. Desafortunadamente, hasta ahora solo se había documentado que 2 (22q11.2: TBX1 y 8p23.1: GATA4) de las 19 CNV no sindrómicas contenían un gen codificador de proteína relevante responsable de defectos cardíacos (Tabla 1). Obviamente, tal estrategia con la identificación de genes que codifican proteínas sensibles a la dosis estaría lejos de ser suficiente para dilucidar las etiologías de la CHD causada por las CNV.

Las regiones codificantes de proteínas ocupan solo ~2% del genoma humano. Por el contrario, se podría transcribir un total del 60~70% del genoma humano8. Por lo tanto, sería razonable examinar los efectos de los ARN no codificantes en las etiologías de la CNV asociada a la cardiopatía coronaria. Durante los últimos años, se ha implicado a los lncRNA en la orquestación de la expresión génica en los procesos de desarrollo cardíaco. En el estudio actual, investigamos las posibles funciones reguladoras de CNV-lncRNA y su contribución a las etiologías de la cardiopatía coronaria causada por CNV. A través de WGCNA, identificamos dos módulos de coexpresión correlacionados con tejido cardíaco que contienen un total de 35 CNV-lncRNA (Datos complementarios 1). Los análisis de enriquecimiento funcional indicaron que estos módulos estaban relacionados con procesos biológicos como el proceso cardíaco, el desarrollo muscular y el metabolismo energético, que habían sido reconocidos como componentes importantes del proceso de desarrollo cardíaco (Fig. 2c). El módulo negro no sindrómico, que mostró la correlación más alta con los tejidos cardíacos, contenía la mitad (11/22, P = 2,12 × 10−11) de los genes CHD no sindrómicos bien caracterizados, pero solo 2 de los 69 genes CHD sindrómicos ( P = 0,66). Además, los genes que codifican proteínas en el módulo negro también se enriquecieron en los conjuntos de genes CHD LOF (P = 1.34 × 10-3) y DMV (P = 5.62 × 10-5) (Fig. 4a, c y Datos complementarios 5) , que se obtuvieron de acuerdo con descubrimientos de variantes raras a gran escala utilizando secuenciación de próxima generación36. Tomados en conjunto, estos resultados indicaron que el módulo negro no sindrómico tenía una disposición para afectar los fenotipos cardíacos. Además, más de la mitad (52,63 %, 10/19) de las CNV recurrentes no sindrómicas asociadas con CHD abarcaban al menos un lncRNA coexpresado con múltiples genes clave de CHD en el módulo negro no sindrómico (Fig. 3a).

El módulo negro no sindrómico contenía 2 CNV-lncRNA concentradores (HSALNG0104472 en 15q11.2 y HSALNG0137903 en Xp11.22) (Fig. 4a y Datos complementarios 1). El análisis de peso relativo (RWA) mostró que HSALNG0104472 tuvo un efecto significativo en la regulación de la expresión de los 12 genes CHD coexpresados ​​en el módulo negro no sindrómico, y HSALNG0137903 impulsó significativamente la regulación de 10 genes CHD coexpresados ​​excepto MYH6 y SMAD6 (Fig. 7a y Datos complementarios 10). Se ha informado repetidamente que la deleción 15q11.2 contribuye a los defectos del neurodesarrollo. Sin embargo, su asociación con CC fue controvertida37. Recientemente revelamos que la eliminación de 15q11.2 se asoció con TAPVC, una forma rara y grave de CHD24. Mientras que los genes críticos de la deleción 15q11.2 responsables de los defectos cardíacos permanecieron desconocidos. Curiosamente, de los 30 CNV-lncRNA en el módulo negro no sindrómico, HSALNG0104472 mostró una expresión sesgada más significativamente en el corazón en desarrollo en comparación con el cerebro (Fig. 5d y Datos complementarios 7). Luego realizamos experimentos de sobreexpresión y eliminación en líneas celulares de cardiomiocitos para investigar los efectos reguladores de HSALNG0104472. La sobreexpresión de HSALNG0104472 no dio lugar a una alteración significativa de la expresión génica en las líneas celulares AC16. Con la eliminación de HSALNG0104472 en AC16, identificamos genes regulados negativamente involucrados en vías como la regulación positiva de la angiogénesis, la regulación positiva del desarrollo vascular y la regulación del desarrollo vascular. Sin embargo, no pudimos validar sin ambigüedades la relación de coexpresión entre HSALNG0104472 y los genes CHD identificados en el módulo negro no sindrómico (Datos complementarios 12). Especulamos que tal inconsistencia debería atribuirse al hecho de que los módulos de coexpresión se construyeron en base a conjuntos de datos de desarrollo, mientras que AC16 representa una línea celular de cardiomiocitos humanos adultos. La validación adicional utilizando el sistema de diferenciación de iPSCs-cardiomiocitos indicó efectos reguladores específicos de la etapa de HSALNG0104472 en los genes CHD (NKX2-5, ACTC1 y TBX20 en iPSCs y GATA6 en cardiomiocitos diferenciados, Fig. 9 complementaria). La región de deleción 15q11.2 abarca principalmente 4 genes que codifican proteínas: TUBGCP5, CYFIP1, NIPA1 y NIPA2. En este estudio, nuestro análisis de expresión génica diferencial entre los tejidos del cerebro y el corazón en desarrollo indicó que NIPA1 se expresó preferentemente en los tejidos cerebrales en desarrollo, mientras que los otros tres genes no mostraron una expresión diferencial significativa (Datos complementarios 7). Dado que solo se informó que TUBGCP5 y NIPA1 se expresaban en los corazones fetales, creamos previamente iPSCs knockout para TUBGCP5 y probamos que la reducción de TUBGCP5 afectaría la diferenciación de los cardiomiocitos24. Aquí, demostramos que el CNV-lncRNA HSALNG0104472 se expresa específicamente en los tejidos cardíacos en desarrollo y su reducción generaría un impacto más severo en la diferenciación de los cardiomiocitos. Por lo tanto, HSALNG0104472 debería ser un efector importante para los defectos cardíacos resultantes de la deleción 15q11.2.

El reciente descubrimiento de numerosos genes CHD novedosos se benefició de las aplicaciones de secuenciación de próxima generación a gran escala en cohortes de CHD. Dado que la mayoría de las evidencias de estos genes (como se resumen en los conjuntos de genes LOF y DMV, Datos complementarios 5) estaban relacionadas con variantes raras, era razonable que estos genes se enriquecieran en muchos más módulos de coexpresión. Por lo tanto, el descubrimiento de variantes raras basado en la secuenciación de próxima generación amplió notablemente nuestro conocimiento de las etiologías genéticas de la CHD. Tales resultados también fueron consistentes con la heterogeneidad genética universal de CHD. Los conjuntos de genes de CHD sindrómicos y no sindrómicos también se enriquecieron en diferentes módulos, lo que sugiere una divergencia de las bases moleculares subyacentes a la CHD sindrómica y no sindrómica (Fig. 4 y Datos complementarios 5). Por lo tanto, ampliamos nuestro análisis a los lncRNA dentro de las CNV asociadas a CHD sindrómica. En comparación con la CC no sindrómica, casi todas las CNV asociadas a la CC sindrómica eran deleciones4. En general, las eliminaciones deberían ser más perjudiciales que las duplicaciones4. Por otro lado, un número considerable de síndromes de deleción recurrente presentaban penetrancia reducida o alta variabilidad clínica7. Los CNV asociados con la CHD sindrómica contenían más lncRNA y CNV-lncRNA centrales, que estaban involucrados en más del doble (29/13) de módulos que la CHD no sindrómica (Datos complementarios 1 y 8). A través de análisis de expresión génica diferencial de los 88 genes CHD sindrómicos y no sindrómicos y CNV-lncRNA en muestras de desarrollo del corazón y el cerebro, identificamos 21 y 8 genes regulados al alza en el corazón y el cerebro, respectivamente. Los genes regulados al alza en el corazón estaban relacionados con el desarrollo cardíaco, y los genes regulados al alza en el cerebro estaban relacionados con el desarrollo de múltiples sistemas (Fig. 5a-c). Sorprendentemente, tanto los genes de codificación de proteínas regulados al alza del corazón como los CNV-lncRNA estaban más enriquecidos en el módulo s-amarillo, que correspondía al módulo negro no sindrómico (Fig. 5c, d y Datos complementarios 7). El módulo turquesa más grande se enriqueció en los conjuntos de genes CHD sindrómicos, LOF y DMV CHD (Fig. 4b, d y Datos complementarios 5). Revelamos que una gran proporción de CNV-lncRNA asociados con CHD sindrómico regulado al alza en el cerebro se agruparon en el módulo correspondiente (s-turquesa) (Fig. 5d y Datos complementarios 7). El trastorno del espectro autista representó un trastorno del neurodesarrollo con una base genética compartida de CHD. Probamos los genes del trastorno del espectro autista en los módulos de coexpresión sindrómica (Datos complementarios 9). En resumen, estos hallazgos destacaron la importancia de los CNV-lncRNA dentro del módulo turquesa (s-turquesa) en las etiologías de la cardiopatía coronaria sindrómica con defectos del neurodesarrollo.

Los factores ambientales podrían estar asociados con hasta el 30% de los casos de cardiopatía coronaria, mientras que las causas ambientales solitarias son identificables en solo el 2% de los casos4. Se sugirió que la mayoría de los casos de cardiopatía coronaria sin explicación eran causados ​​por interacciones de factores genéticos y ambientales, que podrían ser modulados por reguladores epigenéticos. Las crecientes evidencias de la participación de los lncRNA en el desarrollo cardíaco sugirieron que su desregulación subyacente a la cardiopatía coronaria debería considerarse seriamente. En contraste con el mRNA y los miRNA, los lncRNA evolucionaron rápidamente desde la perspectiva de la secuencia y los niveles de expresión. Sin embargo, sus especificidades tisulares a menudo se conservan. Los LncRNA podrían reprimir o activar las expresiones génicas en cis o en trans. Según nuestros análisis, la mayoría de los CNV-lncRNA estaban altamente correlacionados con genes CHD conocidos fuera de sus regiones CNV correspondientes (Fig. 3a), por lo que funcionaban en trans. Mecánicamente, los lncRNA podrían clasificarse como lncRNA de señalización, lncRNA de señuelo, lncRNA de guía, lncRNA de andamio y lncRNA potenciadores. Anteriormente, construimos con éxito redes reguladoras de genes lncRNA-miRNA-mRNA en tejidos cardíacos con CHD33. En el presente estudio, también identificamos hub CNV-lncRNAs que podrían impulsar la red reguladora lncRNA-miRNA-mRNA (Fig. 3 complementaria). Sin embargo, ninguno de los ARNm objetivo estaba en la lista de genes CHD conocidos (Datos complementarios 5).

La patogenicidad de las CNV se interpretó más comúnmente sobre la base de su efecto sobre la dosis de genes a través de la alteración de las secuencias de codificación, y este enfoque se ha aplicado con éxito en el descubrimiento de genes causales para las CNV en enfermedades mendelianas7. A pesar del éxito de tal estrategia, las patologías de la mayoría de las CNV asociadas con CHD han permanecido indeterminadas durante mucho tiempo. Dado que la mayoría de las CNV también afectan las regiones genómicas de los lncRNA, es necesario considerar seriamente los mecanismos patogénicos que involucran a los lncRNA reguladores. Sorprendentemente, incluso si solo consideráramos el módulo (módulo negro no sindrómico) que se correlacionó más significativamente con los tejidos cardíacos, más de la mitad de las CNV asociadas a CHD no sindrómicas (52,6 %, 10/19) contenían al menos un lncRNA que mostraba una alta coexpresión y correlación con múltiples genes clave de CHD (Fig. 3a). De las 10 CNV que contienen lncRNA antes mencionadas, 1q21.1, 2q24.1, 2q35, 2q37.1, 8p23.1 y 13q14.11 también abarcaron los lncRNA hub involucrados en el mecanismo de ceRNA. Además de estos CNV, otros tres CNV asociados con CHD no sindrómicos (5q31.1, 16p12.2 y 16q23.1) también contenían lncRNA concentrador implicados en los análisis de ceRNA (Fig. 3a y Datos complementarios 6). Aunque los genes CHD no se identificaron como objetivos de los lncRNA centrales para la red de ceRNA, no podíamos ignorar el efecto del mecanismo de ceRNA debido a sus funciones reguladoras ubicuas en el desarrollo cardíaco38. En total, los CNV-lncRNA podrían contribuir potencialmente a las patologías de una proporción máxima del 68,4 % (13/19) de las CNV asociadas a CHD no sindrómicas (Fig. 3a; Tabla 1; y Datos complementarios 6).

Se necesitan más investigaciones ya que existen varias limitaciones en nuestra investigación. En primer lugar, los lncRNA causales que podrían explicar los casos de cardiopatía coronaria resultantes de las CNV deben identificarse a partir de las redes de coexpresión, que también fue la motivación original de este trabajo. En segundo lugar, utilizamos cuatro conjuntos de genes CHD conocidos en los análisis (Datos complementarios 5). Los resultados pueden estar incompletos dado que la lista de genes de CHD aún está creciendo. Además, aunque agrupamos mRNA y CNV-lncRNAs en módulos para simplificar los análisis, los CNV-lncRNAs y mRNAs podrían tener interacciones complejas entre módulos en la vista temporal y espacial. El concentrador CNV-lncRNA HSALNG0104472, por ejemplo, cuyo efecto regulatorio inconsistente sobre genes CHD conocidos se observó en iPSC y cardiomiocitos diferenciados (es decir, los niveles transcripcionales de NKX2.5, ACTC1 y TBX20 estaban regulados a la baja en iPSC pero no en cardiomiocitos diferenciados), indicó los roles específicos de la etapa de HSALNG0104472 (Figura complementaria 9 y Datos complementarios 13). Por último, la falta de una investigación mecanicista profunda es una limitación del estudio. En conjunto, proporcionamos evidencias de que los CNV-lncRNAs potencialmente regulaban los patrones de expresión de genes CHD bien establecidos. Se necesita la integración de conjuntos de datos multidimensionales para revelar sus mecanismos moleculares en CHD. Sin embargo, aún se necesita trabajo adicional para revelar completamente los roles reguladores de CNV-lncRNAs en CHD. La mejora en el modelo celular e in vitro/in vivo, además de la acumulación de datos genéticos clínicos, debería ser necesaria para ayudarnos a lograr ese objetivo. Dado que la mayoría de los CNV-lncRNA no están conservados evolutivamente, los modelos in vitro, como los organoides cardíacos, han surgido como herramientas potenciales para proporcionar información sobre los mecanismos moleculares para ellos.

En conclusión, para investigar si los lncRNA contribuyen a la patogenicidad de las CNV que conducen a CHD, construimos una red de coexpresión para CNV-lncRNA asociados con CHD y genes codificadores de proteínas utilizando datos de desarrollo de órganos humanos. Nuestros resultados sugirieron que los genes CHD conocidos podrían estar regulados por múltiples lncRNA dentro de las regiones CNV asociadas a CHD no sindrómicas y sindrómicas. Para el módulo negro no sindrómico que se enriqueció principalmente en genes CHD no sindrómicos, validamos las funciones reguladoras de un concentrador CNV-lncRNA HSALNG0104472 dentro de la región 15q11.2. Se reveló que HSALNG0104472 debería ser un efector principal responsable de los defectos cardíacos de la deleción 15q11.2 mediante la regulación de la diferenciación de los cardiomiocitos. Nuestros resultados destacaron la contribución potencial de los lncRNA a la patogenicidad de las CNV asociadas a la cardiopatía coronaria.

Nuestro objetivo fue revelar la contribución potencial de los lncRNA a la patogenicidad de las CNV asociadas a la cardiopatía coronaria. Las CNV asociadas con CHD no sindrómica y sindrómica se recuperaron de CHDGKB39 y una revisión reciente sobre CHD4, respectivamente. En primer lugar, restringimos nuestro análisis a las CNV no sindrómicas recurrentes que se informaron en al menos tres casos. Construimos redes de coexpresión para los 568 CNV-lncRNA no sindrómicos y 19 957 genes de codificación de proteínas utilizando los datos transcriptómicos del desarrollo de órganos humanos (n = 313) de LncExpDB23. Se usaron matrices de expresión génica (valor tpm) de las 313 muestras para WGCNA, lo que permitió la identificación de relaciones sólidas de coexpresión que involucran CNV-lncRNA.

Para revelar la base molecular que subyace a las diferencias entre CHD no sindrómico y sindrómico, realizamos otro WGCNA con 1500 CNV-lncRNA asociados con CHD no sindrómico y sindrómico. También identificamos genes CHD expresados ​​​​diferencialmente y CNV-lncRNA entre muestras de cerebro (n = 87) y corazón (n = 50).

Los módulos WGCNA identificados se correlacionaron con el sexo, la etapa de desarrollo y los siete órganos con el paquete WGCNA R. Nos enfocamos principalmente en los módulos que estaban significativamente correlacionados con los tejidos del corazón. HSALNG0104472, un concentrador CNV-lncRNA dentro de 15q11.2, mostró una alta coexpresión y correlación con múltiples genes clave de CHD. Luego realizamos una serie de experimentos con células para validar sus posibles efectos reguladores en los cardiomiocitos.

La línea iPSC se generó a partir de una mujer sana en nuestro estudio anterior24. Se obtuvo el consentimiento informado del participante. El Comité de Ética del SCMC revisó y aprobó este estudio (SCMCIRB-K2022182-1). Todos los procedimientos realizados en estudios con participantes humanos se realizaron de acuerdo con los estándares éticos del comité de investigación institucional y/o nacional y con la Declaración de Helsinki de 1964 y sus enmiendas posteriores o estándares éticos comparables.

Las CNV no sindrómicas se recogieron de CHDGKB39. Dado que las CNV recurrentes tenían muchas más implicaciones clínicas, solo usamos las 19 CNV que se informaron en al menos tres casos para nuestro análisis (Tabla 1). Además, se resumieron 21 CNV sindrómicas de la revisión reciente4 para el análisis comparativo. Los lncRNA anotados23,31 que se mapearon en estas regiones genómicas con un valor de expresión máximo (transcripciones por millón, tpm) ≥ 1 en las 50 muestras de desarrollo del corazón se consideraron expresados ​​durante el desarrollo del corazón. Se utilizó BEDTools v2.29.2 para la recuperación de CNV-lncRNA40. Los datos de expresión génica procesados ​​que involucran estos genes para las 313 muestras de tejido de desarrollo de órganos humanos proporcionadas por LncExpDB se usaron para el análisis de coexpresión. Se utilizó el paquete R WGCNA v1.7022 para la construcción de la red de coexpresión y la identificación del módulo. La correlación de Pearson se utilizó para calcular las correlaciones de expresión génica por pares y las correlaciones de rasgo de módulo. Para las correlaciones módulo-rasgo, el valor P ajustado se calculó con la función corPvalueStudent en el paquete WGCNA R. El valor de potencia se fijó en seis para la construcción de la red de coexpresión. Los parámetros para la función blockwiseModules fueron los siguientes: maxBlockSize = 6000, TOMType = "unsigned", minModuleSize = 30, reassignThreshold = 0, mergeCutHeight = 0.25, numericLabels = T y pamRespectsDendro = F. El valor de membresía del módulo (MM), que fue utilizado como una estimación de la correlación entre un gen/lncRNA y el gen propio del módulo correspondiente, se utilizó para definir los CNV-lncRNA centrales. Los genes de codificación de proteínas en cada módulo se utilizaron como entrada para el análisis de enriquecimiento de ontología génica (GO) y los análisis de enriquecimiento de rutas de la Enciclopedia de genes y genomas de Kyoto (KEGG) con el paquete R clusterProfiler v3.1041.

Recuperamos evidencias de interacción 598537 lncRNA-miRNA y 331604 miRNA-mRNA de LncBook25, NPInter42, miRTarBase43 y TarBase44. Al integrar las evidencias de interacciones con los datos de expresión génica de las muestras de desarrollo del corazón (n = 50), construimos la red reguladora lncRNA-miRNA-mRNA utilizando LncmiRSRN v3.034 para estimar la contribución del mecanismo ceRNA a la patogenicidad de CHD no sindrómico asociado CNV.

La línea iPSC generada a partir de una mujer sana en nuestro laboratorio24 se utilizó para experimentos de diferenciación de cardiomiocitos. Las iPSC (1 × 106) se inocularon en placas de 6 pocillos recubiertas previamente con Matrigel (BD Bioscience, Heidelberg, Alemania). Las iPSC se sembraron y cultivaron con medio E8. Cuando las iPSC alcanzaron la confluencia del 80%~90%, se realizó la diferenciación de cardiomiocitos inducida in vitro con el kit CardioEasy (Cellapybio, Beijing, China) siguiendo el protocolo. Las eficiencias de diferenciación de cardiomiocitos se cuantificaron con citometría de flujo (Ver apartado "Evaluación de la eficiencia de diferenciación de cardiomiocitos").

Para la tinción inmunofluorescente, las células se fijaron con PBS que contenía paraformaldehído al 4 % durante 20 minutos a temperatura ambiente. Después de lavar con PBS, las células se bloquearon durante 30 minutos con PBS que contenía suero bovino al 5%. La tinción con anticuerpos primarios: troponina I cardíaca (cTnI) (RRID: AB_2532494, ThermoFisher, Waltham, MA, EE. UU.), α-actinina (RRID: AB_2692251, ThermoFisher, Waltham, MA, EE. UU.) diluida en tampón de bloqueo se realizó durante la noche a −4 °C de temperatura. Los anticuerpos secundarios se usaron al día siguiente, después de la tinción con DAPI para detectar el núcleo celular. Las imágenes fluorescentes se adquirieron utilizando un microscopio confocal láser (Leica TCS SP8).

El ARN celular total se aisló con el reactivo TRIzol (Ambion, Austin, TX, Estados Unidos) de acuerdo con el protocolo. La concentración y la integridad del ARN se midieron utilizando el sistema Agilent Bioanalyzer 2100. Las muestras con RIN ≥ 7 se calificaron para la construcción de bibliotecas de secuenciación. Preparamos las bibliotecas de secuenciación utilizando el mRNA-seq Lib Prep Kit for Illumina (ABclonal Technology Co., Wuhan, China) con adaptadores para la plataforma BGI. La secuenciación se realizó en el DNBSEQ-T7. Los datos se procesaron de la siguiente manera: análisis de calidad y filtrado de calidad base con FastQC v0.11.9 (https://www.bioinformatics.babraham.ac.uk/projects/fastqc) y Trim Galore v0.6.6 (https://github. com/FelixKrueger/TrimGalore), eliminación de rRNA con SortMeRNA v4.3.445, alineación con STAR v2.7.1046, conteo de lecturas con featureCounts47 implementado en el paquete Subread v2.0.3, análisis de expresión diferencial y análisis de componentes principales con DESeq2 v1.3248, y funcional análisis de enriquecimiento con clusterProfiler v3.1041. Para el análisis de expresión diferencial, los recuentos sin procesar de genes se normalizaron con la función rlog en DESeq2 v1.3248.

Los datos de expresión génica de LncExpDB23 se generaron a través de una anotación integral para lncRNAs del conjunto de datos original de muestras de desarrollo (n = 313, cerebro: 55, cerebelo: 59, corazón: 50, riñón: 40, hígado: 50, ovario: 18 y testículos: 41) recopilados de ArrayExpress (E-MTAB-6814). El muestreo de tejido comenzó a las cuatro semanas posteriores a la concepción y luego se tomaron muestras cada semana hasta las 20 semanas posteriores a la concepción, excepto a las 14, 15 y 17 semanas posteriores a la concepción. Se tomaron muestras de tejidos posnatales como recién nacidos, bebés (6 a 9 meses), niños pequeños (2 a 4 años), en edad escolar (7 a 9 años), adolescentes (13 a 19 años) y adultos (~ 65 años). El desarrollo renal se muestreó hasta los 8 años de edad y el desarrollo ovárico solo se muestreó prenatalmente49.

Los datos transcriptómicos procesados ​​(n = 297) de la diferenciación de cardiomiocitos in vitro de LncExpDB23 se utilizaron para validar la relación de coexpresión altamente correlacionada entre los genes CNV-lncRNA y CHD en el módulo negro no sindrómico identificado por WGCNA. Los datos originales se obtuvieron de Gene Expression Omnibus (GEO) con el acceso GSE122380. Los datos originales se generaron a partir de la diferenciación de cardiomiocitos de líneas iPSC de 19 individuos de la población Yoruba HapMap50.

Los rasgos de muestra en los datos de desarrollo de órganos humanos se recopilaron de LncExpDB23. Las variables categóricas (sexo y tejido) de las muestras se cuantificaron en 1 y 0. Para el sexo, el sexo masculino se cuantificó en 1 y la mujer en 0. Para 7 órganos (corazón, por ejemplo), las muestras de corazón se cuantificaron en 1 mientras que otras muestras se cuantificaron en 0. Las variables continuas (etapa de desarrollo) de las muestras se cuantificaron en semanas de acuerdo con las siguientes reglas: para las muestras de embriones (antes del nacimiento), el valor de la etapa de desarrollo es igual a cuántas semanas estuvieron después de la concepción (por ejemplo, si el embrión tenía 10 semanas, el valor era 10.). Para las muestras recolectadas después del nacimiento, el valor de la etapa de desarrollo es igual a 40 (valor estimado del embarazo humano de 40 semanas) más la edad (recuento en semanas). 1 año se calculó como 52 semanas, 1 mes como 1/12 años y 1 semana como 7 días. (Por ejemplo, para una muestra a los 6 meses después del nacimiento, el valor de la etapa de desarrollo fue 40 + 6/12 × 52 = 66; para una muestra a los 7 días después del nacimiento, el valor de la etapa de desarrollo fue 40 + 7/7 = 41. ) (Datos Complementarios 1).

Los detalles (incluido el subtipo de cardiopatía coronaria) de las CNV asociadas a cardiopatía coronaria no sindrómica recurrente se recopilaron de CHDGKB39. Después de filtrar los registros de CNV sin información específica de coordenadas de CNV, las coordenadas originales de cada registro de CNV se convirtieron al ensamblaje hg38 utilizando la herramienta de elevación en UCSC (http://genome.ucsc.edu)51. Las coordenadas de todos los CNV-lncRNA (ensamblaje hg38) se recuperaron de LncExpDB23. Tomamos la intersección de coordenadas para identificar la asociación entre CNV-lncRNA y el subtipo CHD.

El análisis de peso relativo (RWA), que también se conoce como análisis de controladores, se realizó con RWA Web y R package52 para identificar los CNV-lncRNA de controladores clave en el módulo negro no sindrómico. Para cada análisis RWA, el gen CHD se utilizó como variable de respuesta y los CNV-lncRNA se utilizaron como predictores. R2 estimó la contribución de un grupo de predictores a la variable respuesta. Cuando no se incluyó 0 en los intervalos de confianza, el peso relativo se denotó significativo. De lo contrario, el peso relativo no fue significativamente el uno del otro. Ver más detalles en la Web de RWA.

Para los experimentos de sobreexpresión, la longitud completa de la transcripción (HSALNT0217290) para HSALNG0104472 se clonó en el vector lentiviral PCDH-CMV-MCS-EF1a-gfp-T2A-puro, el vector vacío se usó como control. Para los experimentos de eliminación estables con shRNA, se insertó una secuencia complementaria (AGGGAACCAGCTTCAGAACTCAAGAGGTTCTGAAGCTGGTTCCCTTTTTTT) dirigida a la transcripción HSALNG0104472 en el vector lentiviral pLVX-shRNA2-zsGreen-PGK-puro. La secuencia codificada correspondiente (CGTATACCCGGAACAAAGGTCAAGAGCCTTTGTTCCGGGTATACGTTTTTT) se usó como control. Los plásmidos lentivirales construidos se transfectaron respectivamente en células HEK293 con los plásmidos de empaquetamiento psPAX2 y pMD2·G mediante Lipofectamine 2000 (Invitrogen, Carlsbad, CA, EE. UU.) para producir virus. Se infectaron AC16/iPSC con los lentivirus después del tratamiento con puromicina durante varios días para obtener la sobreexpresión y las líneas celulares de eliminación. Los experimentos de derribo también se repitieron a través de la transfección transitoria con un Smart Silencer (mezcla de pequeños ARN de interferencia y oligonucleótidos antisentido dirigidos a HSALNG010447, sintetizados por RiboBio, Guang Zhou, China). El Smart Silencer se transfectó en iPSC o cardiomiocitos con Lipofectamine RNAiMAX (Invitrogen, Carlsbad, CA, EE. UU.). Las secuencias del silenciador se enumeraron en la Tabla complementaria 3.

Se usó un total de 1 µg de ARN celular como molde para la preparación de ADNc con el kit de reactivos PrimeScript RT (Takara, Dalian, China). La qPCR de transcripción inversa cuantitativa (RT-qPCR) se realizó con el kit TB Green Premix Ex Taq II (Takara, Dalian, China) en el sistema de detección de PCR en tiempo real CFX 96 (Bio-Rad Laboratories, Inc., Hercules, CA, EE. Estados Unidos). Los niveles relativos de expresión génica se calcularon con base en el método 2−∆∆Ct. Se realizaron al menos tres experimentos biológicamente independientes para cada grupo. GAPDH se utilizó como gen de referencia interno. Los pares de cebadores RT-qPCR se enumeraron en la Tabla complementaria 4.

Se utilizó citometría de flujo para evaluar el rendimiento relativo de cardiomiocitos y la eficiencia de la diferenciación celular midiendo el número de células que expresan proteínas cardiacas específicas Troponina T cardiaca (cTnT). Se usó el anticuerpo policlonal PE de troponina T cardiaca conjugado (n.º de catálogo: #C90559PE) para apuntar a los cardiomiocitos. Para la preparación de muestras, digiera los cardiomiocitos con enzimas digestivas suaves durante 5 min. Agregue un volumen igual de medio de cultivo celular para detener la reacción. Centrifugar a 25 ° C 800 × g durante 5 minutos y resuspender las células con PBS para lavar las células 2 veces con el mismo procedimiento. Alícuota de 1 × 106 células de la muestra pretratada en 100 ul por volumen en un tubo de ensayo de 5 ml por prueba. Agregue el anticuerpo policlonal PE de troponina T cardiaca conjugado en la dilución adecuada (1:100) a los tubos de ensayo. Incubar a 37 ° C durante 1 hora. Lavar por centrifugación en 2-3 ml de tampón de lavado (PBS con FBS al 0,1 %). Resuspender las células en 0,3–0,5 ml de PBS y analizar en el citómetro de flujo. Se utilizó el citómetro de flujo BD FACSCanto™ para los ensayos de diferenciación de cardiomiocitos. El porcentaje de células se evaluó mediante el software BD FACSDiva™ v8.0.1. La abundancia de fracciones positivas y negativas se determinó mediante recuento de células después de la clasificación. La estrategia de activación se mostró en Información complementaria (Fig. 10 complementaria).

Se utilizó un umbral de valor de P ajustado <0,05 para el análisis de expresión génica diferencial. Los valores de P se ajustaron para pruebas múltiples utilizando el método de Benjamini-Hochberg. Se utilizaron pruebas hipergeométricas para estimar la importancia del enriquecimiento de genes CHD conocidos en módulos de coexpresión. Se usó la prueba t de Student de dos colas para la comparación entre dos grupos. Se realizaron al menos tres experimentos biológicamente independientes para cada grupo.

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de Nature Portfolio vinculado a este artículo.

Los datos sin procesar de RNAseq para la sobreexpresión y los experimentos de eliminación de HSALNG0104472 en cardiomiocitos AC16 que respaldan los hallazgos de este estudio están disponibles abiertamente en GEO: GSE201076. Todos los datos están disponibles en el texto principal o en los materiales complementarios. El plásmido para la sobreexpresión y eliminación de HSALNG0104472 se ha depositado en Addgene (197902, 197989 y 197991).

GBD 2017 Cardiopatías Congénitas Colaboradores. Carga mundial, regional y nacional de cardiopatías congénitas, 1990-2017: un análisis sistemático para el Estudio de carga mundial de enfermedades 2017. Lancet Child Adolesc. Salud 4, 185–200 (2020).

Artículo Google Académico

Liu, Y. et al. Prevalencia mundial al nacer de defectos cardíacos congénitos 1970-2017: revisión sistemática actualizada y metanálisis de 260 estudios. Int J. Epidemiol. 48, 455–463 (2019).

Artículo PubMed PubMed Central Google Académico

Leirgul, E. et al. Prevalencia al nacer de defectos cardíacos congénitos en Noruega 1994-2009: un estudio a nivel nacional. Soy. Corazón J. 168, 956–964 (2014).

Artículo PubMed Google Académico

Pierpont, ME y col. Base genética para la cardiopatía congénita: revisión: una declaración científica de la American Heart Association. Circulación 138, e653–e711 (2018).

Artículo PubMed PubMed Central Google Académico

Nees, SN & Chung, WK Bases genéticas de la cardiopatía congénita humana. Harb de primavera fría. Perspectiva. Biol. https://doi.org/10.1101/cshperspect.a036749 (2020).

Jin, SC et al. Contribución de variantes raras heredadas y de novo en 2.871 probandos de cardiopatías congénitas. Nat. Gineta. 49, 1593–1601 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Spielmann, M., Lupianez, DG & Mundlos, S. Variación estructural en el genoma 3D. Nat. Rev. Genet. 19, 453–467 (2018).

Artículo CAS PubMed Google Académico

Djebali, S. et al. Paisaje de la transcripción en células humanas. Naturaleza 489, 101–108 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Batista, PJ & Chang, HY ARN largos no codificantes: códigos de dirección celular en el desarrollo y la enfermedad. Celda 152, 1298–1307 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Klattenhoff, CA et al. Braveheart, un ARN largo no codificante requerido para el compromiso del linaje cardiovascular. Celda 152, 570–583 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Grote, P. et al. El lncRNA Fendrr específico de tejido es un regulador esencial del desarrollo del corazón y la pared corporal en el ratón. desarrollo Celda 24, 206–214 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Viereck, J. et al. Chast de ARN no codificante largo promueve la remodelación cardíaca. ciencia Traducir Medicina. 8, 326ra322 (2016).

Artículo Google Académico

Liu, J., Li, Y., Lin, B., Sheng, Y. & Yang, L. HBL1 es un ARN largo no codificante humano que modula el desarrollo de cardiomiocitos a partir de células madre pluripotentes al contrarrestar MIR1. desarrollo Celda 42, 333–348 e335 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Anderson, KM et al. La transcripción de la parte superior del ARN no codificante controla la expresión de Hand2 y el desarrollo del corazón. Naturaleza 539, 433–436 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Ritter, N. et al. El locus lncRNA regula los programas de genes cardíacos y es esencial para el desarrollo temprano del ratón. desarrollo Celda 50, 644–657.e648 (2019).

Artículo CAS PubMed Google Académico

Wilson, KD et al. El lncRNA BANCR derivado de retrovirus endógeno promueve la migración de cardiomiocitos en humanos y primates no humanos. desarrollo Celda 54, 694–709.e699 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Li, H. et al. lncExACT1 y DCHS2 regulan el crecimiento cardíaco fisiológico y patológico. Circulación. https://doi.org/10.1161/CIRCULATIONAHA.121.056850 (2022).

Meng, Q. et al. El ARN largo no codificante de DGCR5 puede regular la expresión de varios genes relacionados con la esquizofrenia. ciencia Traducir Medicina. https://doi.org/10.1126/scitranslmed.aat6912 (2018).

Alinejad-Rokny, H., Heng, JIT & Forrest, ARR Los genes de ARN codificantes y no codificantes largos enriquecidos en el cerebro están sobrerrepresentados en las CNV con trastornos del neurodesarrollo recurrentes. Informe celular 33, 108307 (2020).

Artículo CAS PubMed Google Académico

Richter, F. et al. Los análisis genómicos implican variantes de novo no codificantes en la cardiopatía congénita. Nat. Gineta. 52, 769–777 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Meerschaut, I. et al. Una reevaluación de las variaciones del número de copias en los defectos cardíacos congénitos: representando el genoma completo. Genes (Basilea). https://doi.org/10.3390/genes12071048 (2021).

Langfelder, P. & Horvath, S. WGCNA: un paquete R para análisis de red de correlación ponderada. BMC Bioinforme. 9, 559 (2008).

Artículo Google Académico

Li, Z. et al. LncExpDB: una base de datos de expresión de ARN largos no codificantes humanos. Ácidos Nucleicos Res. 49, D962–D968 (2021).

Artículo CAS PubMed Google Académico

Li, X. et al. La deleción 15q11.2 se enriquece en pacientes con conexión venosa pulmonar anómala total. J.Med. Gineta. https://doi.org/10.1136/jmedgenet-2019-106608 (2020).

Soemedi, R. et al. Contribución de las variantes globales raras del número de copias al riesgo de cardiopatía congénita esporádica. Soy. J. Hum. Gineta. 91, 489–501 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Silversides, CK et al. Las raras variaciones en el número de copias en adultos con tetralogía de Fallot implican nuevas vías genéticas de riesgo. PLoS Genet. 8, e1002843 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Xie, L. et al. Variantes raras de novo del número de copias en pacientes con atresia pulmonar congénita. PLoS ONE 9, e96471 (2014).

Artículo PubMed PubMed Central Google Académico

Glessner, JT et al. Aumento de la frecuencia de las variantes del número de copias de novo en la cardiopatía congénita mediante el análisis integrador de la matriz de polimorfismos de un solo nucleótido y los datos de la secuencia del exoma. Circ. Res. 115, 884–896 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Sánchez-Castro, M. et al. La búsqueda de variantes raras del número de copias en defectos cardíacos congénitos identifica nuevos genes candidatos y un papel potencial para FOXC1 en pacientes con coartación de la aorta. Circ. Cardiovasc. Gineta. 9, 86–94 (2016).

Artículo CAS PubMed Google Académico

Costain, G. et al. Las variaciones del número de copias raras en todo el genoma contribuyen al riesgo genético de transposición de las grandes arterias. En t. J. Cardiol. 204, 115–121 (2016).

Artículo PubMed Google Académico

Ma, L. et al. LncBook: una base de conocimientos seleccionada de ARN largos no codificantes humanos. Ácidos Nucleicos Res. 47, D128–D134 (2019).

Artículo CAS PubMed Google Académico

Li, Z. et al. LncBook 2.0: integración de ARN largos no codificantes humanos con anotaciones multiómicas. Ácidos Nucleicos Res. https://doi.org/10.1093/nar/gkac999 (2022).

Zhang, X. et al. FGD5-AS1 es un ceRNA hub lncRNA en corazones con tetralogía de Fallot que regula genes de enfermedades cardíacas congénitas transcripcional y epigenéticamente. Frente. Desarrollo celular Biol. 9, 630634 (2021).

Artículo PubMed PubMed Central Google Académico

Zhang, J., Liu, L., Li, J. y Le, TD LncmiRSRN: identificación y análisis de la red reguladora de esponja miARN relacionada con ARN no codificante largo en el cáncer humano. Bioinformática 34, 4232–4240 (2018).

Artículo CAS PubMed Google Académico

Abrahams, BS et al. SFARI Gene 2.0: una base de conocimientos impulsada por la comunidad para los trastornos del espectro autista (TEA). mol. Autismo 4, 36 (2013).

Artículo PubMed PubMed Central Google Académico

Morton, SU, Quiat, D., Seidman, JG y Seidman, CE Fronteras genómicas en cardiopatías congénitas. Nat. Rev. Cardiol. 19, 26–42 (2022).

Artículo PubMed Google Académico

Zhao, W. et al. Análisis de alta resolución de las variantes del número de copias en adultos con cardiopatía congénita de simple a moderada. Soy. J.Med. Gineta. A 161A, 3087–3094 (2013).

Artículo PubMed Google Académico

Alexanian, M. y Ounzain, S. ARN no codificantes largos en el desarrollo cardíaco. Harb de primavera fría. Perspectiva. Biol. https://doi.org/10.1101/cshperspect.a037374 (2020).

Yang, L. et al. CHDGKB: una base de conocimientos para la comprensión sistemática de las variaciones genéticas asociadas con la cardiopatía congénita no sindrómica. Base de datos (Oxford). https://doi.org/10.1093/database/baaa048 (2020).

Quinlan, AR & Hall, IM BEDTools: un conjunto flexible de utilidades para comparar características genómicas. Bioinformática 26, 841–842 (2010).

Artículo CAS PubMed PubMed Central Google Scholar

Yu, G., Wang, LG, Han, Y. & He, QY clusterProfiler: un paquete R para comparar temas biológicos entre grupos de genes. OMICS 16, 284–287 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Hao, Y. et al. NPInter v3.0: una base de datos actualizada de interacciones asociadas al ARN no codificante. Base de datos (Oxford). https://doi.org/10.1093/database/baw057 (2016).

Chou, CH et al. Actualización de miRTarBase 2018: un recurso para interacciones microARN-objetivo validadas experimentalmente. Ácidos Nucleicos Res. 46, D296–D302 (2018).

Artículo CAS PubMed Google Académico

Vlachos, IS et al. DIANA-TarBase v7.0: indexación de más de medio millón de interacciones miRNA:mRNA respaldadas experimentalmente. Ácidos Nucleicos Res. 43, D153–D159 (2015).

Artículo CAS PubMed Google Académico

Kopylova, E., Noe, L. & Touzet, H. SortMeRNA: filtrado rápido y preciso de ARN ribosomal en datos metatranscriptómicos. Bioinformática 28, 3211–3217 (2012).

Artículo CAS PubMed Google Académico

Dobin, A. et al. STAR: alineador RNA-seq universal ultrarrápido. Bioinformática 29, 15–21 (2013).

Artículo CAS PubMed Google Académico

Liao, Y., Smyth, GK & Shi, W. featureCounts: un programa eficiente de propósito general para asignar lecturas de secuencias a características genómicas. Bioinformática 30, 923–930 (2014).

Artículo CAS PubMed Google Académico

Love, MI, Huber, W. & Anders, S. Estimación moderada de cambio de pliegue y dispersión para datos de RNA-seq con DESeq2. Genoma Biol. 15, 550 (2014).

Artículo PubMed PubMed Central Google Académico

Cardoso-Moreira, M. et al. Expresión génica en el desarrollo de órganos de mamíferos. Naturaleza 571, 505–509 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Strober, BJ y col. Regulación genética dinámica de la expresión génica durante la diferenciación celular. Ciencia 364, 1287–1290 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Kent, WJ et al. El navegador del genoma humano en la UCSC. Genoma Res. 12, 996–1006 (2002).

Artículo CAS PubMed PubMed Central Google Scholar

Tonidandel, S. & LeBreton, JM RWA Web: una herramienta gratuita, completa, basada en la web y fácil de usar para análisis de peso relativo. J. Autobús. psicol. 30, 207–216 (2015).

Artículo Google Académico

Sicko, RJ et al. Variantes genéticas en la anomalía de ebstein aislada implicadas en las vías de desarrollo del miocardio. PLoS ONE 11, e0165174 (2016).

Artículo PubMed PubMed Central Google Académico

Yagi, H. et al. Papel de TBX1 en el síndrome humano del22q11.2. Lancet 362, 1366–1373 (2003).

Artículo CAS PubMed Google Académico

Descargar referencias

Agradecemos a todos los participantes por su colaboración en esta investigación. También agradecemos a la Sra. MJ Zhou de Fresenius Medical Care por editar el texto en inglés de un borrador de este manuscrito. Este trabajo fue apoyado por el Programa Nacional Clave de I+D de China [2021YFC2701104 hasta Qh.F.]; Fundación Nacional de Ciencias Naturales de China [82172352 a BW, 82072372 a Qh.F.]; Comisión de Ciencia, Tecnología y Economía de Pudong [PKJ2022-Y04 a BW]; Centro Nacional de Medicina Traslacional (Shanghái) [TMSK-2021-133 para BW]; y Shanghai Municipal Science and Technology [20JC1418500, 21Y31900300 y 20dz2260900 a Qh.F.].

Estos autores contribuyeron por igual: Yibo Lu, Qing Fang, Ming Qi.

Instituto de Medicina Traslacional Pediátrica, Centro Médico Infantil de Shanghái, Facultad de Medicina, Universidad Jiao Tong de Shanghái, Shanghái, China

Yibo Lu, Qing Fang, Ming Qi, Xingyu Zhang, Yuwan Lin, Ying Xiang, Qihua Fu y Bo Wang

Departamento de Genética Médica y Laboratorio de Diagnóstico Molecular, Centro Médico Infantil de Shanghái, Facultad de Medicina, Universidad Jiao Tong de Shanghái, Shanghái, China

Xiaoliang Li

Laboratorio Clave de Shanghai de Diagnóstico Clínico Molecular para Pediatría, Shanghai, China

Ying Xiang, Qihua Fu y Bo Wang

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

Yb.L. y BW contribuyó con la revisión de la literatura, el diseño del estudio, la recopilación de datos, el análisis de datos, la interpretación de datos y la redacción del manuscrito; QF, MQ, XL, Yw.L. y XZ contribuyeron con la recopilación de datos, la validación experimental, la interpretación de datos y la preparación del manuscrito; YX, Qh.F. y BW contribuyeron con la supervisión de todos los aspectos del estudio y la preparación del manuscrito. Los autores leyeron y aprobaron el manuscrito final.

Correspondencia a Ying Xiang, Qihua Fu o Bo Wang.

Los autores declaran no tener conflictos de intereses.

Communications Biology agradece a Marlin Touma y a los otros revisores anónimos por su contribución a la revisión por pares de este trabajo. Editor principal de manejo: George Inglis. Los informes de los revisores están disponibles.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Lu, Y., Fang, Q., Qi, M. et al. Los lncRNA asociados con la variación del número de copias pueden contribuir a las etiologías de la cardiopatía congénita. Comun Biol 6, 189 (2023). https://doi.org/10.1038/s42003-023-04565-z

Descargar cita

Recibido: 23 junio 2022

Aceptado: 08 febrero 2023

Publicado: 17 febrero 2023

DOI: https://doi.org/10.1038/s42003-023-04565-z

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.

COMPARTIR