Los investigadores amplían y actualizan el recurso del Proyecto 1000 Genomas utilizando la secuenciación del genoma completo

Los investigadores amplían y actualizan el recurso del Proyecto 1000 Genomas utilizando secuenciación de genoma completo de alta cobertura y análisis mejorado

El resumen gráfico del estudio. Crédito: Marta Byrska-Bishop (Centro del Genoma de Nueva York)

Hace siete años, el Proyecto 1000 Genomas (1kGP) publicó un recurso de acceso abierto basado principalmente en datos de secuenciación del genoma completo (WGS) de baja cobertura de 2504 individuos de 26 poblaciones que representan cinco regiones continentales del mundo, lo que lo convierte en el primer gran Esfuerzo WGS a gran escala para entregar un catálogo de la variación genética humana.

Ahora, los investigadores del Centro del Genoma de Nueva York (NYGC), en colaboración con grupos del Hospital General de Massachusetts, la Universidad de Yale y el Consorcio de Variación Estructural del Genoma Humano (HGSVC), han ampliado el recurso 1kGP para incluir casi todos los tríos de padres e hijos en la colección, junto con las muestras originales, y las secuenciaron con alta cobertura utilizando instrumentos Illumina NovaSeq. El estudio, publicado en Célulapresenta análisis integrales de los datos WGS de alta cobertura en la cohorte 1kGP ampliada que ahora consta de 3202 muestras, incluidos 602 tríos.

“La cohorte del Proyecto 1000 Genomas es un recurso tan valioso que sentimos que sería útil para la comunidad actualizar la secuenciación con la última versión de la tecnología de lectura corta y agregar la riqueza de las muestras familiares previamente omitidas”. explicó Michael Zody, Ph.D., director científico de biología computacional en NYGC y autor principal del estudio.

Utilizando métodos y algoritmos de última generación, los investigadores del NYGC secuenciaron el ADN derivado de líneas celulares linfoblastoides (LCL, es decir, células B humanas inmortalizadas de sangre periférica) de la cohorte ampliada hasta una profundidad específica de cobertura genómica 30X. A continuación, el grupo realizó un solo nucleótido variar (SNV) y llamada de inserción y eliminación corta (INDEL), que consiste en la identificación de sitios variantes a partir de los datos de secuencia relativos a la Genoma humano referencia y genotipado de sitios variantes descubiertos en todas las muestras de la cohorte.

Además, un equipo del grupo del Dr. Michael Talkowski en la Escuela de Medicina de Harvard, el Instituto Broad y el Hospital General de Massachusetts, en colaboración con el grupo del Dr. Ira Hall en la Universidad de Yale y la Escuela de Medicina de la Universidad de Washington, así como el HGSVC, descubrió y genotiparon un conjunto integral de variantes estructurales (SV) en las 3202 muestras de 1kGP mediante la integración de múltiples enfoques analíticos.

En general, el estudio muestra mejoras significativas tanto en el poder de descubrimiento como en la precisión de las llamadas variantes, especialmente entre los SNV raros, así como los INDEL y SV que abarcan el espectro de frecuencia, que antes eran inaccesibles con la secuenciación de baja cobertura.

Un aspecto importante del recurso 1kGP original es su uso como panel de referencia para la imputación de variantes, es decir, la inferencia estadística de genotipos no observados en muestras dispersas basadas en matrices basadas en agrupaciones de variantes que normalmente se heredan juntas en la población aprendida de la referencia. panel, que facilitó numerosos estudios de asociación del genoma completo (GWAS). Ahora, con la expansión del recurso original, el equipo actualizó el panel de imputación de referencia para incluir más variantes descubiertas a través de WGS de alta cobertura y familias de tríos.

“El nuevo panel de imputación incluye más sitios, especialmente muchos INDEL y SV más comunes, lo que amplía el número de variantes accesibles para GWAS que, dado el gran tamaño del efecto de la variación no SNV, es probable que permita el descubrimiento de nuevas asociaciones genéticas que ayudar a identificar la variante causal”, explica Marta Byrska-Bishop, Ph.D., científica sénior en bioinformática del NYGC y coautora del estudio.

Todos los datos de secuencia sin procesar y los conjuntos de llamadas de variantes se publicaron de inmediato al público después de completar la secuenciación a través de varios repositorios de datos genómicos, incluido el International Genome Sample Resource (IGSR), que es mantenido por coautores del Instituto Europeo de Bioinformática en el Laboratorio Europeo de Biología Molecular. (EMBL-EBI).

“Nuestro objetivo es que este recurso público sirva como punto de referencia para futuros estudios genéticos de población y desarrollo de métodos”, agrega Xuefang Zhao, Ph.D., becario postdoctoral en el Centro de Medicina Genómica del Hospital General de Massachusetts y coautor del estudio. autor.

Los datos ya han despertado el interés de la comunidad de genética y genómica. Es probable que esto continúe en los próximos años gracias a la naturaleza de acceso totalmente abierto de las muestras de 1kGP que, a diferencia de la mayoría de los esfuerzos de WGS emergentes, están autorizados para la distribución pública de genético datos sin restricción de acceso o uso.


Una nueva forma de encontrar variaciones genéticas elimina el sesgo del genotipado humano


Más información:
Marta Byrska-Bishop et al, Secuenciación del genoma completo de alta cobertura de la cohorte ampliada del Proyecto 1000 Genomes que incluye 602 tríos, Célula (2022). DOI: 10.1016/j.cell.2022.08.004

Información de registro:
Célula


Proporcionado por el Centro del Genoma de Nueva York

Cotizar: Los investigadores amplían y actualizan el recurso del Proyecto 1000 Genomas utilizando la secuenciación del genoma completo (2022, 1 de septiembre) consultado el 1 de septiembre de 2022 en https://medicalxpress.com/news/2022-09-genomes-resource-whole-genome-sequencing. html

Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.

Leave a Comment

Your email address will not be published.