19.04.2021 - Max-Planck-Institut für molekulare Genetik

Más que la suma de mutaciones

Identificados 165 nuevos genes del cáncer con la ayuda del aprendizaje automático

Un nuevo algoritmo puede predecir qué genes causan cáncer, aunque su secuencia de ADN no esté modificada. Un equipo de investigadores de Berlín combinó una gran variedad de datos, los analizó con "inteligencia artificial" e identificó numerosos genes del cáncer. Esto abre nuevas perspectivas para la terapia dirigida del cáncer en la medicina personalizada y para el desarrollo de biomarcadores.

En el cáncer, las células se descontrolan. Proliferan y se abren paso en los tejidos, destruyendo los órganos y perjudicando así las funciones vitales esenciales. Este crecimiento descontrolado suele estar inducido por una acumulación de cambios en el ADN de los genes del cáncer, es decir, mutaciones en estos genes que rigen el desarrollo de la célula. Pero algunos cánceres tienen muy pocos genes mutados, lo que significa que en estos casos hay otras causas que provocan la enfermedad.

Un equipo de investigadores del Instituto Max Planck de Genética Molecular (MPIMG) de Berlín y del Instituto de Biología Computacional del Helmholtz Zentrum München ha desarrollado un nuevo algoritmo con tecnología de aprendizaje automático para identificar 165 genes cancerígenos hasta ahora desconocidos. Las secuencias de estos genes no están necesariamente alteradas - aparentemente, ya una desregulación de estos genes puede conducir al cáncer. Todos los genes recién identificados interactúan estrechamente con genes cancerígenos bien conocidos y han demostrado ser esenciales para la supervivencia de las células tumorales en experimentos de cultivo celular.

El algoritmo, bautizado como "EMOGI" (Explainable Multi-Omics Graph Integration), también puede explicar las relaciones en la maquinaria celular que hacen que un gen sea cancerígeno. Como describe el equipo de investigadores dirigido por Annalisa Marsico en la revista Nature Machine Intelligence, el software integra decenas de miles de conjuntos de datos generados a partir de muestras de pacientes. Estos contienen información sobre las metilaciones del ADN, la actividad de los genes individuales y las interacciones de las proteínas dentro de las vías celulares, además de los datos de la secuencia con las mutaciones. En estos datos, un algoritmo de aprendizaje profundo detecta los patrones y principios moleculares que conducen al desarrollo del cáncer.

"Idealmente, obtenemos una imagen completa de todos los genes del cáncer en algún momento, lo que puede tener un impacto diferente en la progresión del cáncer para diferentes pacientes", dice Marsico, jefe de un grupo de investigación en el MPIMG hasta hace poco y ahora en Helmholtz Zentrum München. "Esta es la base de la terapia personalizada del cáncer".

A diferencia de lo que ocurre con los tratamientos convencionales contra el cáncer, como la quimioterapia, los enfoques de la terapia personalizada adaptan la medicación con precisión al tipo de tumor. "El objetivo es seleccionar la mejor terapia para cada paciente, es decir, el tratamiento más eficaz con el menor número de efectos secundarios. Además, podríamos identificar los cánceres ya en etapas tempranas, basándonos en sus características moleculares."

"Sólo si conocemos las causas de la enfermedad podremos contrarrestarlas o corregirlas eficazmente", afirma el investigador. "Por eso es tan importante identificar el mayor número posible de mecanismos que pueden inducir cánceres".

"Hasta ahora, la mayoría de las investigaciones se han centrado en los cambios patógenos en la secuencia genética, es decir, en el plano de la célula", dice Roman Schulte-Sasse, estudiante de doctorado del equipo de Marsico y primer autor de la publicación. "Al mismo tiempo, en los últimos años se ha puesto de manifiesto que las perturbaciones epigenéticas o la desregulación de la actividad génica también pueden provocar cáncer".

Por ello, los investigadores fusionaron los datos de la secuencia que reflejan los fallos en el plano con la información que representa los acontecimientos en el interior de la célula. En un primer momento, los científicos confirmaron que las mutaciones, o la multiplicación de segmentos del genoma, son efectivamente los principales impulsores del cáncer. A continuación, en un segundo paso, identificaron los genes candidatos que se encuentran en un contexto menos directo que el gen que provoca el cáncer.

"Por ejemplo, encontramos genes cuya secuencia no se modifica en su mayor parte en el cáncer y que, sin embargo, son indispensables para el tumor porque regulan el suministro de energía", afirma Schulte-Sasse. Estos genes están fuera de control por otros medios, por ejemplo, debido a cambios químicos en el ADN como las metilaciones. Estas modificaciones dejan intacta la información de la secuencia pero rigen la actividad de un gen. "Tales genes son objetivos prometedores para los fármacos, pero como operan en segundo plano, sólo podemos encontrarlos utilizando complejos algoritmos".

El nuevo programa del investigador añade un número considerable de nuevas entradas a la lista de genes sospechosos de cáncer, que ha crecido hasta alcanzar entre 700 y 1.000 en los últimos años. Sólo mediante una combinación de análisis bioinformáticos y los más novedosos métodos de Inteligencia Artificial (IA), los investigadores pudieron rastrear los genes ocultos.

"Las interacciones de las proteínas y los genes pueden trazarse como una red matemática, conocida como gráfico", afirma Schulte-Sasse. "Se puede pensar en ello como si se tratara de adivinar una red ferroviaria; cada estación corresponde a una proteína o gen, y cada interacción entre ellos es la conexión del tren".

Con la ayuda del aprendizaje profundo -los mismos algoritmos que han ayudado a la inteligencia artificial a hacer un gran avance en los últimos años- los investigadores fueron capaces de descubrir incluso esas conexiones de trenes que antes habían pasado desapercibidas. Schulte-Sasse hizo que el ordenador analizara decenas de miles de mapas de redes diferentes de 16 tipos de cáncer distintos, cada uno de los cuales contenía entre 12.000 y 19.000 puntos de datos.

En los datos se esconden muchos más detalles interesantes. "Vemos patrones que dependen del cáncer y del tejido en particular", dice Marsico. "Vemos esto como una prueba de que los tumores se desencadenan por diferentes mecanismos moleculares en diferentes órganos".

El programa EMOGI no se limita al cáncer, subrayan los investigadores. En teoría, puede utilizarse para integrar diversos conjuntos de datos biológicos y encontrar patrones en ellos, explica Marsico. "Podría ser útil aplicar nuestro algoritmo a enfermedades igualmente complejas para las que se recogen datos multifacéticos y en las que los genes desempeñan un papel importante. Un ejemplo podrían ser las enfermedades metabólicas complejas como la diabetes".

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática.

  • Roman Schulte-Sasse, Stefan Budach, Denes Hnisz, and Annalisa Marsico; "Integration of Multi-Omics Data with Graph Convolutional Networks to Identify New Cancer Genes and their Associated Molecular Mechanisms"; Nature Machine Intelligence

Max-Planck-Institut für molekulare Genetik

Recommiende artículo PDF / Imprimir artículo

Compartir

Más sobre MPI für molekulare Genetik
  • Noticias

    Trazando el camino de la leucemia

    La linfocitosis de células B, una condición en la que los individuos tienen niveles elevados de determinados glóbulos blancos, en algunos casos conduce al cáncer de sangre. Como muestra ahora un equipo internacional de investigadores en muestras de pacientes, ambas enfermedades muestran fir ... más

    El desarrollo embrionario en una placa de Petri

    Al cultivar células madre de ratón en un gel especial, un equipo de investigación de Berlín logró hacer crecer estructuras similares a las partes de un embrión. Las estructuras similares al tronco desarrollan los precursores de los tejidos neurales, óseos, cartílagos y musculares de los gru ... más

    Andamiaje de estructuras subcelulares identificadas después de cien años

    Las motas nucleares son pequeñas aglomeraciones de proteínas en el núcleo de la célula que participan en el procesamiento de la información genética. Los investigadores de Berlín han descubierto ahora cómo se construyen las motas nucleares y fueron capaces de cerrar una brecha de larga data ... más

Más sobre Max-Planck-Gesellschaft