Por qué el aprendizaje autosupervisado cambia las reglas del juego de la IA médica

¿No pudiste asistir a Transform 2022? ¡Vea todas las sesiones de la cumbre en nuestra biblioteca a pedido ahora! Mira aquí.


El aprendizaje autosupervisado ha sido una tendencia de rápido crecimiento en inteligencia artificial (IA) en los últimos dos años, ya que los investigadores buscan aprovechar los datos no anotados a gran escala para desarrollar mejores aprendizaje automático modelos

En 2020, Yann Lecun, científico jefe de inteligencia artificial de Meta, dijo que el aprendizaje supervisado, que implica entrenar un modelo de inteligencia artificial en un conjunto de datos etiquetados, desempeñaría un papel cada vez menor a medida que el aprendizaje supervisado se generalizara.

“La mayor parte de lo que aprendemos como humanos y la mayor parte de lo que aprenden los animales es en un modo de autosupervisión, no en un modo de refuerzo”. el dijo una audiencia de sesión virtual durante la Conferencia Internacional sobre Representación del Aprendizaje (ICLR) 2020. Y en un Publicación de metablog de 2021, LeCun explicó que el aprendizaje autosupervisado “obtiene señales de supervisión de los propios datos, a menudo aprovechando la estructura subyacente de los datos”. Por eso, puede hacer uso de una “variedad de señales de supervisión a través de modalidades concurrentes (por ejemplo, video y audio) y a través de grandes conjuntos de datos, todo sin depender de etiquetas”.

Uso creciente del aprendizaje autosupervisado en medicina

Esas ventajas han llevado a un uso cada vez mayor del aprendizaje autosupervisado en salud y medicina, gracias a la gran cantidad de datos no estructurados disponible en esa industria, incluidos registros de salud electrónicos y conjuntos de datos de imágenes médicas, señales bioeléctricas y secuencias y estructuras de genes y proteínas. Anteriormente, el desarrollo de aplicaciones médicas de aprendizaje automático requería la anotación manual de datos, a menudo por parte de expertos médicos.

Evento

MetaBeat 2022

MetaBeat reunirá a líderes de opinión para brindar orientación sobre cómo la tecnología del metaverso transformará la forma en que todas las industrias se comunican y hacen negocios el 4 de octubre en San Francisco, CA.

Registrarse aquí

Este fue un cuello de botella para el progreso, dijo Pranav Rajpurkar, profesor asistente de informática biomédica en la Escuela de Medicina de Harvard. Rajpurkar lidera un laboratorio de investigación se centró en el aprendizaje profundo para la interpretación de imágenes médicas con etiquetas eficientes, el diseño de colaboración entre el médico y la IA y la curación de puntos de referencia abiertos.

“Hemos visto muchos avances emocionantes con nuestros conjuntos de datos etiquetados”, dijo a VentureBeat, pero era necesario un “cambio de paradigma” para pasar de 100 algoritmos que realizan tareas médicas muy específicas a los miles necesarios sin pasar por un laborioso, proceso intensivo.

Ahí es donde el aprendizaje autosupervisado, con su capacidad de predecir cualquier parte no observada u oculta de una entrada a partir de cualquier parte observada o no oculta de una entrada, ha cambiado las reglas del juego.

Destacando el aprendizaje autosupervisado

En una reciente documento de revisión en Naturaleza Ingeniería BiomédicaRajpurkar, junto con el cardiólogo, científico y autor Eric Topol y el estudiante investigador Rayan Krishnan, destacaron los métodos y modelos autosupervisados ​​utilizados en medicina y atención médica, así como aplicaciones prometedoras del aprendizaje autosupervisado para el desarrollo de modelos que aprovechan conjuntos de datos multimodales. , y los desafíos en la recopilación de datos imparciales para su capacitación.

El documento, dijo Rajpurkar, tenía como objetivo “comunicar las oportunidades y los desafíos que subyacen a este cambio de paradigma que veremos en los próximos años en muchas aplicaciones de la IA, sin duda incluida la medicina”.

Con el aprendizaje autosupervisado, Rajpurkar explicó que él, “… puede aprender sobre una determinada fuente de datos, ya sea una imagen médica o una señal, mediante el uso de datos no etiquetados. Eso me permite un excelente punto de partida para realizar cualquier tarea que me interese dentro de la medicina y más allá sin tener que recopilar grandes conjuntos de datos etiquetados”.

Grandes logros desbloqueados

En 2019 y 2020, el laboratorio de Rajpurkar vio algunos de los primeros grandes logros que el aprendizaje autosupervisado estaba desbloqueando para interpretar imágenes médicas, incluidas las radiografías de tórax.

“Con algunas modificaciones a los algoritmos que nos ayudaron a comprender las imágenes naturales, redujimos la cantidad de radiografías de tórax que debían verse con una enfermedad en particular antes de que pudiéramos comenzar a identificar esa enfermedad”, dijo.

Rajpurkar y sus colegas aplicaron principios similares a los electrocardiogramas.

“Demostramos que con algunas formas de aplicar el aprendizaje autosupervisado, en combinación con un poco de información fisiológica en el algoritmo, pudimos aprovechar una gran cantidad de datos no etiquetados”, dijo.

Desde entonces, también ha aplicado el aprendizaje autosupervisado a los datos de sonido de los pulmones y el corazón.

“Lo que ha sido muy emocionante sobre el aprendizaje profundo en su conjunto, pero especialmente en los últimos uno o dos años, es que hemos podido transferir nuestros métodos muy bien entre modalidades”, dijo Rajpurkar.

Aprendizaje autosupervisado en todas las modalidades

Por ejemplo, otro artículo que se publicará próximamente mostró que incluso con ejemplos de enfermedades sin anotaciones en las radiografías de tórax, el equipo de Rajpurkar pudo detectar enfermedades en las radiografías de tórax y clasificarlas casi al nivel de los radiólogos. a través de una variedad de patologías.

“Básicamente, aprendimos de las imágenes combinadas con los informes de radiología que se dictaron en el momento de su interpretación, y combinamos estas dos modalidades para crear un modelo que podría aplicarse de manera de disparo cero, lo que significa que las muestras etiquetadas no eran necesarias para poder clasificar diferentes enfermedades”, dijo.

Ya sea que trabaje con proteínas, imágenes o texto, el proceso toma prestado el mismo tipo de marcos, métodos y terminologías de una manera más unificada que hace dos o tres años.

“Eso es emocionante para el campo porque significa que un conjunto de avances en un conjunto general de herramientas ayuda a todos los que trabajan en estas modalidades muy específicas”, dijo.

En la interpretación de imágenes médicas, que ha sido el foco de investigación de Rajpurkar durante muchos años, esto es “absolutamente revolucionario”, dijo. “En lugar de pensar en resolver los problemas de uno en uno e iterar[ing] este proceso 1000 veces, puedo resolver un conjunto mucho más grande de problemas a la vez”.

Impulso para aplicar métodos

Estas posibilidades han generado un impulso hacia el desarrollo y la aplicación de métodos de aprendizaje autosupervisados ​​en medicina y atención médica, y probablemente para otras industrias que también tienen la capacidad de recopilar datos a escala, dijo Rajpurkar, especialmente aquellas industrias que no tienen la sensibilidad asociada con datos medicos

En el futuro, agrega que está interesado en acercarse a resolver la gama completa de tareas potenciales que realiza un experto médico.

“El objetivo siempre ha sido habilitar sistemas inteligentes que puedan aumentar la accesibilidad de la medicina y la atención médica a una gran audiencia”, dijo, y agregó que lo que lo emociona es crear soluciones que no solo resuelvan un problema limitado: “Estamos trabajando hacia un mundo con modelos que combinen diferentes señales para que los médicos o pacientes puedan tomar decisiones inteligentes sobre diagnósticos y tratamientos”.

La misión de VentureBeat es ser una plaza pública digital para que los responsables de la toma de decisiones técnicas adquieran conocimientos sobre tecnología empresarial transformadora y realicen transacciones. Descubre nuestras sesiones informativas.

Leave a Comment

Your email address will not be published.