Los datos utilizados para crear algoritmos que detectan enfermedades de la piel son demasiado blancos

La mayoría de las imágenes no tienen buena información sobre el tono de piel.

Los conjuntos de datos públicos de imágenes de la piel que se utilizan para entrenar algoritmos para detectar problemas de la piel no incluyen suficiente información sobre el tono de la piel, según un nuevo análisis . Y dentro de los conjuntos de datos donde está disponible la información del tono de piel, solo una pequeña cantidad de imágenes son de piel más oscura, por lo que los algoritmos creados con estos conjuntos de datos pueden no ser tan precisos para las personas que no son blancas.

El estudio, publicado hoy en The Lancet Digital Health , examinó 21 conjuntos de datos de acceso gratuito a imágenes de afecciones de la piel. Combinados, contenían más de 100.000 imágenes. Un poco más de 1.400 de esas imágenes tenían información adjunta sobre el origen étnico del paciente, y solo 2.236 tenían información sobre el color de la piel. Esta falta de datos limita la capacidad de los investigadores para detectar sesgos en los algoritmos entrenados en las imágenes. Y estos algoritmos podrían muy bien estar sesgados: de las imágenes con información sobre el tono de la piel, solo 11 eran de pacientes con las dos categorías más oscuras en la escala de Fitzpatrick, que clasifica el color de la piel. No hubo imágenes de pacientes de origen africano, afrocaribeño o del sur de Asia.

Las conclusiones son similares a las de un estudio publicado en septiembre , que también encontró que la mayoría de los conjuntos de datos utilizados para entrenar algoritmos dermatológicos no tienen información sobre el origen étnico o el tono de la piel. Ese estudio examinó los datos detrás de 70 estudios que desarrollaron o probaron algoritmos y encontró que solo siete describían los tipos de piel en las imágenes utilizadas.

                                Anuncio

«Lo que vemos en la pequeña cantidad de artículos que informan sobre las distribuciones de los tonos de piel es que muestran una representación insuficiente de los tonos de piel más oscuros», dice Roxana Daneshjou, académica clínica en dermatología de la Universidad de Stanford y autora del artículo de septiembre. Su artículo analizó muchos de los mismos conjuntos de datos que la nueva investigación de Lancet y llegó a conclusiones similares.

Cuando las imágenes de un conjunto de datos están disponibles públicamente, los investigadores pueden revisar qué tonos de piel parecen estar presentes. Pero eso puede ser difícil, porque las fotos pueden no coincidir exactamente con el tono de piel en la vida real. “La situación más ideal es que se observe el tono de la piel en el momento de la visita clínica”, dice Daneshjou. Luego, la imagen del problema de la piel de ese paciente podría etiquetarse antes de ingresar a una base de datos.

Sin etiquetas en las imágenes, los investigadores no pueden verificar los algoritmos para ver si están construidos usando conjuntos de datos con suficientes ejemplos de personas con diferentes tipos de piel.

Es importante analizar estos conjuntos de imágenes porque a menudo se utilizan para crear algoritmos que ayudan a los médicos a diagnosticar a los pacientes con afecciones de la piel, algunas de las cuales, como los cánceres de piel, son más peligrosas si no se detectan a tiempo. Si los algoritmos solo se han entrenado o probado en pieles claras, no serán tan precisos para todos los demás. «La investigación ha demostrado que los programas entrenados en imágenes tomadas de personas con tipos de piel más claros pueden no ser tan precisos para las personas con piel más oscura, y viceversa», dice David Wen, coautor del nuevo artículo e investigador de la Universidad de Oxford.

Siempre se pueden agregar nuevas imágenes a los conjuntos de datos públicos, y los investigadores quieren ver más ejemplos de afecciones en pieles más oscuras. Y mejorar la transparencia y claridad de los conjuntos de datos ayudará a los investigadores a rastrear el progreso hacia conjuntos de imágenes más diversos que podrían conducir a herramientas de IA más equitativas. “Me gustaría ver más datos abiertos y más datos bien etiquetados”, dice Daneshjou.

Fuente: theverge

 

Artículos Relacionados

DEJA UN COMENTARIO:

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.