Article

Sep 24, 2025

Análisis al estudio de Harinath et al. sobre el sistema Genius Digital Diagnostics (Hologic) y Ruta de innovación en IA para conseguír autonomía tecnológica en el dominio de la citología cervico-vaginal

Análisis al estudio de Harinath et al. sobre el sistema Genius Digital Diagnostics (Hologic) y Ruta de innovación en IA para conseguír autonomía tecnológica en el dominio de la citología cervico-vaginal © 2025 Andric Guerrero E. — CC-BY-NC-4.0

La inteligencia artificial (IA) ha comenzado a transformar la práctica de la patología y la citología. Una de las áreas más sensibles es la detección de lesiones intraepiteliales escamosas de alto grado (HSIL) en citologías cervicales tipo Pap, dado que de su correcta identificación depende el diagnóstico oportuno de lesiones precancerosas y cáncer cervicouterino.


Un reciente estudio publicado en Cancer Cytopathology (Harinath et al., 2025) evaluó el rendimiento del sistema digital Genius Digital Diagnostics (Hologic). Pero, ¿qué tan sólido es este trabajo y qué limitaciones debemos tener en cuenta?


Resumen rápido del estudio

• El objetivo fue evaluar la sensibilidad de diagnóstico de HSIL (lesión intraepitelial escamosa de alto grado) en citologías tipo Pap asistidas por el sistema digital-AI Genius Digital Diagnostics System (Genius / GDDS) de Hologic.

• Emplearon una muestra de 890 citologías ThinPrep digitalizadas, de las cuales 183 casos eran citologías originalmente interpretadas como HSIL confirmadas por biopsia (CIN2+) y seleccionadas para el análisis.

• Tres patólogos revisaron de forma independiente las imágenes generadas por el sistema. Se calcularon sensibilidades con distintos umbrales diagnósticos (ASC-US y superior, LSIL y superior, ASC-H y superior). También evaluaron concordancia interobservador mediante el coeficiente de Kendall’s W (~0,722).



Crítica: qué hicieron bien y qué aspectos podrían mejorar o cuestionarse


Aspectos positivos / fortalezas

1. Enfoque clínico relevante

HSIL es una categoría con implicancias clínicas importantes (riesgo de lesiones precancerosas o cáncer cervical). Validar cómo un sistema asistido por IA se desempeña en esta categoría es relevante para la práctica citopatológica.

2. Uso de “gold standard”

Comparan los diagnósticos del sistema + patólogos con la biopsia (CIN2+) como estándar de referencia, lo cual es lo adecuado para evaluar sensibilidad diagnóstica.

3. Muestra relativamente grande para un estudio de validación interna

Aunque el análisis principal se centra en 183 casos confirmados de HSIL, tuvieron inicialmente 890 muestras digitalizadas, lo que da un marco más robusto al estudio global.

4. Evaluación de variabilidad interobservador

No basta con sensibilidad: también examinar cómo los diferentes patólogos interpretan las imágenes es crucial, especialmente en tecnología nueva. El uso del coeficiente de Kendall W es apropiado para medir concordancia ordinal entre evaluadores.

5. Transparencia en las limitaciones declaradas

Los autores reconocen que solo pudieron calcular sensibilidad (porque los casos estaban preseleccionados como HSIL) y que muchas interpretaciones fueron realizadas como categorías menos precisas (ASC-H) en lugar de HSIL directo.

6. Desconocimiento del historial clínico/hpv/original

Para evitar sesgo de conocimiento, los revisores no tenían acceso a datos clínicos, diagnóstico original, ni estado de HPV al interpretar las imágenes. Esto ayuda a que la evaluación esté basada solo en la morfología digital.

Limitaciones, debilidades o aspectos cuestionables

1. Selección de casos preseleccionados

El estudio solo incluyó casos que previamente se interpretaron como HSIL y que tenían confirmación histológica de CIN2+. Es decir, no evaluó la especificidad, los falsos positivos, ni el rendimiento global en una población no preseleccionada. Los autores admiten que sólo la sensibilidad puede calcularse en este diseño.

Esto implica que no conocemos cuántos casos “normales” el sistema podría clasificar incorrectamente como HSIL u otras categorías, lo que limita la comprensión de su balance entre sensibilidad y especificidad.

2. Ausencia de un grupo control “no HSIL”

Para determinar aspectos como tasa de falsos positivos, valor predictivo positivo, especificidad, etc., se necesita una muestra representativa de casos negativos o de otras categorías citológicas. Pero en este estudio no se contemplan.

3. Dependencia del sistema + patólogos combinados

Los diagnósticos no son producto puramente autónomo de la IA, sino del sistema asistido. Los patólogos veían las “objetos de interés” sugeridos por el sistema y luego interpretaban. Esto hace que las mejoras puedan deberse tanto al sistema como al ojo humano que trabaja alrededor del sistema, dificultando evaluar el aporte aislado de la IA.

4. Curva de aprendizaje / familiaridad con la tecnología

Los revisores fueron entrenados durante solo 2 días para usar el sistema, lo cual puede ser insuficiente para dominar una plataforma digital nueva y podría influir en performance (subdiagnósticos o sobrediagnósticos).

Si los patólogos no están completamente familiarizados con cómo el sistema muestra las imágenes, puede haber errores atribuibles más al “usuario vs interfaz” que al algoritmo en sí.

5. No se analiza el tiempo de interpretación ni eficiencia

Aunque muchos estudios de sistemas con IA también reportan cuántos minutos/unidades de tiempo se ahorra, este artículo no enfatiza el impacto en tiempo o carga de trabajo (o al menos no lo resalta como resultado principal). (Puede que en otros trabajos del mismo grupo lo hagan).

6. Interpretaciones intermedias frecuentes (ASC-H / AGC) en lugar de HSIL directo

Una proporción significativa de los casos fueron clasificados no como HSIL, sino como categorías intermedias como ASC-H, AGC, etc. Esto sugiere que incluso con la ayuda del sistema, los revisores (o el sistema) tienden a usar categorías menos precisas cuando tienen dudas.

Esto plantea la pregunta de hasta qué punto el sistema mejora la especificidad o la certeza diagnóstica, más allá de la mera sensibilidad.

7. Coeficiente de concordancia no perfecto

Aunque Kendall’s W = 0,722 indica “fuerte” concordancia según estándares, no es concordancia perfecta. Hay discrepancias entre patólogos en algunos casos. Eso no es necesariamente un error, pero muestra que no hay unanimidad perfecta.

8. Potencial conflicto de interés / financiamiento / involucramiento del fabricante

Aunque no se detecta explícitamente un conflicto de interés declarado como financiamiento directo, hay mención de que representantes de Hologic participaron en la capacitación del personal local.

Es importante que en estudios con tecnologías comerciales se declare claramente independencia analítica y evitar sesgos inducidos por el fabricante.

9. Falta de métricas más amplias (ROC, AUC, tasa de falsos negativos/positivos, etc.)

Dado que solo casos positivos fueron analizados, no se presentan curvas ROC, valores predictivos positivos/negativos completos, exactitud en población general, etc. Esto limita la generalización de los hallazgos.

10. Generalización limitada / posible sesgo de centro único

El estudio se realizó en un solo centro universitario con experiencia en citopatología digital. Los resultados podrían no replicarse en laboratorios con distinta experiencia, calidad de muestra, variabilidad técnica, diferencias en preparación de citologías, etc.


Qué sabemos públicamente sobre la arquitectura de Hologic Genius / Genius Cervical AI

No encontré documentación pública completa que describa la arquitectura exacta (por ejemplo, número de capas, tipo de red, tamaño de embedding) del modelo interno de Hologic. Sin embargo, la propia documentación técnica del dispositivo (“Instructions for Use”, manuales) sí ofrece pistas útiles generales de su funcionamiento. En el manual del Genius Digital Imager aparece una afirmación interesante:

“A convolutional neural network was created based on a modification of the MobileNet CNN architecture, with added layers.”

Esa frase sugiere que al menos una parte del modelo es una red convolucional (CNN), basada o derivada de MobileNet, con modificaciones adicionales. No indica explícitamente que usen transformers ni embeddings de atención profunda (como en modelos tipo transformer), al menos no en la parte visible del manual.

1. Qué hace el algoritmo (según el manual de uso)

• El algoritmo está diseñado para identificar objetos de interés (objects of interest, OOI) en la imagen completa digitalizada de la lámina ThinPrep, y presentar los más clínicamente relevantes en una galería para revisión.

• Clasifica cada célula identificada mediante un modelo de aprendizaje profundo entrenado para reconocer características morfológicas (por ejemplo, presencia de núcleos agrandados, morfología celular, posibles cambios citológicos) sobre imágenes 40×.

• Las células con mayor probabilidad de anormalidad son agrupadas en filas (según morfología parecida) y presentadas al citólogo / patólogo para su evaluación.

• Si el usuario (patólogo) tiene dudas tras revisar la galería, debe recurrir al examen directo del portaobjetos bajo microscopio (esto lo admiten los manuales como limitación).

Entonces según documentación oficial, el sistema usa una red convolucional modificada (basada en MobileNet) para clasificar células y seleccionar objetos de interés, no un modelo de atención tipo transformer que produzca una salida diagnóstica autónoma. Por tanto, sigue siendo un sistema de apoyo, no un diagnóstico independiente. Es posible que internamente en la arquitectura del código utilicen más componentes avanzados, ocultos por propiedad intelectual.



Hacia un sistema de IA propio y más robusto

Si bien el sistema Hologic Genius representa un avance en digitalización y apoyo al diagnóstico, su lógica sigue siendo la de un filtro de selección con base en CNN. Esto es útil, pero insuficiente frente a lo que la IA moderna puede ofrecer. La propuesta es ir más allá: diseñar un modelo propio, adaptado a la realidad de nuestros pacientes y muestras, basado en arquitecturas de última generación:

1. Uso de Vision Transformers (ViT)

• Los ViT permiten analizar las láminas digitales no solo como un conjunto de células aisladas, sino como un mosaico contextual en el que se preservan patrones espaciales y relaciones arquitectónicas.

• A diferencia de las CNN, los transformers generan representaciones vectoriales en espacios de alta dimensión, capaces de capturar matices morfológicos sutiles en núcleos, citoplasma y organización celular.

2. Modelos híbridos (CNN + ViT)

• Un enfoque mixto, con un “stem” convolucional que extraiga detalles locales de alta resolución y un encoder transformer que integre la información contextual, puede superar las limitaciones de cada arquitectura por separado.

• Esto es especialmente útil en citología, donde se requiere tanto precisión morfológica (micronúcleos, halos perinucleares, alteraciones nucleares) como comprensión de patrones globales.

3. Entrenamiento en nuestra propia realidad peruana

• Muchos sistemas comerciales se entrenan en bases de datos externas (EE.UU., Europa), que no siempre reflejan la epidemiología ni las características de las muestras locales.

• Entrenar un modelo con datos de nuestros hospitales y laboratorios garantizaría mayor precisión, reduciendo falsos positivos/negativos en nuestra población.

4. Aplicaciones potenciales

• Asistencia diagnóstica: señalar regiones de interés y proponer un diagnóstico probabilístico (ejemplo: “probabilidad de HSIL = 87 %”).

• Cribado poblacional: clasificar de forma autónoma las láminas como negativas, dudosas o positivas para revisión prioritaria.

• Estandarización: generar reportes cuantitativos y comparables, reduciendo la variabilidad entre observadores.




De la crítica a la propuesta: hacia un modelo propio y encarnado en la realidad local

Contar con copilotos diagnósticos basados en IA ayuda, pero no resuelve la necesidad de un diagnóstico autónomo y estandarizado. Si de verdad queremos revolucionar la citología en nuestro país, podríamos plantear algo más ambicioso: entrenar nuestros propios modelos híbridos de última generación, usando tanto CNN como Vision Transformers, con datos locales, para reflejar las características de nuestras muestras y pacientes.

Una propuesta innovadora realizada hace años constaba de un sistema en dos fases:

1. Cribado rápido a baja resolución: un modelo ligero que clasifique de manera binaria (negativo vs sospechoso) a partir de escaneos de baja calidad. Esto permitiría superar el cuello de botella de las láminas convencionales, que pueden tardar hasta 7 horas en digitalizarse completamente.

2. Diagnóstico de alta precisión: un segundo modelo, más complejo y entrenado con alta resolución, revisaría solo las láminas sospechosas, garantizando sensibilidad y especificidad sin colapsar la infraestructura tecnológica.

El siguiente paso sería encarnar estos modelos en dispositivos humanoides diseñados para interactuar con la realidad de los laboratorios en provincias: brazos, manos y sistemas ópticos capaces de manipular y analizar láminas convencionales, incluso en entornos sin citología en base líquida. Estos humanoides serían un puente entre la IA de vanguardia y la infraestructura clásica de los laboratorios, realizando el cribado inicial y conectándose con instituciones de referencia para la confirmación.

Esto no es solo ciencia ficción: es la forma más realista de llevar la IA de vanguardia a todos los rincones del país, democratizando el diagnóstico y superando barreras de costo y acceso. De la crítica al sistema actual surge, entonces, una necesidad urgente de innovación local, donde el entrenamiento de nuestros propios modelos híbridos y su implementación en dispositivos físicos se conviertan en el núcleo de una estrategia nacional contra el cáncer cervicouterino.


Flujo de trabajo:

1. Primer modelo: cribado rápido con baja resolución

• Arquitectura: híbrida CNN + Transformer (ConvStem para extracción local + encoder transformer para contexto global). Podríamos intentar probar con nuevas arquitecturas no transformer.

• Objetivo: clasificar láminas digitalizadas a baja resolución en dos categorías: negativas vs sospechosas de displasia. Son clases básicas principales para el siguiente Step. Podémos agregar mas clases: indeterminado, artefactos, no adecuada, etc.

• Ventaja: evita escanear completamente en alta resolución cada lámina (que puede tardar 7 horas en citología convencional).

• Entrenamiento: dataset balanceado con casos positivos y negativos locales, incluyendo tinciones convencionales. También recomiendo laminas mal procesadas como parte del sistema de clasificación, para enriquecer los vectores.

2. Segundo modelo: diagnóstico de precisión en alta resolución

• Arquitectura: Vision Transformer puro o híbrido avanzado. Podríamos intentar probar con nuevas arquitecturas no transformer.

• Objetivo: analizar regiones sospechosas con aumentos de 25–40X, suficientes para capturar morfología nuclear, patrón de tinción y distribución celular.

• Salida: diagnóstico probabilístico (ej. “HSIL 0.87 prob.”) con mapas de atención o heatmaps que indiquen las áreas críticas.

• Entrenamiento paralelo o secuencial: podría entrenarse junto con el modelo de cribado o después, usando como entrada solo las láminas marcadas como sospechosas.

3. Interfaz de encarnación física

• Diseño humanoide funcional: la movilidad no requiere necesariamente un sistema bípedo, pudiendo resolverse de manera más eficiente con una base móvil con ruedas motorizadas, capaz de desplazarse en entornos planos de laboratorio. En instalaciones que incluyen escaleras, múltiples niveles o zonas de difícil acceso, se justificaría la incorporación de versiones humanoides con locomoción bípeda o sistemas híbridos (ruedas + patas robóticas).

Adicionalmente, se plantea el desarrollo de humanoides con integración de hardware óptico propio —microscopios digitales de campo claro, escáneres de portaobjetos o módulos de captura multifocal— embebidos en su estructura. Esta integración elimina la dependencia de equipos externos y permitiría que las láminas sean manipuladas, enfocadas y digitalizadas dentro del propio humanoide, reduciendo tiempos y variabilidad.

De este modo, el humanoide no solo ejecuta funciones de manipulación robótica de portaobjetos mediante actuadores de alta precisión en sus manos o dedos, sino que también incorpora un sistema de visión computacional embebido, enlazado directamente con los modelos de IA de cribado y diagnóstico. Esto convierte al dispositivo en una plataforma autónoma de análisis morfológico, capaz de funcionar en laboratorios convencionales con mínima infraestructura adicional.

• Requisitos:

• Manos/dedos robóticos con suficiente precisión para manipular portaobjetos y microscopios convencionales.

• Visión artificial integrada para alinear láminas, enfocar, usar microscopios convencionales, PC, teclados, mouse y alimentar imágenes al pipeline IA.

• Función: servir como puente entre IA y laboratorios clásicos que no cuentan con citología líquida o patología digital, permitiendo automatizar cribado y diagnóstico preliminar incluso en entornos con recursos limitados.

4. Pipeline de trabajo integrado

1. El humanoide manipula lámina convencional → digitalización rápida (baja resolución).

2. Modelo 1 (cribado) descarta negativas y selecciona sospechosas.

3. Solo las sospechosas se escanean en alta resolución → Modelo 2 (diagnóstico de precisión) genera predicciones detalladas.

4. Los resultados se envían automáticamente al laboratorio de referencia o a la nube para integración clínica.

5. Impacto esperado

• Reducción de tiempos de procesamiento: de horas a minutos en el cribado inicial.

• Democratización del acceso: aplicable en laboratorios que aún trabajan solo con láminas convencionales.

• Estándar nacional propio: modelos entrenados con datos locales, adaptados a la epidemiología real.

• IA encarnada: dispositivos físico-digitales capaces de integrarse con la rutina de laboratorio, sin exigir una infraestructura nueva costosa.

Conclusión

El estudio analizado confirma que los sistemas de IA para citología cervical pueden aumentar la sensibilidad en escenarios controlados, pero su diseño —centrado en casos HSIL preseleccionados, sin estimar especificidad ni eficiencia operativa— impide extrapolar el beneficio clínico neto a flujos reales de cribado. Persisten, además, la variabilidad interobservador y la ausencia de métricas clave (tiempos, carga de trabajo, falsos positivos/negativos en poblaciones mixtas), lo que subraya que hoy la IA comercial funciona más como asistencia de lectura que como diagnóstico autónomo.

Frente a ello, proponemos un pipeline en dos etapas (cribado rápido a baja resolución → diagnóstico de precisión en alta resolución) soportado por modelos híbridos CNN-ViT y entrenado con datos locales. Este enfoque prioriza la triage eficiente (evita escanear íntegramente todas las láminas), focaliza recursos en los casos sospechosos y, al incorporar mapas de atención y probabilidades calibradas, mejora trazabilidad y auditabilidad. El despliegue “encarnado” en humanoides funcionales —con óptica integrada y base móvil— añade estandarización de la manipulación, reduce la dependencia de infraestructura costosa y conecta laboratorios periféricos con centros de referencia mediante interoperabilidad en la nube.

Para demostrar valor clínico y no solo desempeño técnico, los próximos pasos deben incluir: (1) validaciones multicéntricas con cohortes consecutivas (positivos y negativos) y endpoints clínicos pre-registrados; (2) reportes completos (sensibilidad, especificidad, AUC, VPP/VPN, tiempo a diagnóstico, throughput y costes); (3) gobernanza de datos y seguridad (consentimiento, anonimización, control de acceso, trazas), con monitorización de deriva y recalibración; (4) evaluaciones de costo-efectividad y análisis de impacto en equidad de acceso; y (5) adopción de estándares de reporte y evaluación para IA clínica y de ciclos de mejora continua integrados al sistema de calidad del laboratorio.

En suma, la citología asistida por IA aportará beneficio tangible cuando una arquitectura escalable, explicable y validada en la realidad local se integre en un flujo clínico interoperable, con medidas de resultado clínicamente relevantes y mecanismos de supervisión que garanticen seguridad, eficiencia y justicia distributiva en la lucha contra el cáncer cervicouterino.


© 2025 Andric Guerrero E. — CC-BY-NC-4.0