Detectores de IA para imagenes: Pueden las plataformas saber si una foto es real? (Parte 3)

46 detectores ia p3 1

En la Parte 1 de esta serie expliqué que la etiqueta de IA en redes sociales es un checkbox que el usuario llena manualmente, no un detector. En la Parte 2 desmonté la petición de principio: el gobierno asumió como premisa lo que debería haber demostrado como conclusión. Ahora toca la pregunta técnica que todo el mundo quiere hacer y que casi nadie responde con honestidad.

Los detectores de IA para imágenes — esas herramientas que prometen decirte si una foto es real o generada — ¿realmente funcionan?

La respuesta corta: no con la confiabilidad que necesitas para un proceso legal, para una investigación periodística seria, ni siquiera para tu tranquilidad personal.

La respuesta larga es este artículo.

Llevo 17 años en informática forense. He formado a más de 1,300 peritos en 10 países. He usado, evaluado, descartado y confrontado detectores de IA en contextos periciales donde la diferencia entre «probablemente real» y «definitivamente real» puede ser la diferencia entre una condena y una absolución. Y lo que voy a compartir aquí no es una opinión. Es el resultado de años de trabajo con estas herramientas, de observar sus aciertos, de documentar sus fallos, y de explicar esos fallos ante jueces que creían que un porcentaje en una pantalla era un veredicto.

No lo es.

Contenidos de la página

Las herramientas fallan más de lo que aciertan

Voy a empezar con un dato que debería enmarcar toda la conversación sobre detectores de IA: las tasas de error documentadas de los detectores de imágenes generadas por inteligencia artificial son inaceptables para cualquier contexto probatorio.

No estoy hablando de detectores artesanales hechos por un estudiante de programación un sábado por la tarde. Estoy hablando de los detectores desarrollados por empresas con presupuestos millonarios, equipos de investigación de primer nivel, y acceso a los datasets más grandes del mundo.

Las tasas de precisión varían según el detector, el modelo generativo que produjo la imagen, la resolución, el post-procesamiento y una docena de factores más. Pero para dar un panorama honesto:

Los mejores detectores disponibles públicamente reportan tasas de precisión entre el 80% y el 95% en condiciones controladas de laboratorio. «Condiciones controladas de laboratorio» significa: imágenes sin post-procesamiento, generadas por modelos que el detector conoce, en resoluciones que el detector maneja bien, sin compresión adicional, sin filtros, sin recortes.

En condiciones reales — imágenes compartidas por redes sociales, comprimidas por WhatsApp, capturadas con screenshot, redimensionadas, filtradas, editadas parcialmente — la precisión cae. Cae significativamente. Algunos estudios independientes han documentado tasas de precisión por debajo del 60% en condiciones reales.

Sesenta por ciento. Eso significa que el detector se equivoca en 4 de cada 10 imágenes. Cuatro de cada diez. En un contexto donde cada imagen puede ser una prueba en un juicio, cada error es una injusticia potencial.

Abogado que me lee: la próxima vez que alguien presente el resultado de un detector de IA como evidencia en un caso, exige que te proporcionen la tasa de precisión documentada del detector específico que utilizaron, en las condiciones específicas en las que lo utilizaron. No la tasa del paper académico original. La tasa en condiciones reales. Con imágenes comprimidas. Con post-procesamiento. Con modelos generativos que no estaban en el set de entrenamiento. Si no pueden darte esos números, lo que te están presentando no es evidencia técnica. Es una opinión con interfaz gráfica.

Falsos positivos: cuando lo real se declara falso

Un falso positivo en detección de IA ocurre cuando el detector analiza una imagen auténtica — una fotografía capturada por una cámara física, de un evento real, sin manipulación — y la clasifica como «generada por IA.»

Suena como un error menor. No lo es.

Imagina que eres el acusado en un juicio penal. Tu defensa presenta una fotografía que te ubica en un lugar distinto a la escena del crimen a la hora de los hechos. Es una foto real, tomada con un celular, en una reunión familiar. La fiscalía la pasa por un detector de IA. El detector arroja: «87% de probabilidad de ser generada por inteligencia artificial.» La fiscalía presenta ese resultado ante el juez y dice: «La fotografía de la defensa probablemente fue fabricada con IA.»

Tu coartada acaba de ser desacreditada por un software que no puede distinguir entre «generada por un modelo» y «comprimida por WhatsApp.»

Porque esa es una de las causas más frecuentes de falsos positivos: la compresión. Cada vez que una imagen se sube a WhatsApp, a Instagram, a Facebook, a Twitter, la plataforma la recomprime. Reduce su tamaño. Altera los valores de los píxeles. Modifica los patrones estadísticos que el detector busca como «firma» de modelos generativos.

El resultado: una fotografía perfectamente auténtica que pasó por WhatsApp puede tener patrones estadísticos que se parecen — desde la perspectiva limitada del detector — a los patrones de una imagen generada por Stable Diffusion.

Los detectores no distinguen entre «patrón generado por un modelo de IA» y «patrón generado por compresión agresiva.» Para ellos, una anomalía estadística es una anomalía estadística. No saben de dónde vino. Solo saben que está ahí.

Otras causas documentadas de falsos positivos:

Filtros de cámara y de aplicación. Los filtros de belleza que suavizan la piel, los filtros de iluminación que uniformizan las sombras, los filtros artísticos que alteran texturas — todos modifican los patrones estadísticos de la imagen de formas que los detectores pueden interpretar como «generación artificial.»

Edición profesional. Una fotografía profesionalmente retocada en Photoshop — corrección de color, ajuste de niveles, eliminación de imperfecciones, suavizado de texturas — puede activar el detector porque los patrones estadísticos del retoque se solapan con los patrones de generación por IA.

HDR y procesamiento computacional de cámara. Los teléfonos modernos — iPhone, Samsung, Google Pixel — aplican procesamiento computacional avanzado a cada fotografía: HDR, reducción de ruido por inteligencia artificial, mejora de bordes, fusión de múltiples exposiciones. Irónicamente, el procesamiento por IA que el propio teléfono aplica a las fotos «reales» puede hacer que los detectores las clasifiquen como «generadas por IA.»

Lee esa última oración otra vez. El teléfono usa IA para mejorar tus fotos reales. Y el detector de IA detecta esa IA y concluye que la foto no es real. Es una trampa circular donde la tecnología se contradice a sí misma.

Ciudadano que me lee y que alguna vez pasó una foto suya por un detector de IA y le salió «posiblemente generada»: no entre en pánico. Es probable que el detector esté reaccionando a la compresión, al filtro, al procesamiento de tu teléfono, o a cualquier otra alteración que la imagen sufrió entre la cámara y el detector. Eso no significa que su foto sea falsa. Significa que el detector no puede distinguir entre lo falso y lo procesado.

46 detectores ia p3 2

Falsos negativos: cuando lo falso se declara real

Si los falsos positivos son problemáticos, los falsos negativos son peligrosos.

Un falso negativo ocurre cuando el detector analiza una imagen que fue generada por inteligencia artificial y la clasifica como «real.» Le da el visto bueno. La declara auténtica. Y esa declaración se usa como evidencia de autenticidad.

Los falsos negativos ocurren por múltiples razones:

El modelo generativo no está en el set de entrenamiento del detector. Los detectores se entrenan con imágenes generadas por modelos específicos — DALL-E 2, Midjourney v5, Stable Diffusion 1.5. Si la imagen fue generada por un modelo que el detector no conoce — una versión nueva de Midjourney, un modelo de código abierto personalizado, un generador regional o de nicho –, el detector no reconoce la firma. No la marca. La deja pasar.

Esto no es un defecto menor. Es un defecto estructural. Los modelos generativos se actualizan más rápido que los detectores. Cada nueva versión del generador produce imágenes con patrones diferentes. El detector que fue bueno detectando Midjourney v5 puede ser completamente ciego a Midjourney v7. Y el que detecta DALL-E 3 puede no detectar Flux o Ideogram o cualquier otro modelo que surja la próxima semana.

Es una carrera armamentista donde el generador siempre va adelante. El detector siempre va atrás. Y esa brecha temporal es la ventana por la que pasan los falsos negativos.

Post-procesamiento intencional para evadir detección. Si alguien genera una imagen con IA y quiere que pase un detector como «real,» puede aplicar técnicas de post-procesamiento: añadir ruido gaussiano, aplicar una leve desenfocación, recomprimir con parámetros específicos, redimensionar ligeramente, agregar metadatos EXIF falsos. Cada una de estas operaciones degrada la «firma» del modelo generativo en la imagen. Y si la firma se degrada lo suficiente, el detector no la reconoce.

No necesitas ser un experto en procesamiento de imágenes para hacer esto. Hay tutoriales en YouTube. Hay scripts automatizados en GitHub. Hay comunidades en línea donde se comparten técnicas de evasión de detectores. La barrera de entrada para evadir un detector de IA es mínima. La barrera de entrada para construir un detector que no se pueda evadir es enorme.

Imágenes mixtas. Tomas una fotografía real. Le cambias el rostro con IA. O le agregas un objeto que no existía. O alteras un texto dentro de la imagen. El resultado es una imagen que es parcialmente real y parcialmente generada. El detector la analiza como un todo y, como la mayor parte de la imagen es «real,» la clasifica como «real.» No detecta la porción generada porque su análisis es global, no regional.

Legislador que me lee y que está pensando en marcos regulatorios para deepfakes: los falsos negativos son el escenario que su regulación necesita contemplar con mayor urgencia. Porque los falsos negativos son los que le dan a la autoridad la falsa confianza de que «verificó» una imagen. Son los que permiten que una imagen generada entre a un proceso legal como prueba auténtica. Son los que convierten el detector en un sello de goma que valida lo que no debería validar.

OpenAI retiró su propio clasificador (y nadie pareció entender por qué)

En enero de 2023, OpenAI lanzó un clasificador de texto generado por IA. Era una herramienta diseñada para determinar si un texto había sido escrito por un humano o generado por un modelo de lenguaje como GPT. OpenAI, la empresa que creó GPT, que tiene acceso al modelo, a los datos de entrenamiento, a la arquitectura interna — toda la información privilegiada que cualquier otro detector no tiene — creó su propio clasificador.

Seis meses después, lo retiró. Lo descontinuó. Lo quitó de circulación.

La razón que dieron públicamente: la tasa de precisión era demasiado baja. El clasificador identificaba correctamente solo el 26% del texto generado por IA como «probablemente escrito por IA.» Veintiséis por ciento. Tres de cada cuatro textos generados por IA pasaban el detector como si fueran escritos por humanos.

Y el 9% de los textos escritos por humanos eran incorrectamente marcados como «probablemente escritos por IA.» Casi uno de cada diez.

Ahora detente un momento y piensa en lo que esto significa.

OpenAI — la empresa que creó el modelo — no pudo construir un detector confiable para su propio modelo. Tiene el acceso más privilegiado imaginable a la tecnología generativa y aun así su detector fallaba tres de cada cuatro veces.

Si OpenAI no puede detectar con certeza lo que su propio modelo genera, ¿qué nivel de confianza deberíamos depositar en una aplicación gratuita de internet que afirma poder detectar imágenes generadas por cualquier modelo?

La respuesta es: ninguno que tenga valor probatorio. Ninguno que debería ser aceptado como evidencia en un juzgado. Ninguno que debería fundamentar un argumento oficial sobre la autenticidad de una imagen.

Periodista que me lee: este dato — que OpenAI retiró su propio clasificador por baja precisión — debería aparecer en cada nota que escribas sobre detección de IA. No como contexto menor al final del artículo. Como marco fundamental de la historia. Porque si la empresa que creó la tecnología no puede detectarla con confianza, la premisa de que «los detectores funcionan» se derrumba antes de empezar.

46 detectores ia p3 3

Pasar una imagen por una web gratuita no es un laboratorio forense

Voy a ser directo porque este punto necesita contundencia, no matices.

Hay una diferencia abismal, inconmensurable, entre pasar una imagen por una aplicación gratuita de internet y someterla a un análisis forense en un laboratorio. Son actividades tan diferentes como tomarte la temperatura con la mano y hacerte una resonancia magnética. Ambas le hacen algo a tu cuerpo. Una te da una impresión. La otra te da un diagnóstico.

Cuando pasas una imagen por un detector gratuito de IA en internet, lo que sucede es esto:

La imagen se sube a un servidor. Un modelo pre-entrenado la analiza en uno o dos segundos. El modelo compara patrones estadísticos de la imagen con los patrones que aprendió durante su entrenamiento. Emite un porcentaje: «83% probabilidad de ser real» o «67% probabilidad de ser generada por IA.» Y eso es todo.

No analizó metadatos EXIF. No examinó el ruido residual del sensor. No verificó los patrones de compresión. No evaluó la consistencia de iluminación ni de perspectiva. No buscó la firma estadística de modelos generativos específicos. No comparó con una base de datos de dispositivos conocidos. No documentó su metodología. No emitió un dictamen. No tiene valor probatorio.

Es un filtro. Un tamiz. Un primer vistazo. Y como primer vistazo, tiene su utilidad — de la misma forma que tomarte la temperatura con la mano tiene su utilidad. Pero nadie confundiría tomarse la temperatura con la mano con un diagnóstico médico. Y nadie debería confundir un detector gratuito de IA con un análisis forense.

Cuando un laboratorio forense analiza una imagen para determinar su autenticidad, el proceso es radicalmente diferente. Y voy a explicar las capas específicas que lo hacen diferente, porque la diferencia no es solo de calidad — es de naturaleza.

Análisis forense de ruido residual (PRNU)

Cada sensor de cámara — cada CCD, cada CMOS que existe en el mundo — tiene un patrón de ruido único. Es como una huella dactilar del sensor. Se llama Photo Response Non-Uniformity, PRNU. Es causado por imperfecciones microscópicas en el silicio del sensor que hacen que cada píxel responda de forma ligeramente diferente a la misma cantidad de luz.

Dos fotografías tomadas con la misma cámara comparten el mismo patrón PRNU. Si tengo la imagen cuestionada y tengo el dispositivo que supuestamente la capturó, puedo extraer el PRNU de ambos y compararlos. Si coinciden, la imagen fue capturada por ese dispositivo. Si no coinciden, no fue capturada por ese dispositivo.

Las imágenes generadas por IA no tienen PRNU de cámara. No fueron capturadas por un sensor físico. Tienen un patrón de ruido diferente, determinado por el modelo generativo y por el proceso de muestreo que usó para generar la imagen. Un perito con las herramientas adecuadas puede distinguir entre el ruido de un sensor físico y el ruido de un modelo generativo.

Ninguna aplicación gratuita de internet hace análisis de PRNU. Ninguna.

Análisis forense de compresión

Las imágenes digitales pasan por procesos de compresión — JPEG es el más común — que dejan artefactos específicos y cuantificables. Cada vez que una imagen se guarda, se comparte, se sube, se descarga, los artefactos de compresión se modifican y se acumulan. Un perito puede analizar las capas de compresión para construir la historia de procesamiento de la imagen: cuántas veces fue comprimida, con qué parámetros, si la compresión es consistente con un flujo normal (cámara, almacenamiento, red social) o si presenta anomalías que sugieran edición, generación o manipulación.

Los modelos generativos producen imágenes con patrones de compresión que no son idénticos a los de una cámara. Los parámetros de cuantización, la distribución de los coeficientes DCT, la estructura de los bloques JPEG — todo tiene firmas analizables. Un perito las analiza. Un detector gratuito no.

Análisis de metadatos de modelo generativo

Algunos modelos generativos dejan rastros en los metadatos de las imágenes que producen — no solo los metadatos C2PA voluntarios, sino rastros técnicos en la estructura del archivo, en los parámetros de codificación, en la forma en que organizan los datos de la imagen.

Además, cada modelo generativo tiene una «firma» estadística en las imágenes que produce. Es la distribución específica de frecuencias espaciales, el patrón de dithering, la forma en que resuelve bordes y transiciones, la distribución de colores en el espacio de frecuencia. Un laboratorio forense con las herramientas adecuadas puede, en muchos casos, no solo determinar que la imagen fue generada por IA sino identificar qué familia de modelos la generó.

Esa identificación — «esta imagen fue generada por un modelo de la familia Stable Diffusion, versión XL o posterior, con estas características de muestreo» — tiene valor pericial. Es específica. Es fundamentada. Es reproducible. Es confrontable en audiencia.

Un porcentaje en una pantalla de una app gratuita no tiene nada de eso.

Abogado que me lee: cuando la contraparte presente el resultado de un detector gratuito como «prueba» de que una imagen es auténtica o falsa, tu pregunta debe ser: «¿Se realizó análisis de PRNU? ¿Se analizaron los patrones de compresión? ¿Se identificó la firma del modelo generativo? ¿Se documentaron los hallazgos en un dictamen reproducible?» Si la respuesta a todas esas preguntas es no, lo que la contraparte presentó no es un análisis. Es un filtro. Y un filtro no tiene la precisión ni el rigor que un proceso legal requiere.

La brecha que nadie quiere reconocer

Existe una brecha entre lo que la sociedad cree que los detectores de IA pueden hacer y lo que realmente pueden hacer. Y esa brecha se está ensanchando, no cerrando.

La sociedad cree — porque los medios lo repiten, porque los funcionarios lo asumen, porque las empresas lo sugieren en su marketing — que los detectores de IA son herramientas confiables que pueden determinar con certeza si una imagen es real o generada. Que basta con subir la imagen, esperar unos segundos, y obtener un veredicto definitivo.

La realidad es que los detectores son herramientas probabilísticas con tasas de error significativas, vulnerables a evasión, dependientes de sus datos de entrenamiento, degradadas por el post-procesamiento, e incapaces de distinguir entre alteraciones técnicas legítimas (compresión, filtros, procesamiento computacional de cámara) y generación artificial.

Esa brecha entre percepción y realidad es peligrosa. Y es peligrosa en tres direcciones.

Es peligrosa para el inocente. Si un detector marca una foto real como «generada por IA,» el inocente cuya foto es cuestionada tiene que demostrar que la herramienta se equivocó. La carga de la prueba se invierte de facto. En vez de que quien cuestiona la imagen demuestre que es falsa, el dueño de la imagen tiene que demostrar que es real. Y demostrar que una herramienta se equivocó es más difícil que demostrar que una herramienta acertó.

Es peligrosa para la víctima. Si un detector marca una imagen generada como «real,» la víctima de esa imagen fabricada — un deepfake pornográfico, una imagen difamatoria, una prueba plantada — tiene que enfrentar una «verificación» que dice que la imagen es auténtica. La herramienta que debería protegerla la traicionó.

Es peligrosa para el sistema de justicia. Cada vez que un detector se equivoca y su resultado se acepta como evidencia, el sistema de justicia toma una decisión basada en información falsa. Y las decisiones basadas en información falsa son, por definición, injustas. No importa si favorecen al acusado o a la acusación. Son injustas porque no están basadas en la realidad.

Estudiante de cualquier disciplina que me lee — derecho, ingeniería, comunicación, ciencias políticas: entiende esto ahora, porque tu generación va a vivir profesionalmente en un mundo donde la pregunta «¿es real o es IA?» va a aparecer en cada contexto imaginable. Y la respuesta nunca va a ser un porcentaje en una pantalla. La respuesta va a requerir análisis. Rigor. Herramientas especializadas. Formación. Pensamiento crítico. Y la capacidad de decir «esto no es suficiente» cuando alguien te presente un detector como si fuera un oráculo.

46 detectores ia p3 4

Si no son confiables, ¿entonces qué?

La pregunta lógica que surge después de todo lo que he explicado es: si los detectores no son confiables, ¿entonces cómo determinamos si una imagen es real o generada?

La respuesta la he dado en cada parte de esta serie, pero voy a formularla una vez más con toda la claridad posible.

La autenticidad de una imagen digital se determina mediante un peritaje forense de medios digitales. Un análisis multicapa que examine la imagen desde múltiples ángulos técnicos, con herramientas especializadas, realizado por un perito con formación y experiencia, que emita un dictamen documentado, fundamentado y reproducible.

Ese peritaje incluye — como mínimo — las capas que describí en este artículo: análisis de PRNU, análisis de compresión, análisis de metadatos, análisis de consistencia visual, identificación de firma de modelo generativo.

No es instantáneo. No es gratuito. No cabe en una pantalla de 3 segundos. Pero es riguroso. Es confrontable. Es reproducible. Y es la única forma de establecer la autenticidad de una imagen con el nivel de certeza que un proceso legal, una investigación periodística seria o un debate público informado requieren.

Los detectores de IA pueden ser un primer filtro. Un indicador inicial. Una herramienta de triaje. Pero no son la respuesta final. No son el veredicto. No son el peritaje. Son el termómetro, no el tomógrafo. Y tratar al termómetro como tomógrafo es un error que puede costar libertades, patrimonios y reputaciones.

Lo que viene en la Parte 4

He explicado la falacia del checkbox. He desmontado la petición de principio. He mostrado por qué los detectores fallan. Queda la pregunta más importante de todas: qué significa todo esto para ti. No para el debate abstracto sobre IA y autenticidad. Para ti. Para tu juicio. Para tu caso. Para tu evidencia.

Si el gobierno usa argumentos falaces con una foto del presidente — una foto pública, de alto perfil, con toda la atención mediática del país –, ¿qué pasa cuando una fiscalía presenta evidencia digital en tu caso? ¿En un caso que nadie está mirando? ¿Con un juez que no tiene formación técnica? ¿Con un fiscal que no distingue un JPG real de una imagen generada con prompts?

En la Parte 4 voy a bajar del macro al micro. De la foto del presidente a tu expediente. De la falacia nacional a la amenaza personal. Y voy a explicar por qué la ignorancia técnica del sistema de justicia es una amenaza directa a tus derechos.

Suscríbete para recibir la Parte 4 cuando se publique.

No son lo que crees que son

Los detectores de IA para imágenes no son lo que crees que son. No son laboratorios portátiles. No son peritos automatizados. No son oráculos digitales que distinguen lo real de lo falso con un clic.

Son herramientas probabilísticas con limitaciones severas, tasas de error documentadas, y vulnerabilidades estructurales que las hacen insuficientes para cualquier contexto donde la verdad importa.

OpenAI no pudo detectar con confianza lo que su propio modelo genera. Los falsos positivos convierten fotos reales en sospechosas. Los falsos negativos convierten imágenes fabricadas en «verificadas.» La compresión de WhatsApp confunde al detector tanto como un modelo generativo de última generación.

Y en medio de todo eso, hay personas que usan estas herramientas como si fueran el veredicto final. Fiscales que dicen «el detector la validó.» Abogados que no saben cuestionar el resultado. Jueces que aceptan un porcentaje como si fuera un dictamen.

En Duriva, la pregunta «¿es real o es IA?» se responde con ciencia forense. Con PRNU. Con análisis de compresión. Con identificación de firma de modelo generativo. Con un dictamen que documenta cada hallazgo, cada herramienta utilizada, cada paso metodológico. Un dictamen que se puede defender en audiencia. Que se puede confrontar técnicamente. Que tiene valor probatorio real.

Porque la autenticidad de una imagen no se determina con una app. Se determina con un peritaje. Y la diferencia entre los dos es la diferencia entre una impresión y una conclusión fundamentada.