PDFiD: Análisis de Archivos PDF en Español
PDFiD: Análisis de Archivos PDF en Español
PDFiD es una herramienta esencial dentro de Kali Linux (desarrollada originalmente por Didier Stevens) que se utiliza para el análisis inicial de archivos PDF. Su función principal es buscar "firmas" o palabras clave específicas dentro del código del archivo para determinar si el PDF es potencialmente malicioso sin llegar a ejecutarlo.
Aquí tienes una guía rápida sobre cómo funciona y cómo interpretar sus resultados.
¿Para qué sirve PDFiD?
A diferencia de un antivirus tradicional, PDFiD no busca firmas de virus conocidas. En su lugar, escanea la estructura interna del PDF en busca de elementos que suelen usarse en exploits, como:
Scripts automáticos (JavaScript).
Acciones al abrir el archivo (OpenAction).
Contenido incrustado o comprimido que oculte código malicioso.
Cómo usarlo en Kali Linux
PDFiD ya viene preinstalado en las herramientas de "Reverse Engineering" o "Forensics" de Kali. Para usarlo, simplemente abre la terminal y escribe:
pdfid nombre_del_archivo.pdf
Ejemplo de salida y qué significa
Cuando ejecutas el comando, verás una lista de contadores. Aquí te explico los más importantes:
| Palabra Clave | Significado | Nivel de Alerta |
| obj / endobj | Define los objetos del PDF. Un número muy alto puede indicar complejidad. | Informativo |
| stream | Contiene los datos reales (texto, imágenes o código). | Informativo |
| /JS / /JavaScript | Indica la presencia de código JavaScript. | Alto (Frecuente en ataques) |
| /AA / /OpenAction | Acciones que se ejecutan automáticamente al abrir el PDF. | Muy Alto |
| /JBIG2Decode | Un filtro de compresión que ha tenido vulnerabilidades críticas en el pasado. | Medio |
| /RichMedia | Contenido multimedia (Flash, etc.), a menudo usado para exploits. | Medio |
Interpretación de resultados
1. El archivo parece "limpio"
Si ves que /JS, /JavaScript y /OpenAction están en 0, es probable que el archivo sea un documento estático inofensivo.
2. El archivo es sospechoso
Si ves números mayores a 0 en las categorías de JavaScript o acciones automáticas, el archivo requiere un análisis más profundo con herramientas como pdf-parser.
[!TIP]
Dato importante: Muchos atacantes intentan "ofuscar" estas palabras clave (por ejemplo, separando las letras o usando códigos hexadecimales) para que PDFiD no las detecte. Si ves etiquetas extrañas o contadores con caracteres no comunes, desconfía.
Herramientas Complementarias
PDFiD es solo el primer paso (el triage). Si encuentras algo sospechoso, el siguiente flujo de trabajo en Kali suele ser:
PDFiD: Para ver si hay scripts.
pdf-parser: Para extraer y examinar el código sospechoso detectado.
Peepdf: Una herramienta interactiva que combina ambas funciones.