Guía de pdf-parser en Kali Linux
Guía de pdf-parser en Kali Linux
pdf-parser es una herramienta fundamental en Kali Linux (creada por Didier Stevens) para analizar archivos PDF sospechosos. Su objetivo no es "leer" el PDF como un usuario normal, sino descomponer su estructura interna para encontrar scripts maliciosos, URLs ocultas o exploits.
Aquí tienes una guía rápida en español para dominarla:
1. Conceptos Básicos
Un archivo PDF se compone de objetos (como texto, imágenes o scripts). Muchos ataques utilizan objetos de tipo /JS (JavaScript) o /Action para ejecutarse automáticamente.
Comandos esenciales:
Ver las estadísticas del archivo:
Útil para ver rápidamente si hay elementos sospechosos (como JavaScript).
Bashpdf-parser -a documento.pdfBuscar elementos específicos:
Si quieres ver todos los objetos que contienen una palabra clave (ej. "JavaScript"):
Bashpdf-parser -s JavaScript documento.pdf
2. Análisis de Objetos
Cada elemento en un PDF tiene un ID de objeto. Si las estadísticas muestran algo raro en el objeto 7, puedes inspeccionarlo directamente:
Ver un objeto por su ID:
Bashpdf-parser -o 7 documento.pdfExtraer contenido filtrado (Descomprimir):
Muchos PDFs maliciosos comprimen su código con
FlateDecode. Para leer el contenido real, usa la opción-f:Bashpdf-parser -o 7 -f documento.pdf
3. Flujo de Trabajo Típico (Forense)
Si sospechas de un archivo, este es el orden lógico de inspección:
Resumen:
pdf-parser -a archivo.pdf(Busca recuentos altos en/JS,/JavaScript,/OpenAction).Búsqueda:
pdf-parser -s /OpenAction archivo.pdf(Para ver qué se ejecuta al abrir).Inspección:
pdf-parser -o [ID] -f archivo.pdf(Para leer el código o enlace oculto).
4. Opciones Avanzadas
| Opción | Descripción |
-v / --verbose | Muestra más detalles técnicos del análisis. |
-e / --elements | Extrae elementos específicos como tipos de diccionarios. |
-r / --raw | Muestra el contenido del objeto sin procesar. |
-c / --content | Extrae el contenido del "stream" (flujo de datos) del objeto. |
Nota de seguridad: Siempre analiza archivos sospechosos dentro de una máquina virtual (como Kali) y nunca abras el PDF con un lector convencional (Adobe, Evince) hasta estar seguro de que es inofensivo.
Si ya tienes un archivo sospechoso entre manos, vamos a pasar de la teoría a la práctica. Para ayudarte mejor, necesito saber qué estás viendo en tu terminal.
Si ejecutas el comando de estadísticas:
pdf-parser -a nombre_del_archivo.pdf
¿Qué valores te aparecen en estas líneas?
/JSo/JavaScript/OpenActiono/AA(Automatic Action)/EmbeddedFile
Si alguno de estos tiene un número mayor a 0, es una señal de alerta.