Guía de pdf-parser en Kali Linux

 

https://www.onlinetis.com/es/ 

Guía de pdf-parser en Kali Linux

pdf-parser es una herramienta fundamental en Kali Linux (creada por Didier Stevens) para analizar archivos PDF sospechosos. Su objetivo no es "leer" el PDF como un usuario normal, sino descomponer su estructura interna para encontrar scripts maliciosos, URLs ocultas o exploits.

Aquí tienes una guía rápida en español para dominarla:


1. Conceptos Básicos

Un archivo PDF se compone de objetos (como texto, imágenes o scripts). Muchos ataques utilizan objetos de tipo /JS (JavaScript) o /Action para ejecutarse automáticamente.

Comandos esenciales:

  • Ver las estadísticas del archivo:

    Útil para ver rápidamente si hay elementos sospechosos (como JavaScript).

    Bash
    pdf-parser -a documento.pdf
    
  • Buscar elementos específicos:

    Si quieres ver todos los objetos que contienen una palabra clave (ej. "JavaScript"):

    Bash
    pdf-parser -s JavaScript documento.pdf
    

2. Análisis de Objetos

Cada elemento en un PDF tiene un ID de objeto. Si las estadísticas muestran algo raro en el objeto 7, puedes inspeccionarlo directamente:

  • Ver un objeto por su ID:

    Bash
    pdf-parser -o 7 documento.pdf
    
  • Extraer contenido filtrado (Descomprimir):

    Muchos PDFs maliciosos comprimen su código con FlateDecode. Para leer el contenido real, usa la opción -f:

    Bash
    pdf-parser -o 7 -f documento.pdf
    

3. Flujo de Trabajo Típico (Forense)

Si sospechas de un archivo, este es el orden lógico de inspección:

  1. Resumen: pdf-parser -a archivo.pdf (Busca recuentos altos en /JS, /JavaScript, /OpenAction).

  2. Búsqueda: pdf-parser -s /OpenAction archivo.pdf (Para ver qué se ejecuta al abrir).

  3. Inspección: pdf-parser -o [ID] -f archivo.pdf (Para leer el código o enlace oculto).


4. Opciones Avanzadas

OpciónDescripción
-v / --verboseMuestra más detalles técnicos del análisis.
-e / --elementsExtrae elementos específicos como tipos de diccionarios.
-r / --rawMuestra el contenido del objeto sin procesar.
-c / --contentExtrae el contenido del "stream" (flujo de datos) del objeto.

Nota de seguridad: Siempre analiza archivos sospechosos dentro de una máquina virtual (como Kali) y nunca abras el PDF con un lector convencional (Adobe, Evince) hasta estar seguro de que es inofensivo.

 

Si ya tienes un archivo sospechoso entre manos, vamos a pasar de la teoría a la práctica. Para ayudarte mejor, necesito saber qué estás viendo en tu terminal.

Si ejecutas el comando de estadísticas:

Bash
pdf-parser -a nombre_del_archivo.pdf

¿Qué valores te aparecen en estas líneas?

  • /JS o /JavaScript

  • /OpenAction o /AA (Automatic Action)

  • /EmbeddedFile

Si alguno de estos tiene un número mayor a 0, es una señal de alerta.

Entradas populares de este blog

Hacking y ciberseguridad en kali linux con Fping

Hacking y ciberseguridad en kali linux con atk6-thcping6

Como utilizar Fierce en kali linux