HTTrack en Kali Linux: Guía Rápida
HTTrack en Kali Linux: Guía Rápida
Usar HTTrack en Kali Linux es una excelente manera de "clonar" sitios web completos para analizarlos fuera de línea o realizar auditorías de seguridad sin estar conectado constantemente al servidor objetivo.
Aquí tienes una guía rápida y sencilla para usarlo en español.
¿Qué es HTTrack?
Es una utilidad de código abierto que permite descargar un sitio web de Internet a un directorio local, construyendo recursivamente todos los directorios, obteniendo HTML, imágenes y otros archivos del servidor.
1. Instalación
Aunque Kali suele traer muchas herramientas, a veces no viene preinstalado por defecto. Puedes instalarlo abriendo tu terminal y escribiendo:
sudo apt update
sudo apt install httrack
Cómo usar HTTrack en la Terminal
La versión de línea de comandos es la más eficiente. Sigue estos pasos:
Inicia el programa: Escribe
httracky presiona Enter.Nombre del proyecto: Dale un nombre a tu descarga (ej:
mi_clon_web).Ruta base: Elige dónde se guardará. Si presionas Enter, se guardará en la carpeta actual (
websites/).Dirección URL: Escribe la dirección completa (ej:
http://www.ejemplo.com).Tipo de acción: Normalmente elegirás la opción 1 (Mirror Web Site(s)).
Opciones adicionales: Puedes dejarlas por defecto presionando Enter.
¡Comenzar!: Confirma con "Y" para iniciar la descarga.
Consejos de "Ninja" para Kali
Si prefieres no usar el asistente paso a paso, puedes lanzar el comando directamente:
Comando rápido:
httrack "http://www.sitio.com" -O "/ruta/de/carpeta" "+*.sitio.com/*"WebHTTrack (Interfaz Gráfica):
Si prefieres usar el ratón y el navegador, instala la versión con interfaz:
sudo apt install webhttrackLuego búscala en tu menú de aplicaciones de Kali. Se abrirá una ventana en tu navegador para gestionar las descargas de forma visual.
⚠️ Advertencia Ética
Recuerda que clonar un sitio web consume ancho de banda del servidor de destino. Asegúrate de tener permiso para hacerlo o de usarlo en entornos de prueba controlados, ya que realizar descargas masivas puede ser detectado como un ataque de denegación de servicio (DoS) o violar los términos de servicio del sitio.
Filtrar archivos es la clave para que una descarga no tarde horas y para no llenar tu disco duro con archivos innecesarios (como videos de 1GB o instaladores).
Para aplicar filtros en HTTrack, usamos los signos + (permitir) y - (bloquear). Aquí tienes los comandos más útiles para que tu clonación sea ligera y rápida:
1. El comando "Limpio" (Sin Multimedia Pesada)
Si solo quieres el código, el texto y el diseño (CSS/JS), usa este comando:
httrack "http://www.ejemplo.com" -O "/ruta/de/guardado" "-*.mp4" "-*.mp3" "-*.zip" "-*.rar" "-*.pdf" "-*.exe"
2. Filtros comunes que te ahorrarán tiempo
Aquí tienes una tabla de lo que suele dar problemas y cómo evitarlo:
| Lo que quieres evitar | Filtro a añadir |
| Videos pesados | -*.mp4 -*.avi -*.mkv -*.mov |
| Archivos de audio | -*.mp3 -*.wav -*.ogg |
| Documentos grandes | -*.pdf -*.zip -*.rar -*.iso |
| Imágenes específicas | -*.gif (útil para evitar banners animados) |
| Cualquier archivo de un subdirectorio | -www.ejemplo.com/descargas/* |
3. Cómo limitar la "Profundidad" (Depth)
A veces el problema no son los archivos, sino que HTTrack empieza a saltar de un enlace a otro y termina intentando descargar medio Internet.
-ext: Solo descarga archivos dentro del dominio principal (evita que se salga a sitios externos).-r2: Limita la profundidad a 2 niveles de clics desde la página principal.
Ejemplo Pro:
httrack "http://www.ejemplo.com" -O "./clon" "-*.mp4" "-*.zip" -ext -r3(Descarga el sitio, ignora videos y zips, no se sale del dominio y solo llega a 3 niveles de profundidad).
¿Cómo ver los resultados?
Una vez que termine, entra en la carpeta que elegiste y busca un archivo llamado index.html. Ábrelo con tu navegador y verás el sitio funcionando totalmente offline.