DESMONTANDO Y ESPIANDO SITIOS WEB CON HTTRACK

HTTrack Website Copier es un potente software que trabaja On-Line desde Internet (Conectado a Internet) y que nos permite hacer cosas muy interesantes como por ejemplo descargar una página web completa, y cuando digo completa, me refiero a completa para así poder analizar todo su contenido tranquilamente desde nuestro disco duro, sin la necesidad de estar constantemente conectado a Internet. Este software, que es completamente gratis, y que podéis visitar en esta dirección web http://www.httrack.com/ , tiene la ventaja de que se puede usar de muchas formas incluso también con otros propósitos menos elegantes.

Yo voy a explicar sin ninguna censura como he usado durante años este software, que he hecho con él y que he conseguido con su empleo en internet. Empezare por comentar el caso tipico. Muchas veces una página web tiene restricciones, es decir, tiene una zona de acceso privado con un Login y un password para que entren los usuarios. Normalmente en estas zonas se suelen almacenar funciones extra tales como; los archivos que solo te puedes descargar si te registras y te haces miembro del sitio web, asunto que no siempre puede gustarte especialmente si solo deseas bajar algún software, un libro, un serial, un Keygen, una medicina, o lo que sea. En otros casos la web que nos interesa contiene archivos de fotos que son muy atractivos y que nos gustaría tener para usarlas en otras cosas, o tiene libros en PDF, o quizá música en Mp3, videos, o cualquier otro material que pudiera interesarnos.


QUE SE PUEDE HACER CON HTTrack

Bueno, pues te pondre algunos ejemplos que yo he usado alguna vez. Si te descargas HTTrack, te lo instalas y lo configuras como lo ves aquí, tu puedes ir a una página web porno y bajarte toda la web completa y cuando finalice el proceso, ir al Disco duro de WindowsXP o Vista o Windows7, y abrirla carpeta con la copia exacta de ese sitio web, y con mucha tranquilidad y paciencia, ir desmotando poco apoco todo el sitio (Es un poco entretenido pero el resultado es muchas veces muy satisfactorio) hasta logar tener a tu alcance todo ese material que tu deseabas. Un importante cuestión que debo comentar que solo podrás bajar estos materiales si el web máster no es muy cuidadoso y dedicado a su profesion, ya que hay casos donde todo este maerial esta baneado impidiendo que HHTrack se haga copias de texto, fotos, flashplayers, y quizá de archivos internos, y la segunda cuestión es que solo podrá bajarte estos materiales si están alojados en el mismo sitio web del servidor.

Normalmente tras haber conectado HHTrack a un sitio y descargarlo si se trata de fotos, pues las encontraras en una carpeta que casi siempre se denomina “Images”; lo digo por si tu debilidad son las fotos porno. El resto de los materiales puede ser un poco más complicado, porque no hay un claro indicador de donde está alojado este material, ya que cada web máster al hacer la pagina puede crear una carpeta con el nombre de Files, o Stuff, o incluso el nombre que él quiera. Esto te obligara a tener que recorrer carpeta por carpeta hasta el final y comprovar que contiene y así saber por eliminación sistemática, donde estará oculto el material que buscas.

Estos son algunas de las aplicaciones pero tiene otras muchas más utilidades especialmente interesantes para los que quieren hacerse una página web sin casi esforzarse y sin que les cobren una fortuna por diseñársela. Te buscas una web o un blog que te guste, lo pones en el punto de mira de HTTrack, y a continuación te lo bajas completo. Después de un paciente proceso de considerable investigación del site web que te has bajado, y eliminando la escoria de carpetas que no son del dominio central del sitio web, tomas un Editor de páginas Web como el Dreamweaver, o el FrontPage de Microsoft, y modificas la pagina a tu entero gusto. Como normalmente los que diseñan estas páginas se valen de templates, (Plantillas web) y estas o bien son gratis, o bien son de pago, cualquiera comprar una pero con HHTrack solo tienes que modificarla y adaptarla a tus necesidades. Si, ya lo sé, esto se llama piratear, pero siempre que no hagas un Website exacto, es decir, un Phising y lo uses tal cual puedes usar una página web de las muchas que hay en Internet.


COMO USAR HHTrack PARA DESMONTAR UNA WEB DE INTERNET

Bueno como paso previo, primero debes ir la web oficial de HHTrack y descargar la versión para WindowsXP. Después la instalas pulsando dos veces el ejecutable exe que contiene el softwere y le seleccionas inmediatamente el idioma con la opción “Castellano, o el idioma d tu pais” para poder tener una mejor operatividad con la configuracion. El paso siguiente es cerrar el programa y reiniciarlo Una vez que arranque veras el programa HHTrack en tu idioma ya que dispones de varios. Con el software otra vez funcionando, seleccionas “Siguiente” y llegaras un nuevo panel. Aparentemente los paneles producen una cierta sensacion de complejidad; de hecho algunas partes de este softwere si son complicadas, pero en el resto de paneles y a menos que seas muy exigente con solo marcar unas pocas opciones obtendras un buen resultado y una descarga del sitio excelente.

En el siguiente panel debes insertar el nombre del proyecto. Para que lo entiendas facilmente, el nombre del proyecto se refiere al nombre que le darás a la carpeta donde quieres que se descargue la pagina web que tu pretendes bajar desde internet. Luego le colocas una etiqueta, que en este caso será un sitio web aunque si se trata de un blog debes poner Blog. En el apartado “Ruta Base” tú puedes elegir en que unidad de disco duro quieres que esta carpeta denominada proyecto se aloje. Como ejemplo, si tienes dos discos duros, y quieres que la carpeta como la que ves aquí WEB MICROSOFT se aloje en tu segundo disco duro E:\ pues sustituyes la unidad C:\ por la unidad E:\. Una vez configurado esto nos vamos pulsando siguiente a una nueva pantalla.

En nuestra siguiente pantalla ya tenemos algunas opciones más que configurar. Lo primero que vamos a hacer es insertar donde indica Dirección Web URL, la dirección de la pagina web que deseamos que nos copie y nos baje desde Internet, que en este caso y para demostración hemos puesto la de tío Bill, que es la de Microsoft. En la pestaña Acción, seleccionaremos copiar todas las páginas del sitio (Copia Múltiple). Con esto conseguimos que HHTrack se infiltre en todas las paginas que componen el sitio web que deseamos copiar. Continuando con la configuración (Ya sé que es un poco molesto hacerlo) pero si al comienzo configuramos correctamente estas opciones, los resultados serán en un 90% de las veces muy buenos o tendrán éxito completo, mientras que habrá un 10% aproximadamente en que solo se copiara lo que el administrador web permita y no tenga baneado.

Pulsamos en Definir las Opciones y en esta pantalla aparecerá un sub panel donde veremos varias opciones que habra de ajustar para lograr que el sitio web que queremos copiar lo haga completamente. Aquí vamos a recorrer varias pestañas para configurar óptimamente nuestra descarga. La primera pestaña, filtro sirve para seleccionar que tipo de archivos deseas que se bajen, y como ya puedes ver están representados casi todos. Si tu intención es bajarlos todos, pues marcas todos, pero si solo te interesan un tipo concreto de archivos, marca el que desees y deja en blanco el resto. Una vez marcados, pulsa el botón aceptar enlaces, y selecciona TODOS LOS ENLACES, y eso permitira al HHTrack que tenga en cuenta todos los links que existan relacionados con el sitio, bien del propio sitio como los que son de otros sitios.

La siguiente pestaña es algo más simple y solo tienes que marcar tres de las cuatro opciones, que son las siguientes; intentar detectar todos los enlaces que te permitira que HHTrack rastree toda la web por dentro, la siguient opcion es capturar todos los ficheros lo que te permitira localizar cualquier fichero ocuto que exista alojado en ese sitio web; bien sea videos, peliculas, Mp3, Imagenes, textos, Zip, Rar; PDF, y en general cualquier material que el Administrador no haya restringido o prohibido (Baneado) expresamente, y por ultimo la opcion comprobar todos los enlaces incluso los prohibidos, que es lo mas util puesto que traspasa zonas donde hay materiales que podrian ser descargados pero que si HHTrack si los descubre y no hay reglas establecidas puede bajarlos. Después de haber configurados estas opciones, pulsa aceptar y entraras en siguiente panel.

En este panel hay que seleccionar no conectar con el proveedor (Conexión ya establecida) y listo. Si tu sistema de navegacion es un Moden Router ADSL conectado de forma directa al cable telefonico y por un cable LAN a un conector RJ45 a uno de los pruertos del router, esta sera la opcion. Existe la posiblidad de navegar detras de un Servidor proxy que tu previamente hayas ya examidado. Esta opcion es la que usan muchos paranoicos precisamente para evitar dejar rastros y pistas de sus numeros IP verdaderos en los servidores donde pretenden copiar la pagina web, ya que queda registrado toda la actividad, y eso les permite estar ocultos y no ser traceados. Ahora que ya sabes todo esto, siéntate y espera, que la descarga de la pagina web puede llevar cerca de una hora o más, dependiendo de lo grande que sea el sitio, del ancho de banda que tengas y de si estas conectado al Bittorrent o emule, o cualquier otro software que consuma velocidad.

Aquí podéis ver la descarga del sitio de Microsoft, que es un éxito, y HHTrack bajara la pagina web completa si nadie de Microsoft se lo impide. Debo advertir como nota final, que muchos Administradores de sitios Web de Internet estan al corriente de estas practicas, y si estan monitorizando el trafico con alguna potente herramienta Linux, y detectan una conexion de una IP por un tiempo prolongado, en la que ademas se esta produciendo una actividad sospechosa en la que se incluyen descargas de archivos, el Administrador puede automaticamente forzar remotamente la desconexion del HHTrack. Esto lo comento porque si notais que se desconecta con relativa frecuencia, es que el Administrador os esta Baneando y tendreis que usar el ingenio para engañarle y poder bajar la pagina sin interrupciones.


0 comentarios to "DESMONTANDO Y ESPIANDO SITIOS WEB CON HTTRACK"

Publicar un comentario en la entrada

Blog Archivo

Subscribete via E-Mail

Subscribete via RSS!

Ingresa tu email para:
Recibe actualizaciones del Blog.

Etiquetas

16-bit 2.0 2012 256 colores 2d 3 404 5 8 acelerar Acer Aspire ActionScript ADD-ONS addon adobe adobe air Adsense aerogarden agilidad airbender AJAX alarma alien all your base alta definición Android angulacion answers API APIs aplicacion aplicaciones Apple apps archive Argentina ask atajo atajos de teclado ataque audio avance avatar aventura grafica back background backtweets balsamiq mockups banda bang banners barcelona barra lateral bases de datos Batacazo bateria bbcode bear bebé Biblioteca Virtual big bing BitDefender BitTorrent blekko Blog blogger bloggers blogósfera Blogs bocetos bollywood bordes botánica brickify brush buenos aires buscador búsqueda avanzada cache caja calendario calidad cámara web canciones Canvas carrusel catástrofe ceguera de banners celular CEO charla chpimunk chrome chrome web store chromium chuck norris cine Cisco cita cliente ftp cloud cluster Cms cocina codec código coleccion color colorotate columna comercio commodore 64 compatibilidad Competencia compositio Comscore comunicacion Comunidad comunidad online Conferencia configuración consejos contenido content copia correo correo electrónico cotidiano cpanel Creatividad criminal cross-browser cse CSS CSS3 cubo cuenta cuentos cultivo Curiosidades curso photoshop Cursos daisies date Debian degradé dell desaparecer desarrollo web descarga Descargas descomprimir desfragmentar despertador despertar deviantart DHTML Digg diseñador Diseño Diseño Grafico Diseño Gráfico diseño web Disney dispositivo dispositivos moviles dispositivos táctiles div dominio dramatic dropbox duck go e-book e-commerce e-commerce day e-mail EBE ecología editor educación a distancia educativo Educativos Niños efecto efectos ejemplo emblema emprendimiento emulador emuladores encabezados encuesta enlace episodios error escritura España estadística Estados Unidos estilo estudio etica evento Eventos Excel exportar extensión extensiones extraterrestre Facebook facebook connect garage fc64 feeds Fiberparty film Filosofía Firebug firefinder Firefox firmware fixes Flash flex 4 Flickr fondo fondos font font dragr form formularios foto Fotografía Framework freelance fuente fuentes future FXG g1 gadget gadgets games gaming gazelle geek gestion gestor de contenido gestos gestuales gesture ghajini gm730 Gmail Google google analytics google app Google Calendar Google Chrome Google Docs gradient gradiente gradientes gráfico gran torino gratis groupon guerra guia h.264 habla hack Hackers handle handler hardware herramientas gráficas hitchcock hollywood homepage horizontal hover HP html HTML válido HTML5 HTTP hub huerta IBM icono IE illustrator imagen Imagenes imágenes importar impress inclinacion indio infecciones info-box infografías iniciador Inkscape inspiracion interactivo interfaz Internet Internet Explorer interno invasión investigación iPhone iphone os iPod island istick IT iTunes U jackson JavaScript jerarquía jetpack jQuery jQuery TOOLS jsc64 juego Juegos lanzamiento laptop lego lenguaje Lenovo Lg libre librería libro limpieza Links Linux literatura lógica logo logos logotipo lolcat Lotería love luca lucasarts luces luminoso luz Mac mac book pro mac os x MacBook macro mago Malware manejo mantenimiento manual mapa mapeo maquetación marciano Marketing mascara mascota McBook medicion medio ambiente meme memoria mente menú metafilter metropolis michael microsoft Mobile Learning mockup monkey moonwalker mootools moousture motivacional motor de busqueda motores de búsqueda mouse mouseprobe mov movil mozilla Mozilla Firefox Mozilla Labs mp3 MS Office mujer maravilla multimedia MultiTouch música MXML MySpace MySql N97 napkee navegación Navegador navegadores networking New York nightly nihilogic no ser encontrado nodos Nokia notebook noticias Novedades ochentoso oferta offers oficial online Open Source Open SUSE OpenOffice opera operativo oportunidad optimización orden organizacion orgullo os oscurecer oscuridad oso Outlook oz page speed PageRank pagespeed pageviews panaderia Panda paneles pantalla pantallas táctiles parasitos PDF peekfeed película pencil peoplebrowsr perfil pestaña photoshop photoshop clase 2 PHP php 5 Picasa picker pinceles pingie piratas pirates plagio plantación plantar plantilla plastic logic Plugin plugins pocket yoga podcasts port portal portátil posicionamiento powerpoint ppc prejuicio preparacion presentación Productividad Programación programas promocion protofish prototype proyecto prueba PSD Psicología public Publicidad puerto QEMU quickoffice quicktime quote rafael jimenez rank Recursos Red red social reddit Redes sociales reloj remake reproductor reseña resolución respaldo resultado retro robo rojo RSS rubik Ruby rust Safari Salud sans-serif sclipo script sculpting sdk seleccionador SEO serie serif SERP server servidor servidor web set shadow share sherlock shortcodes shuffle sidebar sidepost simple simpson Sin clasificar sistema sistema operativo sistemas operativos sitios web slideshow smart smooth SMS snow leopard social sociedad Software Software educativo software libre sombra sonido soundmanager2 spam spreadsheet SQL Squeeze startup steps left store streaming subdominio success suckerfish sun microsystems tablas table tabs tactil Taller de Fotografía Digital Taller de Photoshop taller photoshop Talleres Tarjetas de Crédito teaser tecnica Tecnologia teddy telefono television telltale template templates textbox the theme Themes theora thumbnails tienda time tipografía tipografias tips titulares to touchscreen tower defense trailer transform transition tres Troyano Troyanos truco Trucos tutorial photoshop tutoriales TV tweet tweetstats Twitter unplugged Usabilidad USB usuarios Utilidades para PC Utilidades para tu web variables vector vegetales velocidad venta Ventas verde verdura version video videojuego videojuegos videos Videos de Música Peruana viernes Viernes Unplugged VirtualBox Virus Visas VMware voucher w3c wallpaper wallpapers web Web 2.0 web participativa webcam WebKit webm webmaker Wi-Fi widescreen Wikipedia Windows Windows 7 Windows Mobile wiz wizard wolfram wonder woman Word Wordpress WorldBuilder wwdc 09 XHTML yahoo Youtube yui zip