HTTrack est un crawler Web et un navigateur hors ligne libre et ouvert, développé par Xavier Roche et sous licence GNU General Public License Version 3.
Xavier Roche
mai 1998 ; il y a 22 ans
C
Microsoft Windows, Mac OS X, GNU, GNU/Linux, FreeBSD et Android
Navigateur hors ligne et crawler Web
GNU General Public License Version 3
www.httrack.com
HTTrack permet aux utilisateurs de télécharger des sites du World Wide Web depuis Internet vers un ordinateur local. Par défaut, HTTrack organise le site téléchargé selon la structure relative des liens du site original. Le site téléchargé (ou « miroir ») peut être parcouru en ouvrant une page du site dans un navigateur.
HTTrack peut également mettre à jour un site miroir existant et reprendre les téléchargements interrompus. HTTrack est configurable par options et par filtres (inclure/exclure), et dispose d’un système d’aide intégré. Il existe une version de base en ligne de commande et deux versions GUI (WinHTTrack et WebHTTrack) ; la première peut faire partie de scripts et de tâches cron.
HTTrack utilise un crawler Web pour télécharger un site Web. Certaines parties du site Web peuvent ne pas être téléchargées par défaut en raison du protocole d’exclusion des robots, sauf si elles sont désactivées pendant le programme. HTTrack peut suivre les liens qui sont générés avec du JavaScript de base et à l’intérieur d’Applets ou de Flash, mais pas les liens complexes (générés à l’aide de fonctions ou d’expressions) ou les cartes d’images côté serveur.