HTTrack è un Web crawler e un browser offline libero e open-source, sviluppato da Xavier Roche e rilasciato sotto la GNU General Public License versione 3.
Xavier Roche
maggio 1998; 22 anni fa
C
Microsoft Windows, Mac OS X, GNU, GNU/Linux, FreeBSD e Android
Browser offline e Web crawler
GNU General Public License Versione 3
www.httrack.com
HTTrack permette agli utenti di scaricare siti World Wide Web da Internet a un computer locale. Per impostazione predefinita, HTTrack organizza il sito scaricato in base alla struttura di link relativa del sito originale. Il sito scaricato (o “rispecchiato”) può essere navigato aprendo una pagina del sito in un browser.
HTTrack può anche aggiornare un sito rispecchiato esistente e riprendere i download interrotti. HTTrack è configurabile tramite opzioni e filtri (include/exclude), e ha un sistema di aiuto integrato. C’è una versione di base a riga di comando e due versioni GUI (WinHTTrack e WebHTTrack); la prima può essere parte di script e cron job.
HTTrack usa un crawler web per scaricare un sito web. Alcune parti del sito web potrebbero non essere scaricate per impostazione predefinita a causa del protocollo di esclusione dei robot, a meno che non siano disabilitate durante il programma. HTTrack può seguire i link generati con JavaScript di base e all’interno di Applet o Flash, ma non i link complessi (generati utilizzando funzioni o espressioni) o le mappe immagine lato server.