Faceți o copie în oglindă offline a unui site cu Wget pe Windows și Linux
Uneori trebuie să obțineți o copie navigabilă a unui site web, astfel încât să îl puteți accesa offline, să puneți un stick USB sau chiar să îl încărcați pe smartphone și să-l citiți când zburați sau călătoriți. Deși în browserele și sistemele de operare moderne este ușor să salvați o pagină web în PDF, poate fi deranjant să procesați fiecare pagină. Aici vine wget.
Reclama
Wget este un manager de descărcare open-source. Este o aplicație pentru consolă dezvoltată în principal pentru Linux, dar portată cu succes pe alte sisteme de operare, inclusiv Windows și MacOS.
cum să ștergeți automat e-mailurile din Gmail
Dacă nu sunteți familiarizați cu wget, ar trebui să încercați cu siguranță. Este foarte puternic. Permite preluarea fișierelor de pe site-uri web folosind HTTP, HTTPS și FTP, protocoalele Internet pe care le folosim în aceste zile. Comportamentul său este controlat de argumente din linia de comandă.
Wget acceptă o varietate de opțiuni pentru a prelua fișiere pe conexiuni lente sau instabile, inclusiv reîncercări, continua de unde a rămas și multe altele. Acceptă fișierul „robots.txt”, deci poate funcționa ca un crawler web. Poate prelua numai fișiere modificate, acceptă metacaractere, limite de tip de fișier și extensii obișnuite.
Wget acceptă recuperarea recursivă a site-urilor web HTML și a serverelor FTP, permițându-vă să creați o oglindă a site-ului web. Iată cum se poate face.
Înainte de a continua, trebuie să obțineți aplicația wget.
Obțineți Wget pe Windows
De obicei folosesc binare din aceste surse:
Ambii își fac treaba.
Obțineți Wget pe Linux
Folosiți managerul de pachete al distribuției. Câteva exemple (run le ca rădăcină ):
Debian / Ubuntu / Mint:
apt install wget
CentOS / Redhat
instalează wget
Arch Linux
pacman -Sy wget
Anulați Linux
xbps-install -S wget
Pentru a face o copie offline a unui site cu Wget,
- Deschis prompt de comandă / Terminal .
- Pe Windows, tastați calea completă către fișierul wget.exe.
- Pe Linux, tastați doar wget.
- Acum, tastați următoarele argumente pentru a obține următoarea comandă:
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://site-to-download.com
- Inlocuieste
https://site-to-download.com
porțiune cu adresa URL a site-ului real din care doriți să creați o oglindă.
Esti gata!
Iată comutatoarele pe care le folosim:
--oglindă
- aplică o serie de opțiuni pentru ca descărcarea să fie recursivă.- fără părinte
- Nu accesați cu crawlere directorul părinte pentru a obține doar o porțiune a site-ului.--convert-links
- face ca toate linkurile să funcționeze corect cu copia offline.--pagina-cerințe
- descărcați fișiere JS și CSS pentru a păstra stilul de pagină original atunci când răsfoiți o oglindă locală.--adjust-extension
- adaugă extensiile corespunzătoare (de ex. html, css, js) la fișiere dacă au fost recuperate fără ele.
Asta e.