View previous topic :: View next topic |
Author |
Message |
fedeliallalinea Administrator
Joined: 08 Mar 2003 Posts: 30918 Location: here
|
Posted: Sat Feb 12, 2005 12:17 pm Post subject: [TIP] html2txt |
|
|
Molti di voi sanno come scaricare una pagina html con wget ma magari non sanno come scaricarla gia' interpretata. Cercano un po' ho trovato questo utile tips (almeno a me e' servito), il comando da lanciare e'
Code: | $ lynx -dump pagina.html > file.txt |
NOTA: se non avete lynx basta un
_________________ Questions are guaranteed in life; Answers aren't. |
|
Back to top |
|
|
lavish Bodhisattva
Joined: 13 Sep 2004 Posts: 4296
|
Posted: Sat Feb 12, 2005 12:22 pm Post subject: |
|
|
Ho che comodo!
Mi era capitato piu' volte di dover "tradurre" delle pagine web in file di testo e questo capita davvero a fagiolo ! Davvero ottimo!
Complimentoni! _________________ minimalblue.com | secgroup.github.io/ |
|
Back to top |
|
|
X-Drum Advocate
Joined: 24 Aug 2003 Posts: 2517 Location: ('Modica','Trieste','Ferrara') Italy
|
Posted: Sat Feb 12, 2005 1:19 pm Post subject: |
|
|
cool
non sapevo che lynx disponesse anche di questa funzione _________________ "...There are two sort of lies, lies and benchmarks..." |
|
Back to top |
|
|
Kernel78 Moderator
Joined: 24 Jun 2005 Posts: 3654
|
Posted: Sun Jun 26, 2005 12:22 pm Post subject: |
|
|
Ne deduco che o non conoscevate o non gradivate la comodissima (almeno IMHO) utility html2text |
|
Back to top |
|
|
Ic3M4n Advocate
Joined: 02 Nov 2004 Posts: 3489 Location: Bergamo.
|
Posted: Sun Jun 26, 2005 1:22 pm Post subject: |
|
|
leggermente OT ma nemmeno più di molto...
in portage ci sono moltissime utility con nome autoesplicativo tipo: Code: |
pdf2html
html2latex
texi2html |
e chi più ne ha più ne metta.
in particolare possono risultare utili quelle sui pdf per effettuare delle modifiche al testo... tipo documenti vari etc. logicamente si perde un po' la formattazione. |
|
Back to top |
|
|
|