Gentoo Forums
Gentoo Forums
Gentoo Forums
Quick Search: in
[OFF] Cookies avec wget ou lynx
View unanswered posts
View posts from last 24 hours

 
Reply to topic    Gentoo Forums Forum Index French
View previous topic :: View next topic  
Author Message
404_crazy
Tux's lil' helper
Tux's lil' helper


Joined: 22 Jan 2008
Posts: 145

PostPosted: Sun Jul 12, 2009 3:15 pm    Post subject: [OFF] Cookies avec wget ou lynx Reply with quote

Bonjour a tous,

Voila je suis en train de faire un petit script et je dois aller chercher des infos sur une page en html donc je pense télécharger cette page avec Wget puis prend l'info que je cherche.
Mais voila le probleme est que sur le site en question pour entré il faut indiqué ca region, puis l'info et mise dans un cookie alore je voudrai savoire comment je peut faire ca avec wget ou bien lynx en prenant par exemple la marne pour mettre dans le cookie ?

merci d'avance
Back to top
View user's profile Send private message
DuF
Advocate
Advocate


Joined: 09 Dec 2002
Posts: 2671
Location: Paris

PostPosted: Sun Jul 12, 2009 3:41 pm    Post subject: Reply with quote

Bonjour,

Déjà je m'étais jamais posé cette question ni eu à faire ce genre de manipulations, mais en faisant un bête wget -h j'obtiens :
Code:
HTTP options:
       --http-user=USAGER      fixer l'USAGER http.
       --http-password=MDP    fixer le MDP (mot de passe) http.
       --no-cache              permettre la cache de données sur le serveur.
  -E,  --html-extension        sauvegarder les documents HTML avec la terminaison `.html'.
       --ignore-length         ignorer le champ de l'en-tête `Content-Length'.
       --header=CHAÎNE         insérer la CHAÎNE à travers les en-têtes.
       --max-redirect          maximum redirections allowed per page.
       --proxy-user=USAGER     fixer le nom d'USAGER proxy.
       --proxy-password=MDP    fixer le MDP (mot de passe) du proxy.
       --referer=URL           inclure l'en-tête `Referer: URL' dans la requête HTTP.
       --save-headers          sauvegarder les en-têtes HTTP dans le fichier.
  -U,  --user-agent=AGENT      s'identifier comme AGENT au lieu de Wget/VERSION.
       --no-http-keep-alive    désactiver l'option HTTP keep-alive (connexions persistentes).
       --no-cookies            ne pas utiliser les cookies.
       --load-cookies=FICHIER  charger les cookies à partir du FICHIER avant la session.
       --save-cookies=FICHIER  sauvegarder les cookies dans le FICHIER après la session.
       --keep-session-cookies  charger et sauvegarder les cookies de sesson (mode non permanent).
       --post-data=CHAÎNE      utiliser une méthode POST; transmettre la CHAÎNE comme des données.
       --post-file=FICHIER     utiliser une méthode POST; transmettre le contenue du FICHIER.
       --content-disposition   honor the Content-Disposition header when
                               choosing local file names (EXPERIMENTAL).
       --auth-no-challenge     Send Basic HTTP authentication information
                               without first waiting for the server's
                               challenge.


Ensuite, en général les 2 méthodes les plus répandues pour récupérer des données en HTTP sont GET et POST :
http://fr.wikipedia.org/wiki/Http wrote:
GET
C'est la méthode la plus courante pour demander une ressource. Une requête GET est sans effet sur la ressource, il doit être possible de répéter la requête sans effet.
POST
Cette méthode doit être utilisée pour ajouter une nouvelle ressource (un message sur un forum ou un article dans un site). L'URI fournie est l'URI d'une ressource liée à la nouvelle ressource (comme l'URI du forum ou site) et non l'URI de la ressource nouvellement créée.


A partir de l'ensemble de ces éléments tu as le moyen de charger un fichier cookie avec wget (--load-cookies) et/ou d'envoyer un appel POST plutôt que GET avec --post-data par exemple. De toute façon, que ce soit un GET ou un POST, la différence c'est qu'avec le GET il faut que toutes les informations soient dans l'url du GET (alors que le POST ça sera plus sous forme d'un formulaire).

Enfin, si tu n'a pas d'idée du type d'url qu'il te faut formaté, tu as un moyen simple de l'obtenir si tu es capable de soumettre cette url avec un navigateur web. Pour ce faire, utilises wireshark pour faire une capture réseau sur le port 80 (peut être que ton port sera différent, par défaut c'est celui là). Une fois la capture obtenue tu auras le GET (ou POST) avec l'ensemble des éléments que tu auras besoin de transmettre.

Cdt,
Back to top
View user's profile Send private message
Display posts from previous:   
Reply to topic    Gentoo Forums Forum Index French All times are GMT
Page 1 of 1

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum