Forums

Skip to content

Advanced search
  • Quick links
    • Unanswered topics
    • Active topics
    • Search
  • FAQ
  • Login
  • Register
  • Board index International Gentoo Users Polskie forum (Polish)
  • Search

[skypt] rozwiązanie małego programu

Witajcie na polskim forum użytkowników Gentoo!
Opis instalacji i pracy z Gentoo. Pozostała dokumentacja Gentoo

Moderator: SlashBeast

Post Reply
  • Print view
Advanced search
3 posts • Page 1 of 1
Author
Message
ar_it
Apprentice
Apprentice
User avatar
Posts: 212
Joined: Sat Feb 25, 2006 3:36 pm
Location: Poland/Warsaw

[skypt] rozwiązanie małego programu

  • Quote

Post by ar_it » Mon Sep 23, 2013 9:15 am

Witam
Potrzebny jest mi skrypt do pobierania linków od google.pl
zrobiłem sobie cos takiego

Code: Select all

perl -e '$i=0;while($i<1000){sleep 1; open(WGET,qq/|xargs lynx -dump/);printf WGET qq{http://www.google.com/search?q=site:wp.pl+warszawa&hl=pl&start=$i&sa=N},$i+=10}' | grep "\/\/[^/]*wp.pl\/"|grep -v webcache |grep -v forum |grep -v grupy |grep -v firmy
Co daje mi wynik zaczynajacy się od

Code: Select all

42. http://www.google.com/url?q=
a tego co jest powyżej chcialbym się bardzo pozbyć.
I teraz pytanie jak to zrobić.
ar_it
https://www.teamquest.pl/
Top
SlashBeast
Retired Dev
Retired Dev
User avatar
Posts: 2922
Joined: Tue May 23, 2006 11:50 am
Contact:
Contact SlashBeast
Website

  • Quote

Post by SlashBeast » Mon Sep 23, 2013 3:19 pm

Masz w jednej linijce perla, lynxa i grepa (kilka razy), toz to dramat jakis!

Przepisz to wszystko do perla. Uzyj np. LWP::Simple, perl ma bulitin jak grep i mozna nim modzic stringi jak awk'iem.
Top
Jacekalex
Guru
Guru
User avatar
Posts: 554
Joined: Thu Sep 17, 2009 5:18 am

  • Quote

Post by Jacekalex » Mon Sep 23, 2013 10:56 pm

Najlepszy jest WWW::Mechanize, a do Ajaxa lub Javascripta WWW::Scripter (działanie niemal identyczne, jak WWW::Mechanize).
Regexy masz w Perlu takie same jak w grepie, lynxa w ogóle nie potrzebujesz (WWW::Mechanize wczytuje stronę html do zmiennej), trochę rzeźbienia jest, ale warto.

Tu masz przykład skrypta, który conieco czesze ze stron internetowych:
http://jacekalex.sh.dug.net.pl/rssperl

W poszczególnych funkcjach masz przykłady użycia kilku modułów razem z regexami.
Top
Post Reply
  • Print view

3 posts • Page 1 of 1

Return to “Polskie forum (Polish)”

Jump to
  • Assistance
  • ↳   News & Announcements
  • ↳   Frequently Asked Questions
  • ↳   Installing Gentoo
  • ↳   Multimedia
  • ↳   Desktop Environments
  • ↳   Networking & Security
  • ↳   Kernel & Hardware
  • ↳   Portage & Programming
  • ↳   Gamers & Players
  • ↳   Other Things Gentoo
  • ↳   Unsupported Software
  • Discussion & Documentation
  • ↳   Documentation, Tips & Tricks
  • ↳   Gentoo Chat
  • ↳   Gentoo Forums Feedback
  • ↳   Duplicate Threads
  • International Gentoo Users
  • ↳   中文 (Chinese)
  • ↳   Dutch
  • ↳   Finnish
  • ↳   French
  • ↳   Deutsches Forum (German)
  • ↳   Diskussionsforum
  • ↳   Deutsche Dokumentation
  • ↳   Greek
  • ↳   Forum italiano (Italian)
  • ↳   Forum di discussione italiano
  • ↳   Risorse italiane (documentazione e tools)
  • ↳   Polskie forum (Polish)
  • ↳   Instalacja i sprzęt
  • ↳   Polish OTW
  • ↳   Portuguese
  • ↳   Documentação, Ferramentas e Dicas
  • ↳   Russian
  • ↳   Scandinavian
  • ↳   Spanish
  • ↳   Other Languages
  • Architectures & Platforms
  • ↳   Gentoo on ARM
  • ↳   Gentoo on PPC
  • ↳   Gentoo on Sparc
  • ↳   Gentoo on Alternative Architectures
  • ↳   Gentoo on AMD64
  • ↳   Gentoo for Mac OS X (Portage for Mac OS X)
  • Board index
  • All times are UTC
  • Delete cookies

© 2001–2026 Gentoo Foundation, Inc.

Powered by phpBB® Forum Software © phpBB Limited

Privacy Policy

 

 

magic