in Ruhe weiterlesen
Da meine armen Hirnwindungen mittlerweile vollkommen ausgelastet sind, will ich über diesen Weg mal den Gentoo-Brain-Cluster (TM) aktivieren
Es geht um folgendes Problem:
Man nehme eine Website, schreibe irgend einen blah, blah rein und irgendwo postiere man einige Mailadressen darin:
Code: Select all
<HTML>
...
<A HREF="mailto:mickey.mouse@entenhausen.eh">mickey.mouse@enthenhausen.eh</A><BR>
<A HREF="mailto:donald.duck@entenhausen.eh">donald.duck@enthenhausen.eh</A><BR>
...
</HTML>Das bedeutet:
- Ersetzen der Mailadresse durch ein Bild ist doof da gerade bei langen & komplizierten Mails alles mühsam abgetippt werden muss.
- Verschandeln der Mailadresse (z.B. mickey [dot] mouse [at] entenhausen [dot] eh) ist doof weil links dann nicht mehr direkt anklickbar sind.
- Verwendung von Javascript oder Cookies um die Mailadresse(n) einzupflanzen ist doof weil heutzutage mit all den voreiligen PersonallFirewall's und Virensuites irgendwer sicherlich KEINE Mailadresse angezeigt bekommt.
Die bisher beste Lösung die ich für dieses Problem gefunden habe ist folgende:
Jeder Buchstabe der Mailadresse wird entweder als normales Zeichen (Möglichkeit 1), als HTML Hex Code (Möglichkeit 2) oder als URL encoded (Möglichkeit 3) Zeichen dargestellt. Die Verwendung der einzelnen Möglichkeiten erfolgt (mehr oder weniger) willkürlich. Für mickey mouse würde das Resultat dann z.b. so aussehen:
Code: Select all
<HTML>
...
<a href="mailto:%6d%69c%6bey.%6douse@e%6e%74en%68a%75sen%2ee%68">mickey.mouse@entenhausen.eh</a>
...
</HTML>Zum Test könnt Ihr euch den Code einfach mal in ein leeres html pasten und ausprobieren. Der Vorteil vom ganzen ist der, dass die Mailadresse anklickbar bleibt, dem Mailclient normal übergeben werden kann und trotzdem vor RegEx'es versteckt bleiben kann.
Die Frage die sich mir nun stellt:
Ist das ganze wirklich vor RegEx's sicher? Kann man damit ein Scan Programm wirklich täuschen oder ist es mit einem simplen Script ganz einfach möglich die Mails aus dem Source zu extrahieren?
Hier also der Aufruf:
Wer hat Lust anhand einer Beispiel Website die Mailadressen mittels Script herauszuholen? Oder kann jemand sachdienliche Hinweise liefern, welche aufzeigen, dass das ganze nicht funktionieren kann?
P.s. Die Beispiel Website ist ebenfalls ein schönes Beispiel, weil Lycos einfach VOR und NACH meinem HTML Text noch Werbemüll und Scripts knallt.
P.s.2. ich selber werde mich am Weekend ebenfalls dem Problem widmen (Man soll mir nicht nachsagen, ich lasse andere für mich arbeiten
Lieber Gruss
STiGMaTa




