2,049 views

23 Likes   0 Dislikes



Webcrawler #02 - HTML Elemente Richtig Auslesen


Michael Mark

Michael Mark

Published on 2015 December 02


Download :

Description :

📚Buch-Kapitel gratis lesen: https://nobreakpoints.lpages.co/buch-spiele-programmieren/
Bevor wir unseren eigenen Web-Crawler in der Ruby Programmiersprache erstellen, müssen wir zuerst verstehen wie unsere Zielseite überhaupt aufgebaut ist. Wir befinden uns zum Start wieder auf unserer Seite www.rottentomatoes.com und suchen hier doch einmal einen beliebigen Film.

Ich nehme wieder einmal James Bond. Wenn wir hier nach unten scrollen dann sehen wir die Darstellung des Films. Die einzelnen Seiten sind immer gleich aufgebaut. Ruft man beispielsweise die Seite von Hunger Games auf, dann unterscheidet sich diese nicht. http://www.rottentomatoes.com/m/the_hunger_games_mockingjay_part_2/ Also der Aufbau ist definitiv gleich.

00:58 Inspect Element / Element untersuchen
Daher können wir nun mit “rechtsklick” und “Element untersuchen” die einzelnen Elemente der Webseite auswählen. Starten wir doch zuerst einmal mit dem Titel. Wir klicken auf den Titel und hier unten in der HTML Übersicht sehen wir, dass der Titel innerhalb des h1 Container gespeichert wird. Und so können wir nun alle Informationen sammeln die später gecrawlt werden sollen.

01:38 ratingValue
Beispielsweise auch das Rating der Zuschauer, dieses wird in einer Spalte namens “ratingValue” gespeichert.

01:52 Bilder
Zusätzlich prüfen wir noch wo das Bild abgespeichert wird und wir sehen hier innerhalb einer div names “movie-image-section”

Diese Episode gilt nur als kleine Einführung wie man solche HTML Dokument am einfachsten auslesen kann beziehungsweise die einzelnen Element selektiert.


Comments :


Related Videos
3:12
ProWebScraper
14,209 views
5:07
4:03
Udacity
147,151 views
33:31
11:26
Hitesh Choudhary
286,220 views
4:17
video2brain
39,382 views
12:34
Oresoft LWC
31,263 views
17:07
Software Architecture & Design
4,395 views
0:49
SAM Online Marketing
7 views
3:13
23:56
30:25
1:01:02
Free and Open Source Software Conference (FrOSCon) e.V.
198 views