Datenbank der Seiten und Links
Nachdem eine Website "gecrawled" wurde, sind die gefundenen Daten in der Site Visualizer-Projektdatei (*.SVZ-Datei) als Tabellen einer einfachen Datenbank mit folgender Struktur gespeichert:
The program uses PostgreSQL Database Management System (DBMS), which is being installed automatically along with Site Visualizer. Alle vorgefertigten Berichte wurden in SQL geschrieben.
Um besser zu verstehen, wie die Generierung von Berichten funktioniert, klicken Sie mit der rechten Maustaste auf den Bericht Alle Antworten und wählen Sie den Befehl Bearbeiten... im Kontextmenü. Der SQL-Text sieht wie folgt aus:
SELECT response, response_code, COUNT(*) AS number FROM pages GROUP BY response, response_code ORDER BY response_code
Dieser dargestellte SQL-Code sagt aus, dass wir die Anzahl aller Link-Antworten, sortiert nach Antwort-Code, sehen wollen. Sie finden eine Abbildung der Ergebnistabelle im Kapitel Berichte.
Beispiel für doppelte H1-Überschriften
Wenn Sie einen bestimmten Bericht brauchen, aber noch nicht viel Erfahrung mit SQL haben oder keine Möglichkeit, es schnell zu lernen, können Sie mit uns Kontakt aufnehmen, damit wir diesen Bericht für Sie erstellen. Wenn Sie allerdings Ihre Kunden-Berichte selbst erstellen, finden Sie im Folgenden ein Beispiel dazu.
In diesem Fall wollen wir alle Seiten herausfinden, die mehr als eine Überschrift der Ebene 1 (H1) haben. Dazu finden wir zuerst die ID aller Seiten, die doppelte <H1>-Überschriften haben:
SELECT page_id /* 1. Auswahl der IDs aller Seiten mit mehr als einer H1 */ FROM headings WHERE level=1 GROUP BY page_id HAVING COUNT(*)>1
Jetzt fügen wir zum besseren Verständnis den Text der Überschrift hinzu (wir fügen die SQL-Abfrage von oben in eine t0-Teilabfrage (subquery) ein:
SELECT t0.page_id, t1.h_text FROM -- 2. Auswahl Text aller gefundenen H1-Überschriften ( SELECT page_id /* 1. Auswahl der IDs aller Seiten mit mehr als einer H1 */ FROM headings WHERE level=1 GROUP BY page_id HAVING COUNT(*)>1 ) AS t0 LEFT JOIN headings AS t1 on t0.page_id=t1.page_id AND t1.level=1
Abschließend - um die Seiten schnell zu finden und die doppelten Überschriften zu bearbeiten oder entfernen - hängen wir die URL und den Titeltext aus der Tabelle Seiten an. Wir binden die obige Anweisung erneut ein (nested queries) und erhalten die vollständige Abfrage:
SELECT url,title,h_text -- 3. URL und Titel FROM pages RIGHT JOIN ( SELECT t0.page_id, t1.h_text FROM -- 2. Auswahl Text aller gefundenen H1-Überschriften ( SELECT page_id /* 1. Auswahl der IDs aller Seiten mit mehr als einer H1 */ FROM headings WHERE level=1 GROUP BY page_id HAVING COUNT(*)>1 ) AS t0 LEFT JOIN headings AS t1 on t0.page_id=t1.page_id AND t1.level=1 ) AS t0 ON pages.id=t0.page_id
Kopieren Sie jetzt die vollständige (letzte) SQL-Abfrage und fügen Sie diese in das Texteingabefeld im Karteireiter Datenbank des Hauptfensters von Site Visualizer ein. Klicken Sie dann auf die Schaltfläche Ausführen oder die F5-Taste:
Die Auswertung enthält die Tabelle mit den Daten, die die Abfrage zusammengetragen hat. Um die Daten an eine externe Anwendung zu übergeben, wie z.B. Excel, wählen Sie die Befehle Alle auswählen und Zeilen kopieren.
Um die Tabelle schnell zu sortieren, klicken Sie auf den Spaltenkopf. Die Tabelle wird nach dieser Spalte in aufsteigender Reihenfolge sortiert. Durch erneutes Klicken auf den Spaltenkopf wird die Sortierung umgekehrt (absteigend).
Der Reiter Meldungen enthält mögliche Fehlermeldung aus der SQL-Ausführung und die dazugehörigen Zeilenangaben, ebenso Erfolgsmeldungen wie die Anzahl betroffener Zeilen. Klicken Sie auf den Menüeintrag Werkzeuge - Als Kunden-Bericht speichern, um den SQL-Text als neuen Kunden-Bericht für spätere Verwendung zu speichern.
Technical Information
The app uses PostgreSQL v9.5.25, port number 4891. If you have PostgreSQL already installed and you'd like Site Visualizer to use your existing database system, or you'd like to integrate the app into your database, please contact us.