Datenbank der Seiten und Links

Nachdem eine Website "gecrawled" wurde, sind die gefundenen Daten in der Site Visualizer-Projektdatei (*.SVZ-Datei) als Tabellen einer einfachen Datenbank mit folgender Struktur gespeichert:

Site Visualizer Datenbank

Das Programm hat ein eingebautes, eigenes Datenbankmanagementsystem (DBMS). Alle vorgefertigten Berichte wurden in SQL geschrieben.

Um besser zu verstehen, wie die Generierung von Berichten funktioniert, klicken Sie mit der rechten Maustaste auf den Bericht Alle Antworten und wählen Sie den Befehl Bearbeiten... im Kontextmenü. Der SQL-Text sieht wie folgt aus:

SELECT response, response_code, COUNT(*) AS number
FROM links
GROUP BY response, response_code
ORDER BY response_code

Dieser dargestellte SQL-Code sagt aus, dass wir die Anzahl aller Link-Antworten, sortiert nach Antwort-Code, sehen wollen. Sie finden eine Abbildung der Ergebnistabelle im Kapitel Berichte.

Beispiel für doppelte H1-Überschriften

Wenn Sie einen bestimmten Bericht brauchen, aber noch nicht viel Erfahrung mit SQL haben oder keine Möglichkeit, es schnell zu lernen, können Sie mit uns Kontakt aufnehmen, damit wir diesen Bericht für Sie erstellen. Wenn Sie allerdings Ihre Kunden-Berichte selbst erstellen, finden Sie im Folgenden ein Beispiel dazu.

In diesem Fall wollen wir alle Seiten herausfinden, die mehr als eine Überschrift der Ebene 1 (H1) haben. Dazu finden wir zuerst die ID aller Seiten, die doppelte <H1>-Überschriften haben:

SELECT page_id /* 1. Auswahl der IDs aller Seiten mit mehr als einer H1 */
FROM headings
WHERE level=1
GROUP BY page_id
HAVING COUNT(*)>1

Jetzt fügen wir zum besseren Verständnis den Text der Überschrift hinzu (wir fügen die SQL-Abfrage von oben in eine t0-Teilabfrage (subquery) ein:

SELECT t0.page_id, t1.h_text FROM -- 2. Auswahl Text aller gefundenen H1-Überschriften 
(
  SELECT page_id /* 1. Auswahl der IDs aller Seiten mit mehr als einer H1 */
  FROM headings
  WHERE level=1
  GROUP BY page_id
  HAVING COUNT(*)>1
) AS t0 
LEFT JOIN headings AS t1 on t0.page_id=t1.page_id AND t1.level=1

Abschließend - um die Seiten schnell zu finden und die doppelten Überschriften zu bearbeiten oder entfernen - hängen wir die URL und den Titeltext aus der Tabelle Seiten an. Wir binden die obige Anweisung erneut ein (nested queries) und erhalten die vollständige Abfrage:

SELECT url,title,h_text -- 3. URL und Titel   
FROM pages RIGHT JOIN
(
  SELECT t0.page_id, t1.h_text FROM -- 2. Auswahl Text aller gefundenen H1-Überschriften 
  (
    SELECT page_id /* 1. Auswahl der IDs aller Seiten mit mehr als einer H1 */
    FROM headings
    WHERE level=1
    GROUP BY page_id
    HAVING COUNT(*)>1
  ) AS t0 
  LEFT JOIN headings AS t1 on t0.page_id=t1.page_id AND t1.level=1
) AS t0
ON pages.id=t0.page_id

Kopieren Sie jetzt die vollständige (letzte) SQL-Abfrage und fügen Sie diese in das Texteingabefeld im Karteireiter Datenbank des Hauptfensters von Site Visualizer ein. Klicken Sie dann auf die Schaltfläche Ausführen oder die F5-Taste:

Doppelte H1-Überschriften

Die Auswertung enthält die Tabelle mit den Daten, die die Abfrage zusammengetragen hat. Um die Daten an eine externe Anwendung zu übergeben, wie z.B. Excel, wählen Sie die Befehle Alle auswählen und Zeilen kopieren.

Um die Tabelle schnell zu sortieren, klicken Sie auf den Spaltenkopf. Die Tabelle wird nach dieser Spalte in aufsteigender Reihenfolge sortiert. Durch erneutes Klicken auf den Spaltenkopf wird die Sortierung umgekehrt (absteigend).

Der Reiter Meldungen enthält mögliche Fehlermeldung aus der SQL-Ausführung und die dazugehörigen Zeilenangaben, ebenso Erfolgsmeldungen wie die Anzahl betroffener Zeilen. Klicken Sie auf den Menüeintrag Werkzeuge - Als Kunden-Bericht speichern, um den SQL-Text als neuen Kunden-Bericht für spätere Verwendung zu speichern.

 Site Visualizer jetzt testen    Site Visualizer jetzt kaufen