www.blinde-kuh.de
Designschaltung zum Testen:

Blinde Kuh Information Jugendschutz XML-Struktur

Die XML-Struktur des BK-ABS

Die XML-Struktur ist grob

<?xml version="1.0" encoding="ISO-8859-1"?>
  1 <bk-abs> 
    2 <total>3536</total>
    3 <count>3761</count> 
    4 <items>  
          /* Einträge */
       </items>
     </bk-abs>

Der Tag 1 <bk-abs> klärt, dass es sich hier um die Angaben des Blinde Kuh Antiblockiersystem handelt.

Der Tag 2 <total> ist die Angabe für die Einträge direkt aus dem Index der Blinden Kuh Suchmaschine, während es durchaus noch weitere Adressen geben kann, was quantitativ in 3 <count> angegeben ist. (Änderung noch vorbehalten)

mögliche weitere Domains für www.blinde-kuh.de:

  • Domains mit und ohne www als Subdomain: blinde-kuh.de
  • Domains mit und ohne Minuszeichen im Namen: blindekuh.de
  • Domains mit anderen Topleveldomains: www.blinde-kuh.at
  • Einspieladressen für Inhalt Dritter: www.kids-e-zine.de/community/
  • etc.

Im Tag 4 <items> werden die einzelnen Einträge mit dem Container-Tag <item> aufgelistet.

<indextype> kann verschiedene Bedeutungen haben.

indextype=domain

So würde

<item id="00000815" md5domain="c3f95b01b07038a5f240fb66ee39cf62">
<indextype>domain</indextype>
</item>

aussagen, dass die Adresse "www.seitenstark.de" komplett im Index der Suchmaschine aufgenommen ist. Jede Seite von www.seitenstark.de könnte daher im Index der Suchmaschine zu finden sein. Der hash-String c3f95b01b07038a5f240fb66ee39cf62 ist der md5-Schlüssel für "www.seitenstark.de".
Link: Wikipedia md5-Schlüssel


indextype=dir

Es kommt auch vor, dass die Domain selbst gar nicht in die Suchmaschine aufgenommen wurde, etwa weil nur die Kinderseite einer Gemeinde für Kinder brauchbar erschien, oder nur ein bestimmtes Thema relevant war, z.B. eine berühmte Person, wie Epikur, die etwa auf einer privaten Homepage in einer Universität ausführlichst beschrieben wurde, oder gar ein Gedicht von Schiller (Die Glocke) auf einer Seite eines Unternehmens (Glockengießer). Gut, die Glocke ist jetzt ein heftiges Beispiel für Kinder. Aber es könnte ja sein, dass die Glocke dort mit Bildern der Herstellungsvorgänge illustriert wurde, aber der Server anonsten für Kinder, die unsere Suchmaschine nutzen, eher uninteressant ist.

In dem Falle könnten ganze Verzeichnisse bedenkenlos aufgenommen sein.

Hier als Beispiel, die Kinderzeitschrift Geolino:

<item id="00000815" md5domain="4d4128b212930fdad4b7c212b8b6c4d5">
<dir>/geolino/</dir>
<indextype>dir</indextype>
</item>

indextype=file

In einem anderen Fall sind es nur die einzelnen Dateien. Dies kann etwa vorkommen, wenn eine große Zeitung eine Kinderzeitung im PDF-Format anbietet, oder wenn sich die Videos bzw der Podcast einer Kinderseite auf einem anderen Server befinden.

Hier als Beispiel, die Kinderzeitschrift Galaxo:

<item id="00000815" md5domain="f504f3c9a587ef450157747ce44d1178">
<file  media="pdf">/extern/downloads/Galaxo_2007-05-25.pdf</file>
<file  media="pdf">/extern/downloads/Galaxo_2007-06-08.pdf</file>
<file  media="pdf">/extern/downloads/Galaxo_2007-06-19.pdf</file>
<file  media="pdf">/extern/downloads/Galaxo_2007-06-29.pdf</file>
<file  media="pdf">/extern/downloads/Galaxo_2007-07-03.pdf</file>
<file  media="pdf">/extern/downloads/Galaxo_2007-07-06.pdf</file>
<file  media="pdf">/extern/downloads/Galaxo_2007-07-13.pdf</file>
...
<indextype>file</indextype>
</item>

Bei der Blinden Kuh werden keine Ausschlussregeln genannt.