Die Suche nach Ketten war sehr erfolgreich, unter den potentiellen Kandidaten befanden sich aber auch falsche positive Resultate, also scheinbare Kettenseiten die keinen „wahren“ Ketten zuzuordnen sind.
Ausgangspunkt der Suche war die Nutzung des Linkfrequenzsignals zur Vorsortierung um potentielle Kandidaten zu finden. Danach schaute ich entweder nach „Familiennamen“ bzw. welche Seite welche anderen Seiten zitiert um auch die „Patchworkfamilien“ und Anhaenger zu finden. Da lag es natuerlich nahe, dass ich eine ganze Weile darueber nachdachte ob Letzteres nicht von Anfang an genutzt kønnte um ohne Vorsortierung Ketten zu finden … also so ’ne Art ab inito Analyse. Zu meiner Unzufriedenheit fuehrten diese Ueberlegungen immer in die gleichen Sackgassen die sich alle mit diesem Bild zusammenfassen lassen:

Hier hat man alles: die Kette an sich (Punkte mit roter Umrandung), den Einstiegspunkt (links oben) und das Ende der Selben (mittig unten), abzweigende Ketten (bspw. (aber nicht ausschlieszlich) zu Anhaengern) die Teile der eigentliche Kette „mitbenutzen und ganz wichtig, Teile des direkt „angeschlossenen“ Gesamtwikipedialinknetzwerkes. In kurz: die Kettenseiten sind (selbstverstaendlich!) Teil des Netzwerkes ALLER Wikipediaseiten.
Der Begriff „Kette“ gaukelt leider vor, als ob die nur fuer sich stehen und leicht zu erkennen sind. Ich muss zugeben, dass die Art wie ich das Phaenomen bisher darstellte zu diesem Eindruck beitraegt. Zur Rechtfertigung kønnte ich heranziehen, dass das daher kam, weil Kettenseiten im Linkfrequenzsignal auch scheinbar (!) so aussehen; am Anfang solcher Seiten passiert „nix“ und  erst zum Ende ist ueberhaupt ein nennenswertes Signal da … was ja falsch ist, denn ueber alle Linklevel gibt es ein Signal, aber das ist minimal und ich habe das einfach nicht weiter betrachtet, weil es nicht nuetzlich war.

Das bedeutet, dass der oben erwaehnte ab initio Ansatz doppelt gemoppelt ist, denn dieser wuerde wieder das gesamte Netzwerk untersuche eben mit den Kettenseiten als Ausgangspunkt … und das habe ich ja schon gemacht.

Das wiederum brachte mich dazu mir mal zu ueberlegen, was das „Kettenseitensignal“ in der Linkfrequenz ueberhaupt ist und in kurz ausgedrueckt (unter Zuhilfenahme einer der Physik entliehenen Terminologie) ist es die „Antwort“ des Ensembles (aller Wikipdiaseiten) auf eine „Anregung“ … … … oioioi … hier gibt es drei Sachen zu „entpacken“.

Die „Anregung“ ist nur der Start der Analyse, also das „Anschubsen“, damit die Ursprungsseite (ueberhaupt erstmal) „los geht“ und allen (neuen) Links auf LL0 folgt. So lange es neue Links gibt ist das eine sich selbst erhaltende „Reaktion“.
Mit „Ensemble“ ist die Gesamtheit ALLER Wikipediaseiten gemeint, inklusive der Kettenseiten. Wie oben dargestellt, sind die Kettenseiten (selbstverstaendlich) Teil des Ensembles.
Die Frage zur „Antwort“ ist im Wesentlichen: wann „kollidieren“ (oder sehen) die Seiten des Ensembles zum ersten Mal mit gegebenen anderen Seiten (des selben Ensembles). Damit ist die „Antwort“ selber das was man im Linkfrequenzsignal sieht. Prinzipiell kønnte man das als sowas wie eine „mittlere freie Weglaenge“ betrachten.

Weiterhin ist es nun so, dass die (meisten) Kettenseiten im Durchschnitt viel spaeter mit dem Rest des Ensembles „kollidieren“ als (fast) alle anderen Seiten. DAS ist das Erkennungsmerkmal (aber nicht Alleinstellungsmerkmal!) von Kettenseiten. Daraus folgt dann zwingend: so lange ich die „Antwort“ des (gesamten) Ensembles auf die „Anregung“ nicht kenne, kann ich Kettenseiten nicht identifizieren.
Das habe ich also von Anfang an (vermutlich eher unbewusst … naja … vielleicht semi-bewusst) gemacht, weil ich das Linkfrequenzsignals zur Vorsortierung nutzte; ich hatte nur keine Terminologie dafuer um den Prozess und was dahinter steht systematisch zu beschreiben.

Nun ist es aber so, dass die „Kettensignalantwort“ aber auch von Seiten kommen kann, die keine Kettenseiten sind. Wenn man die Antwort des Ensembles kennt, also Kandidaten schon vorsortiert hat, kann man dann den ab inito Ansatz hernehmen (der dann natuerlich NICHT mehr ab inito ist! … aber die Herangehensweise bleibt erhalten) und den allen wer-zitiert-wen-Links folgen … was das ist was ich gemacht hatte um „Patchworkfamilien“ und Anhaenger zu finden. Zu dem Zeitpunkt hat das Ensemble ja schon „geantwortet“ (ich habe Kandidaten vorsortiert) und dadurch fallen extrem viele Pfeile in der obigen Abbildung weg. Man folgt nur noch den wenigen Verbindungen die grob vereinfachend gesagt noch keine „Kollision“ erfahren haben (oder erst ganz kurz vorher), was sich dadurch ausdrueckt, dass sie eben auch als potentielle Kandidaten fuer Kettenseiten „vorsortiert“ wurden.

In diesem Bild des Ensembles welche auf eine „Anregung“ „antwortet“ komme ich wieder auf eine Idee zurueck, die vor laengerer Zeit bereits vorgeschlagen, naeher untersucht und durch die unzureichende Datenlage wieder verworfen wurde. Das wuerde hier aber zu einem all zu lagen Artikkel fuehren und ich verweise auf das naechste Mal.

Leave a Reply