Archive for the ‘Allgemein’ Category

Weil zwischen diesem und dem letzten Beitrag nix liegt, steige ich gleich voll ein.
OKOK, ein paar Stichwørter zur kurzen Wiederholung: zu viele Selbstreferenzen auf LL0, die meisten davon sind vom No-way-home-Archipel, welches aber nur ein Spezialfall des beim letzten mal erweiterten/verallgemeinerten Konzepts des Archipels-der-nicht-vom-groszen-Linknetzwerk-aus-sich-aber-in-aufsteigender-Reihenfolge-selber-zitierenden-Inseln darstellt.

Diese Erweiterung(en) habe ich beim letzten Mal nicht zuende gefuehrt und das hole ich hiermit nach. Nun aber genug der Vorrede und ich erweitere besagtes Konzepts sogleich um die Inseln Lambda und Kappa:

Lambda ist weiterhin Mitglied der roten Gruppe (weil ich das von der tiefsten Stufe (Zeta/Eta) aus erreiche) und auch Mitglied der gruenen Gruppe (dito, nur eben fuer Theta/Iota). Gleichzeitig bildet Lambda eine weitere Untergruppe „fuchsia1“ Ich denke ich muss nicht weiter erklaeren, warum dies eine weitere Untergruppe ist.

Nun ist da aber auch noch die Insel Kappa und hier wird es etwas komplizierter. Kappa hat einen Pfeil der auf Kappa selbst zurueck zeigt. Dies soll eine Seite darstelle, die sich selbst auf LL0 zitiert (und die bereits øfter erwaehnt wurden; bspw. hier) und die in dem Fall hier (und in diesem Zusammenhang relevant) nicht von anderen Seiten zitiert wird. Weil Kappa sich selbst zitiert kann sie nicht zur „Insel der Unzitierten“ (Alpha, siehe der letzte Beitrag) gehøren.

Das Komplizierte ist nun, dass ich bisher die „Stufen der Zitierungen“ relativ klar definieren konnte. Insbesondere konnte ich immer einen Anfang, also eine Stufe Null finden. Beim No-way-home-Archipel bestand Stufe Null aus nur einer Insel. Beim erweiterten Konzept konnte Stufe Null aus mehreren, sich „im Kreis“ zitierenden Inseln bestehen; dito fuer andere Stufen. Wichtig war, dass die Stufen abzaehlbar und schrittweise aufsteigend waren.
Kappa zitiert nun aber Lambda. Kappa ist in Gruppe „blau“ eindeutig Stufe Null und von Kappa aus gesehen ist Lambda Strufe 1. Aber von Eta aus gesehen ist Lambda auf Stufe 2. Das geht doch eigentlich nicht.

Das Dilemma løst sich auf die folgende Weise auf. Im ersten Fall sind die Untergruppen „gruen“ und „fuchsia1“ Teilmengen, welche vollstaendig in Gruppe „rot“ enthalten sind. Die Untergruppen sind also _nicht_ unabhaengig voneinander und dies folgt aus der Abzaehlbarkeit der Stufen.
Wenn Gruppe „blau“ nun als komplett unabhaenging von Gruppe „rot“ angesehen wird, trotzdem die beiden Gruppen eine Insel miteinander teilen (!), dann kann diese Insel Lambda sich eben doch auf zwei verschiedenen Stufen befinden, weil das ja zwei unterschiedliche „Treppen“ sind.

In den Daten wuerde ich die Existenz mehrerer, voneinander unabhaengiger Untergruppen nicht ausschlieszen wollen. Worauf ich aber hinaus will ist, dass diese doch wieder ein Netzwerk bilden, sobald es ein Verbindungsglied gibt. Anders als beim „groszen Auszerhalb“, erreiche ich hier aber NICHT jede Seite von jeder anderen Seite aus (siehe oben). Es gilt weiterhin: eine Seite die sich in einem solchen Netzwerk, welches nicht vom „groszen Auszerhalb“ zitiert wird“, befindet und von einer tieferliegenden Stufe zitiert wird, sollte keine Selbstreferenzen haben

Als Letzte Erweiterung, die aber eigentlich in allem Oben gesagten bereits enthalten ist, fuege ich die Insel Mu hinzu:

Ich habe die zugehørende Gruppe „fuchsia2“ genannt, weil mir die Primaerfarben ausgeganen sind (und gelb zu hell ist und deswegen nicht gut rueber kommt). Aber man kønnte den Namen der Gruppe ja so erklaeren, dass „fuchsia2„, so wie „fuchsia1„, eine Teilmenge von „rot“ ist, die aus nur einem Element besteht. … Puuuh, nochmal gerettet.

Wieauchimmer, Mu ist von Eta aus gesehen auf Stufe 2, gehørt aber NICHT zur Gruppe „gruen“. Zum Glueck habe ich oben das Konzept der voneinander unabhaengigen Teilmengen eingefuehrt und damit ist das kein Problem mehr (selbst dann wenn, wie hier, „fuchsia2“ vollstaendig in „rot“ enthalten ist). Oder anders: eine Stufe kann aus mehreren, voneinander unabhaengigen Inseln bestehen, die sich nicht notwendigerweise zitieren muessen; so wie Theta/Iota und Mu. Beim No-way-home-Archipel war Letzteres implizit gegeben; hier wollte ich direkt darauf hinweisen.
Desweiteren wird Mu von Alpha aus zitiert, ist aber nicht Teil des No-way-home-Archipels. NICHT, weil ich wieder zu Mu zurueck kommen wuerde, sondern weil Mu von Eta zitiert wird, und eine Insel kann nur Teil des No-way-home-Archipels sein, wenn besagte Insel nicht von „Auszerhalb“ zitiert wird (und Eta ist „Auszerhalb“ vom No-way-home-Archipel aus gesehen).

An diesem finalen Diagramm erkennt man, warum ich das in einen zusaetzlichen Beitrag gepackt habe — es passiert naemlich ganz schøn viel und aus dem intuitiv zu verstehenden Spezialfall des No-way-home-Archipels ist ein deutlich komplizierteres allgemeineres Konstrukt geworden.

Hier habe ich beispielhaft drei verschiedene Archipele, die ich als unabhaengig voneinander ansehen kann. Das No-way-home-Archipel hat keine Insel gemein mit der „roten“ Gruppe; bei der „blauen“ Gruppe ist dies aber der Fall. Letztere bilden deswegen aus leicht nachzuvollziehenden Gruenden ein gemeinsames Netzwerk. Ersteres Archipel zitiert aber Seiten in der „roten“ Gruppe und deswegen kann ich alle drei Archipele zu einem Gesamtnetzwerk „zusammen ziehen“. Aber wie gesagt, das bedeutet NICHT, dass man jede Insel von jeder anderen Insel aus erreichen kann.
Sollten in den Daten mehrere Archipele existieren, so sei ebenso gesagt, dass diese durchaus komplett unabhaengig voneinander sein kønnen. Also komplett ohne gemeinsame Elemente oder Zitierungen (selbst wenn diese nur in eine Richtung gehen wuerde).

Nun ist der Artikel schon wieder so lang und ich sage zum Abschluss nur noch das Folgende. Die Existenz des No-way-home-Archipels konnte ich nachweisen. Die Frage ist nun, ob Archipele der erweiterten Form auch im Wikipedialinknetzwerk existieren. Dafuer musste ich eine schøne rekursive Funktion schreiben und die Analyse (meiner Meinung nach durchaus plausibel) einschraenken. Aber das kommt alles beim naechsten mal.

Zur Erinnerung: zum ersten Balken dieser Verteilung tragen 474.653 Seiten bei. Das war eine Ueberraschung und ich fand herraus, dass 451.792 durch das No-way-home-Archipel zustande kommen. Somit muss nur noch fuer 15.212 Seiten erklaert werden, wie diese zum ersten Balken besagter Verteilung beitragen.

Beim letzten Mal meinte ich ganz zum Schluss, dass …

[…] das obige Konzept [des Archipels] […] nochmals erweitert werden [kann].

Und das machen wir heute.

Die Inseln des „No-way-home“-Archipels kønnen aufsteigend sortiert werden. Die Namen — Alpha, Beta, Gamma etc. — deuten dies bereits an und kønnen als Stufe 0, Stufe 1, Stufe 2 usw. gedeutet werden. Dabei ist es so, dass Seiten (auf Inseln) einer bestimmten Stufe nur von Seiten (auf Inseln) auf tieferliegenden Stufen zitiert werden; niemals von Seiten (auf Inseln) auf høherliegenden Stufen.
Es muss wahrscheinlich nicht gesagt werden, ich tue es trotzdem: DAS ist das Alleinstellungsmerkmal des No-way-home-Archipels und der Grund warum es diesen Namen bekam. In diesem Bild ist alles auszerhalb des Archipels auf einer sehr hohen „Stufe“.

Nun zur Erweiterung des Konzepts des Archipels. Die vollziehe ich schrittweise und fange einfach an indem zunaechst nur die Inseln Zeta und Eta hinzugefuegt werden:

Hier und im Weiteren muesst ihr, meine lieben Leserinnen und Leser, euch die duennen, grauen Pfeile selber denken. Diese deuteten beim letzten Mal Links nach auszerhalb des Archipels an. Natuerlich gibt es auch im erweiterten Konzept Links nach auszen, aber ich lasse die duennen grauen Pfeile heute mal weg, denn das wird schon kompliziert genug (und die sind auch nicht wirklich relevant fuer besagtes Konzept).

Von Epsilon aus erreiche ich (eine Stufe høher) Zeta. So weit erstmal nix Neues. Von Zeta aus gehe ich noch eine Stufe weiter und erreiche Eta. Nun ist es aber so, dass Eta (in der gesamten Kette eine „høherliegende“ Insel) wieder Zeta (in der gesamten Kette eine „tieferliegende Insel“) zitiert. Dies ist im Widerspruch zum obigen Alleinstellungsmerkmal und deswegen gehørt alles nach Epsilon NICHT mit zum no-way-home-Archipel.

Die rote Gruppe, gekennzeichnet durch die rote Box, liegt lokal (!) vom No-way-home-Archipel aus gesehen also auszerhalb. Aber Achtung! Weiterhin gilt, dass auch die Inseln in der roten Box nicht vom „allgemeinen (!) Auszerhalb“, also vom groszen, zusammenhaengenden Linknetzwerk, zitiert werden. Die Erweiterung des Konzepts ist naemlich gleichzeitig eine Verallgemeinerung, aber dabei ist nicht zu vergessen, dass diesem Konzept zugrunde liegt, dass keine Insel des Archipels aus dem „groszen Auszerhalb“ zitiert wird. Das No-way-home-Archipel ist nur der Spezialfall mit den zweitmeisten Einschraenkungen (die meisten Einschraenkungen hat Insel Alpha).

Letzteres laeszt sich dadurch veranschaulichen, indem man sich denkt, dass Alpha von Zeta zitiert wird. Im konkreten Fall wuerde das heiszen, dass alle der mehr als 300k „Einwohner“ von Alpha zitiert werden muessten, aber das ist ja nur ein Gedankenexperiment und man muss sich einfach nur vorstellen, dass Alpha nur einen „Einwohner“ hat. In dem Fall bleibt das Grundkonzept des Archipels (keine Zitaten vom „groszen Auszerhalb“ erhalten, aber es gibt kein No-way-home-Archipel mehr.

Weiterhin gilt, dass die „Verbindung“ zum No-way-home Archipel hier nur stattfand um einen Anknuepfungspunkt zu finden. Kein Mitglied der roten Gruppen _muss_ vom No-way-home-Archipel aus zitiert werden. Die rote Gruppe kann isoliert fuer sich allein existieren (muss es aber nicht), so lange besagte rote Gruppe nicht vom „groszen Auszerhalb“ zitiert wird, sind alle Mitglieder der roten Gruppe immer Teil des erweiterten/verallgemeinerten Archipels.

Jetzt bin ich so weit, dass ich den Spezialfall des No-way-home-Archipel auszen vor lassen kann um das Archipel nochmals zu erweitern (immerhin gibt es einen Grund, dass ich die rote Box so grosz gemacht habe):

Von Eta aus zitiere ich Theta und (wichtig) Theta zitiert Iota und Iota zitiert Theta. Diese vier Inseln sind _alle_ Teil der roten Gruppe, Theta und Iota bilden aber ebenso die kleinere gruene Untergruppe.

Was passiert hier? Nun ja, Zeta und Eta bilden zusammen die niedrigste Stufe der roten Gruppe. Von dort gelange ich zu høheren Stufen, die im erweiterten Konzept aus mehreren Inseln bestehen kønnen, aber ich komme von dort nicht zurueck zur niedrigeren Stufe. Das Konzept der „sortierbaren Stufen“ bleibt also erhalten, gilt aber nicht mehr nur fuer einzeile Inseln, wie im Spezialfall des No-way-home-Archipels, sondern fuer ganze Inselgruppen.
Ich nenne nenne es deswegen Untergruppe, weil ich von der niedrigsten Stufe die grøszte Menge an anderen Inseln (naemlich alle) erreiche, aber nicht umgekehrt. Oder anders ausgedrueckt: die gruene Gruppe ist eine Teilmenge der roten Gruppe.

Es sei gesagt, dass die niedrigste Stufe aus mehr als nur zwei sich gegenseitig zitierenden Inseln bestehen kann. Prinzipiell kønnte es eine ganze „Inselkette“ sein, solange die sich alle nur wenigstens „im Kreis“ zitieren. Also mindestens die letzte Insel der Kette muss wieder die erste Insel der Kette zitieren. Das muss also kein direktes Hin-und-Zurueck sein, wie oben dargestellt.

An dieser Stelle bin ich noch nicht fertig, ich merke aber, dass der Artikel schon wieder arg lang ist. Deswegen verschiebe ich die naechsten Erweiterungen auf das naechste Mal.

Neulich stolperte ich ueber dieses Diagramm:

Aus diffusen rechtlichen Gruenden buchstaeblich vom Bildschirm abfotografiert, wobei das hier meine Quelle war. Wie ueblich im Internet konnte ich die Originalquelle des Bildes nicht ausfindig machen, aber entweder das Bild oder wenigstens die Daten dazu scheinen aus diesem Buch zu stammen.

Willow kann seine (ihre? ich kenn mich damit nicht so aus) Abstammung in einer langen Linie bis zu Susan zurueck verfolgen. Und dann wird so gern gesagt, dass ein Teil von Susan in Willow bis ins 21. Jahrhundert gelebt hat.

Das erinnerte mich daran, wie in Frank Herberts Dune-Universum die Erinnerungen der Vorfahren in den Genen gespeichert sind und besagte Vorfahren dann mehr oder weniger autonome innere Ratgeber fuer einen Menschen werden kønnen, wenn der „genetische Wissensspeicher“ aktiviert wird.

Und da stellte sich mir die Frage: wie viel ist eigentlich noch von „mir“ (beachte die Anfuehrungszeichen (!); deren Bedeutung wird aber erst im Laufe dieser Miniserie klar) in 1000 Jahren „vorhanden“?
Oder in kurz, es geht irgendwie mal wieder irgendwie um das worueber ich bereits hier sprach.
Im Laufe dieser Miniserie werde ich Argumente bringen, warum diese Vorstellung (dass da noch was von „mir“ sein wird) alberner Unsinn ist und ich die Frage von Anfang an (also nicht erst nach 1000 Jahren) ganz konkret mit < NICHTS > beantworten kann. Aber es wird auch im mehr als dies gehen.

Jetzt beim Schreiben faellt mir auf, dass das eigentlich alles Gedanken im grøszeren Umfeld dessen sind, dass ich versuche zu lernen, mit der Absolutheit meiner eigenen Sterblichkeit umzugehen … aber so mache ich das ja immer, ich zerlege schwere Probleme in Teile die ich prozessieren kann … und oft kommen dabei Fragen und Antworten und Ideen und Ueberlegungen bei raus, die ganz unabhaengig vom urspruenglichen (oder eigentlichen) Problem durchaus interessant sind :) .

Zur Erinnerung: im allerersten Balken in der hier gezeigten Verteilung stecken 474.653 Seiten. Davon sind nur 7649 von der Sorte, die sich auf LL0 selbst zitieren und entweder keine oder niemals mehr als eine Selbstreferenz auf høheren Linkleveln haben. Damit muss ich nur noch erklaeren wo die restlichen 467.004 Seiten die dieses Signal ausmachen herkommen.

Natuerliche Kandidaten sind uns bereits vor fast genau einem Jahr begegnet. Es sind Seiten die niemals nicht zitiert werden (und damit in dem zweiten Grafen den schwarzen Streifen auf der linken Seite verursachen), aber selber andere Seiten zitieren. Damals waren die nur im grøszeren Zusammenhang von Interesse aber im Speziellen nicht weiter relevant. Aber im Zusammenhang mit dem Mysterium des hohen ersten Balkens der Verteilung der Maxima der Selbstreferenzen muss ich eben diese nun etwas genauer betrachten.

Solange eine Seite Links hat, hat diese prinzipiell Zugriff auf das gesamte Wikipedialinknetzwerk. Wenn diese Seite nun niemals woanders verlinkt wird, so fuehrt dies zu null Selbstreferenzen, trotzdem ich von der Seite den Rest des Linknetzwerkes abschreiten kann. So weit so klar und ich kann relativ einfach schauen, welche Seiten niemals nicht zitiert werden. Derer gibt es 320.089 … wow!
Es gibt sozusagen eine „isolierte Insel“ auf der ca. 5 % aller Wikipediaseiten „wohnen“. Von dieser Insel kommt man zwar weg (Links zu anderen Seiten) aber wenn man einmal weg ist, dann kommt man niemals zurueck (weil ja kein Inselbewohner zitiert wird).
Auch wenn mich die Menge etwas ueberrascht so ist das natuerlich gut mit Hinblick auf obiges Mysterium. Denn pløtzlich muss ich nur noch eine Erklaerung finden fuer 146.915 Seiten die zitiert werden, aber trotzdem keine Selbstreferenzen erhalten. Hier greift die obige, einfache Erklaerung nicht.

Nun denke man sich aber eine Seite, die zwar KEIN „Einwohner“ der (isolierten) „Insel der Verdammten Unzitierten“ ist. Diese  Seite wird dann sehr wohl zitiert, aber weiter denke man sich, dass diese(s) Zitat(e) NUR von besagter Insel kommen.
In dem Fall hat man auch null Selbstreferenzen, denn von der Seite komme ich ja niemals auf die Insel und somit kann das Selbstzitat auch niemals aktiviert werden.

So weit so gut. Ich schaute mal und tatsaechlich, ich habe 124.139 Seiten die zwar nicht Teil der „isolierten Insel“ sind, aber NUR von dort Zitate erhalten.
Cool wa! Damit bleiben nur 22.776 Seiten uebrig. Prinzipiell kønnte ich hier aufhøren und sagen, dass alles uebriggebliebene Unerklaerte nun so wenig ist, dass ich das getrost in den beruehmten Fehler druecken kann. Aber ich bin mit meinen Ideen noch nicht am Ende und das Prinzip der „Insel der Unzitierten“ haelt noch mehr in petto (was uebrigens nicht Latein sondern italienisch ist, obgleich auch aus dem Lateinischen abgeleitet) was auch so einiges ueber die Struktur des Linknetzwerkes beleuchtet. Dafuer muessen wir das Konzept aber von einer Insel zu einem Archipel erweitern. … Ich habe da mal was vorbereitet:

Die grosze Ellipse mit dem groszen Alpha drin soll die „isolierte Insel der Unzitierten“ darstellen. Die duennen, grauen Pfeile gehen zu Seiten die mit dem gesamten (restlichen) Linknetzwerk verbunden sind (aber natuerlich NICHT mit dieser Insel).
„Einwohner“ auf Alpha zitieren Einwohner auf den Beta und Gamma Inseln. Das ist durch die dicken, blauen Pfeile gekennzeichnet. Dies beruht aber nicht auf Gegenseitigkeit, denn von dort geht kein dicker, blauer Pfeil (und somit kein Zitat) zurueck. Damit kønnen Beta und Gamma NICHT Teil von Alpha sein, denn die werden ja zitiert (von Alpha) waehrend das Erkennungsmerkmal von Alpha gerade ist, dass die Seiten dort nicht zitiert werden. Gamma zitiert nun Delta und Delta zitiert Epsilon und von Epsilon komm ich nur zu Seiten im groszen Linknetzwerk.

Es bildet sich also eine Art Inselkette und das wichtige Merkmal dieser Kette ist, dass die Zitate immer nur in eine Richtung gehen und niemals zurueck! Sobald ich eine Insel verlassen habe, komme ich nie wieder auf diese zurueck.
Nun ist es aber keine Kette sondern vielmehr eben ein Archipel. Dies versuche ich mit den zwei Pfeilen zur Insel Gamma darzustellen. Oder anders: das Prinzip auf das ich hinaus will bleibt erhalten, auch wenn man Zitate von verschiedenen Inseln zulaeszt.

Was hat das nun mit unseren 22.776 Seiten zu tun, die oben noch uebrig geblieben sind? Zur Klaerung dieser Frage stelle man sich Folgendes vor: alle Einwohner von Insel Gamma gehøren zu diesen 22.776 Seiten (denn die werden ja zitiert (von Alpha und Beta)). Wenn ich mit einer Seite auf Insel Gamma starte, dann habe ich Zugriff auf das gesamte Linknetzwerk (via den duennen, grauen Pfeilen), aber von dort kommt ja niemals ein Zitat zurueck (und somit keine Selbstreferenz zustande). Die einzige Selbstreferenz kønnte von den Inseln Alpha oder Beta stammen, aber weil niemand von auszerhalb Alpha oder Beta zitiert und Insel Gamma dies auch nicht tut sind wir wieder bei obiger Situation, dass diese Selbstreferenzen niemals „aktiviert“ werden.

Aber Achtung! Waehrend die Existenz von Insel Alpha durchaus als plausibel von vornherein angenommen werden konnte, ist die Existenz eines solchen Archipels mitnichten zwangslaeufig!

Ich habe natuerlich mal geguckt und siehe da: es gibt ein solches no-way-home Archipel. Insgesamt besteht das Archipel aus 39 Inseln (inklusive der zuerst betrachteten „Insel der Unzitierten“), auf denen sich 451.792 Seiten tummeln. Die obigen 124.139 Seiten welche nicht Einwohner der „Insel der Unzitierten“ sind aber von dort zitiert werden, „wohnen“ also alle auf dem Archipel. Der Rest sind ebenso Bewohner des Archipels, die werden aber nicht von Insel Alpha zitiert.
Die weitaus meisten Inseln haben uebrigens drei oder weniger „Einwohner“; der allergrøszte Teil der „Einwohner“ treibt sich also auf nur drei Inseln rum.

Cool wa! Pløtzlich bleibt von den 474.653 Seiten im ersten Balken der Ursprung von nur noch 15.212 Seiten unerklaert. Das nenn ich mal einen riesigen Erfolg.
Ganz am Ende bin ich damit noch nicht. Denn das obige Konzept kann nochmals erweitert werden. Aber das mache ich beim naechsten Mal.

Wie schon bei den totalen und den neuen Links, schaute ich mir auch bei den Selbstreferenzen an, wo jeweils das Maximum der indivduellen Verteilung lag. Und hier erlebte ich diese Ueberraschung:

Ich meine natuerlich, dass sich das so unerwartet lang hin zieht. Diese Ueberraschung stellt sich dann aber gar nicht mehr als so interessant dar, wenn man das in Bezug setzt zur Anzahl der totalen Links. Man nehme bspw. LL10; dort gibt es noch insgesamt 222 Selbstzitate … bei immer noch ueber 200 Milliarden (!) Links total … ja gut, rein statistisch sollte das schonmal passieren. Nichtsdestotrotz komme ich nochmal kurz auf drei Seiten die zu den Messwerten ganz am Ende fuehren zurueck … weil’s kurios ist.

Wenn man die Anzahl aller Links auf einem Linklevel in Betracht zieht, dann „tuemmeln“ sich die Selbstreferenzen um Bereich des Erwarteten — sehr zum Anfang dieses Diagramms.
Ich bin also ein „Opfer“ des Gegenteils des hier als „logarithmische Komprimierung“ beschriebenen Effektes geworden: der logarithmischen Streckung und des Schaffens von (unnøtiger (?)) Aufmerksamkeit zu hohen Linkleveln und den dortigen kleinen Werten.

Wieauchimmer, die eigentliche Ueberraschung liegt vielmehr ganz am Anfang — buchstaeblich im ersten Balken: der ist naemlich urst hoch! Sagte ich nicht, dass es nur ca. 80k Selbstreferenzen (und alle sind Artefakte) auf LL0 gibt? Der Balken hat aber eine Amplitude von fast 500-tausend.
Um dies aufzuklaeren muss ich nochmals etwas weiter ausholen, was eigentlich hinter dem obigen Diagramm steckt.

Als ich das bei den totalen Links zum ersten Mal einfuehrte, erklaerte ich, wie dies zustande kam. Ich schaute mir fuer jede Seite an, auf welchem Linklevel diese die meisten totalen Links hatte. War besagtes Maximum bspw. auf LL5, so ging der Zaehler des Balkens bei LL5 um eins hoch. Wenn man sich die beispielhaft gezeigten individuellen Verteilungen nochmals anschaut, so sind das richtig schøne Kurven mit einem klaren Anfang, Maximum, Mittelteil und Ende.
Bei den neunen Links wird im Wesentlichen die gleiche Situation herrschen (von der Grøsze der Zahlen auf der Ordinate natuerlich abgesehen). Es gibt keinen Grund anzunehmen, dass dies dort anders sein sollte; dafuer sind diese beiden „Messgrøszen“ zu aehnlich.

Bei den Selbstreferenzen laufe ich aber in das Problem, dass ich davon nur so wenige habe. Erstmal kønnte das kein Problem, sein, denn auch bei kleinen Zahlen kann man (mehr oder weniger) „schøne Kurven“ haben. So wie im linken Diagramm in diesem Bild (Achtung: es gibt keine Werte zwischen den Punkten; die Linien sind nur da, damit man dem Verlauf eines Datensatzes besser folgen kann):

Bei der 1916 Democratic National Convention (schwarze Kurve im linken Diagramm) geht die Anzahl der Selbstreferenzen hoch, hat ein klar definiertes Maximum ungefaehr da wo auch das Maximum der totalen Links ist und geht dann schnell runter auf Null. Das ist also so wie oben beschrieben.
Das 10th Iowa Infantry Regiment (rote Kurve im linken Diagramm) duempelt recht lange bei kleinen Werten vor sich hin aber dann gibt es auch hier ein klares Maximum. Die Kurve folgt im Groben dem beschriebenen Schema.
Im Wesentlichen dito fuer die 10th Irish Film & Television Awards (blaue Kurve im linken Diagramm). Es gibt ein sehr breites (zweigeteiltes) Maximum gleich zum Anfang, aber die generellen Strukturen einer „schønen Kurve“ sind durchaus erkennbar.

Wichtig hieran sind zwei Sachen. Zum einen, dass „die Statistik“ (was immer das auch sein mag), also die Flaeche unter der Kurve, noch grosz genug ist um (relativ) gute Aussagen treffen zu kønnen. Zum Anderen verteilt sich besagte Statistik ueber einen (mehr oder weniger) ausgedehnten Bereich. Letzteres ist nøtig um ueberhaupt von einer „Kurve“ (welche analysierbar ist) sprechen zu kønnen.

Was aber mindestens genauso haeufig vorliegt, sieht man im rechten Diagramm (ACHTUNG: selbe Farben, unterschiedliche Seiten!). Ich habe die Linien weg gelassen, damit man das Ausmasz der Misere besser wahr nimmt.
Fuer das 1916 Furman Purple Hurricane football team versammeln sich (fast) alle Selbstreferenzen auf LL1 (plus eine einzige auf LL3). Ein Punkt ist keine Kurve (und immer das Maximum).
Bei den 10th Lambda Literary Awards verteilen sich die Werte zwar auf mehr als ein Linklevel, aber „die Statistik“ ist nicht so doll. Ist das ein „echtes“ Maximum bei LL3, blosz weil der Punkt dort mit einem Wert von zwei um eins høher ist als die Punkte bei LL1 bzw. LL4?
Und beides gleichzeitig liegt fuer das 10th Kisei vor.

Ich frag mich was es mit der Haeufung von 10’ern in den Beispielen auf sich hat. Naja, kommt sicherlich dadurch zustande, dass ich diese nur semi-zufaellig ausgewaehlt habe. Nicht vergessen, auch wenn ich hier die kompletten Titel hinschreibe, so arbeite ich intern mit Nummern. Und ich habe die Nummern fuer die Beispiele nicht aus allen 6 Millionen møglichen gezogen sondern nur unter den ersten 50-tausend die genommen, die fuer die Beispiele gepasst haben und auch repraesentativ waren. Das kønnte ja sein, dass es im Wikipediaquellcode ’ne Art lose Reihenfolge gibt. Dafuer spricht, dass alle Beispiele hier mit Zahlen anfangen und diese Zahlen alle ’ne „1“ am Anfang haben.

Wieauchimmer, ich schwoff ab. Mit dem bisher Gesagten laeszt sich die Form der Verteilung ganz oben teilweise erklaeren. Um beim dort erwaehnten Beispiel zu bleiben: ich finde es durchaus plausibel, dass 222 Seiten auf ein paar Linkleveln ein Mal, aber auf LL10 zwei Mal zitiert werden und somit zum Balken bei LL10 in besagter Verteilung beitragen.

Auch auf das Mysterium des (relativ) hohen Balkens bei LL0 werfen die obigen Aussagen etwas Licht. Der Grund liegt darin, dass wenn eine individuelle Verteilung „flach“ ist, dann wird das Maximum an den Anfang gelegt. Beispiel: eine Seite hat jeweils drei Selbstreferenzen auf LL5, LL17 und LL23; das Maximum wird nun zu LL5 „gelegt“ obwohl die anderen beiden Messwerte ja gleich grosz sind … aber so ist das nun mal.
Hier komme ich zu den bekannten 83.435 Seiten mit Selbstreferenzen auf LL0 zurueck. Davon haben 75.786 Seiten das Maximum nicht bei LL0. Es bleiben also 7649 Seiten die entweder keine weiteren Selbstreferenzen oder auf keinem Linklevel mehr als eine Selbstreferenz haben.

Von den 474.653 Seiten die im Balken bei LL0 bleiben damit noch 467.004 uebrig die nicht darunter fallen. Wie gesagt, das Obige wirft nur _etwas_ Licht auf das Mysterium.
Der Beitrag ist aber schon so lang und deswegen verschiebe ich die Aufklaerung dieses seltsamen Sachverhalts auf das naechste Mal.

… ist die Fortsetzung der Tales from the Loop. Aber anders als man vielleicht erwarten mag. Die Grundstimmung bleibt durchaus erhalten — (verlorene) Vergangenheit, unerklaerliche Dinge im Hintergrund des Lebens. Aber im ersten Buch ist es ein Kind, welches diesen Hintergrund ins Leben integriert und davor (mit seinen Freunden) agiert. Das Unerklaerliche ist spannend, wird konfrontiert und ein groszer Abenteuerspielplatz. Nun aber …

… ist’s ein Jugendlicher, also ein Mensch der mehr und mehr aus der Welt der Abenteuer faellt, ja, fallen muss. Das Unerklaerliche wird zum Teil profan und ist mindestens nicht mehr mysteriøs. Somit ist es nicht mehr spannend und wird halt hingenommen. Noch dazu ist es ein Scheidungskind was natuerlich die Psyche und damit den Blick auf die Welt beeinflusst und so eine positive Rueckkopplungsschleife bzgl. des zuerst Gesagten bildet.

Vielleicht war es deswegen, dass mir dieses Buch nicht so gut gefallen hat. Was eigentlich paradox ist, denn die Art der Kunst und der Motive aendert sich nicht. Auszerdem ist das Buch wirklich gut darin die Stimmung dieses Lebensabschnitts in der gegebenen Umgebung einzufangen. Das es mir nicht so fut gefaellt liegt also nicht am Buch, sondern an mir, dem Leser, denn ich hatte vermutlich nochmals eine durchaus positive Geschichte erwartet.

Man nimmt von sich selber ja immer an, dass man die Krone (also das Ende) der Schøpfung ist. Die Evolution des Menschen ist aber mitnichten abgeschlossen. Hier erwaehnte ich, dass …

[…] die letzten zwei Mutation die sich im menschlichen Genom durchgesetzt haben vor ca. 20-tausend und ca. 7-tausend Jahren stattfanden […]

… blieb die Quelle(n) aber schuldig (und kann diese leider auch heute nicht liefern).

Aber bei dem hier erwaehnten Artikel (*hust*) verblueffte mich auch diese Stelle:

[…] falciparum malaria in its present form is probably only a few thousand years old.

Die Einschraenkung auf „in its present form“ ist wichtig, denn man kann die verantwortlichen Parasiten weitaus laenger zurueck verfolgen. Aber die fuer die Sichelzellenkrankheit verantwortlichen Gene (und somit die direkt zugrundeliegenden Ursachen) sind evolutionsbiologisch ziemlich neu (schon erstaunlich, und urst cool, dass man sowas datieren kann, nicht wahr). Diese Gene konnten sich trotz der gewaltigen negativen Konsequenzen bei homozygotischen Traegern regional in mit Malaria verseuchten Gebieten erhalten. Letzteres natuerlich, weil Menschen die nur eine Kopie dieser Gene mit sich herum tragen besser gegen diese Krankheit geschuetzt sind.

Ich erwaehne das, weil es ein echt tolles Beispiel fuer die oft als „natuerliche Auslese“ bezeichneten Prozesse der Evolution ist. Selbst (und immer noch) beim Menschen und auch in dem Falle hier, wo im Groszen und Ganzen die Ueberlebenswahrscheinlichkeit der Spezies durch solche Gene reduziert wird (wenn diese sich in der gesamten menschlichen Population durchgesetzt haetten), eben weil diese _nur_ auf das Ueberleben gegen Malaria optimiert sind.

Aber damit bin ich bei dem was ich bereits (unter anderem) beim letzten Mal besprach und kann es heute kurz halten.

Letztes Jahr war bei uns so wenig los, dass es sogar Nichtnachrichten in die Nachrichten geschafft haben (gesehen auf einem bei mir im Buero rumhaengenden Bildschirm):

Kein Feuer, Stjørdal
Kein Brand in Husebyhagen
5 von 5 (Neuestes – NRK [Norwegischer Rundfunk] Trøndelag [Lokalabteilung]

Diese Spannung! Was wird als naechstes nicht-passieren? Kein Skandal bei der Regierungspartei? Kein Unfall auf der E6? Oder ganz verrueckt: kein Regen? … wobei das ja wieder ungewøhnlich und somit eine Nachricht waere.

Jedenfalls gilt: Niemand ist sicher vor Sachen die nicht passieren!

Im ersten Nachtrag zu dieser Reihe sprach ich ueber Guppies. Dies als Beispiel um darauf aufmerksam zu machen, dass es fuer die gesamte Population gesehen vermutlich grøszere negative als positive Konsequenzen haben wird, wenn wir die Gene des Menschen nur mit dem Blick auf Intelligenz modifizieren wuerden.

Dort erwaehnte ich auch (mal wieder) die Ashkenazi Juden und wie diese sich in einem natuerlichen „Experiment“ in Richtung (durchschnittlich) erhøhter Intelligenz entwickelt haben und dass dies auch mit (genetischen) Nachteilen einher ging.

Nun stolperte ich vor kurzem ueber einen Artikel von Cochran, G., Hardy, J. und Harpending, H. im Journal of Biosocial Science, 38 (5), 2006 , pp. 659 — 693 in dem es (mal wieder) um diese Gruppe und deren „besonderen Eigenschaften“ ging. Der Titel des Artikels ist „Natural History of Ashkenazi Intelligence“ … *hust*.

Aber ich will im Speziellen gar nicht darauf hinaus, sondern dort wird ein Textbuch zitiert auf welches ich leider keinen Zugriff habe. Deswegen zitiere ich das Zitat ausnahsmweise ungeprueft:

„[…] selection for a metric character that is not fitness itself must reduce mean fitness unless the character and genes controlling it are completely neutral […].“

Das ist die Verallgemeinerung des beim letzten Mal beispielhaft angefuehrten Prinzips: wenn man die Vermehrung von Lebewesen nur aufgrund einer bestimmten Eigenschaft erlaubt, wenn man also eine spezifische Sache (bspw. IQ) selektiert, dann wir das _immer_ die allgemeine Ueberlebenswahrscheinlichkeit dieser Lebewesen (als Spezies) vermindern … und ja das gilt im Wesentlichen, auch beim IQ (siehe das Beispiel der Ashkenazi Juden).

Oder anders: mal wieder ein Verweis auf diesen Beitrag.

Dieser Vogel Dinosaurier hier …

Quelle, Fotograf: Quartl, Lizenz: CC BY-SA 3.0

… wirkt erstmal ganz fluffig. Aber wenn man sich dessen Fuesze mal (aus sicherem Abstand) genauer anschaut …

Quelle, Fotograf: Dezidor, Lizenz: CC BY 3.0

… dann wirkt das gar nicht mehr fluffig.

Beim Guardian stiesz ich auf ein Video, welches dieses Wesen im Attackmodus zeigt. Also ich haette keine Chance gegen diesen eindeutigen Nachfahren fleischfressender Dinosaurier.

„Vogel“ … my ass!