Ich hab nicht viel von Marvel, denn das interessierte mich damals eigtl. nicht und ich war mit DC gut ausgelastet (zeitlich und noch mehr finanziell) . Aber als die Comics fuer ein paar wenige Jahre grosz waren in Dtschl., kamen auch Marvelsachen auf den Markt die mich „magisch“ angezogen haben … ich kønnte jetzt sagen, dass es an den Storylines lag die mich interessierten … und das war sicherlich ein nicht unbedeutender Grund. Aber ich gestehe ein, dass es vermutlich doch eher an den Zeichnungen lag … was bei dem was ich in dieser Kategorie so bisher zeigte, jetzt sicherlich Bilder von leichtbekleideten jungen Damen in den Køpfen von euch, meinen lieben Leserinnen und Leser, zu Tage førdert. Deswegen nehme ich an, dass euch dieses Cover etwas ueberrascht (hoffentlich positiv):

Jup … es waren die Zeichnungen von Rob Liefeld, weswegen ich mir (ein paar wenige) Marvel(superhelden)comics kaufte.

Und wie man hier deutlich sieht (aber i. A. auch bei Batman, Superman und Co., nur nicht ganz so uebertrieben offensichtlich), hat die Comicindustrie keinen doppelten Standard; auch die Kørper von Maennern entsprechen nicht dem was Otto Normalverbraucher (also ich) im Spiegel sieht … hat das mein Selbstbild beeinflusst … *ueberleg* … neeee, hat’s nicht, ich hab das immer als ’ne Fantasiewelt eingeordnet bekommen (wenn auch nicht unbedingt so bewusst ausgedrueckt) … und das gilt auch fuer die gezeichneten Damen die ich in vorherigen Beitraegen zeigte.

Aber guck mal! So eine geile Actionszene! Kein Wunder, dass junge Menschen (zugegeben, vor allem junge Maenner) Superheldencomics einfach møgen.

Und so’n Gruppenbild fetzt auch:

Apropos „problembehaftete Comics“. Das Maedchen links unten ist Bucky Barnes … eigentlich und allermeistens ein Mann. Wenn man das richtig in die Comicszene und die damalige Welt an sich einsortiert, dann ist das durchaus gewagt und hat zumindest einen Hauch von Gleichberechtigung … und sowas haben Comics i.A. irgendwie immer gemacht. Schon ganz frueher, kein Wunder, dass die so lange als „subversiv“ und „irgendwie gefaehrlich fuer unsere armen Kinder“ angesehen wurden … Comics Code Authority, my bottom!

Wieauchimmer, es stellte sich dann innerhalb weniger Ausgaben heraus, dass die Storyline jetzt nicht so doll war wie angekuendigt … und dann hat Rob Liefeld auch nicht mehr das eigtl. Comic gezeichnet (sondern nur noch die Cover) … ich hoffte damals (und auch beim nochmal durchlesen) sehr, dass das „Industrielle Revolution“-Crossover mit anderen Serien …

… eine Verbesserung bringt. Dem war leider nicht so und ich entschloss mich dann mitten in der Serie aufzuhøren die zu sammeln … bei DC Comics dauerte das immer deutlich laenger, die lagen mir halt mehr am Herzen.

Ich hatte mir damals aus den Summenkurven (hier und hier die Reproduktion) das Verhaeltniss der totalen Links zu den neuen Links angeschaut, weil ich einen (mehr oder weniger) konstanten Faktor vermutete. Dies um Ueberschlagsrechnungen und eventuelle Simulation zu erleichtern. Das Ergebniss war OK.
Spaeter schaute ich mir auch das Verhaeltniss der totalen Links zu den zwei anderen Grøszen von Interesse an. Da kam aber nicht so viel bei rum und ich verfolgte das nicht weiter.

Nun dachte ich mir: ach, das ist unkompliziert, da kann ich schnell ’nen kurzen Reproduktionsbeitrag zu schreiben … tjaaaa … ich habe anscheinend die Kevin Bacon Lektion auch zum Ende des Projekts nicht gelernt: nix geht schnell und es passiert (fast) immer was Spannendes war einer genaueren Untersuchung bedarf. In kurz (Achtung Spoiler): Eine Sache reproduziert nicht.

Die einzelnen Effekte sind relativ subtil und laufen (zu Recht) unter „Reproduktion gelungen“. Aber im (entgegenlaufenden) Zusammenspiel kommt es zu einer Verstaerkung und erst wenn man dieses Zusammenspiel betrachtet (bspw. in Form besagter Verhaeltnisse), dann sieht man die „grøszeren Wellen“ die das Ganze „schlaegt“.

Deswegen habe ich mich entschlossen, diese Reproduktionsbetrachtungen in zwei Artikel zu packen. Hier die (hoffentlich) etwas leichter zu verstehende Sache, die Verhaeltnisse des Summensignals der totalen Links zum Summensignal der neuen Links, den Selbstreferenzen und der Linkfrequenz. Beim naechsten Mal dann die Verhaeltnisse mit den letztgenannten drei Grøszen von Interesse im Zaehler.

Ach so, gleich vorweg: was hier untersucht wird geht natuerlich nur mit zwei Datenquellen. Deswegen lass ich das unter „Reproduktion“ fallen, aber eigtl. ist das ein ein neues Phaenomen … im Zusammenspiel mit bereits bekannten („aelteren“) Phaenomenen.

Und nun geht’s direkt los mit den Diagrammen:

Zunaechst zum „Stein des Anstoszes“ und dem urspruenglichen „Aufhaenger“ dieses (und des naechsten) Artikels: die besagten Verhaeltniss der totalen Links zu den drei anderen Grøszen im linken, oberen Diagramm.

Die „schwachfarbigen“ Kurven zeigen die 2020 Daten und die „vollfarbigen“ Kurven die 2023 Daten. Wie damals gilt: wenn da ein „x 5“ (oder so) steht, dann muss der an der Ordinate abgelesen Wert mit dem entsprechenden Faktor multipliziert werden um zum eigentlichen Wert zu kommen (welche aber nicht weiter von Interesse sind).

Zunaechst das Einfache: das Verhaeltniss der totalen Links zu den Selbstreferenzen (blaue Kurven) ist im Wesentlichen unveraendert. Innerhalb der natuerlichen Schwankungen sind Kurvenform und absolute Werte gleich … also reproduziert.
Das scheint auch fuer das Verhaeltniss der totalen Links zur Linkfrequenz zu gelten (lila Kurven) … ab ca. LL45 hebt sich die 2023 Kurve zwar etwas von der 2020 Kurve ab, aber im Allgemeinen wuerde ich die Abweichungen als zu gering einstufen und zunaechst auch von einer gelungenen Reproduktion sprechen … ABER … das hier ist der erste subtile Effekt und die Reproduktion ist nicht wirklich gelungen … genauere Betrachtungen dazu muessen bis zum naechsten Mal warten.

Und nun der „Elefant im Raum“: das Verhaeltniss der totalen Links zu den neuen Links (rote Kurven). Bis ungefaeher LL25 scheint eine Reproduktion vorzuliegen … aber dann fangen die Kurven immer deutlicher an voneinander abzuweichen. Und zwar nicht nur im Rahmen der zu erwartenden Schwankungen wie bei den blauen Kurven, sondern systematisch wird das 2023 Verhaeltniss kleiner als das 2020 Verhaeltniss. Von den Schwankungen abgesehen wuerde ich abschaetzen, dass ein systematischer Unterschied um bis zu einen Faktor fuenf zu erklaeren ist … sagen wir mal vier, das rechnet sich einfacher. Und da mach ich mich jetzt ran.

Zur Erklaerung verweise ich erstmal auf das rechte obere und und linke untere Diagramm, in welchen die erwaehnten Summensignale der totalen und neuen Links zu sehen sind. Damals sagte ich dazu, dass das reproduziert und das stimmt auch so. Es gibt kleinere Abweichungen bei mittleren bzw. høheren Linkleveln, aber nur um ca. einen Faktor zwei und das ist zu erwarten zwischen verschiedenen Datensaetzen.
Was man aber auch sieht ist, dass dies (wieder) systematische Abweichungen sind — die 2023 Daten liegen bei den totalen Links immer unter den 2020 und umgekehrt bei den neuen Links.

Damit nicht nur immer alles abgeschaetzt bleibt, habe ich die linklevelabhaengigen Verhaeltnisse der jeweiligen 2023 Summenkurve zur jeweiligen 2020 Summenkurve im rechten unteren Diagramm dargestellt. Man sieht, dass meine Abschaetzung (ein Faktor zwei bei høheren Linkleveln) gar nicht mal so schlecht war.

Einzeln fuer sich genommen behaupte ich noch immer, dass die Summenkurven reproduziert werden. Aber wenn die Summenkurven der totalen Links ab mittleren Linkleveln sytematisch um ca. einen Faktor zwei nach UNTEN abweichen und die entsprechenden Kurven der neuen Links systematisch um einen Faktor zwei nach OBEN … dann muss man das multiplizieren fuer das Verhaeltniss der beiden unterschiedlichen Summenkurven zueinander; das ergibt in dem Fall ungefaehr einen Faktor vier zwischen den 2023 und den 2020 Daten … wie aus dem linken, oberen Diagramm abgeschaetzt.

Was fuer’n Mechanismus steckt nun dahinter, der die Anzahl der totalen Links halbiert, aber die Anzahl der neuen Links verdoppelt? Im Allgemeinen ist das sicherlich sehr kompliziert mit vielen „Wechselwirkungen“. Aber der Effekt tritt erst im Bereich der langen Ketten auf und wir wissen, dass zum Ende jeder Kurve alle Wikipediaseiten sich nur entlang einer Kette bewegen — in den 2020 Daten die São-Paulo-Kette, in den 2023 Daten in der Meshir-Kette. Damit kann ich einen einfachen Mechanismus diskutieren, der das Verhalten erklaeren wuerde.

Zunaechst dachte ich, dass ich am Ende ZWEI, parallel „laufende“ Ketten habe. Da kam ich vor einer ganzen Weile zum ersten Mal drauf, als das „Wert am Ausgang“-Diagramm der 2023 Daten ZWEI hohe Balken aufwies. Ich hatte in dem zugehørigen Beitrag geschrieben, dass ich mich da nochmal drum kuemmern werde … hatte das aber vergessen … bis eben gerade.
Der klare Gegenbeweis gegen die zwei-Ketten-These zeigt sich ganz eindeutig in den Resultaten der Reproduktionsuntersuchungen zu den Ketten von neulich … kein einziges Zeichen einer zweiten, parallel laufenden Kette. Also gruebelte ich ’ne Weile drueber nach … und muss dafuer erstmal etwas ausholen und zunaechst nochmal die bekannte Situation der São-Paulo-Kette schildern.

Vereinfacht sieht man das in dieser Skizze:

Aus dem groszen Wikipedialinknetzwerk kommend, steigen (so ziemlich) alle Seiten in die Kette bei A ein. Hierbei lassen wir auszer acht, dass das eigtl. ’ne Verteilung ist. Zum Einen weil wir hier nur den einfachsten, prinzipiellen Mechanismus betrachten um die Beobachtungen zu erklaeren. Zum Anderen weil die allermeisten (Start)seiten (der jeweiligen Linknetzwerkanalyse) ohnehin auf dem selben (!) Linklevel an den Anfang der Kette gelangen.

Wenn wir mitten in … oder eher auf? … der Kette sind (B oder C) gibt’s immer zwei Links total — einen zur naechsten und einen zur vorherigen Seite in der Kette. Davon ist natuerlich nur Ersterer ein neuer Link, denn die vorherige Seite wurde ja zwangslaeufig schon besucht. Bei Kettenseite D geht’s dann nicht weiter (sondern nur zurueck, was verboten ist).

Wie die rote Kurve im Diagramm rechts unten zeigt, muss die Anzahl der _neuen_ Links verdoppelt werden. Das entspricht einer Verdopplung der durchgehenden, „vollfarbigen“ Pfeile. Wenn aber keine zweite Kette zugelassen ist geht das nur, wenn der Einstieg von BEIDEN Seiten der Kette geschieht und man sich in der Mitte trifft. Das wuerde dann so aussehen:

Das muss ich jetzt nicht weiter erklaeren, denn mit der Skizze muss die obige Erklaerung nur gleichzeitig ein zweites Mal angewendet werden. Auf einem gegebenen Linklevel befindet sich „das System“ also bspw. gleichzeitig in B und in B-Strich.
Man beachte, dass die Anzahl der Schritte bis zum Ende (D bzw. D-Strich) gleich bleibt, obwohl die Kette doppelt so viele Seiten enthaelt. Ungefaehr doppelt so viele Seiten sieht man uebrigens tatsaechlich in der Meshir-Kette (im Vergleich zur São-Paulo-Kette).

Super, damit ist der Faktor zwei bei den neuen Links erklaert … das obige Modell ist aber zu einfach, denn es gibt ein Problem: wenn ich die Kette gleichzeitig von beiden Enden kommend entlangscrhreite, dann verdoppelt sich in dem obigen Modell auch die Anzahl der totalen Links. Zunaechst wollte ich das dadurch løsen, dass ich keine „Rueckwaertspfeile“ zulasse … das geht zwar „mathematisch“ … widerspricht aber der Realitaet. Die Seiten der Meshir-Kette zitieren sich immer fein vor- und rueckwaerts.
Die selbe Realitaet hilft aber aus der Misere heraus, denn alle Seiten verlinken ja auch zurueck ins grosze Wikipedialinknetzwerk … (das sind halt alles nur keine neuen Links). Die Situation bei den 2020 Daten sieht also so aus:

Der Einfachheit halber habe ich jeder Kettenseite acht totale Links gegeben … denn das laeszt sich leicht halbieren und nochmal halbieren fuer die Situation bei den 2023 Daten:

Zweimal halbieren muss man das deswegen, weil ich ja die Kette von beiden Ende „ablaufe“. Auf einem gegebenen Linklevel in 2023 hat man also die Summe der Links bspw. von C und C-Strich … diese SUMME muss die Haelfte der Anzahl der totalen Links fuer 2020-C sein. Also kønnen 2023-C und 2023-C-Strich jeweils nur ein viertel der totalen Links von 2020-C haben.
Und das sieht man auch — die Seiten der São-Paulo-Kette haben im Durchschnitt ca. 30 Links pro Seite, waehrend die Seiten der Meshir-Kette im Durchschnitt nur ca. 9 haben. Ist jetzt nicht ganz ein Faktor von vier, aber in dem einfachen Modell haut das schon hin.

Letzteres sieht man uebrigens in dem oben erwaehnten „Wert am Ausgang“-Diagramm. In den den 2020-Daten steigen alle (Start)Seiten bei einer Kettenseite mit 27 Links aus. Hingegen steigt ca. 1/3 der (Start)Seiten in den 2023 Daten bei einer Kettenseite mit 14 Links aus und der Rest bei einer Kettenseite mit 7 Links. Und 1/3 x 14 plus 2/3 x 7 ergibt ungefaehr 9 und das ist naeher an 1/4 von 27 dran als an 1/2 von 27.
Dass das nicht genau hinhaut liegt natuerlich daran, dass die Endseiten nicht genau dem Durchschnitt entsprechen (aber ziemlich nah dran liegen) … und das ist auch ueberhaupt nicht schlimm, denn wenn man nochmal auf das rechte untere Diagramm schaut, dann betraegt das Verhaeltniss der 2023 totalen Links zu den 2020 totalen Links zum Ende ohnehin eher 75 % als 1/2 … und das ist dann schon beinahe die obige 9.

Das soll reichen fuer heute. Es ist ’ne gute Grundlage um die restlichen Verhaeltnisse der Grøszen von Interesse beim naechsten Mal zu besrpechen.

Nur eine Sache noch zum „Wert am Ausgang“-Diagramm. Wie gesagt, damals vermutete ich, dass das durch zwei Ketten zustande kommt, wobei 1/3 der Seiten ein bisschen eher in der einen Kette ist, als in der anderen. Nun gibt es keine zwei Ketten, aber den Einstieg in die Meshir-Kette von beiden Seiten ist analog. Hier ist’s dann so, dass ein Drittel der (Start)Seiten ein Linklevel eher von (ich sag jetzt mal) links als von rechts in die Kette einsteigt. Die kommen dann auch ein Linklevel weiter bevor sie auf die von „rechts kommenden“ (Start)Seiten stoszen. Damit ist fuer 1/3 der (Start)Seiten (der Linknetzwerkanalyse) das Wikipedialinknetzwerk auf C-Strich Schluss (also ueber D = D-Strich hinaus gehend), waehrend alle anderen (Start)Seiten immer noch bei D = D-Strich zum Ende kommen. Zwei verschiedene Seiten mit unterschiedlicher Anzahl an Links gibt zwei Peaks in dem besagten Diagramm.

Fetzt wa! Wie sich das alles aufklaert wenn man mal genauer hinschaut. Und die „Erweiterung“ des Modells aendert (zum Glueck) auch nichts an der (verdoppelten) Anzahl der neuen Links.

Ach ja … ich bin voll froh, dass in den 2020 Daten die São-Paulo-Kette nur von einer Seite durchlaufen wird. Das machte es damals deutlich einfacher alles zu analysieren und zu modellieren. So viel schwerer ist das „beidseitige Abschreiten“ der Meshir-Kette nun auch nicht … aber nur unter der Bedingung, dass man schon von den Ketten weisz … die fallen aber nicht sofort aus den Daten raus. Vielmehr musste ich mir das damals in vielen, zeitlich oft lange auseinanderliegenden, Schritten zusammenreimen. Und die Schritte um zu den Ketten zu kommen tat ich oft genug nur, weil es „Komischkeiten“ in verschiedenen anderen, nur mittelbar mit den Ketten zusammenhaengenden Resultaten gab. Und besagtes Zusammreimen war (vermutlich deutlich) einfacher, weil die São-Paulo-Kettensituation einfacher ist.

Die Space Fatigue ist ueberwunden und ich flitze wieder im Weltraum umher. Als erstes kaufte ich mir ’n neues Raumschiff … meine Kaliadne:

Fetzt wa! … Allerdings fetzt diese elegante Dame. Voll wendig die Gute. Und so sehr ich meine Kassiopeia auch mag … und nicht zu vergessen die hunderttausende … vermutlich eher Millionen von Lichtjahre die ich mit ihr geflogen bin … die vielen zehntausende Spruenge von Stern zu Stern … hach … Erinnerungen … aber ich schwoff ab … jedenfalls so sehr ich meine Kassiopeia auch mag muss ich doch eingestehen, dass sie so agil ist wie’n nasser Sack voll Badewannenstøpsel. Was nicht verwunderlich ist, denn das Schiffsdesign der Anaconda ist nun schon mehrere hundert Jahre alt. Die Mandalay hingegen ist nicht nur frisch aus der Produktion sondern hat auch von Grund auf ein brandneues Design … ich sag mal so: man merkt’s.

Kassiopeia ist nun im wohlverdienten Ruhestand und ich hab eine neue Kutsche fuer meine Reise durch die Galaxie.

Und weil’s so neu ist, kann ich endlich auch auf Planeten mit duennen (!) Atmosphaeren landen … Man sieht das an dem schønen Farbverlauf des Himmels.

Und das kleine Maennchen das da oben auf Kaliadne steht … das bin ICH! Ich habe mir naemlich endlich mal ’nen Raumanzug gekauft. Ist auch nøtig, denn wenn das kalte Vakuum ausgesperrt wird, dann findet (auszerirdisches!) Leben manchmal einen Weg sich an der Kruste festzuklammern … und jetzt wo ich auf solchen Planeten auch landen kann, will ich das natuerlich untersuchen …

… aber dafuer muss ich aus meiner Kaliadne aussteigen … womit der Kreis sich schlieszt, denn das benøtigt einen Raumanzug.

Bonus: im groszen galaktischen Archiv wird vermerkt, wenn ich der erste war der einen Fusz auf einen Planeten setzte … Fetzt, wa!

Im Zuge der Erforschung langer Ketten ging ich ging ich damals nochmal der Idee eines Phasenuebergangs in der Wikipedia nach. Ich denke weiterhin, dass der Ansatz sich mglw. durchaus als Fruchtbar erweisen kønnte, auch wenn ich dann doch nicht viel mehr draus gemacht habe.
Damals beschaeftigte ich mich dann mit der Existenz eines Ordnungsparameters welcher den Phasenuebergangs charakterisieren kønnte. Ich probierte die Anzahl der zitierten Seiten und den „Volumenanteil“ der Kettenseiten an alle Zitaten aus (natuerlich jeweils pro Linklevel). Beides funktioniert qualitativ, und ich meine auch vom Prinzip her, ganz gut. Letztlich kam ich aber zu dem Schluss, dass die Anzahl der NICHT zitierten Seiten pro Linklevel sich am besten als Ordungsparameter eignet.

Wieauchimmer, auf das Thema an sich gehe ich nicht nochmal ein, aber die Anzahl der zitierten Seiten pro Linklevel ist durchaus auch unabhaengig von den Betrachtungen eines Phasenuebergangs und der Diskussion um einen Ordnungsparameter von Interesse. Deswegen hab ich das nochmal fix programmiert und hier ist das Ergebniss:

Da kann ich doch sofort verkuenden: Reproduktion gelungen. Und das obwohl die Kettenseiten sich in den 2023 Daten doch recht anders verhalten. Aber wenn man sich die Resultate diesbezueglich nochmal anschaut und insb. auf die Skala der Ordinate achtet … dann sieht man, dass das „recht anders“ durchaus auch hier zu sehen ist. Denn da wo die Unterschiede in den Kettenseiten bsonders grosz sind, „duempelt“  besagte Skala bei absoluten Weren um ca. 100 rum (ich bin groszzuegig und ueberabaschaetze das jetzt mal massiv), waehrend die Skala der Ordinate im obigen Diagramm ca. ’ne Grøszeordnung grøszer ist. Deswegen haut das mit den Unterschieden hier und da schon hin.

Ein kleiner aber durchaus interessanter Unterschied ist, dass die 2023 Daten im Uebergangsbereich etwas fixer „absteigen“. Da ist die Dynamik also schneller … deswegen ist das interessant … aber das muss sich wer anders mal genauer anschauen.

Die Anzahl der NICHT zitierten Seiten folgt direkt aus den obigen Daten. Mehr oder weniger direkt auch der erwaehnte Volumenanteil der Kettenseiten, aber bei der Quantifizierung dieser Idee konnte man mit gutem Willen in den 2020 Daten zwar einen Trend erkennen, aber das zappelte alles ganz schøn rum. Dewegen wuerde selbst bei sehr aehnlicher Kurve mit den 2023 Daten die Aussagekraft dieser Idee nicht gesteigert werden. Und umgekehrt gilt etwas sehr aehnliches: wenn das alles mit den 2023 Daten anders aussieht, dann ist das nur noch mehr rumzappeln und aus entgegengesetztem Rumzappeln von Daten durch „Rauschen“ kann man nicht notwendigerweise das Gegenteil schlieszen.

Wieauchimmer, das soll’s gewesen sein fuer heute, denn mehr habe ich dazu nicht zu sagen.

Ist ja fein wenn’s auch mal schnell geht. Das war die urpsruengliche Idee die ich fuer die Reproduktion angedacht hatte. Ich konnte ja nicht ahnen, dass ich bei so vielen Sachen nochmal ganze Faesser aufmachen konnte und dass sich das jetzt (schon wieder) viel laenger hinzieht als anfangs geplant … andererseits … so ging das ja die ganze Zeit und immer zu in dieser Maxiserie … vllt. haette ich das doch ahnen kønnen … aaaaaaaaber … ein Ende ist jetzt dann doch endlich mal in tatsaechlich greifbare Naehe gerueckt … das fuehlt sich nicht mehr wie ’ne Fata Morgana an … so wie in den vorhergehenden (fast) sechs Jahren seitdem ich das erste Mal die Idee hatte mir mal das Wikipedialinknetzwerk genauer anzuschauen.

Hohoho …da fang ich mit dem Schreiben dieses Artikels an und mir faellt auf, dass ich unerwarteterweise eine Gelegenheit gefunden habe, doch nochmal dieses Prachtexemplar zu zeigen:

*grins* … der Hintergrund ist naemlich, dass ich im weiteren Umfeld des Lernens ueber die Gravitation, auch (zwangslaeufig) ein bisschen ueber Neutronensterne und die Prozesse in welche diese involviert sind gelesen habe. Im obigen Buch sind die gar nicht so praesent, deren Existenz war zum Zeitpunkt als das Buch geschrieben wurde zwar gesichert via Beobachtungen, aber es gab noch nicht genuegend Messungen um viel draus zu machen … waren die ersten eindeutig Neutronensternen zugeordneten Beobachtungen doch grade mal 5 Jahre alt.

Genug der Vorrede und der Reihe nach. In der Schule … *ueberleg* … als ich noch zur Schule ging, habe ich mir in populaerwissenschaftlichen Buechern den folgenden „Ablauf“ der Entstehung der Elemente — Nukleosynthese — angelesen.
Im Urknall entstand aller Wasserstoff und der grøszte Teil des Heliums. Das Alles sammelte sich in Sternen und durch Fusion haben die dann Elemente bis zum Eisen „ausgebruetet“. Kerne mit høherer Protonenzahl kønnen durch Fusion nicht entstehen, weil die Bindungsenergie pro Teilchen (im Kern) fuer alles was schwerer ist als Eisen wieder abnimmt.
Hier wird’s truebe in der populaerwissenschaftlichen Literatur, denn offensichtlich gibt’s ja Elemente mit deutlich mehr als den 26 Protonen die Eisen hat. Im Wesentlichen wurde ich damals damit abgespeist, dass die in Supernovaexplosionen entstehen. Damit hab ich mich jahrzehntelang zufrieden gegeben und (zu meiner Schande) bis vor gar nicht all zu langer Zeit im Wesentlichen gedacht, dass Elemente wie bspw. Krypton dadurch entstehen, dass in einer Supernova die vorhandenen Eisen und Neon Kerne (im Falle Kryptons) wie zwei Lehmklumpen gegeneinander „geschmissen“ werden und dann einfach „zusammen backen“ (und nur durch die Kraft der Explosion genug kinetische Energie haben um die Coulombarriere zu ueberwinden.

Letzteres ist natuerlich groszer Quatsch und zu meiner „Verteidigung“ kann ich nur anfuehren, dass Nukleosynthese einfach kein Teil meines Lebens oder Studiums war. Aber Teil meines Lebens und Studiums waren ein Haufen „Bausteine“, die mir halfen das was wirklich passiert besser zu verstehen, sodass was nun folgt mein WeltUniversumsbild nur aufraeumte, aber nicht durcheinander brachte … mit einer wichtigen Ausnahme.

Aber der Reihe nach … bzw. das geht nicht in Reihe weil so viel gleichzeitig passiert und man ein bisschen hin und herspringen muss … deswegen eins nach dem anderen.

Erstens ist im Urknall nicht nur Wasserstoff und Helium entstanden, sondern auch ein bisschen Lithium und Beryllium (das wurde aber (fast) vollstaendig als „Treibstoff“ in den nuklearen Reaktionen in Sternen verbraucht). Dann hatte sich das Universum genug abgekuehlt und andere Elemente konnten nicht weiter entstehen. Das aendert aber eigtl. nix an der oben etablierten Story, denn Lithium und Beryllium spielen keine weitere grosze Rolle bei dieser Geschichte.
Dieser Prozess wird primordiale Nukleosynthese genannt und ist an sich eine super spannende Geschichte, denn das war damals mal ein SOWAS von URST KNAPPER Zeitrahmen der unsere heutige Existenz ueberhaupt erst ermøglicht. Wenn ich dran denke, dann erzaehl ich das mal an anderer Stelle.

Nun zum „Ausbrueten“ von Elemente jenseits von Wasserstoff (und Helium) in Sternen via Fusion. Wasserstoff zu (noch mehr) Helium ist gegeben. Und (drei bzw. vier) Heliumkerne zu Kohlenstoff und Sauerstoff ist auch klar.
Fuer unsere Sonne hørt es hier dann auch schon auf. Wie ueber 95 % aller Sterne in unserer Galaxis ist sie einfach nicht schwer genug um genuegend gravitativen Druck zu erzeugen um den elektrostatischen Druck der bereits vorhandenen Kerne zu ueberwinden (bzw. kommt da irgendwann auch die Quantenmechanik via Pauli’s Ausschlussprinzip ins Spiel, aber ich will’s hier ja kurz halten). Am Ende des Lebens unserer Sonne bleibt also ein Kern zurueck, der sehr viel Kohlen- und Sauerstoff enthaelt … ein weiszer Zwerg. Das alles ist natuerlich etwas komplizierter (und super spannend).
Bei schwereren Sternen erlaubt besagter gravitativer Druck (und vor allem die damit einhergehende deutlich høhere Temperatur!) im Kern die „Anlagerung“ weiterer Heliumkerne an Kohlenstoff und Sauerstoff und damit die Entstehung von Elementen bis Eisen. Elemente jenseits von Eisen kønnen in den „Hochøfen“ der Sterne aus dem oben genannten Grund mittels Fusion nicht entstehen.

… Kleine Randnotiz: so’n Stern lebt ja ’n paar Millionen Jahre. Die letzte Stufe des „Verbrennens“ von Silizium zu Eisen dauert aber nur ungefaehr einen Tag … krassomat! …

… Und dann explodiert alles und dabei entstehen Elemente mit mehr Protonen als Eisen hat. Hier muss ich aber zunaechst etwas ausholen. Deswegen spulen wir mal zurueck und lassen die Explosion noch etwas auf sich warten.

Anstelle von Anlagerung von weiteren positiv geladenen Protonen (oder Heliumkernen) kann ein Eisenkern (aber auch andere, weniger protonenreiche Kerne) naemlich neutrale … øhm … Neutronen einfangen. Das aendert natuerlich nur die Masse des Kerns, aber nicht deren Art (es bleibt also ein Eisenkern, oder ein Calciumkern, oder ein Mangankern etc. pp. … ich werde im Folgenden aber Eisen annehmen).
Ist der neue Kern mit gleich vielen Protonen aber einem extra Neutron INstabil, so zerfaellt das Extraneutron via Betazerfall in ein Proton und aus dem Eisenkern wird ein Cobaltkern.
Ist der neue Kern mit gleich vielen Protonen aber einem extra Neutron hingegen stabil, so wird frueher oder spaeter ein weiteres Neutron eingefangen. Das passiert so oft, bis ein instabler Kern entsteht.

Ein Beispiel (jenseits von Eisen, ich komme darauf zurueck): 109Ag (62 Neutronen, 47 Protonen) faengt ein Neutron ein und wird zu 110Ag (63 Neutronen). Das ist instabil und zerfaellt zu 110Cd (wieder nur 62 Neutronen, jetzt aber 48 Protonen). Die naechsten vier Cadmiumkerne sind alle stabil. Bis 114Cd kommt es also zu keinem Betazerfall. Erst 115Cd (67 Neutronen) ist instabil und zerfaellt zu 115In (66 Neutronen, 49 Protonen). Das ist wieder stabil und kann ein weiteres Neutron einfangen. 116In ist aber instabil und zerfaellt zu 116Sn (immer noch 66 Neutronen, jetzt aber 50 Protonen). Und so weiter und so fort. Hier das ganze als Grafik:

ffoooo

Langsamer Neutroneneinfang. Quelle, Autor: Rursus, Lizenz: CC-SA 3.0, alle Modifikationen sind von mir

Aha! Da steht ja _langsamer_ Neutroneneinfang. Gibt’s denn auch einen schnellen? Ja, gibt es, aber da bin ich noch nicht. Das oben beschriebene Beispiel ist Nukleosynthese via des s-Prozesses; „s“ fuer Slow. Langsam deswegen, weil der Betazerfall schneller vonstatten geht als ein neues Neutron eingefangen werden kønnte.

Durch diesen Prozess entstehen in alten (also leichten) Sternen Elemente bis zum Blei (Anzahl Protonen: 82). Und alt muessen die Sterne werden, denn wie’s schon im Namen steht: das ist ein langsamerwieriger Vorgang. Das war die erste Ueberraschung (wenn auch keine grosze). Ich hatte nicht genuegend Information mich nicht genuegend damit beschaeftigt um mir selbst zusammen zu reimen, dass protonenreiche Elemete auch ohne Supernova entstehen kønnen.

Nun zum r-Prozess … „r“ fuer Rapid, und schneller im Vergleich zum Betazerfall. Dafuer schalten wir unsere Sternenevolution wieder an und lassen jetzt wirklich alles explodieren. Waehrend einer Supernova sind die Neutronenfluesse derart hoch, dass nach dem Einfang eines Neutrons ein weiteres Neutron eingefangen werden kann bevor das erste eingefangene Neutron sich durch Betazerfall in ein Proton umwandelt. Das erlaubt nun ganz andere Kernprozesse.
Als Beispiel nehmen wir wieder 114Cd. Wenn das schnell hintereinander zwei Neutronen einfaengt (und dann KEINE mehr), dann wird es zu 116Cd. Der Kern ist aber stabil (bzw. EXTREMST wenig instabil, denn die Halbwertszeit liegt bei ueber 20 Trillionen Jahren) und somit wandelt der sich nicht in Indium um via Betazerfall (vielmehr springt der „nach“ den 20 Trillionen Jahren direkt via doppeltem (!) Betazerfall zu 116Sn … ein sehr unwahrscheinlicher Vorgang, weswegen 116Cd so eine lange Halbwertszeit hat).

Lange Rede kurzer Sinn: bei genuegend hohen Neutronenfluessen, wie sie bspw. in Supernovaexplosionen vorkommen, kønnen sich vor dem Betazerfall genuegend Neutronen in Eisenkernen (oder Calciumkernen, oder Mangankernen etc. pp.) sehr viele Neutronen ansammeln. Wenn der hohe Neutronfluss aufhørt ist alles wie vorher und die extrem neutronenreichen Kerne zerfallen in Kerne anderer Art mit (viel) mehr Protonen.

Zwei Anmerkungen. 1.: In einer Supernova wird deutlich mehr als die Haelfte des vorher „ausgebrueteten“ Eisens tansformiert. 2.: Nukleosynthese via des r-Prozesses in einer Supernova erlaubt die Entstehung von Elemente bis Rubidium (Protonenzahl 37). Das war dann die zweite Ueberraschung: Supernovae produzieren ja gar nicht alles ueber Eisen.

Aber es geht noch weiter … denn wenn das ausgebruetete Eisen jetzt weg ist und leichte Sterne kein Eisen ausbrueten … wo kommt denn dann das viele Eisen her. Hier kommt nun Ueberraschung #3 und wir muessen nochmal zur oben erwaehnten Sternenleiche zurueck, dem guten alten Kohlen- und Sauerstoffreichen Weiszen Zwerg. Wenn der sich naemlich in einem Binaersystem mit einem anderen Stern befindet, so kann der Zwerg Masse vom Begleiter absaugen Masse des Begleitsterns in das tiefere Gravitationspotential des weiszen Zwergs fallen. Dadurch wird Letzterer immer schwerer und wenn die Chandrasekhar-Grenze fuer stabile weisze Zwerge ueberschritten ist (wenn der also zu schwer wird) kommt es dann doch (endlich) zur Fusion der Kohlenstoff und Sauerstoffkerne zu protonenreicheren Elementen.
Ach so … das klingt jetzt alles ganz friedlich, aber das ist ein SEHR schneller Prozess, der UNHEIMLICH viel Energie freisetzt. So viel, dass es den weiszen Zwerg zerreiszt. Deswegen wird das auch als Supernova klassifiziert, aber vom Typ Ia.

Und das ist der Prozess (der Fusion und zum Teil r-Prozesse beinhaltet), der fuer den Groszteil der Nukleosynthese der Elemente um Eisen (aber nicht weiter als bis Zink) verantwortlich ist.

Das war’s aber noch nicht, denn der r-Prozess geht nur bis Rubidium und der s-Prozess nur bis Blei … Wo kommt denn dann bspw. das ganze Radon (Protonenzahl 86) her?
Und DAS, meine lieben Leserinnen und Leser, bringt mich nicht nur zu den Neutronensternen zurueck, sondern ist auch der Grund fuer diesen Artikel. Es ist die einzige Information die ich noch nicht hatte, die ich mir also nicht haette zusammenreimen kønnen mit den „Puzzlestuecken“ die mir bekannt waren.

Wieauchimmer, wir brauchen immer noch hohe Neutronenfluesse um protonenreiche Elemente via des r-Prozesses zu erschaffen. Die Neutronenfluesse einer Supernova reichen aber nicht aus. Da bleibt ja dann nur noch eine Sache im Universum uebrig die NOCH høhere Neutronenfluesse zur Folge hat: die Kollision und Verschmelzung zweier Neutronensterne. Seitdem man via Gravitationswellenastronomie solche gewaltigen Ereignisse beobachten und diese dann auch im elektromagnetischen Spektrum verfolgen kann, wird die Haelfte der Nukleosynthese aller Elemente mit mehr Protonen als Eisen solchen Neutronensternverschmelzungen zugeschrieben.

KRASS! O! MAT!

Da das aber erst seit dem historischen Ereignis GW170817 der Fall ist, fuehre ich zu meiner „Verteidigung“ an, dass ich das nun wriklich nicht wissen konnte. Zum Zeitpunkt meines Studiums wurde das sicherlich diskutiert unter Forschern die sich mit dem Thema beschaeftigten, aber das war noch nicht so etabliertes Wissen, dass es bis in meine Vorlesung (oder Buecher) geschafft haette … also ein bisschen wie die Sache mit den Neutronensternen und dem dicken schwarzen Buch ganz oben.

Zum Abschluss dann noch ein letzter Prozess der Nukleosynthese (in diesem Fall) sehr LEICHTER Kerne. Hier haben wir aber keine Anlagerung an Helium oder Wasserstoff (zusaetzliche Protonen oder Neutronen „verdampfen“ einfach von allen Kerne zwischen Helium 4He und 12C), sondern kosmische Strahlen „zerschlagen“ Elemente mit mehr Protonen (aber nicht zu vielen … also bspw. Stickstoff) in kleine Stuecke. Diese Kerzertruemmerung ist verantwortlich fuer alles Beryllium und Bor und ein klein bisschen Lithium. Das alles passiert natuerlich nicht mehr innerhalb von Sternen sondern bspw. in der Erdatmosphaere bzw. haeufiger im mit protoneneichen Elementen angereicherten Raum zwischen den Sternen.

Ach ja … radioaktive Elemente mit kurzer Halbwertszeit entstehen natuerlich auch in allen oben genannten Prozessen. Weil die aber so schnell zerfallen sehen wir die nur, wenn wir die selber herstellen (mit Ausnahmen).

Das alles kann man in diesem, aueszerst coolen Periodensystem zusammenfassen, welches anzeigt woher das Zeuch kommt, was wir im Universum direkt (!) beobachten:

Quelle, Autor: Cmglee, Lizenz: CC-SA 3.0, alle Modifikationen sind von mir

Cool wa!

Das war der ernste Artikel dieser Miniserie. Der steht im Wesentlichen fuer sich allein. Aber wie’s so oft ist, wenn man sich mal mit ’nem Thema beschaeftigt, dann taucht das pløztlich ueberall auf. Die zwei nachfolgenden Beitraege nehmen das Konzept eines Periodensystems der Elemente ein bisschen … ich sag jetzt mal: weniger streng … und vereinfachen das Ganze signifikant … tihihi

Im Hiroshima Peace Memorial Museum gibt’s makabererweise (?) … kurioserweise (?) … eine Ausstellung zur Atombombe welche die Stadt zerstørt hat. Das ist einer der wenigen Plaetze an denen Trinitit

… zu sehen ist.

Da ich aus dem Hauptteil der Ausstellung schon raus war, dachte ich mir, dass Pietaet nicht mehr ganz so wichtig ist und habe mir erlaubt doch ein Foto zu machen.

OKOK … zwei Fotos, denn es wurde auch visualisiert wieviel … oder vielmehr wie wenig von den 48 kg Uran ueberhaupt gespalten wurde (Daumen zum Vergleich):

Das war letztlich weniger als 1 kg.

Beim letzten Mal habe ich aufgrund der Laenge den Artikel zu einem Ende gebracht. Es fehlt aber noch das hier:

Im linken Diagramm sieht man die Anzahl der Seiten in Ketten mit zwei Seiten. Man erinnere sich, dass diese eine wichtige Rolle spielten, um beim letzten Mal Unterschiede zwischen dem alten und dem neuen Algorithmus zu erklaeren.
Nun sieht man hier, dass die mittels des neuen Algorithmus gefundenen Resultate fuer die 2020 Daten (rote Punkte) reproduziert werden von den Resultaten der 2023 Daten (blaue Punkte).
Man baechte, dass ich das nicht mit dem alten Algorithmus vergleichen kann. Denn der hat das nicht gesondert betrachtet und solche Seiten direkt in die Familien mit reingepackt (wo ich die in den aggregierten Daten nicht mehr identifizieren kann).

„Ketten“ mit einer Seite wurden vom alten Algorithmus auch nicht gesondert betrachtet. Aber die kann ich einfach ausrechnen, wenn man von der Gesamtzahl der potentiellen Kettenseitenkandidaten alles abzieht das betrachtet wurde (denn was uebrig bleibt konnten weder Familienseiten noch Anhaenger sein). Und wie man im rechten Diagramm sieht, stimmt das alles im Wesentlichen mit dem was der neue Algorithmus produziert ueberein und auch die neueren Daten reproduzieren das Ganze. Warum das am Anfang unterschiedlich ist wurde ausfuehrlich beim letzten Mal diskutiert.

Mehr gibt’s dazu nicht zu erzaehlen. Zusammenfassend bzgl. der Ketten sei das Folgende gesagt: Waehrend „laufender Untersuchungen“ (auch wenn es nur die Reproduktion war) wurde der Algorithmus geaendert. Das sollte man nicht machen, selbst wenn man die selben Ergebnisse bekommt. aber wenn man’s macht, dann ist es wichtig die Unterschiede zu diskutieren. Deswegen wurde der letzte Artikel so lang.
In diesem Fall kann ich sagen: Reproduktion geglueckt, sowohl zwischen alten und neuen Daten, als auch zwischen altem und neuem Algorithmus. Alle Unterschiede finden eine Erklaerung entweder im geaenderten Algorithmus und dessen geaenderten Parametern, oder in einer (zum Teil extrem) geaenderten Datenlage.

Mit letzterem meine ich natuerlich die „Meshir-Kette“ die ein weiteres Kommentar verdient. Was ich gestern diesbezueglich sagte kønnte ich prinzipiell im Code anpassen. Das waeren aber spezielle Faelle und die machen mich immer etwas unruhig. Lieber habe ich es, dass man „Fehler“ in den Daten sieht und dann versteht wo die herkommen. Denn so bekommt man die eingeordnet um dann (hoffentlich) zu sehen, dass die eigtl. nix Besonderes sind. Und wenn doch, dass man dann neues cooles Zeuch entdeckt. Diese Herangehensweise ist besser, als das vor den Nutzern im Code zu verstecken … erwartet von besagten Nutzern dann aber auch, dass sie mitdenken und neugierig sind.

Ein Comic das alles hatte was ich als junger Mensch in Comics wollte:

Mein (damaliges) Lieblingscomic Witchblade, dazu noch Lara Croft (die zu der Zeit wohl jeder Video spielende junge Mann gut fand) und das Ganze auch noch gezeichnet von Micheal Turner (der wg. Witchblade ohnehin zu meinen Lieblingszeichnern Ende der 90’er Jahre gehørte). Wie geil war das denn! Da størte es auch nicht, dass die Story an sich eher mittelmaeszig war … ach was sag ich … die war definitiv am unteren Ende von mittelmaeszig … mehr (comic) Aesthetik als Substanz … aber aufgrund der drei aufgezaehlten Sachen spielte in diesem Fall die Aesthetik damals eine grøszere Rolle als die Substanz. Beim nochmals durchlesen mit Mitte 40 hatten sich meine Prioritaeten geandert und ich kann wieder nur ehrlich sein und nicht versuchen das unter den Teppich zu kehren, dass ich komplett der „Sex sells“-Masche aufgesessen bin.

Es gab dann noch einen Nachfolger … der hatte auch alles was oben steht … der war dann aber noch viel schlechter bzglw. der Story, sodass es sogar mir auffiel. Letztlich war ich ganz froh, dass da keine monatliche Serie draus wurde.

Nach den theoretischen Vorbetrachtungen zu den Aenderungen bzgl. der Reproduktion der thematisch zusammenhaengenden Ketten vom letzten Mal, kann ich heute ohne Umschweife sofort mit den Resultaten loslegen.

Im linken Diagramm …

… sieht man die Anzahl der „regulaeren Familien“, also solche Ketten von Wikipediaseiten die alle (fast) den gleichen Titel haben (welcher im Wesentlichen dem Thema der Kette entspricht).

Die grauen Punkte sind die alten Resultate und von (sehr) kleinen Linkleveln abgesehen, reproduziert der neue Algorithmus bei selber Datenlage (rote Punkte, Ende 2020 Daten) die alten Resultate (mit geringsten Unterschieden ueber den Rest der Kurve … ich komme darauf zurueck). Und die neueren Daten (blaue Punkte, Ende 2023 Daten) wiederum reproduzieren im Wesentlichen die alten Daten.
Im Diagramm deutlich sichtbar  ist, dass der alte Algorithmus ’ne Grøszenordnung mehr regulaere Familien um LL5 aufsammelt. Ich komme auch darauf zurueck.

Die „Patchworkfamilien“ nun werden bei selbem (neuen) Algorithmus reproduziert; das rote Signal hat im Wesentlichen die gleiche Staerke und den gleichen Verlauf wie das blaue Signal.
Aber man sieht einen sichtbaren Unterschied zu den mittels des alten Algorithmus produzierten Resultats. Auch darauf komme ich zurueck.

Die Grundlage einer Familie sind die Kettenseiten an sich und deren Entwicklung per Linklevel fuer die Daten aus verschiedenen Jahren und verschiene Algorithmen sieht man hier:

Ich beginne mit der Diskussion des linken, oberen Diagramms; der totalen Anzahl an potentiellen Kettenseitenkandidaten. Der gewaltige Unterschied zwischen der roten und blauen Kurve kommt durch die (deutlich) gaenderte Datenlage zustande. Ich hatte das bereits kurz beim letzten Mal anklingen lassen (siehe der Kettenkønig … die Tage des Meshir, Tobi, Koiak und Paremhat, die es in den 2020 Daten noch nicht gab) und werde das im Zuge zweier andere Diagramme genauer beleuchten.

Der neue Algorithmus reproduziert mit den 2020-Daten im Wesentlichen die Resultate des alten Algorithmus es gibt aber wieder eine signifikanten Abweichung bei (sehr) kleinen Linkleveln. Das ist einfach zu erklaeren: die Suchparameter wurden leicht veraendert. Wenn ich mit dem neuen Algorithmus die alten Suchparameter benutze, komme ich auf die selbe Anzahl an potentiellen Kettenseitenkandidaten fuer alle Linklevel. Das war zu erwarten (aber es ist wichtig, dass ich das geprueft habe). Ab LL19 waren die Ergebnisse ohnehin die selben, auch bei geaenderten Parametern.
Oder anders: mit den urspruenglichen Parametern hab ich fuer (sehr) kleine Linklevel viele falsche positive Ergebnisse (vulgo: „Muell“) aufgesammelt. Was uebrigens der Grund war, warum ich die aenderte. Das heiszt natuerlich NICHT, dass der neue Algorithmus keinen „Muell“ mehr aufsammelt. Es ist nur deutlich weniger.

Damit ist das geklaert und das gilt in dem selben Linklevelbereich mal mehr („Patchworkfamilien“) mal weniger (bei den regularen Familien … aber nicht unbedingt null) fuer alle anderen Diagramme.

Damit geht es zu den regularen Familien und da kann ich die Resultate in „Kernfamilie“ (die mit dem gleichen „Familiennamen, also die eigentliche Kette; rechtes oberes Diagramm) und „Anhaenger“ zur Kette (also Seiten die einen anderen Titel haben, aber von den eigentlichen Kernkettenseiten zitiert werden; linkes unteres Diagramm) unterteilen.

Zunaechst die „Kernfamilien“. In den 2020 Daten ist der Grund fuer den Unterschied bei (sehr) kleinen Linkleveln zwischen den roten (neuer Algorithmus) und den grauen (alter Algorithmus) Punkten ein anderer als oben erklaert (wobei Obiges mglw. auch eine kleine Rolle spielt). Vielmehr kommt der Unterschied durch eine Aenderung im Algorithmus an sich zustande, denn Ketten mit zwei oder weniger Seite werden jetzt „rausgeschmissen“. Und tatsaechlich, wenn ich eine Stichprobe bei LL5 mache (das Maximum in der Linkfrequenz ist also NACH LL5), dann finde ich urst viele aussortierte Zwei-Seiten-Ketten mit dem gleichen „Familiennamen“. Ich hab das jetzt nicht nachgezaehlt, aber mein Bauchgefuehl sagt mir, dass das schon hinhaut.
Der selbe Prozess stoppt aber nicht bei høheren Linkleveln sondern passiert immer und immer wieder genau dann, wenn die Anzahl der „Mitglieder“ einer regulaeren Familie auf zwei zusammenschrumpft. Das sieht man aber natuerlich nicht im Diagramm, weil ein Unterschied von zwei Seiten von den dicken roten Quadraten ueberdeckt wird.

Jetzt erstmal schnell zu den „Anhaengern“ in den 2020 Daten: alter und neuer Algorithmus liefern die gleichen Resultate. Unterschiede ergeben sich aus dem eben Beschriebenen: wenn eine Familie zu klein wird, wird diese nicht mehr als Familie angesehen und ihr werden damit auch keine „Anhaenger“ zugeteilt.

Jetzt die 2023 Daten (blaue Punkte). Ich erwaehnte bereits, dass dies durch eine deutliche geaenderte Datengrundlage zustande kommt. Und ich muss eigentlich auch nur die Besonderheiten der „Meshir-Kette“ betrachten, um die Form der blauen Kurve im rechten oberen und linken unteren Diagramm zu erklaeren.
Der neue Algorithmus findet zunaechst alle Seiten einer Kette. Danach werden regulaere Familien daran erkannt, dass die den gleichen Titel haben. Der gleiche Titel wird via eines Histogramms der Wørter in ALLEN Titeln der Seiten der Kette bestimmt. Die Wørter mit den meisten „Treffern“ in besagtem Histogramm werden als der „Familienname“ angesehen. Danach werden die Seiten welche ALLE Wørter des Familiennamens im Titel haben der „Kernfamilie“ zugeordnet. Alle Seiten wo das nicht der Fall ist werden als Anhaenger angesehen. Das funktioniert sehr gut bei Familien die solch eine Namensstruktur haben wie unser guter alter Bekannter, das „São-Paulo-FC-Artefakt“ (alle Titel gleich, bis auf eine Jahreszahl). Die allermeisten regularen Familien verhalten sich auch tatsaechlich so.

Bei der Meshir-Kette ist das jetzt anders. Alle Monate haben gleich viele Tage und damit (zunaechst) gleich viele Seiten in der Kette. Das heiszt, der Algorithmus erkennt, dass der Familienname (zu Recht), „Meshir“, „Tobi“, „Koiak“ und „Paremhat“ zur gleichen Zeit enthalten muss (weil diese Wørter alle gleichhaeufig vorkommen) … was natuerlich nicht geht, weswegen hier (zu Recht) eine regulaere Familie erkannt wird, aber ohne Kernfamilie sondern nur mit Anhaengern. Die Seiten der Meshir-Kette werden im obigen rechten Diagramm also zunaechst gar nicht mitgezaehlt und deswegen geht die blaue Kurve runter, weil immer mehr Kernkettenseiten „rausfallen“.
Je høher das Linklevel umso mehr Seiten fallen auch aus der Meshir-Kette raus. Wenn dann bspw. „Paremhat“ ein Mal seltener im Histogramm auftritt als „Meshir“, „Tobi“ und „Koiak“, wird „Paremhat“ als Teil des Familiennames gestrichen. Das geht immr so weiter, bis tatsaechlich NUR noch „Meshir“ den Spitzenplatz im Histogramm einnimmt und der Familienname dann NUR noch aus „Meshir“ besteht.

Wenn das von LL36 zu LL37 passiert, kann der Algorithmus pløtzlich Seiten einer Kernkette zuordnen (eben alle eigentlichen Meshir-Seiten) und es kommt zu einem Sprung in den beiden blauen Kurven. Nach oben bei der Anzahl der Kernfamilienseiten (dahin werden die Meshir-Seiten pløtzlich einsortiert) und nach unten bei den Anhaengern (denn da zaehlen die Meshir-Seiten pløtzlich nicht mehr mit dazu). Der Sprung betraegt nicht genau 30, weil die Dynamik der Kurve ja auch von anderen Seiten abhaengig ist.

Pøøøøh … was fuer ein Ritt … an der Stelle hab ich mich entschieden diesbezueglich doch noch einen dritten Artikel folgen zu lassen.

Aber das rechte untere Diagramm, die Seiten in Patchworkfamilien, muss noch kurz besprochen werden. Hier sind die roten und blauen Punkte beinahe deckungslgleich … es gibt naemlich keinen „Mesir-Fall“, die Datengrundlage ist also sehr aehnlich.

Man sieht aber einen systematischen Unterschied von einem Faktor ca. zwei bis ca. vier zum alten Algorithmus. Fuer (sehr) kleine Linklevel ist der obige Grund sicherlich wieder, dass durch die Suchparameteraenderung weniger „Muell“ eingesammelt wird.
Zunaechst wuerde ich vermuten, dass das aber nicht die Erklaerung fuer die spaetere Diskrepanz sein (denn wie gesagt, irgendwann erkennen alter und neuer Algorithmus die selbe Anzahl an Kettenseitenkandidaten). Dann sehe ich aber, dass die rote Kurve sowieso nur bis ungefaehr in den Bereich geht wo alter und neuer Algorithmus unterschiedlich viele Seiten erkennen. Mglw. ist das also doch ein Teil der Erklaerung fuer den Unterschied, zusammen mit der Tatsache, dass Zwei-Seiten-Ketten rausfliegen. Ich wuerde das als des Raetsels Løsung anerkennen  … das muesste aber wer anderes genauer untersuchen.

Kurios sind in den alten Daten die (grauen) Punkte um LL42. Denn die haben einen Wert von eins … høh? „Ketten“ mit einer Seite? das geht doch gar nicht … doch doch, das geht im alten Algorithmus, denn es gibt Seiten die sich selbst zitieren und damit als „Patchworkfamilien“ (falsch) „erkannt“ werden, weil sie ja von einer potentiellen Kettenseite (eben sich selber) zitiert werden. Und das zieht sich nicht durch von kleineren Linkleveln, weil das mglw. urpsruenglich zu regulaeren Familien gehørende Seiten waren … oder sowas.

Aber das ist nun wirklich genug fuer heute.

 

Das ist schon deutlich laenger her als ich da war:

… … … verdammt … das war vor ueber zwei Jahrzehnten …

Wo ich schonmal hier bin kann ich auch ein Bonusbild davon zeige, wie ich vor auf einer Zeitzonengrenze stehe … oder eher halb liege:

Die geht naemlich an der Grenze zwischen Nevada und Arizona lang … aber weil Arizona nicht den Quatsch mit der Sommerzeit mitmacht, gehen die Uhren in den Tuermchen auf den beiden Seiten des Hoover Damms fuer die Haelfte des Jahres gleich.