Archive for April, 2023

OIOIOI … das ist voll spannend.

Schmidt und Frank bemerken in ihrem Artikel, dass die Menschheit innerhalb kuerzester Zeit (nur ein paar Jahrhunderte) detektierbar viel Kohlenstoff biologischen Ursprungs in die Umwelt „geblasen“ haben. Detektierbar bedeutet dass dieser Prozess vonstatten ging mit einer Rate …

[…] orders of magnitude faster than natural long-term sources or sinks.

Der Hinweis, dass es sich hierbei um „biologischen“ Kohlenstoff handelt ist wichtig, denn dieser ist …

[…] depleted in 13C compared with the much larger pool of inorganic carbon [….

Das ist wichtig im hier besprochenen Zusammenhang, denn das ist die Grundlage des Suess-Effekts — der Aenderung  des Verhaeltnisses von 13C zu 12C …

[…] with a current change of around -1 ‰ δ13C since the pre-industrial […] in the surface ocean and atmosphere.

Eine weitere Isotopenspur (oder vielmehr das dazugehørige delta) findet sich um Kalkstein. Ja, genau das aus Kleinstlebewesen gebildete Zeug aus dem der Kønigsstuhl auf Ruegen besteht. Der Grund liegt in der temperaturabhaengig des Einbaus von 18O — eine ein Grad høhere Temperatur fuehrt zu einem δ18O von -0.2 ‰ im „Skelett“ dieser Kleinstlebewesen.

Hierbei handelt es sich also im ein Signal welches direkt gesehen unabhaengig vom Verbrennen von Øl und Kohle ist. Vielmehr entsteht es indirekt, weil der erhøhte Ausstosz von (industriellen) Treibhausgasen (was ja mehr ist als Kohlenstoffdioxid) zu einer erhøhten Temperatur der Atmosphaere und des Ozeans fuehren.

Als Drittes bietet sich eine δ15N Anomalie an. Diese entsteht im Wesentlichen durch drei Prozesse. Der Erste ist wieder die Nutzung fossiler Brennstoffe, denn da sind auch Molekuele mit Stickstoff drin.
Der Zweite ist die Verwendung von Duengemitteln auf groszer Skala. Die Entdeckung (Erfindung?) des Haber-Bosch Prozesses ist eine der ganz groszen und wichtigsten Dinge in der bisherigen Geschichte der Menschheit. Aber dadurch wird direkt urst krass viel mehr Stickstoff im Boden deponiert, als im langjaehrigen (gemeint: viele Millionen Jahre lang!) Mittel normal ist.
Der dritte Prozess ist damit gekoppelt, kønnte aber auch unabhaengig davon stattfinden: die Stickstofffixierung durch Nutzpflanzen. Das machen normale Pflanzen auch, aber der Umsatz von Nutzpflanzen im Vergleich zum natuerlichen Umsatz ist signifikant grøszer als im bereits erwaehnten Mittel ueber die letzten Millionen Jahre. Und die Reste dieser Pflanzen landen alle wieder unter der Erde … oder im Meer, aber da faellen sie aus und werden wieder zu Erde … letztlich also wie die Kleinstlebewesen aus denen die Kreidefelsen bestehen.

Und siehe da:

[…] δ15N anomalies are already detectable in sediments remote from civilization […].

Als Letztes bieten sich langlebige Isotope von Elementen an, welche im Wesentlichen nur durch Kernspaltung zustande kommen kønnen … oder Supernovae … aber mich duenkt Letztere sind unvereinbar mit einer stratigraphischen Aufzeichnung der Aktivitaeten einer Zivilisation.

Mit Halbwertszeiten von ca. 80.8 Millionen Jahren bzw. 15 Millionen Jahren bieten sich 244Pu und 247Cm an. Der Nachteil ist, dass diese Isotope global verteilt sein muessten … in messbaren Mengen … was im Wesentlichen nur das …

[…] result of a nuclear weapon exchange

… sein kønnte. Verdammt.

Endlagerstaetten fuer nuklearen Abfall wuerden ueber viele Millionen Jahre geologisch „verschmiert“ werden, waeren aber immer noch nur „lokale“ Ursachen eines unnatuerlichen Signals. Solche lokalen Signal wurden tatsaechlich gefunden und konnten bis zu ca. 2 Milliarden (!) Jahre zurueckverfolgt werden, waren aber natuerlichen Ursprungs:

[…] lower than usual 235U ratios, and the presence of expected daughter products, in uranium ores in the Franceville Basin in the Gabon have been traced to naturally occurring nuclear fission in oxygenated, hydrated rocks […].

Das soll genug sein fuer heute. Ich werde aber auf die ersten beiden deltas an anderer Stelle nochmal zurueck kommen.

Es ist jetzt ganz genau zwei Jahre her, dass ich mit dieser Maxiserie anfing. Aber nun ist das Ende abzusehen (wenn auch noch nicht unbedingt nah), denn ich komme endlich zur letzten groszen Sache die ich noch gemessen, mir aber bisher nicht angeschaut habe: die Linkfrequenz.

Zur Auffrischung ganz kurz nochmal: Mich interessiert, ob Seite X von anderen Seiten zitiert wird und auf welchem Linklevel das passiert.
ACHTUNG: Mich interessiert NICHT _wie oft_ Seite X auf einem gegebenen Linklevel (einer anderen Seite) zitiert wird, sondern nur _ob_ Seite X ueberhaupt zitiert wurde.

Ein (stark vereinfachtes) Beispiel in zwei Schritten.
Auf LL5 von Seite A wird Seite X ein Mal zitiert und auf LL6 zwei Mal. In beiden Faellen zaehlt fuer Seite X die Linkfrequenz nur ein Mal fuer das jeweilige Linklevel hoch.
Auf LL5 von Seite B wird Seite X dreiundzwanzig Mal zitiert (und dann nie wieder). Die Linkfrequenz von Seite X fuer LL5 zaehlt nochmal eins hoch und liegt dann insgesamt bei zwei.

Das soll als Zusammenfassung reichen, eine detailliertere Erklaerung findet sich hinter dem oben verlinkten Beitrag. Als erstes schaue ich mir wie immer die Summe aller Linkfrequenzen per Linklevel fuer alle Seiten an:

Zum Vergleich habe ich im linken Diagramm wieder die Summe der totalen Links pro Linklevel reingelegt und da sieht man gleich die erste Ueberraschung: ab ungefaehr Linklevel … ich sag jetzt Mal Linklevel 20 ohne das genau zu pruefen, sind die beiden Kurven beinahe deckungsgleich. Das ist auch keine „logarithmische Komprimierung“, denn bei linearer Darstellung (auszugsweise im rechten Diagramm) sieht das genauso aus.

Na da habe ich doch gleich mal ein Raetsel was es zu løsen gilt. Ich habe so ’ne Vermutung, dass das mit dem bereits (vor allem hier aber auch an anderen Stellen) detailliert besprochenen „São Paulo FC“-Artefakt zu tun hat.

Darauf hin fuehrt das Diagramm welches ich ueblichweise im Anschluss an das Obige zeigte — die Verteilung der Position der Maxima der einzelnen Verteilungen:

AHA! Im Vergleich mit den oben verlinkten Verteilungen der gleichen Grøsze bei den anderen drei Messgrøszen geht das viel weiter. Und wenn wir uns den „Schwanz mal anschauen so sehe ich dort das Folgende (JA, die Links sind alle klickbar und man kann ruhig fragen, wieviel Zeit ich damit verbracht habe):

Maximum bei LinklevelSeiten
301967 São Paulo FC season, 1967–68 FC Dinamo București season, 1984 Liga Deportiva Universitaria de Quito season, 1989 Empress's Cup Final, 1876 Massachusetts legislatur, Billboard Top Hits: 1993, Club 9 de Octubre, Estádio Urbano Caldeira, Ion Haidu (footballer), Ion Pârcălab, Spiridon Niculescu, Suzuyo Shimizu FC Lovely Ladies, 1911–12 SK Rapid Wien season, 1963 NCAA University Division baseball rankings
311966 São Paulo FC season, 1966–67 FC Dinamo București season, 1983 Liga Deportiva Universitaria de Quito season, 1988 Empress's Cup Final, 1875 Massachusetts legislature, Albert Palmer (American politician), Billboard Top Hits: 1994, Cornel Popa, Gheorghe Grozea, Ilie Datcu, Iosif Varga (footballer), Octavian Popescu, Vasile Gergely, 1962 NCAA University Division baseball rankings
321965 São Paulo FC season, 1965–66 FC Dinamo București season, 1982 Liga Deportiva Universitaria de Quito season, 1987 Empress's Cup Final, 1874 Massachusetts legislature, Billboard Top Hits: 1995, C.D. Everest, C.D. Universidad Católica del Ecuador, Constantin Ștefan (footballer, born 1939), Emil Petru, George B. Loring, Ion Nunweiller, William E. Livingston
331964 São Paulo FC season, 1964–65 FC Dinamo București season, 1981 Liga Deportiva Universitaria de Quito season, 1986 Empress's Cup Final, 1873 Massachusetts legislature, Constantin Frățilă, Dumitru Ivan, Gheorghe Ene, Lică Nunweiller
341963 São Paulo FC season, 1963–64 FC Dinamo București season, 1980 Liga Deportiva Universitaria de Quito season, 1985 Empress's Cup Final, 1872 Massachusetts legislature, Ion Țîrcovnicu, John E. Sanford
351962 São Paulo FC season, 1962–63 FC Dinamo București season, 1979 Liga Deportiva Universitaria de Quito season, 1984 Empress's Cup Final, 1871 Massachusetts legislature, América de Quito, Manta S.C., Traian Ionescu, Vasile Alexandru, Vasile Anghel
361961 São Paulo FC season, 1961–62 FC Dinamo București season, 1978 Liga Deportiva Universitaria de Quito season, 1983 Empress's Cup Final, 1870 Massachusetts legislature, Associação Atlética Ferroviária, CS Dinamo București, CS Minerul Lupeni, Haralambie Eftimie, Horace H. Coolidge, Shimizudaihachi Pleiades, Stephen H. Rhodes, Takatsuki Ladies FC, Torneio Rio – São Paulo
371960 São Paulo FC season, 1960–61 FC Dinamo București season, 1977 Liga Deportiva Universitaria de Quito season, 1982 Empress's Cup Final, 1869 Massachusetts legislature, Estádio Juca Ribeiro, Miguel Ángel Leyes, Polo Carrera, Waldo Colburn
381959 São Paulo FC season, 1959–60 FC Dinamo București season, 1976 Liga Deportiva Universitaria de Quito season, 1981 Empress's Cup Final, 1868 Massachusetts legislature, Eliphalet Stone (Massachusetts politician), Harvey Jewell, Levi S. Gould
391958 São Paulo FC season, 1958–59 FC Dinamo București season, 1975 Liga Deportiva Universitaria de Quito season, 1959 in Brazilian football, 1980 Empress's Cup Final, 1867 Massachusetts legislature, CSA Steaua București, Esporte Clube Taubaté, Estádio Luís Pereira, George O. Brastow, Jabaquara Atlético Clube, Oscar Zubía, Petre Babone
401957 São Paulo FC season, 1957–58 FC Dinamo București season, 1974 Liga Deportiva Universitaria de Quito season, 1979 Empress's Cup Final, 1980 Empress's Cup, 1866 Massachusetts legislature, Mitsubishi Yowa Sugamo Ground
411956 São Paulo FC season, 1956 FC Dinamo București season, 1973 Liga Deportiva Universitaria de Quito season, 1957 in Brazilian football, 1865 Massachusetts legislature, Florea Birtașu, Levi Stockbridge
421955 São Paulo FC season, 1955 FC Dinamo București season, 1972 Liga Deportiva Universitaria de Quito season, 1956 in Brazilian football, 1864 Massachusetts legislature, Alexander Bullock, Angelo Niculescu, Iosif Szökő, Jacob H. Loud, Ladislau Băcuț
431954 São Paulo FC season, 1954 FC Dinamo București season, 1971 Liga Deportiva Universitaria de Quito season, 1863 Massachusetts legislature, Alexandru Ene, Club Atletic Oradea, Clube Atlético Linense, Gheorghe Băcuț, Ion Suru, Martin Brimmer (1829–1896), Nicolae Dumitru (footballer), Valeriu Călinoiu
441953 São Paulo FC season, 1953 FC Dinamo București season, 1968 Liga Deportiva Universitaria de Quito season, 1970 Liga Deportiva Universitaria de Quito season, 1954 in Brazilian football, 1862 Massachusetts legislature, C.D. INECEL, CS Târgu Mureș, CSF CFR Timișoara, Carol Bartha, Titus Ozon
451952 São Paulo FC season, 1953 in Brazilian football, 1969 Liga Deportiva Universitaria de Quito season, 1953 in Brazilian football, Constantin Marinescu, Florian Ambru
461951 São Paulo FC season, 1948–49 FC Dinamo București season, 1951 FC Dinamo București season, 1952 in Brazilian football, Caius Novac
471950 São Paulo FC season, 1950 FC Dinamo București season, 1951 in Brazilian football, Ion Șiclovan, Iuliu Farkaș
481949 São Paulo FC season, 1950 in Brazilian football, Clube Atlético Ypiranga, Corinthians Santo Andre, Estádio Rua Javari
491948 São Paulo FC season, 1949 in Brazilian football, Associação Atlética Portuguesa (Santos)
501947 São Paulo FC season, 1948 in Brazilian football, Estádio Ulrico Mursa
511946 São Paulo FC season, 1947 in Brazilian football
521945 São Paulo FC season, 1946 in Brazilian football
531944 São Paulo FC season, 1945 in Brazilian football
541943 São Paulo FC season, 1944 in Brazilian football
551942 São Paulo FC season, 1943 in Brazilian football
561941 São Paulo FC season, 1942 in Brazilian football
571940 São Paulo FC season, 1941 in Brazilian football
581939 São Paulo FC season, 1940 in Brazilian football
591938 São Paulo FC season, 1939 in Brazilian football
601937 São Paulo FC season, 1938 in Brazilian football
611936 São Paulo FC season, 1937 in Brazilian football, Estádio Palestra Itália, Estádio Parque São Jorge, Luzitano Futebol Clube
621935 São Paulo FC season, 1936 in Brazilian football, Estádio da Ponte Grande
631934 São Paulo FC season, 1935 in Brazilian football
641933 São Paulo FC season, 1934 in Brazilian football
651932 São Paulo FC season
661931 São Paulo FC season
671930 São Paulo FC season, 1931 in Brazilian football

Nochmal AHA! Denn als ich das „São Paulo FC“-Artefakt zum ersten Mal untersuchte (siehe der Link oben), vermutete (!) ich nur, dass die jeweiligen Jahre am Ende der Linkkette ALLER Seiten stehen. Dafuer hatte ich aber keinen direkten Beweis, auch wenn die indirekten Hinweise sehr schluessig und ueberzeugend waren (bzw. immer noch sind).
Hier nun aber sehe ich direkt, dass die jeweiligen Saisons des São Paulo FC tatsaechlich am haeufigsten (und absteigender Reihenfolge) bei ganz hohen Linkleveln zitiert werden. Cool wa! Ist voll schøn wenn eine (eigene) Theorie direkt bestaetigt wird.

Aber in der Tabelle sehe ich in den entsprechenden Zeilen auch noch viele andere Seiten! Was ist denn mit denen und wieso stehen die da, waren aber nicht zu sehen als das „São Paulo FC“-Artefakt untersucht wurde?

Um das zu erklaeren muss ich etwas weiter ausholen, aber dieser Artikel ist ohnehin schon so lang. Deswegen verschiebe ich das auf das naechste Mal. Und alles zusammen (und noch ein bisschen mehr) fuehrt letztlich zur Entraetselung des obigen Mysteriums.

Als ich die Daten fuer den Beitrag des letzten Mals anschaute, tauchten in einem Datensatz diese Tentakel auf:

Ich sah das … und wollte einfach nur „dran vorbei gehen“. Ich hatte da keine Lust mehr drauf und wollte alles im Zusammenhang mit Selbstreferenzen, totalen und neuen Links abschlieszen um endlich zur Analyse der naechsten (und letzten) Messgrøsze zu kommen.
Es ist ja auch nur in einem Datensatz (OKOK, ich geb’s zu, eigtl. in zwei Datensaetzen, aber bei dem anderen sind’s noch Babytentakel.) … da kann man schon mal 5 grade sein lassen und das merkwuerdige Verhalten in den schon øfter erwaehnten Fehler schieben.

Aber das mir hat natuerlich keine Ruhe gelassen … irgendwie funktioniert meine graue Masse so nicht … ich will wissen was vor sich geht … oder anders: ich wurde wieder mal Opfer von „Nerd Sniping“ … wobei ich mich selbst „gesniped“ habe … bzw. sogar doppelt „gesniped“, denn dieses ganze Kevin Bacon Groszprojekt ist auch sowas.
Im Grunde ist das gar nicht so schlecht, denn aus der Untersuchung von Anomalien folgt oft besseres Verstaendnis oder gar massiver Erkentnissgewinn.

Deswegen fing ich an mir Gedanken zu machen, wie ich den Tentakeln auf die Spur kommen kønnte. Ich war aber vor ein massives Problem gestellt, denn hierbei handelte es sich um Millionen von Links auf (mindestens) tausenden von Seiten. Aber beim allerersten Blob waren ja auch hunderte von Seiten involviert und ich schaffte den zu entraetseln.

Nach laengerem Gruebeln fing ich dann also an Code zu schreiben um die Tentakel zu extrahieren. Ich hatte erst wenige Zeilen eingetippt, als mir der Gedanke kam, dass ich ja mal schauen kønnte, ob das ein Artefakt ist. Um das zu verstehen muss ich zunaechst gestehen, dass ich im obigen Diagramm des Effekts wegen eine wichtige Information weggelassen habe: es handelt sich dabei um die _durchschnittliche_ Anzahl neuer Links. Denn wie bereits ein paar Male zuvor bildete ich (zunaechst) den Durchschnitt, um mit der Masse der Daten besser zurecht zu kommen. Und siehe da:

HURRAH! Es ist tatsaechlich ein Artefakt … Toll wa! Denn das erspart mir urst viel Arbeit.

Das ist uebrigens der Grund, warum ich beim letzten Mal NICHT die Durchschnitte sondern die Rohdaten zeigte. Aber das ist bestimmt nicht aufgefallen, denn ich habe da nicht drauf hingewiesen.

Man sieht (natuerlicherweise) oft Unterschiede zwischen Rohdaten und daraus gebildeten Durchschnitten. Aber fast ebenso oft sind solche Unterschiede nicht sooo grosz und aendern nichts oder wenig am Gesagten. Oder man kommt nicht weiter, wenn man das nicht macht und erst durch die Durchschnittsbildung folgt oben erwaehnter Erkenntnisgewinn. Dem war hier nicht so; die Tentakel sind nur ein ungewolltes Artefakt.
Dieses Beispiel zeigt aber wieder ganz toll, dass man sich bewusst sein sollte wo die Daten eigentlich herkommen und wie die vor der (oder fuer die) Analyse „behandelt“ wurden. Und insbesondere zeigt der hier diskutierte „Vorfall“ auch wieder, wie wichtig es ist dem Ursprung komischer Sachen auf die Spur zu kommen; nicht zuletzt auch um der(auch eigenen) Integritaet Genuege zu tun.

Und das ist das Tolle am Data-Scientist-Dasein, ich mach das und dann ist entweder voll der Erkennisgewinn da ODER ich løse ein Problem. Zwei sehr motivierende Faktoren.
Deswegen sage ich zum Abschluss wiedereinmal: Studienziel: Erreicht!

Beim letzten Mal argumentierte ich, dass man sich keine unnøtigen (!) Sorgen machen sollte, vor Krebsarten, nur weil man von denen schon mal gehørt hat. Das Argument war nicht, dass man sich ueberhaupt nicht mehr drum kuemmern soll. Vielmehr wollte ich darauf hinaus, dass man die nur menschliche Reaktion des Gruebelns anbetracht des Themas „herunterskalieren“ kann, angesichts der tatsaechlichen Daten. Das ist alles kein Hexenwerk.

Heute møchte ich auf einen weiteren Aspekt hinaus, der uns auch unnøtige (!) Sorge bereitet: weil man nunmal eine alternde, (hochfunktionelle) Ansammlung von Zellen (vulgo: ein Mensch) ist, kann man grundsaetzlich nix dagegen tun Krebs zu bekommen! Unter der Einschraenkung, dass Frauen bspw. keinen Prostatakrebs bekommen kønnen … aber ungefaehr jeder 100ste Brustkrebs tritt bei Maennern und selbst Nichtraucher erkranken an Lungenkrebs.

Worauf ich hinaus will ist, dass wir das nicht kontrollieren kønnen und das ist ein anderer Aspekt der oft zu unnøtigen Aengsten fuehrt und dass man sich Gedanken macht.
Als Gegenbeispiel møge der Straszenverkehr dienen. Der Erfolg jeder Autofahrt (oder auch jeden Spaziergangs in der Stadt) ist davon abhaengig, dass hunderte, ja tausende zufaellige Sachen passieren oder nicht passieren. Die meisten davon liegen auszerhalb meines „Wirkungsbereichs“, die passieren also auch ohne, dass ich das beeinflussen kønnte. Aber weil man ja selber am Steuer sitzt, hat man den Eindruck, dass alles unter (persønlicher) Kontrolle ist und macht sich deswegen keine unnøtigen Gedanken darueber.

Meine Hoffnung ist, dass es meinem inneren Frieden diesbezueglich hilft wenn ich mir dieser Prozesse bewusst bin. JA, Krebs kann man nunmal ohne eigenes „Verschulden“ bekommen (leider), aber daran aendert sich nix wenn ich drueber grueble und mir Sorgen mache.

Beim naechsten Mal dann zwei Ausnahmen von dieser Regel.

Vor einer Weile entdeckte ich, dass die individuellen Verteilungen der Selbstreferenzen pro Linklevel maechtigen Gesetzen unterliegen. Das brachte mich auf die Idee mit der Simulation. Dafuer musste ich aber herausfinden, wie sich das System entwickelt. Dies wiederum vollbrachte ich mit einer Untersuchung der Abhaengigkeit der Anzahl der Selbstreferenzen auf einem Linklevel von der Anzahl der Selbstreferenzen auf dem Linklevel davor.
Ersteres hatte ich sowohl fuer die Anzahl aller, als auch die Anzahl neuer Links pro Linklevel getan und da kam eigtl. nix bei raus. Die Idee Letzters mal zu machen kam mir damals erst gar nicht. Das hole ich heute nach.

Zum Glueck muss ich nicht mehr erklaeren was ich hier eigentlich mache und kann sofort ohne viel Aufhebens repraesentative Kurven bzgl. der Anzahl der totalen Links zeigen:

WOW! … Das war meine erste Reaktion als ich das sah. Denn ich hatte obiges Nullergebniss, dass bei den (einfachen) individuellen Verteilungen nicht viel bei rum kam, noch im Hinterkopf. Aber dann praesentiert sich mir hier pløtzlich eine so wunderschøne Abhaengigkeit.

Das ist zwar nicht linear und die Entwicklung des Systems „macht ’ne Kurve und kehrt zurueck“, aber in der doppellogarithmischen Darstellung sieht das aus wie’n Ausschnitt aus ’ner Ellipse und Orbits sind mathematisch in geschlossener Form behandelbar. Das wuerde das Ganze nur etwas komplizierter machen, denn Orbits sind … ich sag jetzt mal im generellen Sinne … zeitabhaengig.
Oder anders: bei den Selbstreferenzen konnte ich einfach sagen, dass die Selbstreferenzen auf dem naechsten Linklevel NUR von den Selbstreferenzen auf dem jetzigen Linklevel abhaengen, aber nicht vom Linklevel selber. Das ist beim Orbit nicht mehr der Fall, denn solche sind keine bijektiven Abbildungen mehr sondern nur noch surjektive Abbildungen. Bei der Entwicklung muss man sich also „merken“ ob man auf dem oberen „Ast“ oder (schon) auf dem unteren „Ast“ ist, denn wenn ein Punkt sich noch auf Ersterem befindet, so soll dieser nicht einfach „runter springen“ sondern schøn „um die Kurve rumgehen“.

Aber Achtung, das ist keine wirkliche Ellipse, denn bei spaeteren Linkleveln verhaelt sich das auch bei linearen Achsen linear:

Aber selbst dann kønnte man das mathematisch noch als Bézier Kurve darstellen.

Bei den neuen Links ist das im Wesentlichen das Gleiche:

Die Skala reicht natuerlich nicht so weit und die neuen Links laufen den totalen Links „voraus“. Letzteres sieht man in der linearen Darstellung an den schwarzen Punkte fuer die neuen Links von LL2 zu LL3. Diese erreichen und ueberschreiten das Maximum bereits, waehrend das bei den totalen Links von LL2 zu LL3 noch nicht der Fall ist.
Aber das war zu erwarten und dieses Phaenomen des „Vorauseilens“ ist uns schon bei der Anzahl der neuen Links pro Linklevel im Vergleich zur Anzahl der totalen Links pro Linklevel ueber den Weg gelaufen, wo Erstere das Maximum eher erreichten als Letztere.

Lange Rede kurzer Sinn, auch die Entwicklung dieser beiden Grøszen kann man mathematisch beschreiben und dann prinzipiell mit nur einer Messung des Anfangszustands besagte Entwicklung des Systems berechnen. Das spare ich mir aber, denn ich habe da keine Lust mehr drauf.

Ach so, Aussteiger der totalen Links habe ich bereits gruendlich untersucht (und das Ergebniss kann auf neue Links uebertragen werden) und Ketten von neuen oder totalen Links kønnen per definitionem nicht reaktiviert werden.

Wir bleiben bei den Genen und heute wird’s voll spannend, denn es geht um Mutationen. Aber dafuer muss ich etwas ausholen.

Aminosaeuren sind unentbehrlich (vor allem in Form von Proteinen) fuer das Funktionieren der Zelle, des Kørpers und des Geistes (Letzteres weil diese bspw. beim Transport von Neurotransmittern eine wichtige Rolle spielen). Die DNA (also der einzige physische Teil den die Kinder von den Eltern haben) kodiert all die fuer’s Menschenleben notwendigen Aminosaeuren.
So wie ein Byte sich (heutzutage) aus acht Bits zusammensetzt, so setzt sich eine Aminosaeure (sehr vereinfacht gesagt) aus jeweils drei Nukleotiden zusammen. Letztere sind die allgemein bekannten „Buchstaben“ (oder eben Bits) der DNA; Adenin (A), Cytosin (C), Guanin (G) und Thymin (T).

Das als Grundlage. Um weiter zu kommen nehme ich das Beispiel Serin — eine Aminosaeure die bei geistigen Funktionen eine wichige Rolle spielt. Diese setzt sich aus den Nukleotiden T-C-T zusammen … oder T-C-C … oder T-C-A … oder T-C-G. Anders als bei Bytes in der Informationstechnik kann man die „Bits“ einer Aminosaeure (bedingt!) austauschen und erhaelt trotzdem die gleiche Aminosaeure mit der selben Funktion! Das sind sogenannte neutrale Mutationen.
Das Ist natuerlich urst toll, denn das macht die Biologie verdammt robust.

Wann immer die DNA reproduziert wird, kann so ein „Bitflip“ stattfinden. Das ist natuerlich ganz wichtig bzgl. der Meiose (die hier ja auch schonmal Thema war), welche die Keimzellen zum Resultat hat, denn diese uebetragen ja die „elterliche DNA“ zum Kind.
Dank dieser Bitflips ist es nun aber nicht mehr die 100%-gleiche DNA wie die Eltern sie haben. Ihr, meine lieben Leserinnen und Leser, kønnt sicher erahnen worauf ich hinaus will.

Bei neutralen Mutationen kønnte man sich natuerlich damit rausreden, dass es bei dem „elterlichen Teil den leibliche Kinder weitertragen“ um den Phaenotyp geht. Also dass schlussendlich der Ausdruck des Genotyp entscheident ist; Serin ist Serin, egal wie es aufgebaut ist.
Hier kann man nun aehnliche Gedankengaenge (a.k.a. „Salamitaktik“) anwenden wie beim letzten Mal um die Absurditaet dieses Konzepts darzustellen. Bei einem Bitflip, insb. da die Funktion erhalten bleibt, geh ich mit besagtem Konzept mit. Aber was ist mit 100 Bitflips oder Tausenden? Das hørt sich nach viel an, aber das kann selbst bei eineiige Zwillinge nach der Geburt auftreten … *hust* … und im hiesigen Zusammenhang akkumulieren sich solche Veraenderungen auch ueber die Generationen.

Wieauchimmer, die Herangehensweise mit den Bitflips wird im naechsten Schritt erweitert zu Aminosaeuren welche dann DOCH anders sind, die aber auch keine Aenderung des Phaenotyps zur Folge haben, wenn diese sich in nichtkodierenden Abschnitten der DNA befinden. Und dann noch einen Schritt zu Mutationen die den Phaenotyp dann doch veraendern, man das aber nicht merkt. Und dann Mutationen wo man das doch merkt, das aber nicht wichtig ist (bspw. eine andere Augenfarbe) … usw. usf.
All diese Mutationen … da bleibt am Ende nicht viel uebrig von dem was die Eltern (oder Ururur…groszeltern) ausmacht(e) (egal ob Geno- oder Phaenotyp). Auszer natuerlich, dass diese Menschen sind (oder waren). Und letztlich stellt wieder die Frage ab wann dieser „Weiterggetragene Teil“ nicht mehr da ist und wo der hin ist.

Das Konzept um das diese ganze Miniserie geht, kann also nicht darin liegen, dass die Kinder die DNA der Eltern weitertragen (denn das tun sie nicht). Das fuehrt dann wieder zum Schluss, dass besagtes Konzept aufgegeben werden muss … oder dass es sich dabei eigentlich um etwas anderes handelt. In dem (geistig, gesellschaftlich, sozialem) postmodernem Fundment auf welchem ich versuche mich zurecht zu finden ist das durchaus zulaessig. Aber dann befindet man sich auszerhalb dessen mit dem ein aeuszeres, rationales, objektives Universum beschrieben werden kann.

Das soll genug sein fuer heute. Ich hoffe, dass ich’s halbwegs geschafft habe, diesen spezifischen Punkt rueber zu bringen. Beim naechsten Mal geht es um einen anderen, nicht minder spannenden, genetischen Aspekt.

Es ist wohl zur Gewhohnheit innerhalb dieser Maxiserie geworden, (meist zum Abschluss) zu schauen um was fuer Seiten es sich bei den extremen Ausreiszern handelt. Das ist eigentlich eine schøne Tradition und ich behalte das bei :). Heute ergeben sich Ausreiszer aus zwei Grafen.

Die Ersten sind die Seiten die zu den fuenf Punkten am Ende der Kurve der Anzahl der ausgestiegenen Seiten pro Linklevel fuehren. Alle diese haben mindestens bis LL4 hunderte von Selbstzitate, zwei sogar zum Teil mehrere Tausend. Ebenso haben diese eine ununterbrochene Kette von Selbstreferenzen bis zum gegebenen „Ausstieg“. Aber die Kette besteht zum allergrøszten Teil ab ca. LL10 nur noch aus Einsen (mit ein paar Zweien dazwischen).

Wieauchimmer, los geht’s mit Campinas, eine Stadt in Brazilien … wait! what? … das riecht doch schon wieder verdaechtig nach Fuszballkram … welche auf LL50 aussteigt. Gefolgt von Associação Portuguesa de Desportos … ICH WUSSTE ES! … einem brasilianischen Fuszballklubb auf LL60.
Auf LL66 begegnet uns ein alter (und bereits ausfuehrlich besprochener) Bekannter: der São Paulo FC.
Diesem schlieszen sich auf LL67 mit Campeonato Paulista eine brasilianische Fuszballliga, mit Sociedade Esportiva Palmeiras, Santos FC und Sport Club Corinthians Paulista vier brasilianische Sportklubbs (die am am meisten wg. ihrer Fuszballaktivitaeten bekannt sind) und die (brasilianische! … das scheint heute das zugrundeliegende Thema zu sein) Stadt São Paulo an.
Die laengste Seite, mit einer unnunterbrochenen Kette an Selbstreferenzen bis LL68 ist … *enttaeuschter trommelwirbel denn irgendwie ahnt man bereits dass das auch wieder dem Fuszball zugehørig sein wird* … Exhibition game. … Oh warte mal. Das gibt’s ja auch fuer andere Sportarten … Hurra!

Zum Zweiten schaute ich mir mal an welche Seiten in den Heatmaps des letzten Beitrag zu den høchsten Punkten fuehren; also reaktivierte Linkketten die 25 oder mehr (zusammenhaengenden) Linklevel haben. Eine kleine Warnung: es geht weiter mit Fuszball.

Im „Verhalten“ sind diese Seiten aehnlich wie die Obigen. Nur im langen Schwanz der Kette wo immer nur einzelne Selbstzitate auftreten gibt es eben Brueche. Mit einer Ausname das Fuszballstadion Pfarrwiese, die keine Selbstreferenzen auf LL1 hat und dann auf LL2 „reaktiviert“ wird mit einer Kette die 29 Linklevel weit reicht. Ebenso 29 „Kettenglieder“ hat das Atahualpa Olympic Stadium, aber dessen „Schwanz“ bricht zwei Mal ab, bevor diese Kette bei LL15 (re)aktiviert wird.
Ein doppelter Abbruch erfolgt auch fuer den FC UTA Arad, das Estádio Urbano Caldeira und den Clube Atlético Juventus deren reaktivierte Linkketten mit jeweils 30, 33 und 34 Kettengliedern auf LL17 , LL25  und LL28 anfangen. Bei Letzterem ist die reaktivierte (und laengste) Kette aber in der Mitte und nicht am Ende.
Sogar fuenf Abbrueche weist die Stadt Santos, São Paulo auf und die vierte reaktivierte Kette an Selbstreferenzen, mit 39 Kettengliedern, beginnt auf LL26.
Mit ganzen 43 Gliedern hat die allerlaengste reaktivierte Kette (auch in der Mitte zwischen dem ersten und zweiten Abbruch) das Pacaembu Stadium.

So, das war’s fuer heute mit dem traditionellen Beglotzen von Ausreiszern. Wie mit Extremwerten ueblich gibt’s hier wenig zu holen, ’s ist aber mal witzig zu schauen.

Ich habe diese Miniserie nicht vergessen. Ich war nur so beschaeftigt mit anderen interessanten Sachen.
Wieauchimmer, beim letzten Mal erwaehnte ich, dass Schmidt, G. A. und Frank, A. in „The Silurian hypothesis: would it be possible to detect an industrial civilization in the geological record?“ im International Journal of Astrobiology, 18(2), 2018, pp. 142–150 ebenso wie ich zu dem Schluss kommen, dass es unwahrscheinlich ist, dass kuenstliche Artefakte (vulgo: Werkzeuge oder Haeuser) oder Fossilien als Zeugen einer Zivilisation von vor vielen Millionen Jahren herhalten kønnten.

Das heiszt aber nicht, dass eine solche Zivilisation keine Spuren hinterlaeszt. Denn …

[…] it is already clear that our human efforts will impact the geologic record being laid down today […].

Und „geologic record“ bedeutet, dass das auch in vielen Millionen Jahren noch messbar sein wird … wenn auch mit einem kleinen Signal. Aber dazu komme ich heute noch nicht. Heute geht es vielmehr darum, dass man bei laenger bestehenden Zivilisationen ein grøszeres Signal in den (geologischen) Daten erwarten wuerde. Aber …

[…] the longer a civilization lasts, the more sustainable its practices would need to have become in order to survive.

Was ja voll logisch ist und nicht weiter erklaert werden muss. Leider (nicht allgemein, sondern nur in diesem Zusammenhang) gilt auch, dass je nachhaltiger eine Zivilisation ist, umso kleiner deren „globaler Fuszabdruck“ wird. Lokal ist das nur bedingt gueltig, aber lokale Veraenderungen bleiben unbemerkt weil diese nicht gefunden werden oder kønnten einfach nur geologische Kuriositaeten sein. Am besten ist etwas das sich ueber die ganze Erde verbreitet (*hust*), aber wegen obiger Feststellung …

[…] might [the footprint of civilization] be self-limiting on a relatively short timescale.

Das bedeutet dann, dass in besagten stratigrafische Aufzeichnung …

[…] the Anthropocene will likely only appear as a section a few cm thick […].

Aber ein Ass haben zukuenftige Forscher dennoch im Aermel, denn dieses Signal …

[…] [will] appear almost instantaneously in the record.

Na das ist doch was womit man arbeiten kann. Dazu mehr in den naechsten Beitraeagen.

Zum Abschluss sei noch gesagt, dass die Autoren sich nur auf die Diskussion von Dingen beschraenken, von denen sie wissen dass diese bereits einen Einfluss auf die stratigrafische Aufzeichnung haben und wie das Signal dieser Dinge in etlichen Millionen Jahren aussehen wuerde. Coruscant Szenarios werden also nicht betrachtet.

Heute ein Diagramm, welches so nicht (mehr oder weniger) direkt aus der Tabelle zu bekommen ist. Hier sind …

… die drei haeufigsten Krebsarten per Alltagsgruppe (wie immer: die Zahlen sind NUR fuer norwegische Maenner im Jahre 2020).
An den Balken kann man ablesen, wie viel Prozent aller Krebsfaelle in einer Altersgruppe zu einer bestimmen Krebsart gehørten. Die drei haeufigsten Arten sind farbkodiert und alle anderen im weiszen Abschnitt eines Balkens zusammengefasst. Ueber jedem Balken ist die Anzahl der totalen Krebsfaelle in der gegebenen Altersgruppe wiedergegeben.

Auf den ersten Blick sieht das ja furchterregend aus! Warum ist das aber (schon wieder) ein positiv zu interpretierendes Diagramm und wie passt das mit dem Titel dieses Beitrags zusammen?
Das ist einfach zu erklaeren und liegt darin begruendet, dass man nie vor unkonkreten Dingen Angst, sondern nur vor solchen Sachen, denen man einen Namen geben kann. Hier meine ich damit, dass man sich bspw. als junger Mann mit 15 Jahren Sorgen um Hodenkrebs macht, weil man das irgendwo gehørt hat. Das ist eine menschliche und sehr verstaendliche Reaktion. Aber besagter junger Mann sorgt sich dann nicht im selben Masze ueber all die anderen potentiellen Krebsarten, die man auch bekommen kønnte. Dies trotz der Tatsache, dass es sogar wahrscheinlicher ist, dass man an denen, und nicht an Hodenkrebs, erkrankt.

Worauf ich hinaus will: man sollte spezifische, einem „bekannte“ Krebsarten im selben Lichte sehen wie alle Krebsarten von denen man noch nix gehørt hat. An Letzteren zu erkranken ist wahrscheinlicher, aber vor denen hat man keine Angst. Warum sollte man also Angst haben vor einer spezifischen Krebsart.
Hinzu kommt hier auch wieder, dass die Chance ueberhaupt an Krebs zu erkranken (noch dazu an einer bestimmten Art), ziemlich klein ist. In meiner Altersgruppe sind mehr als 150-tausend Maenner und weniger als 250 Maenner haben ueberhaupt Krebs bekommen. Meine Sorge vor Darmkrebs sollte ich also entsprechend (deutlich) zurueckschrauben.

Was das NICHT bedeutet: das bedeutet NICHT, dass man sich ueberhaupt keine Gedanken mehr macht und deshalb nicht zu den Vorsorgeuntersuchung geht. Egal wie klein die Chancen auch sind, wenn man spezifische Krebsarten betrachtet (also wenn einem sozusagen ALLE Krebsarten bekannt sind), dann ist die Chance die Haeufigste zu bekommen (per definitionem) am grøszten. Und das ist der Punkt an dem Vorsorgeuntersuchungen ansetzen.

Das Diagramm ist auch auf verschiedene andere Arten voll spannend, aber die Erkundung des Informationsgehalts ueberlasse ich euch, meinen lieben Leserinnen und Lesern, als Hausaufgabe :) .

Vor einer Weile erhielt ich einen neuen Laptop und sogleich machte ich das was man halt so macht: ich schraubte den auf, …

… denn ich wollte schauen ob ich einfach die Festplatte meines alten Laptops reinstecken kønnte. Kann ich nicht, denn die 500 GB Festplatte ist der duenne „Streifen“ links neben der Bueroklammer!

Krass! Damals (vor nur sehr wenigen Jahren!) als ich mit dem Studium anfing, kaufte ich eine 20 GB Festplatte und die war echt grosz. Ich erinnere mich noch wie ich erstaunt fragte ob ich ueberhaupt so viel Speicherplatz brauche. Die Antwort war: Keine Sorge die kriegst du schon voll“. Wieauchimmer, das war noch ein richtiger Klotz und 25 davon neben oder aufeinander gestellt haetten signifikant mehr Platz weggenommen als dieser Streifen.

Da kann ich nur sagen: Wir leben ja wohl mal voll in der Zukunft! Cool wa!