Archive for the ‘Allgemein’ Category

Beim letzten Mal zeigte ich zum Abschluss zwei repraesentative Verteilung der Selbstreferenzen pro Linklevel. Ich wollte damit darauf hinaus, dass diese Verteilungen sich ueber viele Linklevel nach einem maechtigen Gesetz verhalten. Bevor ich darauf beim naechsten Mal zurueck komme und das Ganze systematisch betrachte, møchte ich zunaechst mithilfe dieses Diagramms …

… auf zwei Sachen eingehen.

Die erste sind die wenigen Ausnahmen vom oben Gesagten. Naja, eigentlich sind es viele, aber die allermeisten der vielen Ausnahmen kønnen alle unter einer Kategorie zusammengefasst werden (und diese Kategorie liegt auch noch in der Natur der Sache) und deswegen zaehlen die alle zusammen nur als eine Ausnahme … aber vielleicht sollte ich einfach nur erklaeren.

In dem Diagramm sehen wir die Verteilungen der Selbstzitate fuer LL0 (schwarze Punkte), LL1 (rote Quadrate) und LL9 (blaue Diamanten). Wie immer bei diesen Verteilungen zaehlte ich (in diesem Fall) wieviele Seiten es gab (Ordinate), die auf dem gegebenen Linklevel so viele Selbstreferenzen erhielten, wie auf der Abzsisse angezeigt.
Nicht gezeigt sind die Punkte fuer null Selbstreferenzen; die sind naemlich im Wesentlichen fuer alles weitere unwichtig und lassen sich ohnehin nicht gut bei einer logarithmischen Achse darstellen..

Der erste Ausnahmefall ist LL0. Dort sollte es ueberhaupt keine Selbstreferenzen geben (man ist ja noch keinen Schritt im Linknetzwerk voran geschritten). Wir wissen von frueher, dass der eine Punkt mit einem Wert von ca. 80k durch Artefakte zustande kommt.

Kurioserweise erlaubt mir dieses Artefakt den zweiten Ausnahmefall zu erklaeren, denn genau so sieht das auch aus, wenn man sehr weit im Linknetzwerk vorangeschritten ist. Dort liegt der Grund aber darin, dass dann die Chance fuer eine Selbstreferenz URST winzig ist. Entsprechend klein wird die „Signalstaerke“ und die Werte auf der Abzsisse liegen dann nur noch bei 1 (oder vielleicht mal 2) … also ich habe nur noch bei einer Selbstzitierung (und bei null) ein Signal.
Worauf ich hinaus will ist das Folgende: beim naechsten Mal interessiert mich der Anstieg der Verteilung in der doppellogarithmischen Darstellung (welcher dem Exponenten des Potenzgesetzes entspricht). Diesen erhalte ich durch lineare Regression; aber lineare Regression bei Werten die im Wesentlichen „Rauschen“ sind ist nicht sinnvoll.
Deswegen wuerde ich obige Aussage nur unter starkem Vorbehalt fuer als gueltig auf hohen Linkleveln ansehen. Vermutlich ja, aber die Daten geben das einfach nicht her.

Die dritte Ausnahme ist die Verteilung zu LL1, diese verhaelt sich naemlich eindeutig nicht nach einem Potenzgesetz, denn selbst mit beiden Augen zudruecken kann ich die Daten da nicht mit einer linearen Funktion (bei doppellogarithmischer Darstellung) beschreiben. Das gilt bedingt mglw. auch fuer die Verteilungen bei LL2 und LL3, bei Letzteren kann ich aber auch mit gutem Gewissen eine Gerade durch relevante Abschnitte der Daten legen, die gilt halt nur nicht bei all zu kleinen Linkleveln.
Was passiert hier? Nun ja, das ist einfach zu erklaeren: von gaaaanz frueher wissen wir dass jede Ursprungsseite im Durchschnitt 30 (neue) Seiten auf LL1 hat. Ja, auch von frueher wissen wir, dass es auch (Ursprungs)Seiten gibt, die deutlich mehr (oder weniger) als diese 30 Seiten auf LL1 haben. Aber nach unten bin ich ohnehin begrenzt (weniger als null geht nicht) und nach oben liegt die Grenze bei so ca. 1000 Seiten … das ist zwar deutlich mehr, aber davon gibt es nur sehr wenige.

Wieauchimmer, von jeder Seite auf LL1 kann die Ursprungsseite nur eine Selbstreferenz bekommen. Das limitiert wie weit eine Seite auf der Abszisse „reichen kann“; wenn ich nur 30 Seiten auf LL1 habe, dann kann ich keine 31 Selbstreferenzen bekommen.
Ebenso sollte dies indirekt zu einer Ueberhøhung des Signals gegenueber einer Geraden (und damit einer konvexen Kruemmung der Daten) fuehren. Indirekt deswegen, weil das natuerlich nicht der Mechanismus ist, der zu besagter Ueberhøhung des Signals fuehrt. Vielmehr ist es so, dass ja gerade auf LL1 sicherlich viele Seiten auf die Ursprungsseite zurueck verweisen, einfach weil das thematisch sehr oft nahe liegt. Ich habe also ohnehin schon ein høheres Signal und das „draengelt“ sich, durch ersteren Mechanismus, dann auch noch alles bei kleinen Werten auf der Abszisse.

So, genug zu den Ausnahmen.

Wichtiger fuer’s naechste Mal ist eigentlich alles zu LL9. Da ist naemlich eine der oben erwaehnten Regressionsgeraden drin (die dicke orange Linie). Die sieht schick aus, nicht wahr; so richtig schøn mitten durch den (bei doppellogarithmischer Darstellung) linearen Teil der Daten.
Und hier liegt der Hase im Pfeffer! Denn ich habe ja rechts davon auch noch Daten … aber das sind nur ganz wenige, einzelne Seiten, die so viele Selbstreferenzen erhalten … und diese „passen“ ja offensichtlich nicht zu dem worauf ich hinaus will mit dem linearen Teil. Aber die wuerden natuerlich bei einer linearen Regression ueber alle Daten mit einebzogen werden und zu einer Gerade fuehren, die ueberhaupt nicht mehr „gut passt“.
Waehrend des Studiums  habe ich gelernt das zu ignorieren und das Lineal an den linearen Teil so anzulegen, dass die Linie richtig liegt und die Daten gut (genug) beschreibt … vulgo: schick aussieht … wenn ich den Anstieg und das absolute Glied einfach ablese (ohne was formal zu berechnen).
Und genau das habe ich fuer alle (relevanten) Verteilungen gemacht. Ich habe vom Ende (und wenn nøtig auch vom Anfang) so lange Punkte weggeschnitten, bis die Regressionsgerade schick aussah. Wie oben geschrieben, ist das kein schummeln, sondern wurde von Physikern schon immer so gemacht. Auszerdem ist das Potenzgesetz ohnehin nicht ueberall gueltig und der Bereich der Gueltigkeit ergibt sich daraus wo die Gerade die Daten gut beschreibt. Dennoch wollte ich den Prozess mal erwaehnt haben, denn letztlich habe ich die Geraden durch linere Regression erhalten.

Und damit bin ich dann auch bei der letzten Sache … dem orange-durchsichtigen Band um die dicke Linie. Bei der linearen Regression erhaelt man fuer die Parameter der Geraden einen „Fehler“ … vulgo: die plus/minus Werte … und das orange Band kennzeichnet diesen Bereich. Die Regressionsgerade kønnte also irgendwie liegen, solange es innerhalb dieses Bandes ist. Die wahrscheinlichste Gerade ist die eingezeichnete.
Beim naechsten Mal lasse ich die Baender weg, aber ich komme nochmal auf den „Fehler“ des Anstiegs zurueck. Deswegen wollte ich das hier mal erwaehnt haben.

So, das war jetzt viel mehr als ich urspruenglich dachte. Im naechsten Beitrag wird’s voll interessant :)

Beim letzten Mal endete ich mit einem Verweis auf das „Global Cancer Observatory„. Ich musste ein bisschen Zeit auf dieser Seite verbringen um zu verstehen, wie die Daten aufgebaut sind. Deswegen denke ich, dass es recht nuetzlich ist, wenn ich an dieser Stelle kurz darauf eingehe. Dann kønnt ihr, meine lieben Leserinnen und Leser, bei Interesse gleich zu den relevanten Dingen vorstoszen und spart euch diese Arbeit.
Ich befuerchte allerdings, dass das hier Geschriebene eher eher als spaeter obsolet sein wird. Im Netz veraendert sich schlieszlich immer alles und selbst wenn es die Seite in ein paar Jahren noch gibt, so wird die bestimmt anders aussehen; sei’s drum.

Wenn man den obigen Link klickt, wird man mit mehreren Wahlmøglichkeiten konfrontiert. „Cancer over time“ ist durchaus interessant (und da habe ich mich zunaechst am meisten aufgehalten), aber ich bin natuerlich an der aktuellen Situation interessiert. Deswegen geht es mit „Cancer Today“ (Direktlink) weiter. Weil ich nur an norwegischen Zahlen interessiert bin, ist es nicht so schlimm, dass die Angaben dort  abgeschaetzt sind, denn in den nordischen Laendern ist es seit vielen Jahren obligatorisch Krebs an die entsprechenden Stellen zu melden.

Wieauchimmer, bei „Cancer Today“ wird man dann mit mehreren Wahlmøglichkeiten konfrontiert. Das was sich dahinter befindet ist an allen Faellen von groszem intellektuellen Interesse.
Ganz besonders informativ fand ich die Auftragung der laenderspezifischen, (jeweils altersstandardisierten) (Gesamt)Mortalitaet aufgrund von Krebs ueber dem (Gesamt)Vorkommen von Krebs. Das verhaelt sich alles wie schon besprochen, aber man muss das genauer anschauen um es zu erkennen. Laender wo es wenige Aerzte gibt haben NICHT weniger Krebsfaelle, da wird das nur nicht erkannt/gemeldet. Bzw. haben die vermutlich doch weniger Krebsfaelle, weil die Leute dort frueh an anderen Sachen sterben. In Laendern wo jeder Zugang zu einem Arzt hat werden mehr Krebsfaelle erkannt und gemeldet, aber wenn das Gesundheitssystem dort nicht soooo super gut ist, dann sterben die Leute da auch oft an Krebs (aber nicht so oft an anderen Sachen). In den reichen Laendern gibt es genau so viele Faelle, aber deutlich weniger Leute sterben daran. Auszerdem muss man bei der Darstellung auch immer im Hinterkopf haben, wie viele alte Menschen es in den Laendern gibt (im wesentlichen wieder eine arm/reich Dichotomie, aber nicht nur). Und dann sind da noch Australien und Neuseeland mit den allermeisten Krebsfaellen, die aber zu groszen Teilen durch Hautkrebs zustande kommen; und die Frueherkennung scheint dort sehr gut zu funktionieren, denn die Mortalitaet steigt nicht an.
Das ist ein tolles Diagramm, weil es sooo viel Information enthaelt und all dies kann man auf der linken Seite noch geschlechter- und krebsspezifisch aufteilen … ich gebe aber zu, dass sich die Informationsfuelle eigentlich erst mit genuegend Hintergrundwissen ergibt … allerdings ist das ja oft der Fall.

Aber ich schwoff ab, denn eigentlich bin ich ja an den altersspezifischen rohen Zahlen interessiert und deshalb verschlug es mich am Ende zu den „Tables„.
Auf der linken Seite waehlt man (von unten anfangend) das Land (Population), die Altersgruppe, das Geschlecht und ob man die Anzahl der (abgeschaetzten) Krebsfaelle oder die (abgeschaetzte) Mortalitaet sehen will.

Um die Stimmung bei diesem Thema wieder ein bisschen aufzumuntern, empfehle ich bei den letzten beiden mal hin und her zu wechseln. Zumindest fuer Norwegen (und vermutlich fuer die meisten reichen, westlichen Laender) gibt das naemlich wieder ein hoffnungsfrohes Bild. (Von Ausnahmen abgesehen) stirbt nur ca. 1/3 der Leute an Krebs.

In der Tabelle sieht man auch die Begriffe „Uncertainty Intervall“, „Crude Rate“, „ASR (World)“ und „Cumulative risk“. Weil das abgeschaetzte Zahlen sind, gibt Ersteres fuer alle praktischen Belange an, weit die Zahlen daneben liegen kønnen. Die anderen drei Begriffe erklaere ich ein anderes Mal.

Zum Abschluss noch ein Achtung: Altergruppen sind ueblicherweise (meistens? oft?) 5-Jahres-Intervalle (wenn ich das richtig verstanden habe), der „Slider“ erlaubt als Minimum aber nur 15-Jahres-Intervalle. Ueber die „Drop-Down“-Menues kønnen kuerze Intervalle gewaehlt werden.

Vor einer ganzen Weile zeigte ich die Verteilung der Maxima der einzelnen Verteilungen der Selbstreferenzen. Aus einer Unstimmigkeit im allerersten Balken entwickelte ich in den letzten Artikeln in dieser Maxiserie das Konzept der (Wissens-)Archipele. Letzteres ist abgeschlossen und ich gehe nur nochmal ganz kurz auf die Verteilung der Maxima ein. Genauer interessieren mich die sieben „Ausreiszer“, die erst sehr spaet in ihrem Linknetzwerk zitiert werden.

Das war relativ einfach heraus zu bekommen und die erste Seite (jeweils einmal zitiert auf LL26 und LL27) gehørt zu Alpheus Harding. Mhmm … ja, viel weiter weisz ich dazu jetzt nicht zu sagen.
Auf LL30 erhalten zwei Seiten ihre erste und einzige Zitierung: Estádio Luís Pereira und 1962 NCAA University Division baseball rankings. Weitere von diesen relativ obskuren Seiten, von denen mein „Favorit“ immer noch die bereits erwaehnte Bacon, Ohio ist.
Ebenso auf LL30 zum ersten Mal zitiert wird William E. Livingston. Zunaechst kønnte man denken, dass es sich dabei im eine Person wie Alpheus Harding handelt. Interessant genug fuer einen eigenen Wikipediaeintrag, aber nicht bedeutend genug um einen „grøszeren Eindruck“ in der Weltgeschichte hinterlasse zu haben. Dieser erste Eindruck taeuscht aber, denn William E. Livingston erhaelt weitere Zitate auf LL31, LL32, LL33, LL36, LL37, LL39, LL40, LL45 und LL50. Das kann nicht an seinen Kindern liegen, denn die werden nicht naementlich erwaehnt, ich nehme also an, dass die keine eigenen Wikipediaeintraege haben. An seiner Rolle als Offizieller der Stadt Lowell, Massachusetts kann es eigtl. auch nicht liegen. Diese wird naemlich sofort zitiert und alles was mehr oder weniger direkt damit in Verbindung steht sollte zu relativ fruehen Zitierungen fuehren. Mit dem was ich bisher ueber das Wikipedialinknetzwerk ausgewertet habe laeszt sich dies nicht løsen. Ich hoffe ich denke an diesen Mann, wenn ich so weit gekommen bin, dass ich es prinzipiell aufklaeren kønnte.

Als naechses folgt auf LL35 und LL37 Estádio Juca Ribeiro. Aha! … … … Øhm … ja … ich nehme an die Zitierungen erfolgen im Zusammenhang mit Fuszball.
Fuer die letzten zwei, ganz weit am Ende haengenden, Seiten Mitsubishi Yowa Sugamo Ground (zitiert auf LL39) und Caius Novac gilt das bestimmt auch.

Vielmehr weisz ich dazu nicht zu sagen. Ich wollte nur mal schauen und hier steckt nix weiter drin was man lernen kønnte. Das liegt aber in der Natur singulaerer Ausreiszer.

… … …

… … …

… … …

Themenwechsel zu einem anderen losen Ende: die individuellen Verteilung(en) der Selbstreferenzen pro Linklevel steht noch aus

Zur Erinnerung: bei den totalen Links dachte ich zunaechst begeistert, dass sich dahinter was Cooles und Interessantes verbirgt, gestand am Ende dann aber doch ein, dass ich mich etwas verrant hatte. Das Selbe bei den neuen Links konnte ich kurz abhandeln.

Ich erwaehne das, weil ich nochmals kurz auf die Verteilung der Anzahl der Links pro Seite auf LL0 (ob totale oder neue macht dabei keinen erwaehnenswerten Unterschied) zurueckkommen muss. Ganz spezifisch auf die Tatsaeche, dass diese Verteilung ueber ca. vier Grøszenordnungen (auf der Ordinate) einem maechtigen Gesetz zu folgen scheint. Das ist an und fuer sich nicht weiter verwunderlich, da viele Prozesse in der Natur Potenzgesetzen folgen.
Wichtig ist nun, dass dies auf høheren Linkleveln nicht mehr (oder nur noch sehr bedingt mit Augen zukneifen) gilt. Der Grund ist, weil dann ja auch die vielen Urpsrungsseiten die mit wenigen Links starteten so weit in ihrem Linknetzwerk gekommen sind, sodass immer irgendwie eine Seite mit vielen Links dabei ist. Das verschmiert also.

Nach dieser Wiederholung von bereits Bekannten war ich zunaechst ueberrascht, dass Letzteres nicht fuer die Selbstreferenzen gilt. In diesem Diagramm …

… sind zwei representative individuelle Verteilungen gezeigt. Um sinnvoll mehrere derartige Datensaetze darzustellen habe ich aus den bekannten Balkendiagrammen diesmal Punktdiagramme gemacht. Der Informationsinhalt ist natuerlich der Gleiche.

Wir sehen: egal ob LL2 oder LL10, so folgen die individuellen Verteilungen maechtigen Gesetzen.
Als ich etwas laenger darueber nachgedacht hatte, kam ich zu dem Schluss, dass ich eigentlich gar nicht ueberrascht sein musste. Denn auch wenn fuer die Verteilungen der (totalen/neuen) Links der oben erwaehnte „verschmierende Prozess“ einsetzt, so sind die Selbstreferenzen davon unabhaengig.
Klar, auf den ersten Linkleveln treten zunaechst mehr Selbstreferenzen auf, einfach weil mehr Seiten zur Verfuegung stehen. Das Integral unter der Kurve wird also grøszer und grøszere Werte auf der Abszisse werden „besetzt“. Ebenso klar ist, dass diese beiden Charakteristiken fuer høhere Linklevel abnehmen muessen (eben weil dann wieder weniger Seiten zur Verfuegung stehen). Und das sieht man in den beiden Kurven des Diagramms. Aber mir faellt kein Prozess ein, der zu Abweichungen vom Potenzgesetz fuehren kønnte.

Oder anders: die Verteilung der Grøsze der Einschlagskrater auf Mimas verhaelt sich ja schlieszlich auch nach dem gleichen maechtigen Gesetz wie die selbe Verteilung gemessen an Lady Luna. Es spielt ueberhaupt keine Rolle, dass Letztere einen ca. zehn Mal so groszen Radius hat im Vergleich zu Ersterem. Der Erdmond hat mit einer fast 100 Mal grøszeren Oberflaeche eine entsprechend høhere Anzahl an Kratern, das Signal welches besagte Verteilung ausmacht ist also grøszer … aber das verhaelt sich nach dem selben Potenzgesetz und insb. ist auch der Anstieg der Kurve fuer beide Verteilungen gleich.

Ich erwaehne den Anstieg deshalb, weil ich damit zu einer urst spannenden Sache ueberleiten kann. JA, egal wie hoch das Linklevel ist, die Verteilungen verhalten sich immer nach einem Potenzgesetz. ABER der Anstieg aendert sich.
Das waere aber zu viel des Guten fuer diesen einen Artikel und deswegen komme ich darauf beim naechsten Mal zurueck :) .

Beim letzten Mal erwaehnte ich, das ich

[…] mich daran machte, die wirklichen, altersspezifischen Zahlen zu finden […].

Das stellte sich aber zunaechst als gar nicht so leicht heraus. Der Grund liegt darin, dass in allgemeineren Publikationen bzgl. der Auswirkungen von Krebs diese Zahlen relativ wenig von Interesse sind. Es ist klar, dass ueber 60-jaehrige viel øfter Krebs bekommen als unter 60-jaehrige. Eine Gesellschaft hat aber mehr von Letzteren als von Ersteren. Das ist bei solchen Artikeln in Betracht gezogen und drueckt sich darin aus, dass alle Zahlen „per 100-tausend (Einwohner)“ sind.
Der Artikel von Ugai, T., et al ist bereits eine Ausnahme, weil darin bereits eine altersspezifische Unterscheidung vollzogen wird. Aber mit „juenger oder aelter als 50 Jahre“ ist besagte Unterscheidung sehr grob und ich wollte das feinkørniger haben.

Andererseits sind solche Zahlen sind auch voll informativ, wie der Artikel „Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries“ von Hyuna Sung et al. in CA: A Cancer Journal for Clinicians, 71, 2021, pp. 209–249 zeigt.
Ehrlich, das ist total lohnenswert sich die Grafiken dort mal anzuschauen! Denn wenn man drueber nachdenkt, dann ist es ein voll gute Sache, dass heutzutage ((nicht nur) in den reichen Laendern) die Leute haeufiger an Krebs sterben. Das bedeutet naemlich, dass unheimlich viele vermeidbare Todesursachen verhindert werden. Heutzutage sterben ((nicht nur) in den reichen Laendern) weniger Leute an Infektionskrankheiten, verseuchter Umwelt, bei (Arbeits)Unfaellen etc. pp. Und nur _weil_ wir ((nicht nur) in den reichen Laendern) aelter werden kann Krebs ueberhaupt die Todesursache sein.
(Anmerkung: ich habe das „((nicht nur) in den reichen Laendern)“ rein gepackt um deutlich zu machen, dass sich dieser Fortschritt vor allem auf die „westliche“ Welt bezieht, ABER dass es auch in anderen Teilen der Erde besser geworden ist).

Hinzu kommen diese beiden Zahlen aus dem Artikel, welche wirklich nur positiv interpretiert werden kønnen:
– 19.3 Millionen gemeldete Krebsfaelle (weltweit, 2020)
– 9.9 Millionen gemeldete Krebstote (weltweit, 2020)

Wait! What?! Selbst wenn man SEHR pessimistisch ist und annimmt, dass nur 1/4 der Menschheit fuer diese Statistik in Betracht gezogen wird (auch wenn da „weltweit“ steht), weil der Rest in Gebieten wohnt wo kein Arzt hin kommt, dann bedeutet die erste Zahl, dass die Chance Krebs zu bekommen bei weniger als einem Prozent liegt!
Und die zweite Zahl bedeutet, dass heutzutage 50 Prozent der Leute den Krebs ueberleben! … WOW! … Ich sagte bereits frueher, dass man sich nicht all zu sehr den Kopf zerbrechen muss ueber Krebs.

Auch wenn das voll interessant ist, so war es nicht, was ich suchte. Irgendwann fand ich einen fast 1600 Seiten langen Report mit dem Titel „Cancer Incidence in Five Continents Vol. XI“ (direkt zum PDF) von der International Agency for Research on Cancer. Hurra! Denn hier fand ich endlich laender- und krebsspezifische Zahlen.
Und wieder ist die Chance Krebs zu bekommen fuer mich, der ich in Norwegen (S. 869) wohne, mit ca. 1.3 Prozent ziemlich klein. (Anmerkung: diese Zahl bestaetigt indirekt, dass mglw. weltweit tatsaechlich nur 1/4 aller Krebsfaelle registriert werden, denn fuer Norwegen kann angenommen werden, dass so ziemlich alle Einwohner Zugang zu einem Arzt haben.)

Aber das war immer noch nicht was ich suchte, denn auch wenn die durchschnittliche Wahrscheinlichkeit so klein ist, so liegt die kumulative Wahrscheinlichkeit ueber das ganze Leben bei ungefaehr 40-50 Prozent und ich wollte wissen wie das in meiner Altersgruppe aussieht. Doch dann, spaet Abends, fand ich endlich (wieder) von der International Agency for Research on Cancer eine Datenbank mit dem Titel „Global Cancer Observatory„.

Was fuer Datenschatz! … Damit transformierte ich vom (Daten)Jaeger zum (Daten)Sammler … und damit geht es beim naechsten Mal weiter.

Ich hatte bereits mehrfach erwaehnt, dass Minecraft Turing-komplett ist und Minecraft-Computer sind ja nix neues mehr. Im Wesentlichen geschieht dort das Gleiche wie beim Magic Beispiel vom letzten Mal: (Spiel)Elemente werden in einer bestimmten Reihenfolge angewendet und dies kann dann uminterpretiert werden als Elemente und Instruktionen der Turingmaschine. Bei Minecraft ist das nur viel intuitiver als bei Magic, weil man ja schon mit technischem (Spiel)Elementen anfaengt.
Letzteres ist der Grund, warum ich Minecraft in dieser Serie eigentlich nicht behandeln wollte.

Nun stolperte ich aber darueber, dass jemand einen Minecraft-Computer gebaut hat, in dem Minecraft selbst laeuft. Cool wa! Der Computer im verlinkten Video ist ein Upgrade von dem Modell was hier etwas detaillierter vorgestellt wird (mit noch mehr Programmbeispielen).

Das ist eigentlich immer noch nicht wert fuer diese Serie. Ich bringe es hier, weil ich mehrmals sagte, dass fuer eine gegebene Turingmaschine eine konkrete Uebersetzung eines Programms sehr komplex sein kann und die Bearbeitung von aequivalenten Programmenschritten mitunter sehr viele Einzelschritte in der Turingmaschine benøtigt und damit sehr lange dauert. Hier geht es schnell genug, dass man das zeigen kann. Aber die Implementierung lief bei 10-tausendfacher Geschwindigkeit (und die Videos sind nochmals schneller abgespielt), denn andernfalls …

[…] it would run at a frame every few days

Weil dies das Gesagte so schøn illustriert, war Minecraft dann doch einen kurzen Beitrag wert.

Ach ja, der Titel kommt daher, weil die Leute daran arbeiten, dass auch DOOM auf diesem Computer laeuft. Wenn das fertig ist, ich drueber stolper und mich dran erinnere, dann werde ich das hier auch erwaehnen.

… in Schweden Joe Kurt kaufen:

Tihihihi. Ich fand das zu witzig um das einfach so im Kuehlregal stehen zu lassen und wollte meine Freude gerne mit euch, meine lieben Leserinnen und Leser, teilen :) .

Uff, noch eine neue Miniserie … aber ich versuche mich an kuerzeren, leichter „verdaulichen“ Beitraegen, damit die laengeren und mglw. etwas schwerer zu „verdauenden“ Kevin Bacon Artikel ertraeglicher werden. Das bedeutet aber, dass ich Themen „zerschneiden“ muss.

Wieauchimmer, vor einigen Jahren merkte ich an, dass

[f]alls Dinosaurier intelligent waren dann wuerden wir das gar nicht mitbekommen.

Meine Argumentation lief letztlich auf die Vergaenglichkeit aller Zeugnisse einer wie auch immer gearteten Kultur hinaus.

Mir scheint, dass Schmidt, G. A. und Frank, A. diesen Beitrag gelesen haben und die Idee geklaut davon inspiriert worden sind, den Artikel „The Silurian hypothesis: would it be possible to detect an industrial civilization in the geological record?“ im International Journal of Astrobiology, 18(2), 2018, pp. 142–150 zu schreiben … … … Meine erste Reaktion war: das ist ja wohl mal urst toll wa!
Die Autoren sondieren die im Titel des Artikels gestellte Frage deutlich gruendlicher als ich und ich werde deren Ueberlegungen, Argumente und Ergebnisse im Zuge dieser Miniserie vorstellen.

Gleich vorweg kann ich sagen, dass die Autoren zum selben Ergebniss kommen wie ich. Wenn man nur ein paar wenige Millionen Jahre zurueck geht, hat man ein hinreichend groszes Signal, welches auf Wesen deuten laeszt, die dem Tierreich entstiegen sind:

[…] (the last 2.5 million years), there is widespread extant physical evidence of, for instance, climate changes, soil horizons and archaeological evidence of non-Homo Sapiens cultures […].

Darueber hinaus findet man aber eigentlich nur noch was, wenn man danach buddelt … wobei damit aber i.A. nicht die lustige archaeologische Exkursion in der Wueste Gobi gemeint ist, sondern Bergbau! Und selbst dann kommen nur ein paar wenige Millionen Jahre dazu.

Bleiben Fossilien oder (Abdruecke) von Objekten. Nur dass sich ueberhaupt Fossilien bilden ist EXTREM unwahrscheinlich (mal ganz abgesehen davon, dass man die dann auch noch finden muss):

[…] it is clear that species as short-lived as Homo sapiens (so far) might not be represented in the existing fossil record at all.

Lange Rede kurzer Sinn, die Autoren kommen (wie oben erwaehnt) zu dem Schluss, dass …

[…] for potential civilizations older than about 4 Ma, the chances of finding direct evidence of their existence […] is small.

Deswegen dreht sich der Artikel um …

[…] physicochemical tracers for previous industrial civilizations […]

… denn diese sind nicht lokalisiert (man denke hier an Treibhausgase, Uebersaeuerung der Meere oder Mikroplastik). Voll spannend, wa! Aber dazu mehr beim naechsten Mal.

Zum Abschluss sei noch gesagt, dass die Autoren auch Argumente geben, warum es wichtig ist, sich Gedanken zu machen bzgl. dieser Frage in einem professionellen Kontext … als ob es einer Begruendung braeuchte, sich ueber mglw. raumfahrende Dinosaurier Gedanken zu machen … pfffffff!
Ach ja … zur Begruendung wird (unter anderem) die Drake-Gleichung herangezogen, die in diesem Weblog ja auch bereits Thema (einer Miniserie) war.

Ich finde dies ist ein toller Jahresabschluss … ich wuensche einen guten Rutsch :)

… ist das dritte Buch welches ich von Simon Stålenhag habe. Als ich es nach dem Kauf durchblaetterte, war ich zunaechst enttaeuscht, denn es schien auf den ersten Blick eine Abkehr vom Konzept der vorangehenden zwei Buecher zu sein.

Dementsrpechend wartete ich nach dem Kauf recht lange, bevor ich es las. Zu meiner Ueberraschung stellte sich mein erster Eindruck zwar durchaus als richtig, aber meine Reaktion als unbegruendet heraus.

Das zugrundeliegende Konzept der ersten beiden Buecher — imaginierte Kindheit und Jugend in einer Gegend die voll ist mit seltsamen technischen Artefakten welche dem Ganzen eine Art Semi-Endzeitstimmung geben — gibt nunmal nur so viel her bevor es repetitiv wird. In diesem Buch schafft Stålenhag die erfolgreiche Erweiterung dieses Konzepts. Altes wird erhalten und Neues kommt dazu. Genauer ist hier ein ganzes Land (høchstwahrscheinlich der ganze Planet) und alle Bewohner „betroffen“ von den Artefakten; anstelle einer kleinen Gegend in Schweden und den wenigen Leuten die dort wohnen. Auszerdem muss es eine ganz andere Welt sein, denn die Artefakte sind zwar immer noch technisch, aber ganz anderer Natur.

Stålenhag ist sehr geschickt in der Praesentation dieser (neuen) Welt in Text und Bildern und deswegen wurde trotz meiner anfaenglichen Bedenken dieses (dritte) Buch meine Favorit :) .

Mein Weihnachtsbeitrag von mir an euch, meine lieben Leserinnen und Leser. Dieses Mal versuche ich ein bisschen zu vermitteln, warum ich mir das mit Kevin Bacon eigentlich „antue“. Warum ich nun schon seit bald 2 Jahren den kleinen Diskrepanzen so hinterherforsche (selbst wenn ich mich da auch mal verlaufe). Dies passt naemlich so schøn zusammen, worueber ich in dieser Maxiserie die letzten Wochen geschrieben habe. Aber genug der Vorrede.

In den letzten Artikeln habe ich die ganze Zeit von Archipelen oder Gruppen und Untergruppen gesprochen. Implizit meinte ich damit, dass dies unabhaengige Netzwerke sind, aber ich habe versucht letzteren spezifischen Begriff zu vermeiden.
Der Grund liegt darin, dass ich das urspruengliche Problem bereits mit diesem Begriff verbunden hatte — das Wikipedialinknetzwerk. Dieses entsteht, wenn eine Seite andere Seiten zitiert und man der Kette von Zitierungen folgt; Start zu Ende. Ich komme darauf gleich nochmal zurueck.

Was ich in den letzten Artikeln naeher betrachtete war aber eher eine Art spiegelbildliches Problem: ich schaute, welche Seiten von welchen anderen Seiten zitiert wurden. Man beachte den Unterschied in der Reihenfolge, ist das doch Ende zu Start.
Dies hat ein paar ganz erstaunliche Dinge ueber das Wikipedialinknetzwerk offenbart, die mit der urspruenglichen Herangehensweise vermutlich verborgen geblieben waeren. Aber der Reihe nach und ich muss auch etwas ausholen.

Das Linknetzwerk besteht aus den einzelnen Seiten und den Verbindungen dieser Seiten untereinander. Als (zugegeben weit hergeholtes) Analogon denke man sich, dass die materielle Welt aus Elementarteilchen besteht und wie die sich zueinander verhalten bestimmen die Naturgesetze (sozusagen als Verbindung zwischen den Elementarteilchen).

Ein Elementarteilchen hat nun gewisse Eigenschaften und eine davon ist die Ladung. Eine Eigenschaft der Seiten ist, dass diese von anderen zitiert werden, dass ist sozusagen deren (Selbst)“Zitierladung“. (In Anlehnung an die Farbladung, die ja weder eine Farbe noch eine Ladung ist.)
Anstatt dreier Ladungszustaende wie beim Elementarteilchen (positiv, negativ, neutral) gibt es bei der „Zitierladung“ nur zwei: ein binaeres ja wenn ueberhaupt zitiert wurde, egal wie oft, und nein, wenn eine Seite nicht zitiert wurde.
Die Zitierladung kann ich direkt messen und dabei sehen ich fuer jede Seite, dass die sich immer in einem der beiden Zustaende befindet. So weit ist das leicht zu verstehen.

Bei einem Elementarteilchen kann ich den Ladezustand auch indirekt ermitteln, indem ich schaue, wie dieses in einem elektrischen Feld abgelenkt wird. Die Ergebnisse folgen den Naturgesetzen.
Dass ich nach Selbstreferenzen schaute war eine solche indirekte „Messung“ der Zitierladung. Selbstreferenzen folgen direkt aus der Eigenschaft der Zitierladung der Seiten welche im Linknetzwerk miteinander „agieren“. Die Regel haette ich anfangs so formuliert: hat eine Seite eine Zitierladung, so hat diese eine Selbstreferenz. Klingt ja erstmal logisch, nicht wahr, analog zum Elektron das im elektrischen Feld abgelenkt wird bzw. dem Neutron welches nicht abgelenkt wird.

Waehrend die „direkte Messung“ eindeutige Ergebnisse erbrachte (Zitierladung ja/nein), so war das bei der indirekten Messung zu meiner Ueberraschung nicht so. Das war der erste Balken in der Verteilung der Maxima, der viel grøszer war als erwartet.
Einen groszen Teil des besagten Balkens konnte ich durch die „Ergbenisse direkter Messungen“ erklaeren — Seiten ohne Zitierladung haben natuerlicherweise keine Selbstreferenz. Einen weiteren Anteil kam durch Fehler zustande (das Artefakt der Selbstzitierungen auf Linklevel Null).
Es blieb aber eine Diskrepanz: Seiten die definitiv eine „Zitierladung“ hatten, aber die dennoch keine Selbstreferenz aufwiesen. Das ist ungefaehr so, wie wenn ein Elektron im elektrischen Feld nicht abgelenkt wird.
Der Versuch diese Diskrepanz zu erklaeren fuehrte dann dazu das gesamte Problem spiegelbildlich zu betrachten, ohne aber die urspruengliche „Richtung“ der Zitierungen zu vergessen. In den letzten Artikeln musste ich immer beides im Kopf behalten.

Aber nochmals: Vorsicht! Denn auch wenn ich sage, dass die Archipele vom Linknetzwerk unabhaengig sind, so stimmt das ja gar nicht. Selbst eine Seite des Archipels hat Zugriff auf das gesamte Wikipedialinknetzwerk; sans die Archipele selber (denn da fuehrt ja kein Link hin und natuerlich von den Seiten die keine Links haben abgesehen).
Die Seiten der Archipele scheinen somit bei normaler Betrachtungsweise (beinahe) ununterscheidbar in das Wikipedialinknetzwerk integriert. Erst die Diskrepanz bei der „indirekten Messung“ der Selbstreferenzen machte mich ueberhaupt auf die Archipele aufmerksam. Die „Unabhaengigkeit“ derselben folgt also nur, wenn man sich das Problem anders anschaut.
Und auf diese Integration wollte ich nochmal direkt hinweisen, denn weil die Unabhaengigkeit der Archipele mein Untersuchungsschwerpunkt in den letzten Artikeln war, befuerchte ich, dass Ersteres vielleicht nicht richtig rueber gekommen ist.

ich schreibe dies alles nochmal, weil der Metaaspekt des Ganzen so urst cool ist.
Wenn eine Seite eine Zitierladung, aber keine Selbstreferenz hat, so kommt Letzteres nicht durch eine Eigenschaft des Teilchen zustande, sondern ist eine Art „Wechselwirkung“ des Wikipedialinknetzwerkes auf das Teilchen. Was ich da also entdeckt habe ist eine Eigenschaft des Netzwerkes an sich. Im Gegensatz zu den totalen oder neuen Links pro Linklevel laeszt sich diese Eigenschaft nicht direkt aus den Teilchen(eigenschaften) ableiten, sondern nur aus deren „Interaktion“ miteinander im Netzwerk.

Das ist nicht ganz unaehnlich dem Baendermodell in der Festkørperphysik welches erklaert ob ein Material ein Metall, Halbleiter oder Isolator ist. Das folgt naemlich auch nicht aus den Elektronen und Atomruempfen an sich, sondern nur wenn ein freies Elektron sich in einem periodischen Potential (dem der Atomruempfe) bewegt.
Bevor es das Baendermodell gab, wusste man auch schon, dass Materie aus Atomen besteht, dass diese sich aus Atomkernen und Elektronen zusammensetzen und das Letztere den elektrischen Strom leiten. Dennoch war das Zustandekommen der unterschiedlichen Leitfaehigkeiten von Metallen und Isolatoren nicht aufgeklaert, bevor Bloch und Bethe sich dem Problem mit einer anderen, zugegebenermaszen komplizierteren, Betrachtungsweise naeherten.

Was ich sagen will: zunaechst nicht zu erklaerende „Messwerte“ bei den Selbstreferenzen erforderte die Entwicklung der Theorie der Archipele. Diese sind nicht direkt erkennbar (weil ja die Seiten der Archipele immer noch ins Netzwerk integriert sind) und eine Eigenschaft des Wikipedialinknetzwerks an sich (also nicht der einzelnen Seiten). Dadurch konnte ich recht viel Neues (und durchaus Spannendes) ueber das Netzwerk selbst heraus bekommen (besagte unabhaengigen Archipele) was ich nicht erwartet habe … und neue Erkenntnisse sind immer cool.

Eine kleine Diskrepanz førderte groszes Verstehen zutage … DAS ist Wissenschaft … … … Deswegen noch einmal: cool wa! … und dieser Metaaspekte passen so schøn in diese Zeit.

Damit schliesze ich und wuensche erholsame Tage.

Als ich das No-way-home-Archipel (nwhA) erdachte, erwaehnte ich dass es aus 39 Inseln besteht. Beim letzten Mal bemerkte ich, dass das falsch ist und es vielmehr 39 Stufen haette heiszen muessen und dass eine Stufe aus mehreren (unabhaengigen) Inseln bestehen kann.

Schnell fand ich heraus, dass ab Stufe #23 jede Stufe aus nur einer Seite besteht und die Stufen schon lange davor nur sehr wenige Seiten (meist zwei, manchmal drei) haben. Nach meiner Erfahrung mit dem São Paulo FC kam mir das sehr verdaechtig vor und ich vermutete hier im wesentlichen ein aehnliches Artefakt. Nur dass dieses nicht bei den totalen (oder neuen) Links zu sehen war, denn die Seiten gehøren zum nwhA und auf das wird ja nicht von Auszen zitiert.

Dennoch dachte ich mir, dass es ja mal ganz interessant sein kønnte nachzuschauen. Diesmal gehe ich rueckwaerts vor und schaue mir nicht an wer wen zitiert, sondern wer von wem zitiert wurde.

Auf Stufe #39 finde ich 1949 Waterford Senior Hurling Championship … the what? … wie so oft waehrend dieses Projekts habe ich mal wieder etwas gelernt. Ich war vøllig ignorant dem gegenueber, dass Hurling in Irland eine richtig wichtige Sache ist; man schaue sich nur mal das proppenvolle Stadion hier an.

Wieauchimmer, zurueck zur Sache und das sieht auf den ersten, zweiten und dritten Blick (und allen Blicken danach) tatsaechlich genau so aus wie das São Paulo FC Artefakt. Beim genauen Hinschauen komme ich zu dem Schluss, dass das Hurling Artefakt auch durch den gleichen Mechanismus entsteht, dass also NICHT Links aus dem Text ausgewertet wurden, sondern aus Infoboxen.

Wenn ich dann einen „Schritt“ hinunter gehe und schaue wer die 1949 Waterford Senior Hurling Championship zitiert, so finde ich auf Stufe #38 die 1951 Waterford Senior Hurling Championship. Und dann auf Stufe #37 die 1953 Waterford Senior Hurling Championship.

Das ist definitiv ein Artefakt … … …na dann kann ich das auch schnell abhandeln (dabei lasse ich „Waterford Senior Hurling Championship“ weg und schreibe nur noch das Jahr): Stufe #36: 1954, Stufe #35: 1955, Stufe #34: 1956, Stufe #33: 1957, Stufe #32: 1958, Stufe #31: 1959, Stufe #30: 1960, Stufe #29: 1961, Stufe #28: 1962, Stufe #27: 1963, Stufe #26: 1964, Stufe #25: 1965, Stufe #24: 1966, Stufe #23: 1967, Stufe #22: … hier geschieht was Spannendes. Zunaechst habe ich hier das Jahr 1968 der Waterford Senior Hurling Championship; aber dann habe ich hier auch die Vehicle registration plates of the Dominican Republic.

Diese beiden Seiten wurden von Stufe #21 aus zitiert. Ersteres vom Jahr 1969 und Zweiteres von der Seite zu den Vehicle registration plates of the Canal Zone. Letzteres wurde von sehr vielen Seiten auf unterschiedlichsten Stufen zitiert.
Auf Stufe #20 mache ich bei der Waterford Senior Hurling Championship einen Sprung in das Jahr 1972 und auszerdem befinden sich hier die Vehicle registration plates of the United States for 1924 und die Vehicle registration plates of the United States for 1959. Aha! Also noch ein Artefakt. Damit ich das nicht immer ausschrieben muss, behalte ich fuer die Waterford Senior Hurling Championship nur die Jahreszahlen bei und fuer die Kennzeichen der Vereinigten Staaten benutze ich die Jahreszaehlen und schreibe ein „VP“ davor. Bei Letzteren sieht man, dass das Artefakt verzweigt ist. Aber nun mal weiter die Stufen hinunter.

– Stufe #19: 1974 und VP1922 / VP1944
– Stufe #18: 1975 und die Zweige der Vehicle registration plates of the United States verschmelzen zu einem mit VP1921
– Stufe #17: 1981 und VP1918
– Stufe #16: 1983 und VP1917
– Stufe #15: sieht die Verzweigung der Waterford Senior Hurling Championship mit 1986 und 1992 und natuerlich ist da VP1916
– Stufe #14: 1988 / 1993 und VP1915
– Stufe #13: sieht die Wiedervereinigung der Waterford Senior Hurling Championship mit 1994 und weiterhin ist da noch VP1914
– Stufe #12: 1995 und VP1913
– Stufe #11: 1996 und VP1912
– Stufe #10: 1997 und VP1911
– Stufe #9: 1998 und VP1910
– Stufe #8: 1999 und VP1909
– Stufe #7: 2000 und VP1908

Auf Stufe #6 wird es dann wieder spannend. Zu den 2001 Waterford Senior Hurling Championship und den Vehicle registration plates of the United States for 1907 gesellen sich die Monate February 1927 und April 1946, die Gleiter DTGL Sant‘ Ambrogio (einsitzig) und Horikawa H-22 (zweisitzig), der franzøsische Jihadist Gilles Le Guen, die United Nations Security Council Resolution 903 und zu meiner Freude auch ein Dinosaurier: Tarsodactylus.
Offensichtlich hørt hier das Artefakt auf und das richtige No-way-home-Archipel beginnt. Alle Stufen darunter haben deutlich mehr (mindestens hunderte) und irgendwann unhandhabbar gewaltig mehr (hunderttausende) zitierende Seiten, sodass ich dem nicht weiter folgte.

Auch wenn diese Uebung in groszen Teilen eher weniger spannend war, so war es mir wichtig herauzufinden, ob mein Bauchgefuehl, dass es sich bei der langen Kette um ein Artefakt handelt, richtig war. Zu meiner Ueberraschung stiesz ich dann sogar auf zwei Artefakte. Cool war auszerdem, dass ich wieder was Interessantes in Erfahrung gebracht (Hurling) und Seiten gesehen habe, die ich sonst niemals aufgesucht haette. Weswegen sollte ich mir auch die Kennzeichen der Vereinigten Staaten von 1913 anschauen? Ich wusste ja nicht mal, dass es so eine Wikipediaseite gibt.

Es sei noch das Folgende gesagt. Auch wenn das hier grøsztenteils wieder nur ein Artefakt war, so tut dies bzgl. des allgemeinen Konzepts der Archipele nix zur Sache. Ja, das ist ein langer Schwanz, aber der besteht aus nur wenigen Seiten und geht unter in der Menge aller anderen Seiten welche die vielen hunderttausend echten Archipele konstituieren.
Das soll genug sein fuer heute. Der naechste Beitrag wird dann nochmal ein wichtiges Kommentar bzgl. des Archipelkonzepts und dann geht es endlich weiter mit den Selbstreferenzen.