Nun ist’s wohl ’ne Tradition, dass ich die ersten Resultate einer neu gestarteten Operation zeige.

Bemerkenswert sind R Coronae Austrini A (Reihe 2, Spalte 2) welcher echt klein ist und Phi Persei B (Reihe 3, Spalte 3) welcher BEIDE (!) Distanzrekorde vom Ankunftspunkt im System (am naehsten dran UND am weitesten weg) haelt.

Name: Eol Prou ZE-A f111 A
Typ: O (Blue-White) Star
Rekord: orbitale Periode (am laengsten)
Wert: 222,900,502,527.99997 s oder ca. 0.6 Milliarden Jahre
Bild: Reihe 1, Spalte 1

Name: Dryuae Aoscs AA-A h93 B
Typ: Wolf-Rayet N Star
Rekord 1: Distanz vom Ankunftspunkt im System (am naehsten dran)
Wert 1: 15 ls
Rekord 2: Geschwindigkeit in Periapsis (am schnellsten)
Wert 2: 1,259,597.97836747 m/s oder ca. 4.5 Gm/h
Bild: Reihe 1, Spalte 2

Name: Iowhaik AA-A h47 A
Typ: Wolf-Rayet O Star
Rekord: orbitale Periode (am laengsten)
Wert: 103,110,909,952.0 s oder fast 3270 Jahre
Bild: Reihe 1, Spalte 3

Name: Byaa Ain AA-A h121 A
Typ: B (Blue-White super giant) Star
Rekord: absolute Helligkeit (am leuchtstaerksten)
Wert: -14.480209
Bild: Reihe 2, Spalte 1

Name: R Coronae Austrini A
Typ: B (Blue-White) Star
Rekord: absolute Helligkeit (am leuchtschwaechsten)
Wert: 9.630203
Bild: Reihe 2, Spalte 2
Notes: Super kleiner B (Blue-White) Star. Ich dachte zunaechst ich bin richtig weit weg, aber nein, das war ich nicht. Manchmal ist die Grøsze dann doch wichtig. Nachdem ich so nahe dran war wie møglich musste ich immer noch maximal ranzoomen um diesen Stern so grosz auf’s Bild zu bekommen.

Name: Kappa-1 Sagittarii
Typ: A (Blue-White) Star
Rekord: Distanz vom Ankunftspunkt im System (am weitesten weg)
Wert: 1,915,580 ls
Bild: Reihe 2, Spalte 3

Name: HIP 91911 A
Typ: Wolf-Rayet Star
Rekord: absolute Helligkeit (am leuchtschwaechsten)
Wert: 6.632233
Bild: Reihe 3, Spalte 1

Name: HIP 117365 A
Typ: A (Blue-White) Star
Rekord: Alter (am aeltesten)
Wert: 12.224 Milliarden Jahre
Bild: Reihe 3, Spalte 2

Name: Phi Persei B
Typ: Wolf-Rayet Star
Rekord 1 + 2: Distanz vom Ankunftspunkt im System (am naehsten dran UND am weitesten weg)
Wert 1 + 2: 338 ls
Rekord 3: Geschwindigkeit in Periapsis (am schnellsten)
Wert 3: 119,912.49210768679 m/s oder ca. 431.68 Mm/h
Bild: Reihe 3, Spalte 3
Notes: Weil dieser Stern beide Distanzrekorde haelt kann man schlieszen, dass bisher kein anderer Wolf-Rayet Star (ohne Unterklasse) in einer (mindestens) binaeren Konfiguration gefunden wurde, in welcher dieser NICHT der Anker fuer den Sprungantrieb ist.

Als „Rohdaten“ ist natuerlich die (englische) Wikipedia zu verstehen. Und JA, die kann man _komplett_ runterladen … also ohne Bilder und Videos und sowas … aber wenn man wuenscht, kann man das auch von den offiziellen Quellen nachladen … aber das wuensche ich nicht fuer dieses Projekt.

Zunaechst einmal ist es supercool, dass das ueberhaupt geht … soviel wusste ich … und dann ging’s auch schon los mit der Frage: Wie komme ich an die Daten die ich brauche um die Fragestellung zu bearbeiten?
Das ist uebrigens total normal fuer Data_scientists_. Uns werden Fragen gestellt und wir kønnen dann zusehen, wie wir die beantworten. Ist wie bei normaler Wissenschaft.
Data_analysts_ hingegen kriegen die (oft schon gut vorbereiteten) Daten gegeben und muessen die dann „nur“ analysieren.
Im Laufe der Serie werde ich ein bisschen mehr darauf eingehen, worin ich die Unterschiede sehe zwischen diesen beiden Berufen. Das soll nicht falsch zu verstehen sein. Dataanalysts haben oft ziemliche hohe Kompetenzen in der Datenanalyse die ich nicht habe. Aber Hinz und Kunz die ’n Fragebogen erstellen, dann die paar hundert Antworten ’ner regulaeren statistischen Analyse unterziehen und das ganze oft in einem bekannten Tabellenkalkulationsprogramm oder mit gekaufter proprietaerer Software, ohne zu wissen oder zu reflektieren was dahinter steckt (nicht nur bei der Software, sondern auch bei den Modellen), bezeichnen sich heutzutage so. Und ’s geht mir gegen den Strich, dass ich mit besagten Hinz und Kunz (nicht mit denen die wirkliche Kompetenz haben) in einen Topf geworfen werde. Und ja, ich rege mich hier ueber Kollegen einer anderen Zweigstelle auf … aber das mache ich nur wegen meiner Eitelkeit und weil ich eingebildet bin. Deswegen versuche ich das auf ein Minimum zu reduzieren.

Ich schwoff ab.

Zunaechst wusste ich zwar, dass man die Wikipedia runterladen kann, aber ich wusste nicht wo.
Schritt Null war dann eine allgemeine Suche im Internet und das lesen von ein paar Weblogartikeln. Dabei fand ich die offizielle Wikiepedia-komplett-runterladen-Seite.
Dort navigierte ich fix zum Abschnitt „Where do I get it?“ und das fuehrte mich hierhin, wo ich begrueszt wurde von diesem spartanischen Design …

… … … … wait what? … und war erstmal verwirrt. Es brauchte ein bisschen vorwaerts / rueckwaerts / seitwaerts klicken um immer wieder hier zu landen. Das war also richtig.

Ich nahm das Backup vom 2020-12-20 was mich mich auf die naechste Seite fuehrte (ich frage mich, ob es die in einem Jahr noch gibt). Die Information dort war dann VIEL mehr und ich musste erstmal herrausfinden worum es sich bei all diesen Sachen handelt.
Nachdem ich mich ein bisschen informiert (und probiert) hatte, entschied ich mich fuer die Datei mit dem leicht zu merkenden Namen „enwiki-20201201-pages-articles-multistream.xml.bz2“.

Toll wa! Das Wissen der Welt ist komprimiert und ohne Bilder nur 17.7 GB grosz. … Unkomprimiert sind es ca. 75 GB. Das ist zwar deutlich mehr, aber jetzt auch nicht soooo viel. Schon krass, wie gut Komprimierungsalgorithmen sind. Ist ja bei mp3 oder den Videocodecs nicht anders. Menschlicher Einfallsreichtum par excellence.

Nun hatte ich was ich wollte und war einen Schritt naeher an der Beantwortung der Frage. Zu dem Zeitpunkt ahnte ich noch nicht, dass es noch ziemlich viele Schritte werden bis ich die Antwort in den Haenden halten konnte.
Eine Sache war mir aber klar: die 75 GB; das konnte ich nicht alles gleichzeitig im Arbeitsspeicher behalten. Geschweige denn sich „kreuzende“ Berechnungen ueber alles auf alles daran zu machen. Wie ich dieses Problem (schrittweise) løste, stelle ich in den kommenden Artikeln vor.

Meine Frigg kaufte ich ja erstmal nur wegen des ungewohnlichen Design des Cockpits. Das hatte ich auf Bildern gesehen und das war so anders als alles was ich bisher gesehen hatte, dass ich so einen Imperial Courier gerne haben wollte. Und so sieht es aus, wenn ich in meinem Pilotensitz sitze und Frigg fliege:

Der Neutronenstern den man dort sieht ist Nova Aquila No 3 und hat von allen Sternen (auch ehemaligen) mit nur 0.0000010351843321351545 Solradii den kleinsten aller „Sternen“radien. Auszerdem ist es mit einer absoluten Helligkeit von 5.642715 auch der leuchtschwaechste aller (bisher) im galaktischen Atlas verzeichneten Neutronensterne.

Interessant ist, dass jemand seinen Flottentraeger in einem Abstand von nur ca. 3,000 km direkt daneben geparkt hat! Ich habe den angewaehlt und man sieht’s am Hologramm unten, links-mittig. Ich besuchte den kurz, war dann aber auch gleich wieder auf dem Weg zu anderen Gefilden:

… ist ein seltsamer Name fuer einen Planeten. Hier …

… fahre ich in einer der … øhm … ich sag jetzt mal Staedte darauf herum. Der Grund, dass ich dies tue, liegt darin begruendet, dass es sich bei Rance’s Wreck um den Rocky body handelt, der von allen Planeten dieses Typs (ob man drauf landen kann oder nicht) die laengste grosze Halbachse hat, mit einem Wert von 12,715,827,337,107.96 m oder ca. 85 au.

Jaja, ich gebe zu, dass der Name das Interessanteste an diesem Planeten ist :P .

In dreifacher Hinsicht. Zum Einen bereitet die Botschaft eines Artikels in der New York Times mit dem Titel „The Age of Electric Cars Is Dawning Ahead of Schedule“ gute Laune. Wenn man den Ladevorgang (Wortspielkasse!) der Seite abbricht , dann kommt auch nicht dieses Dingens was einem vom Lesen des Artikels abhaelt … manchmal frage ich mich, was fuer Leute diese „Schutz“mechanismen programmieren und warum das keinem auffaellt wie leicht das zu umgehen ist. Das ist ja noch einfacher als damals, als der Spiegel seine Seiten „verschluesselt“ hat, damit die keiner lesen kann, wo die „Verschluesselung“ dann aber einfach darin bestand im HTML-Code der Seite alle Buchstaben eins nach rechts zu schieben … *lol* … das ist dann der zweite Grund fuer gute Laune … dass man den Artikel trotzdem lesen kann.

Der dritte Grund ist persønlicher Natur … ’s ist doch immer schøn, wenn man Recht hat und es dann sogar mal um eine positive Sache geht :)

Ich war munter auf dem Weg und sammelte Rekorde im Laufe der Operation GOODBYE, BLUE MONDAY! als mich ein Ruf der Pilots Federation erreichte. Alle unabhaengigen Piloten wurden gebeten dabei zu helfen Materialien fuer neue Raumstationen zu liefern. Da hatte ich voll Lust drauf, war es doch eine gute Gelegenheit mal wieder mein Chicken of Doom zu fliegen.
Deswegen eilte ich entlang der Neutronenstern Schnellstrasze zurueck zur Bubble. Ich ueberbrueckte beinahe die gesamte Distanz Colonia–Bubble in nur ca. 2 Stunden. Ganz schøn klein, unser Galaxis, wenn man’s eilig hat.

Besagte Mission ist nun auch schon wieder vorbei. Ich hab zehntausende Tonnen Material geliefert. Schon gut, wenn man ’n Schiff mit groszem Laderaum hat :) .

Da ich nun schon in der Bubble bin, dachte ich mir, dass ich mir mal ’n paar Rekorde hier in der Naehe anschaue. Auszerdem konnte ich mir endlich ein Imperial Courier kaufen. Wegen der einzigartigen Cockpitansicht wollte ich diesen kleinen Flitzer schon laenger haben. Die gibt’s aber nicht in Colonia.

Und hier ist sie, meine Frigg

… vor 24 Sextantis 2, dem Class III gas giant, welcher von allen Planeten dieses Typs am schnellsten in Periapsis ist (81,997,778.41547105 m/s oder ca. 295,192,002 km/h).
Ich gebe zu, der Planet is nicht halb so interessant (oder schøn anzusehen) wie Frigg :) .

Ach ja, auf oben erwaehntem Weg entdeckte ich die Ammoniakwelten #168 (mit Ringen), #169 (dito, und in einem Neutronensternsystem) und #170:

Nun bin ich ein paar Wochen in Colonia gewesen und habe Missionen geflogen fuer alle hier anwesenden Gruppen … (auszer fuer die Independent Detention Foundation denn Gefaengisse haben keine Missionen).

Ich habe mich dann auch entschlossen tatsaechlich das zu machen, was ich nach dem Abschluss von Operation YELLOW ORB ankuendigte: ich werde alle blau-weiszen Sterne mit Rekorden besuchen. Dies beinhaltet Sterne der folgenden Typen:
– A (Blue-White super giant) Star
– A (Blue-White) Star
– B (Blue-White super giant) Star
– B (Blue-White) Star
– O (Blue-White) Star
– Wolf-Rayet C Star
– Wolf-Rayet N Star
– Wolf-Rayet NC Star
– Wolf-Rayet O Star
– Wolf-Rayet Star

Ich verkuende hiermit den Start der Operation GOODBYE, BLUE MONDAY! in Gedenken an den groszen Kilgore Trout.

Und so sind diese Rekorde ueber die Galaxis verteilt (die cyan Punkte):

Quelle, Lizenz: unbekannt. Die galaktische (Hintergrund) Karte wurde angefertigt von CMDR Finwen und CMDR Corbin Moran, kuenstlerische Beschriftung der Regionen und Platzierung der Koordinatengitter durch CMDR Corbin Moran mit Namen vom Galactic Mapping Project. Punkte von Interesse wurden von mir hinzu gefuegt. Ebenso ist die hier zu sehende Karte aus technischen Gruenden von mir verkleinert worden. Das Original (ohne meine Hinzufuegungen und in korrekter Grøsze) kann unter dem angegebenen Quellen-Link gefunden werden.

Mittlerweile bin ich schon wieder unterwegs und habe Ammoniakwelt #167 (mit Ringen) und im sofort darauffolgenden System ELW #102 entdeckt:

Das Konzept der Erdős Nummer ist ja bekannt … wenn nicht, dann empfehle ich diesen XKCD … tihihi.
Meine Erdős Nummer ist vermutlich 7. Es ist aber auch nicht allzuweit hergeholt dass es eine 5 ist. Und unter ganz guenstigen Umstaenden kønnte es sogar eine 4 sein, das bezweifle ich aber.

Das Erweiterte Konzept der Six degrees of separation, ist vermutlich bekannter. In kurz besagt dieses, dass im Durchschnitt jeder Mensch mit jedem anderen Menschen ueber nur 6 andere Leute verbunden ist.
Ich bspw. bin ueber nur 4 Verbindungen mit Fidel Castro verbunden. Ich habe mal jemanden getroffen deren Sohn (oder war’s der Bruder?) zusammen mit Fidels Bruder an einem Agrarprojekt gearbeitet hat.
Noch besser ist meine Verbindung zu TOOL. Dorthin huepfe ich ueber nur drei Verbindungen, denn eine Bekannte von mir hat mal direkt mit dieser Dame zusammengearbeitet. Toll wa!

Die Studien zu diesem Phaenomen deuten zwar in die Richtung dass die Annahme vermutlich schon stimmt, sind aber im Wesentlichen auch nicht ganz eindeutig. Dies liegt daran, weil das schwer zu testen ist (denn solche Ketten muss man ja nachvollziehen). Oder es steckt viel Voreingenommenheit mit drin, weil bspw. Prominente haeufiger auf den sog. „sozialen Kanaelen“ zu finden sind als Leute wie ich.

Six Degrees of Kevin Bacon ist das gleiche Konzept wie die Erdős Nummer … das ist so gleich, dass man direkt sagen kønnte, dass es das Selbe ist (nur mit Kevin Bacon) … und daher kommt auch der Name dieser Miniserie (weil ich’s lustig finde).

Dieses Spiel kann man beliebig fortsetzen, bspw. mit der Erdős-Bacon Nummer oder noch eins drauf mit der Erdős-Bacon-Sabbath Nummer.

In eine allgemeinere Richtung geht Six Degrees of wikipedia.
Allgemeiner deswegen, weil es nicht nur schaut, wie Personen miteinander verknuepft sind, sonder wie im wesentlichen die gesamte Welt (streng genommen gar das gesamte uns bekannte Universum) miteinander verknuepft ist.
Zugegeben, das ist sehr zentriert auf die sog. „westliche Welt“, weil das nunmal der „Ort“ ist, in dem die Wikipedia geschrieben wird. Aber das tat dem keinen Abbruch, dass mich diese Idee faszinierte. Wie kommt man von Trondheim zu Kevin Bacon? (Via Monty Python geht’s zu Tom Hanks und dann direkt zu Kevin.)

Fuer so ein paar konkrete Fragen war dieses Spielzeug ganz nett. Aber ich wollte mehr wissen. Ich wollte wissen, wie alles mit allem anderen zusammenhaengt.
Mein Interesse wurde noch gesteigert, als ich nach mehreren Versuchen immer drei Verbindungen (in seltenen Faellen zwei oder vier) erhielt.

Die meisten Leute sind dann sicherlich den kuerzesten und laengsten Verbindung interessiert (bzw. nach den Wikipediaseiten die gar keine Verbindung haben) und begnuegen sich mit ein paar Beispielen.
Beispiele sind fuer mich aber nur sowas wie Anekdoten und ich fragte mich, wie wohl die Verteilung der Verbindungen ALLER Wikipediaseiten aussieht. Da dies im wesentlichen die (komplette) Statistik der Verlinkungen ist, beinhaltet das natuerlich die obigen zwei (drei) Faelle … ’s ist aber grøszer angelegt … so grosz, dass ich mir dachte: Jawoll! Ich schau mal ob ich das komplette (interne) Wikipedialinknetzwerk analysiert bekomme … als von _jeder_ Seite zu _jeder_anderen Seite.

Um eine Vorstellung von der Wahnwitzigkeit dieser Idee zu bekommen, møge man mal sechs Millionen mal sechs Millionen ausrechnen. Es gibt naemlich ca. 6 Millionen Wikipediaseiten und alles ist mit allem verbunden. Nur ich will halt nicht nur diese Zahl wissen, sondern das auch noch aufgeteilt auf die „Stufe der Verlinkung“, oder das „Linklevel“ wie ich’s nenne.

Und ueber diese „Reise“ handelt diese Miniserie. Weil ich’s so toll (und oft genug auch frustrierend) fand. Weil ich total viel gelernt habe (nicht nur durch das Lesen vieler, vieler Wikipediaseiten sondern auch durch das Programmieren der dafuer nøtigen Werkzeuge). Und weil ich total viel Freude an all den tollen Sachen hatte ueber die ich in der Wikipedia gestolpert bin.

Ich versuche an den Schritten die ich gehen musste (und die ich in den Artikel im groben nachvollziehen werde) ein bisschen deutlich zu machen, wie denn mein „Arbeitsalltag“ als sog. „Datascientist“ so aussieht. Was es bedeutet, (viele) Daten zu analysieren … denn die Analyse an sich steht meist erst ganz am Ende und macht nur ca. 20 % der eigentlichen Arbeit aus … auch wenn das dann das Einzige ist, was man rumzeigt.
Dadurch werden die kommenden Artikel aber zum Teil relativ technisch und die bunten Graphen gibt’s erst ganz am Ende. Ehrlich gesagt, waehrend ich dies schreibe sind die bunten Graphen noch in weiter Ferne, denn die Analyse des kompletten Linknetzwerks der wikipedia dauert mehrere Wochen (siehe die 36 Millionen Millionen Verbindungen die ich oben erwaehnte) … und das obwohl ich das gerade auf 4 Rechnern gleichzeitig rechnen lasse.

Ich bin schon wieder zurueck in Colonia. Auf dieser Tour seit meiner letzten Pause in bewohntem Gebiet gab es nicht viel zu berichten.

Abgesehen von dem ganz fantastischen Anblick von neulich und meiner ELW #100 war ein weiteres Highlight das Phroea Bli EG-Y g556 System. Hier gibt es naemlich sechs Neutronsterne:

Das ist zwar kein Rekord an sich (es gibt naemlich noch mindestens ein weiteres System mit so vielen Neutronensternen), aber ich wollte mal sehen wie so viel Neutronium auf einem Haufen aussieht.

Und dann, kurz bevor ich wieder in Colonia war, besuchte ich noch Hypoae Screia AA-A h466 7. Das ist der Icy body mit der høchsten Graviation. Knochenbrechende 166.84766442768066 g! Das ist fast sechs mal grøszer als die Gravitation an der Oberflaeche von Sol!
Erstmal sieht dieser Planet nicht so interessant aus, …

… aber es ist der einzige Gesteinsplanet den ich bisher gesehen habe, der einen Gasriesen als Mond hat (und nicht andersherum wie sonst ueblich) hat:

Wobei „Riese“ hier relativ ist, da ja der Rekordhalter an sich schon mit einem Radius von 21,140 km sehr grosz und der Gasplanetmond mit einem Radius von nur 23,420 km eher klein ist.

Ansonsten entdeckte ich auch noch Ammoniakwelt #165, ELW #101 und Ammoniakwelt #166 (um einen Neutronenstern, deswegen der blaue Farbton):

Wie gesagt, ich bin zurueck in Colonia. Ein Hauptgrund ist, dass Operation YELLOW ORB abgeschlossen ist! Wie man auf dieser Karte sehen kann …

Quelle, Lizenz: unbekannt. Die galaktische (Hintergrund) Karte wurde angefertigt von CMDR Finwen und CMDR Corbin Moran, kuenstlerische Beschriftung der Regionen und Platzierung der Koordinatengitter durch CMDR Corbin Moran mit Namen vom Galactic Mapping Project. Punkte von Interesse wurden von mir hinzu gefuegt. Ebenso ist die hier zu sehende Karte aus technischen Gruenden von mir verkleinert worden. Das Original (ohne meine Hinzufuegungen und in korrekter Grøsze) kann unter dem angegebenen Quellen-Link gefunden werden.

… (oder vielmehr nicht sehen kann) sind keine gelbe Punkte mehr uebrig. Das bedeutet, dass ich alle Sterne die einen (einzigartigen) Rekord in einer sie beschreibenden Charakteristik und ein rot-gelbliche Farbe haben, besucht habe.

Nun ueberlege ich alle blau-weiszen Sterne (mit Rekorden) zu besuchen. Aber darueber muss ich erstmal noch ein bisschen nachdenken. Zur Zeit bleibe ich erstmal in Colonia und versuche mich mit allen hier anwesenden Fraktionen zu verbuenden. Sind nur so ca. 100. Das sollte nicht mehr als ein paar Wochen dauern.

Noch ’ne neue Serie bei der der Titel alles sagt.

Ich fange an mit dem Schreiben von Gags. Man kønnte das auch mehr oder weniger lustige Wortspiele, Einzeiler oder Bonmots nennen.
Die Lustigkeit (mal mehr, mal weniger) derselben beruht auf dem Unerwarteten durch Verknuepfung verschiedener Themen die so eigentlich nicht zusammen gehøren. Dazu kommt dann (sehr sehr) oft, dass noch ein anstøsziger Zusammenhang durch besagte Verknuepfung hergestellt wird. Ich sag nur Witze ueber Sex, Frauen, Minderheiten oder Sachen die man so nicht sagt und auch nicht zu sagen hat.

Dadurch dass sog. „kuenstliche Intelligenz“ aber darauf basiert dass Muster in Daten gefunden werden, ist’s gar nicht so weit hergeholt zu denken, dass „kuenstliche Intelligenz“ keine Witze schreiben kann. Denn Muster bestehen nur zwischen (mehr oder weniger) gut zusammenpassende Themen. Also das Gegenteil dessen was ich oben schrieb.

Und dann stolperte ich ueber einen Artikel von T. Winters et al. in Proceedings of the 10th International Conference on Computational Creativity, 2019, p. 274–281, mit dem Titel „Towards a General Framework for Humor Generation from Rated Examples“.
Dazu gibt es auch Code (gut gewaehltes Akronym … tihihihi) und Ergebnisse. Die computergenerierten Gags sind jetzt zwar nicht so super lustig, Einzeiler sollen das aber auch nicht sein und das ist in den Trainingsdaten nicht anders.

Die meisten Gags sind (wie erwartet) anstøszig auf eine Art und Weise, die ich hier nicht wiederholen møchte. Das sagt natuerlich mehr ueber die von Menschen gemachten Trainngsdaten als ueber den Algorithmus aus. Aber vier Beispiele der Art < X > + < Y > => < lustige Bemerkung > waeren diese:

men + turkey => roast
people + back => hurt
coffee + buildings => empty
sex + emotions => basic

Fuer ’n Siliziumwesen ohne menschliche Erfahrung und nur ’n bisschen Trainingsdaten ist das gar nicht mal so schlecht, wa!