Eine weitere „ancient probe“ im Ursprungssystem ist diese hier:

Ich flog ganz nahe ran und entdeckte, dass diese sogar eine Namensplatte hat. Leider ist die beschaedigt …

… und ich konnte nur „V…ger“ ausmachen. Unter diesem Namen finde ich im Informationsnetzwerk einen Zusammenfassung dieses Ereignis vor ein bisschen mehr als 1000 Jahren. Seltsam, ich dachte, dass da nix zurueckgeblieben waere. Wieauchimmer, ich lass V…ger hinter mir und fliege zum letzten Signal welches als „ancient probe“ im Scanner erscheint.

Im ersten Artikel zu den Zitierungen gab ich nur wørtlich (bzw. als Zahlen im Diagramm) an, wieviele (oder vielmehr wie wenige) Seiten so und so viel Prozent der Zitierungen ausmachen. Ungefaehr nur ein Drittel aller Seiten vereinen ueber 90 Prozent aller Zitierungen auf sich.

Fuer die Anzahl der Links sieht das aehnlich aus, diesmal aber als Diagramm (zur besseren Orientierung habe ich im Hintergrund die doppeltlogarithmische Verteilung vom letzten Mal herein gepackt, die hat aber keine zugehørige Ordinate!):

.oO(endlich mal keine Verteilung.)

Wie ist dieses Diagramm zu lesen?
Die Kurven stellen jeweils den aufaddierten Anteil aller Seiten (rote Kurve), bzw. aller Links, bis zum gegebenen Argument dar. Als Beispiel nehme man die zweifarbigen Punkte, welche bei jeweils 50 % verortet sind.
Der rot/gruene Punkt liegt bei 14 Links pro Seite und die Haelfte alle Seiten hat so viele oder weniger Links. Folgt man diesem Punkt nach unten, landet man bei ca. 15 % auf der blauen Kurve. Dies bedeutet also, dass 50 % aller Seiten, nur ca. 15 % aller Links auf sich vereinen.
Nun der gruen/lila Punkt. Dieser liegt bei 51 Links pro Seite. Man muss also alle Seiten mit 51 Links oder weniger zusammen nehmen um 50 % aller Links auf der Wikipedia (zu anderen Wikipediaseiten) zu bekommen. Dafuer muss ich aber fast 90 % aller Wikipediaseiten besuchen (lila Punkt auf der roten Kurve).

Umgekehrt bedeutet dies, dass nur ca. 10 % aller Seiten die Haelfte aller Links enthalten! Wiederum werden die Zahlen also von wenigen Seiten dominiert.

Dies hingegen macht eine einfache Abschaetzung der benøtigten Schritte fuer eine „Rundreise“ auf dem kompletten Linknetzwerk fuer mich nicht møglich. Ich schreibe „fuer mich“, weil es bestimmt mathematische Werkzeuge gibt, mit denen man das unter den gegebenen Umstaenden machen kann, aber die sind mir nicht bekannt.
Aus den vielen Seiten mit wenigen Links wuerde ich vermuten, dass man relativ viele Schritte per Rundreise braucht. Wenn man aber nur ein paar wenige Seiten mit vielen schon anfangs erreicht, dann sollte man nur wenige Schritte brauchen. Das hier sind also entgegengesetzte „Prozesse“.

Es sei denn, wenn die Ersteren vor allem sich selber und die Letzteren auch vor allem sich selber zitieren. Wenn also diese zwei Gruppen „unter sich bleiben“.
Aha! … Da muss ich doch glatt mal schauen ob ich da was rausfinden kann.

Deswegen genug fuer heute.

Ach so … Was fuer Seiten das sind, die extrem viele Links enthalten, hatte ich bereits hier besprochen. Und Seiten die keine Links haben werden (wie hier erwaehnt) in meinen Betrachtungen nicht rausgeschmissen wenn diese noch auf anderen Seiten zitiert sind. Drei Beispiele waeren Clematis marmoraria (natuerlicherweise zitiert auf Clematis), Serbian proverbs (zitiert auf Culture of Serbia), oder Third-party software component (zitiert auf Easy Chirp, Shareaza, Foobar2000 und 83 anderen Seiten).

Ich war mal wieder im Ursprungssystem. Eigentlich dachte ich ja, dass ich hier schon alles gesehen haette. Aber dann tauchten im Scanner pløtzlich drei Signale auf. Diese waren mit „ancient probe“ (und nix weiter) bezeichnet.

Cool! Ich kønnte schwøren, dass die bei meinem letzten Besuch noch nicht hier waren, aber da war mir auch nicht langweilig (weswegen ich das System beim letzten Mal nicht scannte).

Ich befand mich nahe des Ursprungsplaneten und besagte Objekte waren ganz schon weit weg von mir. Ich flog dennoch hin und das hier fand ich beim ersten Stop:

Nanu? Was war das denn? Gaaaanz tief unten im Keller des galaxisweiten Informationsnetzes fand ich heraus, dass es sich hierbei um eine mehr als tausend Jahre alte Forschungssonde handelt. Schon krass, mit was fuer kuemmerlichen Geraeten die Wissenschaftler damals Wissen schafften.

Von grøsztem Interesse bzgl. des Linknetzwerks ist die (durchschnittliche) Anzahl der Links pro Seite. Je grøszer diese Zahl ist, desto weniger Schritte brauche ich im Schnitt um das komplette Netzwerk „abzuschreiten“.

Deswegen schaute ich mir genau das mal an und die Verteilung …

… ueberraschte mich.

In der doppeltlogarithmischen Darstellung auf der rechten Seite sieht man (wieder), dass das Verhalten (wieder) ueber einen weiten Bereich mittels eines Potenzgesetzes beschrieben werden kann. Ich wuesste zwar immer noch keinen Mechanismus warum das so sein muesste, aber das ist ja von den Zitierungen bekannt.
Bei genauerer Betrachtung sieht man, dass die Anzahl der Seiten in Abhaengigkeit von der Anzahl der Links im Bereich zwischen ca. 100 und 500 Links etwas von der Geraden abweicht. Phaenomenologisch ist das in dem hiesigen Zusammenhang nicht relevant. Ich bin nur an einer Abschaetzung interessiert. Aber so eine kleine Diskrepanz ist auch, wie das Higgs-Boson entdeckt wurde (siehe Abbildung 1 in diesem Artikel).
Und Phaenomenologie … mhmmm … das kann manchmal auch eine der Intention komplett entgegengesetzte Reaktion zur Folge haben … tihihihi

Das unerwartete ist aber im linken Diagramm zu sehen. Wie bei allen vorherigen Verteilungen haette ich ein deutlich ausgepraegtes Maximum bei einem Wert erwartet. Aber das Maximum bei 8 Links „verschmiert“ sich zu 6 und 7 und 9 Links. Auch die Zaehlungen bei 4 und 5 bzw. 10 und 11 Links sind nur ca. zehn Prozent geringer als der Maximalwert … und 10 % Unterschied wuerde ich normalerweise in den bereits øfter erwaehnten Fehler-bei-Daten-aus-der-echten-Welt einordnen (zumindest wenn kein Trend zu erkennen ist) … ich wuerde das „Maximum“ also eher als Plateau von 5 bis 11 Links sehen.
Bei den Untersuchungen zu den Zitierungen stellte ich fest, dass extrem viele Artikel sehr selten zitiert werden. Ich gab ein paar Beispiele und dabei handenlte es sich um sehr oder relativ kurze Artikel. Da ich die mehr (mehr oder weniger) zufaellig auswaehlte, kann man das durchaus als repraesentativ ansehen. In einem kurzen Artikel gibt es natuerlich auch nicht so viele Gelegenheiten was anderes zu zitieren. Aus der Menge der (wenig zitierten) kurzen Artikel erklaert sich dann auch die grosze Anzahl der Artikel die 5 bis 11 Links haben.

Und dann kommt ganz unerwartet nochmal ein signifikanter „Ausschlag“ bei 12 Links! What the what? Das sieht aus als ob das so ’ne unbewusste, kollektive, psychologische Grenze ist: .oO(Ach jetzt habe ich 11 Links, einer geht noch) … ein kurioses Phaenomen.

Genug fuer heute.

Spike

… ist einer von Snoopies Geschwistern und er wohnt in der Wueste in einer Wohngemeinschaft mit einm Saguarokaktus.

Spike war mir immer sympathisch. Er ist ein bisschen weltfremd, aber meist zufrieden mit seinem Leben fernab der Krach machenden Zivilisation.

Am Anfang ist mir das gar nicht so aufgefallen, aber Snoopies Geschwister interagieren fast nie mit den restlichen Charakteren.

Es wuerde mich nicht wundern, wenn das bei mir unterbewusst auch dazu beitraegt, dass ich Geschichten rund um die hochantropomorphisierten Hunde immer mit am besten fand :)

Der zweite Band (hier der Schuber) …

… kam ein Jahr nach dem ersten Band heraus. Mittlerweile ist fast noch ein Jahr vergangen und ich freue mich total auf den dritten Band.

Alan Moore war der Schreiber hinter den in diesen Baenden gesammelten Geschichten. Er hat aber auch Ideen von seinen Mit-Kuenstlern angenommen und ausgearbeitet. Diese waren derer eine ganze Menge ueber die Jahre, aber heute von Interesse ist Stephen R. Bissette, der Penciller besagter sumpfiger Kunstwerke.

Als Autor von Comics schreibt man nicht nur die Geschichte „runter“, sondern man muss sich auch ueberlegen, wie eine Bildkomposition aussehen soll, wie die Panels angeordnet sein sollen, ob die Grenze eines Panels durchbrochen werden soll usw. usf. All dies traegt dazu bei, dass Comics ein viel dynamischeres Medium sein kønnen, als Buecher (und somit „naeher“ an Filmen).
Aber die Umsetzung all dieser Dynamik haengt massiv an den mitschaffenden Kuenstlern neben dem Autor. Und hier ist die Verbindung zu Stephen R. Bissette. Denn das tolle an diesen Swamp Thing Ausgaben ist, dass Alan Moore das nicht nur geschrieben hat, sondern er hat das geschrieben mit den speziellen Talenten der Anderen im Hinterkopf.

Im Nachwort zum ersten Band beschreibt Stephen R. Bissette die Arbeit an Swamp Thing als einen „Tanz“ in dem die teilnehmenden Taenzer (der dritte wird beim naechsten Mal wichtig) aufgingen, weil es fuer sie so natuerlich war diese Kunstwerke jeden Monat zu erschaffen.

Und das sieht und fuehlt man! Man kønnte einzelne Panele oder ganze Seiten dieser Swamp Thing Ausgaben nehmen und ohne Weiteres ins Museum haengen. Und dank der Sammelbaende kann nun auch ich an dieser Kunst teilhaben :)

Ich erwaehnte bereits, dass meine Flottentraeger eine Besatzung braucht um den zu bedienen. Diese Kosten belaufen sich ueber mehrere Monate auf hunderte Millionen Credits. Deswegen, und weil ich trotz angestrengtem Nachdenkens einfach keinen guten Grund fand dieses Spielzeug zu behalten, habe ich mich entschlossen meinen Flottentraeger wieder zu verkaufen. Ich bekomme zwar das meiste Geld zurueck (der war ja noch ganz neu!), aber dieses kurze „Abenteuer“ hat mich ungefaehr 150 Millionen Credits gekostet. Bei einem Kontostand von 5 Milliarden Credits ist das zu verkraften.

Hier nochmal eine letzte Landung …

… und dann war’s das mit mir im Flottentraegerbusiness.

Einen Flottentraeger steuere ich nicht selbst, sondern das macht meine Flottentraegerbesatzung fuer mich. Ja, die muss auch bezahlt werden und das kostet ganz schon was ueber laengere Zeitraeume.
Besagter Besatzung sage ich, wo ich den Flottentraeger haben will, selbst wenn ich nicht an Bord bin. Und dann passiert was relativ Spektakulaeres.

Aufgrund der immensen Grøsze und Masse funktioniert der Sprungantrieb eines Flottentraegers ganz anders als der Sprungantrieb kleinerer Schiffe. Zunaechst einmal braucht dieser 15 Minuten um aufgeladen zu werden. Und dann wird ein Riss in der Raumzeit erzeugt:

Fuer uns menschliche Beobachter sieht der Riss wie eine dunkle Wolke aus. Ich habe keine Ahnung warum dem so ist. Als Analogon kønnte man aber mglw. Schaum in einem Wasserglas benutzen. Der entsteht, wenn man das Wasser heftig ruehrt. Und seeehr viel „Schaum“ hat ja visuelle (!) Aehnlichkeit mit einer Wolke. Wenn nun der Sprungantrieb den, dem Universum zugrunde liegenden, Quantenschaum bis ueber die Belastungsgrenze „schuettelt“ und „ruettelt“, dann wundert’s mich nicht, dass das fuer uns als „Wolke“ sichtbar wird.

In diese bedrohlich wirkende Wolke fliegt der Flottentraeger hinein …

… und kommt dann wenige Momente spaeter, bis zu 500 Lichtjahre entfernt wieder heraus, in den uns wohlbekannten Normalraum.

So „einfach“ kann’s manchmal sein.

Die Masse eines Flottentraegers ist gewaltig. Entsprechend grosz muessen die Triebwerke sein. Die dicke Røhre hier drueckt durchaus aus, was alles fuer nur EINEN der sieben Antriebe benøtigt wird:

Zum Grøszenvergleich kønnen die Frachtcontainer herangezogen werden. Dadurch, dass es im Weltraum nicht regnet, kann man alles was keine Atmosphaere braucht auszerhalb der schuetzenden Huelle des Flottentraegers transportieren. Schon praktisch.

Das obligatorische Bild besagter Motoren darf natuerlich nicht fehlen:

*Schmacht* … was fuer eine Schønheit :)

Beim vorletzten Mal stellte ich nicht die Gruppe von Artikeln mit den wenigsten Zitierungen, weniger als zehn, vor. Das sei hiermit nachgeholt:

Diesmal ist die Ordinate linear, und man sieht, warum ich beim vorletzten Mal die logarithmische Darstellung waehlte. Die dort diskutierten Gruppen wuerden bei einer linearen Ordinate nur als ganz flache Balken, und damit wenig relevant erscheinen. Warum der subjektive Eindruck falsch ist, wurde beim letzten Mal ausgiebig diskutiert.

Wieauchimmer, in diesem Diagramm zeigt sich, dass die weitaus meisten Seiten entweder gar nicht, oder høchstens zwei Mal zitiert werden. Das hørt sich fuer mich sehr danach an, dass da jemand ueber „lokale Themen“ geschrieben und die untereinander zitiert hat (oder auch nicht). Das kann man aber nur bedingt oft machen. In Zahlen: 64.4 % aller Wikipediaseiten vereinen nur 7.6 % aller Zitierungen auf sich.

Die Frage ist dann, was das fuer Seiten sind. Aber dadurch, dass die nicht (oft) zitiert werden, gelangt man dort nicht durch Zufall hin. Und weil man davon keine Ahnung hat, sucht man die auch nicht direkt auf. Deswegen ein paar Beispiele.

Die 2014 Sark general election wird nur 2 mal zitiert. Aber nachdem ich das gefunden hatte, bin ich einigen der dortigen Links gefolgt und nun møchte ich die Gegend mal voll gerne besuchen. Das spricht doch total fuer die Relevanz dieser Seite, nicht wahr.
Das Dørflein Zaprężyn wird nur ein Mal zitiert … auch hier habe ich jetzt Lust da mal hinzufahren.
Ein anderes Dorf, Mirikənd wird ebenso nur ein Mal zitiert … øhm … dito … aber ich denke nicht, dass das mal was wird … auszerdem lernte ich dabei, dass Aserbaidschan eine Exklave hat.
Die Motte Eucrostis pruinosata wird ueberhaupt nicht zitiert und …
… das gleiche Schicksal ereilt Miss Lithuania 2008: Gabrielė Martirosian … die arme Dame.

Das Beispiel mit der Motte ist uebrigens eine gute Veranschaulichung eines fundamentalen Problems unserer Zeit. Die Menschheit weisz total viel, aber ein einzelner Mensch kann das gar nicht alles speichern. Es gibt so urst krass viel Wissen, welches in den Lagern (und Kellern) von Bibliotheken und Museen liegt. Deswegen gibt es auch sehr oft neue Entdeckungen aufgrund von Zeug was wir (als Menschheit) seit 100 Jahren oder laenger haben, was aber seitdem in besagten Kellern liegt. Manchmal gibt es dann eine (oft pensionierte) Person, welche die weltweite Authoritaet bzgl. bspw. einer bestimmten (praehistorischen) Spezies von Familie der Mollusken ist. Und wenn diese Person stirbt, geht all dieses Wissen verloren. Im Grunde genommen selbst dann, wenn das aufgeschrieben wurde, weil man Erfahrung (und die Zusammenhaengen zwischen verschiedenen Dingen) nicht wirklich (effektiv) kodifizeren kann.

Und das ist ueberhaupt eines der grøszten Probleme der Menschheit (und war es schon immer). Jeder Mensch muss alles selbststaendig und alleine lernen. Anders als im Film Matrix kann man Wissen leider nicht schnell in unsere Køpfe uebertragen. Was Sabine lernt kann Peter noch lange nicht.
Aber Computer kønnen das. Und wenn es mal richtige kuenstliche Intelligenzen gibt, dann kønnen die das mglw. auch. Oder anders (und viel konkreter): wenn ein selbstfahrendes Auto lernt, wie man im Berliner Stadtverkehr andere autofahrende Idioten erkennt, dann kønnen alle anderen selbstfahrenden Autos das ueber Nacht herunter laden und die wissen das dann einen Tag spaeter auch.

Andererseits bedeutet das aber auch das Folgende: sollten wir dieses Problem jemals geløst bekommen, dann wird die Post aber mal voll abgehen fuer die Menschheit! Der Fortschritt seit der Renaissance oder der industriellen Revolution wird dagegen aussehen wie’n Glass Wasser im Ozean.
Und ich halte das durchaus fuer durchfuehrbar. Denn ein anderes Menschheitsproblem ist in unserer Zeit (im Wesentlichen, wenn auch noch nicht ueberall im Praktischen) geløst worden: die Verteilung von Wissen. Wenn man was obskures wissen wollte, dann war das frueher alles ziemlich umstaendlich. Klar, gab (und gibt) es Bibliotheksverbuende, welche auch Buecher von einem Land ins andere schicken. Sicherlich kann man viel in Fachbuechern nachlesen. Aber hat man das auch gemacht? Sind diese Møglichkeiten des Informationstransfers auch massenhaft (vulgo: von der gesamten Menschheit) in Anspruch genommen worden? Oder war es doch eher so, dass nur ein paar hunderttausend (oder lass es auch ein paar Millionen sein) Menschen, welche (mehr oder weniger) zur (Wissens)Elite gehør(t)en, diesen Informationstranfermechanismen auch benutzten? Hier bestand also prinzipiell ebenso die Møglichkeit des Informationstransfers, aber praktisch war das massenhaft (sowohl von der Menge der Information, als auch von der Menge der Rezipienten) nicht zu gebrauchen.
Aber dieses Problem hat das Internet geløst. Und selbst Zensur, oder dass da laengst nicht alles obskure Zeit zu finden ist, aendert nichts an der Tatsache, dass der Informationsfluss tatsaechlich ein Fluss wurde in den letzten 20 Jahren und kein trøpfelndes Rinnsal ist wie vorher. Voll krass wa! Wir leben in ’ner voll geilen Zukunft!!!

Und da macht das dann auch nix, dass das nur einmal zitiert wird. Und es macht auch nix, wenn man die Erfahrung der oben erwaehnten Molluskexpertin nicht kodifizieren kann. Solange es auffindbar ist im Informationstransfernetzwerk, kann sich wer anders besagtes Wissen wieder relativ schnell aneignen … neue Erfahrung kann auf den Dokumenten alter Erfahrung aufbauen und dort fortsetzen (selbst wenn Letztere fuer immer verloren ist) … und das ist Fortschritt … *freu*.

Das war’s jetzt erstmal mit den Sachen, die ich aus den Titeln der Wikipediaseiten (und was damit zusammenhaengt) herausziehen kann. Beim naechsten Mal behandle ich dann noch die Anzahl der Links pro Wikipediaseite … Hurra! Noch eine neue Verteilung auf die ihr, meine lieben Leserinnen und Leser, euch bereits jetzt freuen kønnt :).