{"id":11119,"date":"2021-11-23T13:37:02","date_gmt":"2021-11-23T11:37:02","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=11119"},"modified":"2021-05-21T13:59:11","modified_gmt":"2021-05-21T11:59:11","slug":"kevin-bacon-xi-messbare-relevanz-b","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2021\/11\/kevin-bacon-xi-messbare-relevanz-b\/","title":{"rendered":"Kevin Bacon \u2013 XI \u2013 Messbare Relevanz (b)"},"content":{"rendered":"<p>Kurze Wiederholung, weil es etwas komplizierter ist: <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=11105\" target=\"_blank\" rel=\"noopener\">beim letzten Mal<\/a> stellte ich vor, dass sich die Relevanz von Wikipediaartikeln im Wesentlichen dadurch ausdruecken laeszt, indem man zaehlt wie oft ein Artikel zitiert wird. Der Einfachheit halber nenne ich hier Wikipeidaseiten mit kleinen Relevanzwerten &#8222;irrelevant&#8220; (mit Anfuehrungszeichen). Das bedeutet nicht, dass die irrelevant (ohne Anfuehrungszeichen) sind.<br \/>\nDesweiteren stellte ich fest, dass die Wikipediartikel an den beiden Enden der Relevanzskala (die Artikel mit den kleinsten bzw. gr\u00f8szten Relevanzwerten) vor allem von &#8222;irrelevanten&#8220; Seiten zitiert werden. Daraus folgte, dass zumindest fuer die zwei meistzitierten Artikel die Relevanz nur deswegen zustande kommt, weil es die &#8222;irrelevanten&#8220; Seiten gibt.<br \/>\nDas waren aber nur vier Beispiele und ich setzte mich mal hin und schaute mir das fuer _alle_ Wikipediaseiten an. Dies hier ist das Ergebnis:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/18_Relevanz_total__.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11163 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/18_Relevanz_total__-800x310.png\" alt=\"\" width=\"800\" height=\"310\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/18_Relevanz_total__-800x310.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/18_Relevanz_total__-1024x397.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/18_Relevanz_total__-768x298.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/18_Relevanz_total__-1536x595.png 1536w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/18_Relevanz_total__.png 1719w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>Wenn das Bild geklickt wird, dann wird das gr\u00f8szer.<\/p>\n<p>Was sieht man hier eigentlich? Die Abszisse repraesentiert den oben erwaehnter Relevanzwert einer Seite. Bis 2075 Zitierungen entspricht das der Anzahl der Zitierungen die eine Seite erhalten hat. Danach weichen die Relevanzwerte von der Anzahl der Zitierungen ab. Der Grund ist, dass die Werte der Abszisse das Resultat einer Abbildung einer Gr\u00f8sze mit ungleicher &#8222;Schrittweite&#8220; (Anzahl der Zitierungen) auf eine Gr\u00f8sze mit konstanter &#8222;Schrittweite&#8220; (Relevanzwert) ist. Ein kurzes Beispiel: es gibt keine Seite die 2076 mal zitiert wurde aber 2 Seiten die 2077 mal zitiert wurden. Der Relevanzwert zaehlt also &#8222;OHNE Luecken&#8220;.<br \/>\nVon der Bedeutung aendert sich aber nichts: je mehr Zitierungen eine Seite hat, desto relevanter ist diese (wohl) und entsprechend gr\u00f8szer ist der Relevanzwert.<\/p>\n<p>Die Ordinate repraesentiert im Wesentlichen die gleiche Gr\u00f8sze, aber fuer die zitierende Seite.<\/p>\n<p>Der Farbwert entspricht nun wie oft Seiten gefunden wurden, die einen bestimmten Relevanzwert haben und von einer (anderen) Seite mit einem (anderen) bestimmten Relevanzwert zitiert wurde.<br \/>\nWenn also Seite A drei mal zitiert wurde von drei anderen Seiten die selber drei, elf und siebzehn mal zitiert wurden, dann zaehlt der Wert bei den &#8222;Koordinaten&#8220; (3, 3), (3, 11) und (3, 17) ein mal hoch.<br \/>\nWenn nun Seite B auch drei mal zitiert wurde, von Seiten die drei, sechs und sieben mal zitiert wurde, zaehlen die Werte bei den entsprechen &#8222;Koordinaten&#8220; eins hoch. Der Wert bei (3, 3) ist nun zwei.<br \/>\nDiese Zaehlung habe ich nun fuer alle Wikipediaseiten gemacht und tritt fuer eine &#8222;Koordinate&#8220; kein &#8222;Ereigniss&#8220; auf, so bleibt das &#8222;Pixel&#8220; fuer diese Koordinate schwarz.<\/p>\n<p>Achtung: das obige Bild ist eine quadratische Matrix! Aufgrund gegebener Limitierungen in der Praesentation habe ich mich aber entschieden die Abszisse &#8222;laenger&#8220; zu machen als die Ordinate.<br \/>\nNochmal Achtung: Das ist zwar eine quadratische, aber keine <a href=\"https:\/\/de.wikipedia.org\/wiki\/Symmetrische_Matrix\" target=\"_blank\" rel=\"noopener\">symmetrische Matrix<\/a>! Auch wenn auf den Achsen beide Male Relevanzwerte dargestellt sind, so ist die Bedeutung geringfuegig anders (wie oben beschrieben).<\/p>\n<p>Wir sehen im Bild nun, dass das ueberwiegend schwarz ist. Bei den meisten Koordinaten zaehlt also nix hoch, weil es keine Seiten mit dem jeweiligen Relevanzwert gibt, die zitiert werden von Seiten mit dem (anderen) jeweiligen Relevanzwert. Schaut man genau hin, ist da &#8222;Rauschen&#8220; drin. Ich komme da spaeter drauf zurueck.<\/p>\n<p>Desweiteren sieht man, dass sich alles an der linken und unteren Kante abspielt &#8212; der blaue &#8222;Saum&#8220;. Das ist wichtig, denn dies ist eine Bestaetigung der beim letzten Mal getroffenen Aussage. Egal wie wichtig eine Seite ist (Wert auf der Abszisse), diese erhaelt ihre Wichtigkeit vor allem dadurch, weil sie von &#8222;irrelevanten&#8220; Seiten zitiert wird (Wert auf der Ordinate). Das ist das blaue Band am unteren Rand.<\/p>\n<p>Das blaue Band am linken Rand besagt nun, egal wie wichtig eine Seite (Ordinate) ist, diese zitiert vor allem &#8222;irrelevante&#8220; Seiten (Abszisse). Und das ist krass!<br \/>\nWarum ist das krass? Nun ja, die erste Aussage (Wichtigkeit nur durch die Zitierung von &#8222;irrelevanten&#8220; Seiten) ist ja eindeutig. Aber das Ganze geht noch weiter! Denn die zweite Aussage bedeutet, dass selbst die relevantesten Seiten ueber irrelevante Sachen schreiben (weil man ja zitieren muss worueber man schreibt).<br \/>\nUnd DAS bedeutet dann nicht nur, dass relvante Seiten nur durch die Zitierungen irrelvanter Seiten relevant werden, sondern dass es relevante Seiten gar nicht geben wuerde, wenn diese nicht ueber &#8222;irrelevante&#8220; Seiten schreiben k\u00f8nnten!<\/p>\n<p>DAS ist so krass, denn dies setzt der Relevanzdiskussion ein Ende und die Inkludisten sind die eindeutigen Gewinner!<\/p>\n<p>Das ist das Resultat. Nun ist&#8217;s aber nicht ganz so einfach \u2026 und warum geht die Farbskala eigentlich bis ueber 120-tausend Ereignisse, wenn im Bild entweder alles schwarz oder blau (ein paar tausend Ereignisse) ist?<br \/>\nNun ja, deswegen ist da ein Pfeil im Bild.<\/p>\n<p>Ich zoome mal rein:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/19_Relevanz_total_100_.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11166 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/19_Relevanz_total_100_-800x318.png\" alt=\"\" width=\"800\" height=\"318\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/19_Relevanz_total_100_-800x318.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/19_Relevanz_total_100_-1024x408.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/19_Relevanz_total_100_-768x306.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/19_Relevanz_total_100_-1536x611.png 1536w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/19_Relevanz_total_100_.png 1691w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>AHA! Da wird&#8217;s rot. Im Bereich bis zu Relvanzwerten von 100 passiert alles \u2026 bzw. nix, denn der schwarze Balken bei einer Relevanz von Null liegt natuerlich daran, dass diese Seiten null mal zitiert werden \u2026 aber ich schwoff ab.<br \/>\nKoordinaten fuer Seiten die ein bis zehn mal zitiert werden, von Seiten die selber null bis zwei Zitierungen haben sind im gelb\/roten Bereich. Das sind also 10 mal 3 mal 100-tausend &#8222;Ereignisse&#8220; die sich dort &#8222;versammeln&#8220;. Diese Gruppe ist umgeben von einem deutlich breiteren, gruenen &#8222;Halo&#8220; welche Ereignisse mit Zaehlungen bis ca. 60-tausend beinhaltet.<br \/>\nDie Vielzahl der &#8222;irrelevanten&#8220; Seiten die sich selber zitieren fuehrt zu so krass vielen Zitierungen (Ereignissen), dass das was in diesem Bereich angehaeuft ist vom absoluten Wert alles andere in den (blauen) Schatten stellt. Und weil die &#8222;Ausdehnung&#8220; dieser Gruppe so klein ist, sieht man das im ersten Bild nicht.<\/p>\n<p>Das ist jetzt natuerlich ein Problem in Bezug auf die obigen Aussagen. Die schiere Menge an Zitaten von (und an) &#8222;irrelevante(n)&#8220; Seiten erdrueckt das Signal der Seiten mit gr\u00f8szeren Relevanzwerten.<\/p>\n<p>Aber zum Glueck ist dies mit einer simplen mathematischen Transformation sehr leicht in Betracht zu ziehen: jede Spalte muss normiert werden.<br \/>\nDas h\u00f8rt sich jetzt fancy-pancy an, was das bedeutet ist aber, dass alle Werte in einer Spalte durch den gr\u00f8szten Wert dieser Spalte geteilt werden. Besagter gr\u00f8szter Wert wird dann natuerlich zu 1. Das Gute ist nun, dass ALLE gr\u00f8szten Werte ALLER Spalten den Wert 1 haben. Dadurch wird das &#8222;Gewicht&#8220; von der Farbskala genommen und Spalten mit groszen Relevanzwerten k\u00f8nnen mit Spalten mit kleinen Relevanzwerten verglichen werden. Dabei ist natuerlich immer im Hinterkopf zu behalten, dass dies relative Vergleiche sind, im Gegensatz zum Vergleich der absoluten Werte in den obigen beiden Bildern.<br \/>\nUnd so sieht das dann aus:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/20_Relevanz_column_norm_all__.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11167 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/20_Relevanz_column_norm_all__-800x315.png\" alt=\"\" width=\"800\" height=\"315\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/20_Relevanz_column_norm_all__-800x315.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/20_Relevanz_column_norm_all__-1024x403.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/20_Relevanz_column_norm_all__-768x302.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/20_Relevanz_column_norm_all__-1536x604.png 1536w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/20_Relevanz_column_norm_all__.png 1711w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>Haeh? What? Das ist doch das Gleiche! \u2026 Nun ja, nicht, wenn man ganz genau auf den unteren Rand schaut (ACHTUNG: die Ordinate geht nur noch bis 200 &#8222;Ereignisse&#8220;):<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/21_Relevanz_column_norm_200_.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11168 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/21_Relevanz_column_norm_200_-800x317.png\" alt=\"\" width=\"800\" height=\"317\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/21_Relevanz_column_norm_200_-800x317.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/21_Relevanz_column_norm_200_-1024x406.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/21_Relevanz_column_norm_200_-768x305.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/21_Relevanz_column_norm_200_-1536x609.png 1536w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/21_Relevanz_column_norm_200_.png 1697w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>AHA! Das sieht doch schon ganz anders aus. Durch die Normierung wird (wie vorgesehen) der erdrueckende Anteil der Ereignisse bei kleinen Relevanzwerten irrelevant (tihihi). Das Resultat ist nun das rot gruene Band am unteren Rand. Dieses haelt die obige (erste) Aussage aufrecht: fuer ALLE Seiten, v\u00f8llig unabhaengig davon wie grosz (oder klein) die absolute Anzahl der Zitierungen ist, gilt, dass diese hauptsaechlich von &#8222;irrelevanten&#8220; Seiten zitiert werden.<br \/>\nDas ist zwar das Selbe wie oben schon erkannt, aber es ist gut, dass diese Kontrolle nicht zu einem anderen Ergebis gefuehrt hat.<\/p>\n<p>Aufmerksamkeit m\u00f8chte ich richten auf die Tatsache, dass ein mal zitierte Seiten (Relevanzwert = 1, auf der Abszisse)\u00a0 interessanterweise weniger haeufig andere Seiten zitieren als null mal bzw. drei mal zitierte Seiten. Dies drueckt sich in dem duennen gruenen Streifen parallel zur Abszisse aus, der eingequetscht ist zwischen den roten Streifen bei Relevanzwerten (der zitierenden Seiten, also auf der Ordinate) von null bzw. zwei.<br \/>\nMan sieht das auch bereits in den nicht normierten Daten im obigen Bild. Dort sieht man dann auch einen Grund: der Wert bei der Koordinate (1, 1) hebt sich deutlich hervor im Vergleich zu den Werten bei (1, 0) bzw. (1, 2).<br \/>\nDies wiederum deutet darauf hin, dass meine Erklaerung des &#8222;im Kreis zitieren&#8220; vom letzten Mal \u2026<\/p>\n<blockquote><p>[s]ozusagen wenn Hintertupfingen Vordertupfingen zitiert, weil\u2019s das Nachbardorf ist (und umgekehrt), aber beide von keiner anderen Seite zitiert werden<\/p><\/blockquote>\n<p>\u2026 schon in die richtige Richtung geht fuer viele dieser Seiten. Denn wenn die ihr eines Zitat fuer die &#8222;Nachbardorfseite&#8220; verbrauchen und umgekehrt, dann fehlt das &#8222;Signal&#8220; natuerlich an anderer Stelle.<\/p>\n<p>Dies wiederum waere dann aber auch ein Hinweis auf (mehr oder weniger) tataechliche Nichtrelevanz, da diese Seiten dann ja in keinem Diskurs teilnehmen, sondern nur eine Nabelschau sind. Ich pers\u00f8nlich wuerde die aber trotzdem drin behalten.<\/p>\n<p>Genug dazu \u2026 wie sieht das nun mit der zweiten Aussage aus? Ueber was schreiben die (nicht nur relevanten) Seiten eigentlich? Dafuer muss man natuerlich alle Zeilen normieren und das sieht dann so aus:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/22_Relevanz_row_norm_all_.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11169 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/22_Relevanz_row_norm_all_-800x315.png\" alt=\"\" width=\"800\" height=\"315\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/22_Relevanz_row_norm_all_-800x315.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/22_Relevanz_row_norm_all_-1024x403.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/22_Relevanz_row_norm_all_-768x302.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/22_Relevanz_row_norm_all_-1536x604.png 1536w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/22_Relevanz_row_norm_all_.png 1711w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>Aha! Ein bunter Streifen, der sich an die Ordinate schmiegt. Wenn man rein zoomt, dann sieht das so aus:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/23_Relevanz_row_norm_200_.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11170 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/23_Relevanz_row_norm_200_-800x315.png\" alt=\"\" width=\"800\" height=\"315\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/23_Relevanz_row_norm_200_-800x315.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/23_Relevanz_row_norm_200_-1024x403.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/23_Relevanz_row_norm_200_-768x302.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/23_Relevanz_row_norm_200_-1536x604.png 1536w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/23_Relevanz_row_norm_200_.png 1711w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>Im Allgemeinen bleibt also auch die zweite Aussage bestehen: ALLE Seiten zitieren hauptsaechlich &#8222;irrelevante&#8220; Seiten. Das ist die Bedeutung des gruen-roten Bereichs am linken Rand. Aber das muss etwas genauer betrachtet werden.<\/p>\n<p>Zum Ersten ist das, anders als beim obigen Fall, kein eindeutiges &#8222;rotes Band&#8220; (parallel zur Ordinate in diesem Fall). Das &#8222;duennt aus&#8220; je gr\u00f8szer die Relevanzwerte der zitierenden Seite wird. Dies wiederum bedeutet, dass das &#8222;Signal&#8220; bei h\u00f8heren Relevanzwerten (auf der Abszisse) gr\u00f8szer werden muss zu h\u00f8heren Relevanzwerten auf der Ordinate. Nun sieht man das im Gesamtbild aber wieder nicht, weil das Gesamtsignal bei kleinen Relevanzwerten von vielen Seiten stammt, waehrend es bei groszen Relevanzwerten von wenigen, oft nur einer Seite &#8222;generiert&#8220; wird. Die angesprochene Beobachtung geht also im &#8222;Rauschen&#8220; unter.<\/p>\n<p>Aber tatsaechlich, schaut man sich mal die Ecke bei den 1000 gr\u00f8szten Relevanzwerten an \u2026<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/24_Relevanz_row_norm_4700_5700__.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11171 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/24_Relevanz_row_norm_4700_5700__-800x315.png\" alt=\"\" width=\"800\" height=\"315\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/24_Relevanz_row_norm_4700_5700__-800x315.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/24_Relevanz_row_norm_4700_5700__-1024x403.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/24_Relevanz_row_norm_4700_5700__-768x302.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/24_Relevanz_row_norm_4700_5700__-1536x604.png 1536w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/24_Relevanz_row_norm_4700_5700__.png 1711w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>\u2026 dann scheint sich da Information zu verstecken! In den zeilenweise normierten Daten geht das &#8222;Rauschen&#8220; oft in den blauen und gar gruenen Bereich (manchmal gar in den roten). Hier ist also noch &#8222;was zu holen&#8220;.<br \/>\nAber darum soll es beim naechsten Mal gehen: wie man das Mehr an Information aus den Daten kitzeln kann :)<\/p>\n<p>Zum Zweiten liegt das Maximum des &#8222;roten Bereichs&#8220; nicht bei Relevanzwerten von 1 oder 2 sondern eher bei Relevanzwerten von 5, 6 und 7. Dies ist zum Glueck einfach zu erklaeren.<br \/>\nSeiten mit den kleinsten Relevanzwerten werden zwar total gesehen am haeufigsten zitiert (die Anzahl der Seiten die nur ein mal zitiert werden <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=10947\" target=\"_blank\" rel=\"noopener\">ist gr\u00f8szer als fuer alle anderen Relevanzwerte<\/a>), aber wenn eine Seite mit Relevanzwert 1 ihr eines Zitat erhalten hat, dann ist diese Seite &#8222;verbraucht&#8220;. Die naechste Zitierung muss also zu einer anderen Seite mit Relevanzwert 1 gehen. Bis wir durch sind mit denen. Dadurch &#8222;verschmiert&#8220; sich das Gesamtsignal fuer alle Seiten mit Relevanzwert ueber den kompletten Wertebereich.<br \/>\nHingegen wenn eine Seite mit Relevanzwert 6 eine Zitierung bekommt, dann kann die noch fuenf weitere Male zitiert werden. JA, die Anzahl der Seiten mit Relevanzwert 6 ist geringer, aber das Produkt aus erhaltenen Zitaten und Anzahl der Seiten ist gr\u00f8szer. Bei Relevanzwerten ueber sieben ist&#8217;s dann aber wieder so, dass die Anzahl der Seiten so stark abnimmt, dass besagtes Produkt wieder kleiner wird.<br \/>\nDas sieht man uebrigens auch im Bild mit dem &#8222;reingezoomten&#8220; Bild mit den total Zahlen und deswegen erscheint das Maximum des &#8222;roten Bereichs&#8220; der (zeilenweise) normierten Daten eher dort.<\/p>\n<p>Dieses Wechselspiel aus totalen und normierten Zahlen bzw. vielen Seiten und vielen Zitierungen (bzw. dem Produkt aus beiden) muss alles im Kopf behalten werden waehrend der Interpretation dieser Diagramme. Ich gebe zu, dass dies nicht immer einfach ist. Ich sasz oft laenger da, ohne dass mir die Erklaerungen &#8222;ins Gesicht gesprungen&#8220; ist. Vielmehr musste ich alle Gegebenheiten auseinanderklamuesern, mir genau ueberlegen was die Normierung (oder die Achsen, oder der Farbwert) eigentlich bedeutet, und total aufpassen, dass mir da nix durcheinander kommt um das Signal zu interpretieren und die Zusammenhaenge zu erkennen.<br \/>\nUnd das ist einer der Gruende, warum ich das so toll finde. Einfach, kann ja jeder :)<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Kurze Wiederholung, weil es etwas komplizierter ist: beim letzten Mal stellte ich vor, dass sich die Relevanz von Wikipediaartikeln im Wesentlichen dadurch ausdruecken laeszt, indem man zaehlt wie oft ein Artikel zitiert wird. Der Einfachheit halber nenne ich hier Wikipeidaseiten mit kleinen Relevanzwerten &#8222;irrelevant&#8220; (mit Anfuehrungszeichen). Das bedeutet nicht, dass die irrelevant (ohne Anfuehrungszeichen) sind. [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/11119"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=11119"}],"version-history":[{"count":8,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/11119\/revisions"}],"predecessor-version":[{"id":11175,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/11119\/revisions\/11175"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=11119"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=11119"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=11119"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}