Auswertung der Bandwünsche

  • Als neues Loginsystem benutzen wir die Wacken.ID. Damit du deinen jetzigen Account im Wacken Forum mit der Wacken.ID verknüpfen kannst, klicke bitte auf den Link und trage deine E-Mail Adresse ein, die du auch hier im Forum benutzt. Ein User mit deinem Benutzernamen und deiner E-Mail Adresse wird dann automatisch angelegt. Du bekommst dann eine E-Mail und musst deine Wacken.ID bestätigen.

    Sollte es Probleme geben, schreibt uns bitte.

    Klicke hier, um deinen Account in eine Wacken.ID zu migrireren.
Status
Für weitere Antworten geschlossen.

decembersoul

W:O:A Metalhead
12 Mai 2005
1.079
1
61
45km von Wacken entfernt
Hallo

Wie einige hier im Forum sicher schon festgestellt haben, ist die Rubrik Bandwünsche etwas unübersichtlich geworden.

Ich habe mir daher die Mühe gemacht und ein Programm geschrieben das die zur Verfügung stehenden Daten auswertet und aufbereitet.

Das Produkt meiner Arbeit sind zwei Tabellen und eine CSV Datei.

Top Bands
Flop Bands
CSV Datei, siehe FAQ


FAQ:
Q: Warum stimmen die Stimmen nicht 100% mit denen im Thread überein.
A: Mein Programm wertet das Forum nur ein mal am Tag aus. Das Datum und die Uhrzeit der letzten Auswertung sehr ihr am Ende der Seite

Q: Warum werden einige Antworten nicht als Positiv oder Negativ gewertet?
A: Es ist schwierig bei einigen Antwortmöglichkeiten zu unterscheiden ob diese Positiv oder Negativ zu bewerten sind. Es gibt über 400 Schreibweisen von Ja/Nein/Egal. Stimmen irgendwelche Werte nicht, dann meldet es mir bitte.

Q: Neben dem Namen der Band befindet sich ein *. Was bedeutet das?
A: Bei der Band befindet sich eine Antwortoption die noch nicht zugeordnet werden konnte

Q: Warum hat die Band 0 Stimmen?
A: Einige User haben Bands eingestellt und keine Umfrage gestartet. Daher werden diese mit 0 Punkten bewertet

Q: Warum werden Threads ohne Umfrage nicht raus gefiltert?
A: Damit man sehen kann das es einen Thread zu der Band gibt und damit man dem Programm nicht vorwerfen kann Daten zu zensieren oder zu manipulieren

Q: Wie kann die die CSV Datei öffnen?
A: Die CSV Datei ist eine TAB Separierte Datei die in Excel, LibeOffice oder OpenOffice geöffnet werden kann. Beim öffnen bekommt Ihr in der Regel einen Dialog in dem Ihr auswählen müsst das die Datei TAB separiert ist.

Q: Warum gibt es keine Tabelle in der nach Prozenten sortiert wird?
A: Eine Band mit nur einer positiven Stimme und keiner negativen hat somit 100%. Soll diese in der Liste ganz oben stehen? Das macht meiner Meinung nach keinen Sinn. Wenn man es trotzdem in Prozent haben will, kann man die CSV Datei in Excel auf machen und die Spalten in Prozent umrechnen.

Q: Es gibt Bands die in der Liste mehrmals auftauchen. Warum ist das so?
A: Einige User haben beim erstellen der Threads nicht aufgepasst und nicht drauf geachtet das es die Band schon gibt.

Q: Warum kann man zwei Threads mit der selben Band nicht einfach zusammenzählen?
A: Jeder User darf für eine Band nur ein mal abstimmen. Wenn es für eine Band zwei Threads gibt, kann man zwei mal abstimmen. Würde man diese zusammen zählen, dann würde man das Ergebnis verfälschen. Um dieses sauber aus zurechnen bräuchte man Zugang zu der Datenbank und müsste die UID's vergleichen.

Q: Kann man weitere Kriterien berücksichtigen? z.B. wann die Band das letzte mal gespielt hat oder wie oft?
A: Das ist nicht Aufgabe dieser Auswertung. Ich werte nur die Roh Daten aus und mache keine weitere Gewichtung. Bewerten müsst Ihr es dann selber.

Q: Hat die Auswertung einen Einfluss auf die WOA Orga?
A: Das wüsste ich auch gerne :D

Q: Wie hast Du es realisiert?
A: Ich habe ein Shellscript das per Cron ein mal am Tag gestartet wird. Dieses lädt per wget alle Seiten runter. Die Daten werden dann mit einem C Programm ausgewertet und aufbereitet.

Q: Kann man Dir irgendwie für Deine Arbeit danken?
A: Gebt mir in Wacken ein Bier aus :angel:
 
Zuletzt bearbeitet:

rabbit

Member
2 Aug. 2009
41
0
51
wow, nice work
würd mich ja mal interessieren wie du das genau auf die beine gestellt hast, ist das mal eben so programmiert gewesen?
 
Zuletzt bearbeitet:

decembersoul

W:O:A Metalhead
12 Mai 2005
1.079
1
61
45km von Wacken entfernt
wow, nice work
wie hast du das gemacht?

Wie in den FAQ's steht. Ein Shellscript das erst mal ermittelt welches die erste Seite und die letzte ist. Dann lädt es alle Seiten runter und ermittelt so die ThreadIDs aller Threads in der subrubrik.
Im nächsten Schritt lädt es alle Seiten runter.
Aktuell 880 Seiten. Dauert ca 8 min.

Dann habe ich einen HTML Parser in C geschrieben der mit die relevanten Daten aus den HTML Seiten extrahiert. Das Produkt ist die CSV Datei.

Aus der CSV Datei erzeugt dann ein weiteres shellscript die html seiten.

Das schwere war es die über 400 Schreibweisen von ja/nein/egal zu zu ordnen. Das musste alles per Hand passieren und hat daher etwas gedauert. Einige wenige Optionen fehlen noch aber das spielt wohl nur eine kleine Rolle. Nur bei den Bands die ein * neben dem Namen haben.

Wie auch in den FAQ's drinnen steht könnte man als Admin vom Forum auch noch mehr Daten aus der DB extrahieren. Leider komme ich an die Daten nicht ran.
 

decembersoul

W:O:A Metalhead
12 Mai 2005
1.079
1
61
45km von Wacken entfernt
Ist sehr schön geworden.
Ich wollte, wie die in der Mail geschrieben noch einige Auswertungen dazu machen. Dachte wir stellen das dann zeitgleich rein.

Ja tut mir leid, ich war wohl etwas zu voreilig. :rolleyes:
Es freut mich wenn jemand die Daten weiter verarbeitet und eine Interpretation rein bringt.
Zumindest haben wir nun eine Basis auf der man aufbauen kann.
Freue mich über jeden der aus den Daten was macht. :)

//EDIT
Juhu nun ist der Thread immer oben
 
Zuletzt bearbeitet:

Wattafack

W:O:A Metalhead
22 Juli 2009
541
215
88
Die alte Schule :D

Was noch fehlt ist eine Gegenüberstellung von Ja/Nein, du könntest die Ja/Nein Ratio angeben, oder einfach die "Neins" von den "Jas" abziehen. Dann haben negative Feedbacks direkt negative Bewertungen.

Damit da ein Vergleich reinkommt, ich sehe nämlich David Hasselhoff in beiden Listen recht weit oben :D
 

decembersoul

W:O:A Metalhead
12 Mai 2005
1.079
1
61
45km von Wacken entfernt
Die alte Schule :D

Was noch fehlt ist eine Gegenüberstellung von Ja/Nein, du könntest die Ja/Nein Ratio angeben, oder einfach die "Neins" von den "Jas" abziehen. Dann haben negative Feedbacks direkt negative Bewertungen.

Damit da ein Vergleich reinkommt, ich sehe nämlich David Hasselhoff in beiden Listen recht weit oben :D

Kannst Du ja ganz leicht selber machen. Öffne einfach die CSV Datei und werte es aus. :angel:
Zumindest finde ich die Idee besser als nur auf Prozent zu schauen.
 

pfeiffer

W:O:A Metalhead
7 Aug. 2011
3.692
21
63
Sweeeeet. :cool:

Die "einfache" Top/Flop-Auswertung liefert ja schon interessante Ergebnisse. Bsp. hätte ich nicht erwartet das Volbeat dermassen schlecht abschneidet. *lol*

Mir persönlich fehlt jetzt noch ein Indikator für die relative Umfragebeteiligung (gemessen an der Umfrage mit den meisten Antworten), aber diese Info kann man bestimmt aus der csv-Datei ziehen.


Das Bier hast du dir jedenfalls redlich verdient. ;)
 

MasterChu19155

Moderatorin
6 Aug. 2003
19.183
470
118
40
Hamburg & Berlin
Sweeeeet. :cool:

Die "einfache" Top/Flop-Auswertung liefert ja schon interessante Ergebnisse. Bsp. hätte ich nicht erwartet das Volbeat dermassen schlecht abschneidet. *lol*

Mir persönlich fehlt jetzt noch ein Indikator für die relative Umfragebeteiligung (gemessen an der Umfrage mit den meisten Antworten), aber diese Info kann man bestimmt aus der csv-Datei ziehen.


Das Bier hast du dir jedenfalls redlich verdient. ;)

Wie gesagt ich mache noch eine Interpretation der Zahlen und stelle sie transparent für alle Online. :)
Ziel ist es dann qualitative, aber nachvollziehbare Einblicke zu den Rohdaten zu haben.
 
Status
Für weitere Antworten geschlossen.