1 Zur Methode

Im weiteren werden nur die Geschlechter weiblich und männlich (N=8260) betrachtet.

Für den Vergleich wurden jeweils pro Item/Skala t-Test berechnet. In den Tabellen zum t Test sind verschiedene Werte dargestellt, es folgt die Erläuterung der Abkürzungen.

  • Diff: Differenz der Mittelwerte
  • μ1 weiblich: Mittelwert Frauen
  • μ2 männlich: Mittelwert Männer
  • t: berechneter t Wert
  • SE: Standardfehler (Standard Error)
  • df: Freiheitsgrade
  • CI: 95 % Konfidenzintervall
  • p: Signifikanz des Testverfahrens, ab p< 0.05 gilt ein Unterschied als signifikant
  • Cohen’s d: Maß für die Effektgröße

Die Geschlechter wurden auf den gebildeten Skalen (vgl. Anhang Reliabilitätsanalyse) und den zusammenfassenden Overallitems verglichen.

Neben der statistischen Signifikanz ist für die Interpretation die Effektgröße Cohens d entscheidend, ob ein praktisch bedeutsamer Effekt vorliegt.

Cohen (1988) hat Regeln zur Interpretation der Ergebnisse aus seiner Formel abgeleitet. Demnach fängt ein kleiner Effekt ab 0,2 an, ein mittlerer ab 0,5 und ein großer ab 0,8. Hier ist zu beachten, dass Cohen’s d durchaus auch negativ werden kann. Dies bedeutet lediglich, dass der Effekt in die umgekehrte Richtung geht.

Am Ende einer Berechnung findet sich immer die Interpretation aus SC Sicht.Die Mittelwerte von fünfstufige Skalen kann man bei Güteabstufungen theoretisch auch wie Schulnoten interpretieren. Zur schnellen Interpretation wird deshalb in den Aussagen in Klammern jeweils der Mittelwert dargestellt.

2 Zusammenfassung der Ergebnisse

Insgesamt gibt es für die Onlinelehre im SoSe 2020 bis auf eine Ausnahme, keine signifikanten Geschlechterunterschiede zu berichten, die praktisch bedeutsam wären.

Die Ausnahme besteht bei der Skala Gruppenarbeit. Hier schätzen Frauen die Itemskala etwas besser ein als Männer.

Skala/Item Gibt es Unterschiede zwischen den Geschlechtern? Interpretation
Skala Lehrgüte keine signifikanten praktisch bedeutsamen Unterschiede vorhanden Die Lehrgüte wird als gut(+) eingeschätzt.
Skala Struktur der LV keine signifikanten praktisch bedeutsamen Unterschiede vorhanden Die Struktur wird als gut(+) eingeschätzt.
Skala Betreuung keine signifikanten praktisch bedeutsamen Unterschiede vorhanden Die Betreuungselemente werden als gut(+) eingeschätzt.
Overall-Item Betreuung keine signifikanten praktisch bedeutsamen Unterschiede vorhanden Die Betreuung insgesamt wird als gut eingeschätzt.
Overall-Item Online-Lernmaterialien keine signifikanten praktisch bedeutsamen Unterschiede vorhanden Die Online-Lernmaterialien werden als nützlich eingeschätzt.
Skala Onlineaufgaben keine signifikanten praktisch bedeutsamen Unterschiede vorhanden Die Onlineaufgaben werden als gut eingeschätzt.
Skala Gruppenarbeit ***signifikante praktisch bedeutsame Unterschiede vorhanden; kleiner Effekt Die Gruppenarbeit wird als gut eingeschätzt. Frauen schätzen sie etwas besser ein.
Overall-Item Gruppenarbeit keine signifikanten praktisch bedeutsamen Unterschiede vorhanden Die Umsetzung der Gruppenarbeit wird insgesamt als gut eingeschätzt.
Overall-Item Stoffschwierigkeit keine signifikanten praktisch bedeutsamen Unterschiede vorhanden Die Stoffschwierigkeit wird insgesamt als genau richtig (Tendenz eher schwierig) eingeschätzt.
Overall-Item Workload keine signifikanten praktisch bedeutsamen Unterschiede vorhanden Die Vor und Nachbereitungszeit liegt im Mittel bei 4-6 Stunden pro LV.
Overall-Item Gesamturteil keine signifikanten praktisch bedeutsamen Unterschiede vorhanden Die Lehrveranstaltungen werden insgesamt als gut eingeschätzt.

3 Skala Lehrgüte

Die Lehrgüteskala ist eine Skala zum Dozentenstil und angelehnt an eine Skala von Rindermann et al. Im 2015 hat sich die TU Berlin dazu entschieden diese Skala als eine gemeinsame Skala in allen Lehrevaluationen abzufragen.

Die Lehrgüteskala besteht aus den vier Items:

  • B01 Der/die Lehrende spricht verständlich und anregend.
  • B02 Der/die Lehrende kann Kompliziertes verständlich machen.
  • B03 Der/die Lehrende fasst regelmäßig den Stoff zusammen.
  • B04 Der/die Lehrende ist gut vorbereitet.

Die Abfrage erfolgte mit 5 Stufen (fast immer: sehr selten). Die Skala ist mit Cronbachs Alpha von .84 hoch reliabel und kann für den Einsatz empfohlen werden.

Die Skala gibt einen Eindruck wie der Lehrstil einer Lehrveranstaltung ist.

Table 1: Welch Two Sample t-test with alternative hypothesis: \(\mu_1 \neq \mu_2\)

Diff \(\mu_1\) weiblich \(\mu_2\) männlich t SE df \(CI_{95\%}\) p Cohen's d
0.09 4.34 4.25 4.87 0.02 7804.98 (0.05 - 0.12) < .001 0.11



Aussagen: Insgesamt tritt ein didaktisch guter Dozentenstil bei allen Lehrenden der TU Berlin häufig (+) (Mittelwert 1.7) aus Sicht der Befragten auf. Es gibt keine signifikanten praktisch bedeutsamen Unterschiede zwischen den Geschlechtern.

4 Skala Struktur und Aufbau der Lehrveranstaltung

Diese Skala besteht aus den folgenden drei Items:

  • B05 Der/die Lehrende hat die gesamte Lehrveranstaltung gut strukturiert und nachvollziehbar gegliedert.
  • B06 Der/die Lehrende verdeutlicht die Lernziele zu Beginn jedes Veranstaltungstermins.
  • B07 Der/die Lehrende präsentiert die Lerninhalte/den Stoff stimmig und kohärent.

Die Skala ist mit Cronbachs Alpha von 0.86 hoch reliabel und kann für den Einsatz empfohlen werden.

Sie gibt einen Eindruck darüber wie der Aufbau bzw. die Struktur der Lehrveransatltung, aber Nachvollziehbarkeit des Lehrstoffs ist.

Table 2: Welch Two Sample t-test with alternative hypothesis: \(\mu_1 \neq \mu_2\)

Diff \(\mu_1\) weiblich \(\mu_2\) männlich t SE df \(CI_{95\%}\) p Cohen's d
0.09 4.33 4.24 4.64 0.02 7767.36 (0.05 - 0.13) < .001 0.1



Aussagen: Insgesamt wird die Struktur und der Aufbau der Lehrveranstaltungen gut (Mittelwert Originalskala:1.7) durch die Befragten eingeschätzt. Es gibt keine signifikanten praktisch bedeutsamen Unterschiede zwischen den Geschlechtern.

5 Skala Betreuung

Diese Skala besteht aus den folgenden vier Items:

  • C01 Der/die Lehrende beantwortet Anfragen per E-Mail zügig.
  • C02 Der/die Lehrende reagiert schnell bei Fragen im begleitenden Forum bzw. Chat.
  • C03 Der/die Lehrende beantwortet organisatorische Anfragen sehr gut.
  • C04 Der/die Lehrende beantwortet fachlich inhaltliche Anfragen sehr gut.

Die Skala ist mit Cronbachs Alpha von 0.87 hoch reliabel und kann für den Einsatz empfohlen werden.

Table 3: Welch Two Sample t-test with alternative hypothesis: \(\mu_1 \neq \mu_2\)

Diff \(\mu_1\) weiblich \(\mu_2\) männlich t SE df \(CI_{95\%}\) p Cohen's d
0.09 4.49 4.41 3.75 0.02 4759.83 (0.04 - 0.13) < .001 0.11



Aussagen: Insgesamt wird die Betreuung der Lehrveranstaltungen gut (Mittelwert Originalskala:1.6) durch die Befragten eingeschätzt. Es gibt keine signifikanten praktisch bedeutsamen Unterschiede zwischen den Geschlechtern.

6 Gesamteinschätzung Betreuung

Table 4: Welch Two Sample t-test with alternative hypothesis: \(\mu_1 \neq \mu_2\)

Diff \(\mu_1\) weiblich \(\mu_2\) männlich t SE df \(CI_{95\%}\) p Cohen's d
0.1 4.27 4.17 4.54 0.02 7964.27 (0.06 - 0.15) < .001 0.1



Aussagen: Insgesamt wird die Betreuung der Lehrveranstaltungen gut (Mittelwert Originalskala:1.8) durch die Befragten eingeschätzt. Es gibt keine signifikanten praktisch bedeutsamen Unterschiede zwischen den Geschlechtern.

7 Gesamteinschätzung Online-Lernmaterialien

Table 5: Welch Two Sample t-test with alternative hypothesis: \(\mu_1 \neq \mu_2\)

Diff \(\mu_1\) weiblich \(\mu_2\) männlich t SE df \(CI_{95\%}\) p Cohen's d
0.12 4.23 4.11 5.35 0.02 7779.52 (0.08 - 0.16) < .001 0.12



Aussagen: Insgesamt werden die zur Verfügung gestellten Online-Lernmaterialien nützlich (Mittelwert Originalskala:1.8) durch die Befragten eingeschätzt. Es gibt keine signifikanten praktisch bedeutsamen Unterschiede zwischen den Geschlechtern.

8 Skala Onlineaufgaben

Diese Skala besteht aus den folgenden sechs Items:

  • E01 Die vorgegebenen Aufgabenstellungen sind verständlich formuliert.
  • E02 Die Aufgaben können selbstständig durchgeführt werden.
  • E03 Die Inhalte der Aufgaben werden vom Lehrenden ausreichend vorbereitet.
  • E04 Die Ergebnisse der Aufgaben werden vom Lehrenden ausreichend nachbereitet.
  • E05 Es werden ausreichend Hilfestellungen für das Lösen der Aufgaben bereitgestellt.
  • E06 Die gestellten Aufgaben sind hilfreich, um den vermittelten Stoff besser zu verstehen.

Die Skala ist mit Cronbachs Alpha von 0.89 hoch reliabel und kann für den Einsatz empfohlen werden.

Table 6: Welch Two Sample t-test with alternative hypothesis: \(\mu_1 \neq \mu_2\)

Diff \(\mu_1\) weiblich \(\mu_2\) männlich t SE df \(CI_{95\%}\) p Cohen's d
0.1 4.17 4.07 3.79 0.03 4461.81 (0.05 - 0.14) < .001 0.11



Aussagen: Insgesamt werden die gestellten Onlineaufgaben als gut (Mittelwert Originalskala:1.9) durch die Befragten eingeschätzt. Es gibt keine signifikanten praktisch bedeutsamen Unterschiede zwischen den Geschlechtern.

9 Skala Gruppenarbeit

Diese Skala besteht aus den folgenden vier Items:

  • F02 Die Studierenden werden ermutigt, an Diskussionen teilzunehmen.
  • F03 Die Studiernden werden eingeladen, ihre Ideen und ihr Wissen zu teilen.
  • F04 Die Studierenden werden ermutigt, Fragen zu stellen.
  • F05 Die Studierenden werden ermutigt, ihre eigenen Ideen zu äußern.

Die Skala ist mit Cronbachs Alpha von 0.92 hoch reliabel (exzellent) und kann für den Einsatz empfohlen werden.

Sie gibt Auskunft darüber, wie gut die Gruppenarbeit ist.

Table 7: Welch Two Sample t-test with alternative hypothesis: \(\mu_1 \neq \mu_2\)

Diff \(\mu_1\) weiblich \(\mu_2\) männlich t SE df \(CI_{95\%}\) p Cohen's d
0.2 4.29 4.09 6.27 0.03 3860.61 (0.14 - 0.26) < .001 0.2



Aussagen: Insgesamt wird die Gruppenarbeit als gut (Mittelwert Originalskala:1.8) durch die Befragten eingeschätzt. Es gibt signifikant praktisch bedeutsame Unterschiede zwischen den Geschlechtern. Diese haben aber einen sehr kleinen praktisch bedeutsamen Effekt. Frauen beurteilen die Items der Gruppenarbeit etwas besser als Männer.

10 Gesamteinschätzung Gruppenarbeit

Table 8: Welch Two Sample t-test with alternative hypothesis: \(\mu_1 \neq \mu_2\)

Diff \(\mu_1\) weiblich \(\mu_2\) männlich t SE df \(CI_{95\%}\) p Cohen's d
0.13 4.1 3.98 3.94 0.03 3940.05 (0.06 - 0.19) < .001 0.12



Aussagen: Insgesamt wird die Umsetzung der Gruppenarbeit als gut (Mittelwert Originalskala:1.96) durch die Befragten eingeschätzt. Es gibt keine signifikanten praktisch bedeutsamen Unterschiede zwischen den Geschlechtern.

11 Gesamteinschätzung Stoffschwierigkeit

Table 9: Welch Two Sample t-test with alternative hypothesis: \(\mu_1 \neq \mu_2\)

Diff \(\mu_1\) weiblich \(\mu_2\) männlich t SE df \(CI_{95\%}\) p Cohen's d
-0.07 3.35 3.42 -3.51 0.02 7852.55 (-0.11 - -0.03) < .001 -0.08



Aussagen: Die Stoffschwierigkeit an der TU Berlin für das SoSe 2020 als genau richtig (Tendenz eher schwierig) (Mittelwert 3.4) durch die Befragten eingeschätzt. Es gibt keine signifikanten praktisch bedeutsamen Unterschiede zwischen den Geschlechtern.

12 Gesamteinschätzung Workload

Table 10: Welch Two Sample t-test with alternative hypothesis: \(\mu_1 \neq \mu_2\)

Diff \(\mu_1\) weiblich \(\mu_2\) männlich t SE df \(CI_{95\%}\) p Cohen's d
-0.13 2.63 2.75 -4.62 0.03 7605.75 (-0.18 - -0.07) < .001 -0.1



Aussagen: Die Vor und Nachbereitungszeit an der TU Berlin liegt für das SoSe 2020 zwischen 4-6 Stunden (Mittelwert Originalskala:2.7) durch die Befragten eingeschätzt. Es gibt keine signifikanten praktisch bedeutsamen Unterschiede zwischen den Geschlechtern.

13 Gesamturteil Lehrveranstaltung

Table 11: Welch Two Sample t-test with alternative hypothesis: \(\mu_1 \neq \mu_2\)

Diff \(\mu_1\) weiblich \(\mu_2\) männlich t SE df \(CI_{95\%}\) p Cohen's d
0.11 4.21 4.1 5.15 0.02 7998.98 (0.07 - 0.16) < .001 0.11



Aussagen: Insgesamt werden die evaluierten Lehrveranstaltungen der TU Berlin für das SoSe 2020 als gut (Mittelwert Originalskala:Originalskala:1.9) durch die Befragten eingeschätzt. Es gibt keine signifikanten praktisch bedeutsamen Unterschiede zwischen den Geschlechtern.