06-zmsbwforschungsbericht131ergebnissebevlkerungsumfrage2021

Dieses Dokument ist Teil der Anfrage „Beauftragte Meinungsumfragen des Bundes

/ 314
PDF herunterladen
Oft werden in und von den Medien Zahlen oder Prozentangaben verschiedener Studien zum gleichen Thema wiedergegeben, die sich mitunter widersprechen. Die Gründe hier- für sind vielfältig und basieren zumeist auf Aspekten des totalen Umfragefehlers (siehe 1.4 Umfrage- und Datenqualität). So können z.B. die Grundgesamtheiten in verschiedenen Studien unterschiedlich definiert worden sein. In der Folge beziehen sich die gemessenen Meinungen oder Merkmalsausprägungen mitunter auf unterschiedliche Bevölkerungs- gruppen und weichen daher voneinander ab. Auch verschiedene Stichprobenverfahren und ungleiche Ausschöpfungsquoten bzw. Ausfallfehler können dazu führen, dass sich Umfrageergebnisse unterscheiden. Werden Ergebnisse von Studien mit verschiedenen Messzeitpunkten verglichen, so können die Differenzen das Resultat kurzzeitiger Verän- derungen der Meinung durch bestimmte Ereignisse oder längerfristige Einstellungsände- rungen über einen längeren Zeitraum sein. Auch unterschiedlich große Messfehler kön- nen dazu führen, dass Befragungsergebnisse verschiedener Studien voneinander abwei- chen. Viele Untersuchungen zu Fragebögen haben gezeigt, dass Unterschiede bezüglich des Formates, der Formulierung, der Länge und Position einer Frage sowie die Anzahl, Rei- henfolge und Formulierung von Antwortmöglichkeiten das Antwortverhalten der befragten Personen und damit die Untersuchungsergebnisse verändern. So können bspw. Antwort- vorgaben zur Interpretation der Frage und als Vergleichskriterium verwendet werden. Bei Untersuchungen in unterschiedlichen Ländern kommen sprachliche und kulturelle Unter- schiede hinzu, die die Vergleichbarkeit der Erhebungen beeinträchtigen können. Aus den genannten Gründen könnten die Forschungsergebnisse des ZMSBw zum sicherheits- und verteidigungspolitischen Meinungsbild in der Bundesrepublik Deutschland von den Er- gebnissen anderer Studien zu ähnlichen Themen abweichen. Ein gutes Beispiel für die Effekte unterschiedlicher Frageformulierungen und Antwortskalen innerhalb derselben Studie bieten die Fragen zur Einstellung gegenüber Deutschlands internationalem Enga- gement in Abschnitt 5 (vgl. die Abbildungen 5.2). 1.6 Soziale Erwünschtheit Sozial erwünschtes Antworten ist eine Form der inhaltsbezogenen Verzerrung. Gemeint ist dabei die Neigung eines Befragten im Interview, bei (sensiblen) Fragen nur vermeint- lich akzeptierte Antworten zu geben und damit den „wahren“ Wert (also die tatsächliche Meinung oder Merkmalsausprägung) zu verschleiern. Die Gründe für dieses Verhalten sind vielschichtig. Sozial erwünschtes Antworten kann als Befriedigungsversuch des Be- dürfnisses nach sozialer Anerkennung vom Befragten und demnach als Persönlichkeits- 295
295

merkmal oder aber als situationsspezifische Reaktion auf die Datenerhebung und die da- mit verbundenen Folgen und Konsequenzen interpretiert werden. Unabhängig von den Beweggründen werden von den Befragten demzufolge Angaben im Interview gemacht, von denen er oder sie annimmt, dass sie den sozialen Normen und Werten der Gesell- schaft oder aber des Interviewers entsprechen. Dies kann im Interview eher unbewusst (Selbsttäuschung) oder bewusst (Fremdtäuschung) geschehen. Zufällige Antwortfehler der Befragten sind für die Datenqualität eher unproblematisch, da sie in beide Richtungen um den „wahren“ Wert streuen. Antworten aber viele Befragte sozial erwünscht, also systematisch anders als der „wahre“ Wert, sind die erhobenen Da- ten in der Folge in eine Richtung verzerrt. Bei heiklen Fragen können daher bestimmte sozial unerwünschte Merkmale, Einstellungen oder Verhaltensweisen für die untersuchte Population systematisch unterschätzt werden. Wie die Umfrageforschung belegt, ist der Effekt der sozialen Erwünschtheit aufgrund der Anwesenheit des Interviewers in münd- lichen und vor allem in persönlichen Interviews – wie in der Bevölkerungsbefragung 2021 – am stärksten. 1.7 Repräsentativität Der Begriff der Repräsentativität einer Umfrage oder der repräsentativen Stichprobe wird zwar in fast allen empirischen Arbeiten verwendet, wird aber in der Umfrageforschung stark diskutiert. Bis heute gibt es keine allgemein akzeptierte Definition, da die Markt- und Meinungsforschung, wissenschaftliche Befragungen und amtliche Erhebungen meist unterschiedliche Ansprüche an die Messung und dementsprechend an die Verwendung des Begriffs haben. Allgemein gehört die Repräsentativität einer Umfrage oder Stich- probe neben Objektivität, Validität und Reliabilität der Messung bzw. des Messvorgangs zu den Gütekriterien der empirisch-quantitativen Forschung. Um Rückschlüsse aus einer Stichprobe auf die Grundgesamtheit ziehen zu können, muss die Stichprobe die Grund- gesamtheit bezüglich bestimmter relevanter Merkmale möglichst gut widerspiegeln. Wenn die Stichprobe hinsichtlich dieser Merkmale möglichst ähnlich bzw. strukturgleich ist, können die interessierenden Merkmale (Parameter) – zumindest annähernd – unver- zerrt geschätzt werden. Repräsentativität ist aber eher als Zielvorgabe zu verstehen, da es in der Praxis schwierig ist, ein exaktes Abbild der Grundgesamtheit in einer Stichprobe zu erhalten. In der Markt- und Meinungsforschung werden meist soziodemografische Merkmale wie Alter, Geschlecht und Bildung verwendet, um den Grad der Repräsentati- vität zu bestimmen, weil die Verteilung dieser Merkmale in der Grundgesamtheit (durch den Mikrozensus oder die Volkszählung) bekannt ist. Oft wird Repräsentativität als ge- 296
296

geben angesehen, wenn die Stichprobe die Grundgesamtheit bezüglich dieser festgeleg- ten Merkmale exakt abbildet. Repräsentativ ist eine Stichprobe streng genommen aber immer nur hinsichtlich dieser Eigenschaften oder Zielvorgaben. Da die Daten der Bevöl- kerungsbefragung 2021 nach den Merkmalen Alter, Geschlecht, Bildung und Ortsgröße gewichtet wurden, ist die Stichprobe repräsentativ bezüglich dieser Merkmale (siehe 1.8 Gewichtung). Eigenschaften der Zielpersonen können auch nicht soziodemografische As- pekte wie bspw. Persönlichkeitseigenschaften, Einstellungen, Motive oder Ähnliches sein. Eine wissenschaftliche Definition des Begriffs muss aber mehr berücksichtigen, da die Repräsentativität einer Umfrage durch verschiedenste Aspekte bestimmt oder beein- flusst wird. Dazu zählen das Stichprobendesign (Stichprobenverfahren, Schätzmethode, Stichprobenumfang) sowie methodische Aspekte wie Teilnahmeverweigerungen ((Unit- )Nonresponse), Antwortausfälle (Item-Nonresponse) und Falschangaben. 1.8 Gewichtung Die Auswahl einer Stichprobe von Befragten soll ein repräsentatives Bild der Grundge- samtheit darstellen. Das heißt, die Befragten sollen sich ebenso zusammensetzen wie die Gruppe aller potenziell zu Befragenden (siehe 1.2 Grundgesamtheit, 1.3 Stichprobe und 1.7 Repräsentativität). In der Praxis ist dies jedoch nicht immer passgenau der Fall. Man- che Gruppen – etwa männliche und ältere Befragte oder solche mit höherem Bildungsni- veau – sind typischerweise bei persönlichen Befragungen wie der Bevölkerungsbefra- gung mit höheren Anteilen in der Stichprobe vertreten als es ihrem Anteil in der Grund- gesamtheit aller möglichen Befragten entspricht (für die vorliegende Untersuchung die deutschsprachige Bevölkerung Deutschlands ab 16 Jahren; vgl. aber Tabelle 3.3). Ge- wichtungen korrigieren diese Verzerrungen von Stichproben mit dem Ziel, dass sich die Stichprobe hinsichtlich ausgewählter Kriterien genauso zusammensetzt wie die Gesamt- population, aus der die Stichprobe gezogen wurde. Die Korrektur von Stichprobenfehlern konzentriert sich in der Praxis auf soziodemografische Variablen, da diese für die Ge- samtpopulation exakt zu bestimmen sind (siehe 1.7 Repräsentativität). In der vorliegenden Untersuchung wird die Stichprobe mittels Gewichtung unter Einbe- ziehung von Geschlecht, Alter, Bildung und Ortsgröße korrigiert (vgl. Abschnitt 3). Dazu gehen die Angaben jedes einzelnen Befragten entsprechend seiner sozialstrukturellen Merkmale mit einer spezifischen Gewichtungsgröße in die Analysen ein. Durch Gewich- tungen soll vermieden werden, dass Unter- und Überrepräsentationen von sozialstruktu- rellen Gruppen unter den Befragten zu verzerrten Befragungsergebnissen führen. 297
297

Einschränkend ist zu berücksichtigen, dass die Verteilung der außen- und sicherheitspo- litischen Einstellungen, die im Mittelpunkt der Bevölkerungsbefragung 2021 stehen, zu- meist nicht bekannt ist und daher auch nicht durch Gewichtungen korrigiert werden kann. Dennoch beeinflusst der Einsatz von Gewichten auf der Basis von soziodemografischen Merkmalen die Verteilung der anderen, nicht in die Berechnung der Gewichtungsfaktoren eingehenden Variablen (etwa die Verteilung von Einstellungsvariablen). 2. Messung und Datenmodifikation 2.1 Reliabilität Reliabilität ist ein Gütekriterium für Messverfahren in den Sozialwissenschaften. Relia- bel sind wissenschaftliche Instrumente und Skalen, wenn ihre Messergebnisse reprodu- zierbar sind, d.h., sie zeigen bei wiederholten Messungen unter den gleichen Bedingun- gen dasselbe Ergebnis. Reliabilität ist ein zentrales Kriterium für die Zuverlässigkeit einer Messung. Eine in der Literatur übliche und in diesem Forschungsbericht wiederholt ver- wendete Kennzahl zur Bestimmung der Reliabilität ist Cronbachs alpha. Cronbachs alpha Cronbachs alpha ist ein in den Sozialwissenschaften üblicher Indikator, um die Reliabi- lität einer Skala auszuweisen. Cronbachs alpha bestimmt die interne Konsistenz einer Skala und berechnet, inwieweit die Variablen einer Skala miteinander zusammenhängen. Bei der Verwendung von Cronbachs alpha wird stets von einer eindimensionalen Struktur der Skala ausgegangen. Im Gegensatz hierzu bestimmen Faktorenanalysen (siehe 3.4 Ein- trag Faktorenanalyse) empirisch, welche Dimensionalität eine Skala aufweist, d.h., es werden unter Umständen mehrere Dimensionen ermittelt. Cronbachs alpha kann Werte zwischen minus unendlich und 1 annehmen. In der Literatur hat sich als Konvention etab- liert, dass ein Cronbachs alpha zwischen 0,6 oder 0,7 auf eine ausreichende Reliabilität einer Skala verweist. Werte größer als 0,8 zeigen eine hohe, Werte größer als 0,9 eine sehr hohe Reliabilität an. Skalen mit einem Cronbachs alpha kleiner als 0,6 gelten als wenig reliabel. Ihre Verwendung sollte nur bei theoretisch zwingenden Argumenten oder zu Vergleichszwecken mit anderen Erhebungen erfolgen. Bei der Einordnung von Cron- bachs alpha ist zu berücksichtigen, dass diese Kennzahl abhängig von der Anzahl der berücksichtigten Variablen ist. Je mehr Variablen in eine Skala eingehen, desto höher ist – bei sonst gleichen Bedingungen – der Wert von Cronbachs alpha. 298
298

2.2 Kodierung Unter Kodierung ist die Zuweisung von Angaben und Antworten der Befragten zu be- stimmten Variablenwerten zu verstehen (siehe 3.1 Skalenniveau). In der Praxis werden qualitative Angaben, etwa das Geschlecht oder das Bildungsniveau der Befragten ebenso wie deren Haltungen und Einstellungen in quantitative Angaben überführt. Als Beispiele: Aus der Angabe des Geschlechts der Befragten wird im Datensatz die Variable Ge- schlecht mit den Ausprägungen 0 = Mann und 1 = Frau. In der ZMSBw-Bevölkerungs- befragung 2021 hat keiner der Teilnehmenden die Geschlechtskategorie „divers“ ausge- wählt. Ebenso werden aus der persönlichen Haltung zur Bundeswehr, die auf einer sechs- stufigen Skala von sehr positiv bis zu sehr negativ reichen kann, die Ausprägungen: 1 = sehr positiv, 2 = positiv, 3 = eher positiv, 4 = eher negativ, 5 = negativ und 6 = sehr negativ. Diese Angaben werden zur besseren statistischen Handhabung und zur weiteren Vereinheitlichung über verschiedene Variablen hinweg in folgende Werte rekodiert: 1 = sehr positiv, 0,8 = positiv, 0,6 = eher positiv, 0,4 = eher negativ, 0,2 = negativ und 0 = sehr negativ. Diese Transformationen von Inhalten zu Zahlen sind Voraussetzung, um statistische Auswertungen durchzuführen. Für die Auswertungen in diesem Forschungsbericht sind vielfältige Kodierungen durch- geführt worden. In Kurzform finden sich Angaben zur Kodierung in der Regel in den Anmerkungen unter den jeweiligen Tabellen oder in Fußnoten. Im Forschungsbericht werden wiederholt Vergleiche zwischen den Haltungen verschiedener soziodemografi- scher Gruppen bzw. nach der Wahlabsicht der Befragten durchgeführt (etwa in den Ta- bellen 4.1 und 6.1). Die diesen Auswertungen zugrunde liegenden Kodierungen werden nachstehend detailliert dokumentiert: Geschlecht: Frage: Welches Geschlecht haben Sie? 1: Männlich, 2: Weiblich, 3: Divers. Keiner der Teilnehmenden hat die Geschlechtskategorie „divers“ ausgewählt. Rekodierung: 0: Männlich; 1: Weiblich. Bildungsniveau: Frage: Welchen höchsten Bildungsabschluss haben Sie? 1: Hauptschul- abschluss (Volksschulabschluss) oder Abschluss polytechnische Oberschule 8. oder 9. Klasse, 2: Mittlere Reife, Realschulabschluss, Fachschulreife oder Abschluss polytech- nische Oberschule 10. Klasse, 3: Fachhochschulreife, Abschluss einer Fachoberschule, 4: Abitur (Intervieweranweisung: allgemeine oder fachgebundene Hochschulreife), 5: Hochschul- oder Fachhochschulabschluss, 6: Einen anderen Schulabschluss und zwar: *OFFEN, 7: noch Schüler, 97: keinen Abschluss, 98: Weiß nicht, 99: Keine Antwort. 299
299

Rekodierung: Hauptschulabschluss: Ausprägungen 1 und 97 zusammengefasst, Real- schulabschluss: Ausprägung 2, Hochschul- bzw. Fachhochschulreife: Ausprägungen 3 bis 5 zusammengefasst, alle anderen Ausprägungen wurden als fehlende Werte definiert. Alter: Frage: Bitte sagen Sie mir, wie alt Sie sind. Rekodierung: 1: 16 bis 29 Jahre, 2: 30 bis 49 Jahre, 3: 50 bis 69 Jahre, 4: 70 Jahre und älter. Haushaltsnettoeinkommen pro Monat: Frage: Wie hoch ist etwa das monatliche Netto- Einkommen, das Sie alle zusammen im Haushalt haben, nach Abzug von Steuern und der Sozialversicherung? Alle Einnahmequellen zusammen genommen: In welche der folgen- den Netto-Einkommensgruppen fällt dann Ihr Haushalt? 1: unter 500 Euro, 2: 501–1.000 Euro, 3: 1.001–2.000 Euro, 4: 2.001–3.000 Euro, 5: 3.001–4.000 Euro, 6: 4.001–5.000 Euro, 7: 5.001 oder mehr, 99: Keine Antwort. Rekodierung: Bis 2.000 Euro: Ausprägungen 1 bis 3 zusammengefasst, 2.001 bis 4.000 Euro: Ausprägungen 4 und 5 zusammengefasst, 4.001 Euro und mehr: Ausprägungen 6 und 7 zusammengefasst, alle anderen Ausprägungen wurden als fehlende Werte definiert. Wahlabsicht: Frage: Wenn am nächsten Sonntag Bundestagswahl wäre, welche der fol- genden Parteien würden Sie dann wählen? 1: CDU/CSU, 2: SPD, 3: Bündnis 90/Die Grü- nen, 4: Die Linke, 5: FDP, 6: AfD, 7: Andere Partei und zwar, 8: Keine Partei, würde nicht wählen gehen, 97: Nicht wahlberechtigt, 98: Weiß nicht, 99: Keine Antwort. Rekodierung: Keine Parteipräferenz, Nichtwähler: Ausprägungen 8 sowie 97 bis 99 zu- sammengefasst, die Ausprägungen für CDU/CSU, SPD, Bündnis 90/Die Grünen, Die Linke, FDP, AfD und andere Partei wurden beibehalten. Die Ausprägung „Andere Partei“ wird in der Regel nicht separat in den Tabellen des Forschungsberichts ausgewiesen. Region: Interviewerangabe zum Bundesland der Befragten: 1: Schleswig-Holstein, 2: Hamburg, 3: Niedersachsen, 4: Bremen, 5: Nordrhein-Westfalen, 6: Hessen, 7: Rhein- land-Pfalz, 8: Baden-Württemberg, 9: Bayern, 10: Saarland, 11: Berlin, 12: Brandenburg, 13: Mecklenburg-Vorpommern, 14: Sachsen, 15: Sachsen-Anhalt, 16: Thüringen. Rekodierung: Norddeutschland: Ausprägungen 1 bis 4 zusammengefasst, Ostdeutsch- land: Ausprägungen 11 bis 16 zusammengefasst, Süddeutschland: Ausprägungen 8 und 9 zusammengefasst, Westdeutschland: Ausprägungen 5 bis 7 sowie 10 zusammengefasst. 300
300

Migrationshintergrund: Frage S20: Sind Sie im Gebiet des heutigen Deutschland gebo- ren? (Intervieweranweisung: ES IST DEUTSCHLAND IN DEN GRENZEN VOM 3. OKTOBER 1990 GEMEINT. IST JEMAND AUF EHEMALIGEM DEUTSCHEM GEBIET GEBOREN, Z.B. IN SCHLESIEN ODER OSTPREUSSEN, BEDEUTET DAS „NEIN, IM AUSLAND“) 1: Ja, im Gebiet des heutigen Deutschland, 2: Nein, im Aus- land, 98: Weiß nicht, 99: Keine Antwort. Frage S21: **Filter: WENN S20 = 2 (wenn im Ausland). Bitte sagen Sie mir, wo Sie geboren wurden. 1: frühere deutsche Ostgebiete (z.B. Schlesien, Pommern, Ostpreußen), 2: Türkei, 3: Polen, 4: Italien, 5: Rumänien, 6: Griechenland, 7: Russland, Russische Fö- deration, ehemalige Sowjetunion (UdSSR), 8: Kroatien, Serbien, Bosnien und Herzego- wina, Kosovo, ehemaliges Jugoslawien, 9: Österreich, 10: Schweiz, 11: Frankreich, 12: USA, 13: Anderes Land, und zwar _____, 98: Weiß nicht, 99: Keine Antwort. Frage S22: Wurden Ihre Eltern im Gebiet des heutigen Deutschland geboren? (Intervie- weranweisung: ES IST DEUTSCHLAND IN DEN GRENZEN VOM 3. OKTOBER 1990 GEMEINT. IST JEMAND AUF EHEMALIGEM DEUTSCHEM GEBIET GEBOREN, Z.B. IN SCHLESIEN ODER OSTPREUSSEN, BEDEUTET DAS „NEIN, IM AUSLAND“.) 1: Ja, im Gebiet des heutigen Deutschland, 2: Nein, Mutter im Ausland geboren, 3: Nein, Vater im Ausland geboren, 4: Nein, Mutter und Vater im Ausland ge- boren, 98: Weiß nicht, 99: Keine Antwort. Frage S23: **Filter: WENN S22 = 2, 4 (wenn im Ausland). Bitte sagen Sie mir, wo Ihre Mutter geboren wurde. Länderliste wie bei S21. Frage S24: **Filter: WENN S22 = 3, 4 (wenn im Ausland). Bitte sagen Sie mir, wo Ihr Vater geboren wurde. Länderliste wie bei S21. Rekodierung: Migrationshintergrund: 1: Wenn S20 gleich 2 und S21 ungleich 1 und S22 ungleich 1. Wenn S22 ungleich 1 und S23 ungleich 1. Wenn S22 ungleich 1 und S24 ungleich 1. 0: alle anderen Befragten. Das heißt, Befragte, die im Ausland (Ausnahme: deutsche Ostgebiete) geboren sind oder bei denen mindestens ein Elternteil im Ausland (Ausnahme: deutsche Ostgebiete) geboren ist, haben einen Migrationshintergrund. 3. Methoden der Datenauswertung 3.1 Skalenniveau Das Skalenniveau ist eine Eigenschaft einer Variablen und beschreibt ihren Informati- onsgehalt. Bei einer Messung werden Zahlen zu Objekten auf der Grundlage von ver- schiedenen mathematischen Merkmalen zugeordnet. In der vorliegenden Befragung 301
301

wurde bspw. die Variable Geschlecht mit den Ausprägungen „männlich“, „weiblich“ und „divers“ gemessen. Allen befragten Männern wurde dabei die Zahl „0“ zugeordnet, die befragten Frauen wurden mit „1“ kodiert, Personen mit der Angabe „divers“ gibt es keine im diesjährigen Datensatz. Die zugeordneten Zahlenwerte haben dabei keine empirische Bedeutung und dienen nur der Unterscheidung der Befragten in Gruppen. Je nach Ska- lenniveau der gemessenen Variablen sind unterschiedliche Rechenoperationen für die Messung und die Datenanalyse zulässig (siehe 3.2 univariate Maßzahlen, 3.3 bivariate Zusammenhangsmaße und Verfahren sowie 3.4 multivariate Verfahren). Nominalskalen Das niedrigste Messniveau haben nominale Daten. Beim Messen werden den Objekten (in der Bevölkerungsbefragung 2021: Befragte) Zahlen (im Interview: Merkmalsausprä- gungen) zugeordnet. Für die unterschiedlichen Merkmalsausprägungen werden dabei be- liebige, voneinander verschiedene Zahlen verwendet. Teilt man die Befragten – wie im vorliegenden Bericht – nach ihrem Geschlecht auf, so erhalten alle Männer eine „0“, alle Frauen hingegen eine „1“. Diese numerischen Skalenwerte können nur nach Kategorien unterschieden (gleich/ungleich), nicht aber in eine bestimmte Rangfolge gebracht wer- den. Beispiele für nominalskalierte Merkmale, die in der Befragung erhoben wurden, sind Nationalität, Wohnort oder Parteipräferenz. Für diese Variablen können Häufigkeitsver- teilungen berichtet werden. In der gewichteten Stichprobe dieser Umfrage sind z.B. 49 Prozent der Befragten männlich und 51 Prozent weiblich (vgl. Abschnitt 3, Tabelle 3.3). Ordinalskalen Im Vergleich zu nominalen Daten besitzen ordinale Daten ein höheres Skalenniveau. Wie bei der Nominalskala können Objekte kategorisiert werden. Zusätzlich können diese Ka- tegorien oder Merkmalsausprägungen in einer Rangfolge geordnet werden. Die Abstände zwischen den Kategorien sind jedoch nicht gleich, daher kann man nur „Größer-kleiner“- bzw. „Besser-schlechter“-Aussagen über die Merkmalswerte treffen. Beispiele für Merk- male mit ordinalem Skalenniveau aus dem vorliegenden Bericht sind der Schulabschluss und das (klassiert abgefragte) Einkommen der Befragten. Streng genommen besitzen die meisten in dieser Umfrage gemessenen verteidigungs- und sicherheitspolitischen Einstel- lungen, wie z.B. das Sicherheitsempfinden, die Einstellung zum außen- und sicherheits- politischen Engagement Deutschlands oder die Einstellung zur Bundeswehr ordinales Skalenniveau, da sie mit einer Antwortskala mit mehreren vollständig gelabelten Ant- wortmöglichkeiten gemessen wurden (sogenannte Likert-Skala). In der Forschungspraxis werden solche und andere ordinale Einstellungsvariablen allerdings meist als metrische 302
302

oder quasi-metrische Merkmale verwendet. Dementsprechend können dann statistische Verfahren für dieses höhere Skalenniveau verwendet werden. So wurde bspw. für das Sicherheitsempfinden der Befragten das arithmetische Mittel gebildet, um mithilfe statis- tischer Tests (Mittelwerttest und Varianzanalyse) das Sicherheitsgefühl zwischen ver- schiedenen Gruppen vergleichen (vgl. Abschnitt 4, Tabelle 4.1) oder aber mit multivari- aten Verfahren erklären zu können (vgl. Abschnitt 4, Tabelle 4.7). Metrische Skalen Metrische Daten haben das höchste Skalenniveau, wobei hier nach Verhältnis-, Intervall- und Absolutskala unterschieden wird. Bei Intervallskalen können Objekte, ebenso wie bei ordinalen Daten, kategorisiert und geordnet werden. Darüber hinaus sind die Ab- stände der Merkmalsausprägungen (Intervalle) gleich groß. Ein Beispiel für ein Inter- vallskalenniveau ist die Messung der Temperatur (in Grad Celsius). Im Kontrast dazu besitzt eine Verhältnisskala zusätzlich einen natürlichen Nullpunkt (gleichbedeutend mit der Abwesenheit des Merkmals), der es erlaubt, Aussagen über Größenverhältnisse bzw. Differenzen zu treffen. So kann der Umsatz eines Geschäfts beispielsweise doppelt so groß sein wie der Umsatz des Nachbarladens. Andere Beispiele einer Verhältnisskala sind Länge, Gewicht, Sehvermögen, Einkommen (nicht wie im vorliegenden Bericht in Klas- sen gemessen) oder das in der Befragung erfasste Alter der Befragten in Jahren. Haben die Merkmale zusätzlich eine natürliche Maßeinheit, wie beispielsweise die Anzahl von Kindern, so spricht man von einer Absolutskala. 3.2 Univariate Maßzahlen Univariate Maßzahlen beziehen sich immer nur auf eine Variable bzw. ein Merkmal. Sie beschreiben die zentrale Lage (z.B. Mittelwert) oder die Streuung (z.B. Varianz bzw. Standardabweichung) einer Merkmalsverteilung in der Stichprobe. Neben dieser reinen Beschreibung der Daten (deskriptive Statistik) lassen andere univariate Kennzahlen wie der Standardfehler (Güte der Schätzung des Mittelwertes) und Konfidenzintervalle (Be- reich von möglichen wahren Mittelwerten der Grundgesamtheit) zusätzlich Aussagen über die Grundgesamtheit zu (Inferenzstatistik). Lage- und Streuungsmaße Je nach Skalenniveau (siehe 3.1 Skalenniveau) der Daten können unterschiedliche Lage- und Streuungsmaße verwendet werden. 303
303

Modus Der Modus oder Modalwert ist der häufigste Wert bzw. die am häufigsten vorkommende Ausprägung eines Merkmals in einer Stichprobe. Die Anwendung des Modus ist ab no- minalem Skalenniveau, also für alle Arten von empirischen Variablen, möglich. Da der Modus nur die häufigste Merkmalsausprägung ist, wird er nicht von ungewöhnlichen Werten in der Stichprobe (Ausreißer oder Extremwerte) beeinflusst bzw. verzerrt. Der Diversitätsindex als Streuungsmaß für nominale Daten beschreibt, wie stark sich die Ob- jekte (bei der Bevölkerungsbefragung 2021 die Befragten der Stichprobe) auf die Merk- malsausprägungen verteilen. Median Beim Median, auch Zentralwert genannt, werden die Daten der Rangfolge nach geordnet und die so erzeugte Datenreihe in der Mitte geteilt. 50 Prozent der Messwerte liegen dann über und 50 Prozent unter dem mittleren Messwert, dem Median. Bei einer geraden An- zahl von Objekten (Befragten) wird der Mittelwert aus den beiden Datenpunkten gebildet, die in der Mitte liegen. Durch diese Art der Berechnung ist der Median wenig von Aus- reißern und Extremwerten beeinflusst. Er kann für Daten ab ordinalem Skalenniveau ver- wendet werden. Die Streuung von ordinalen Daten kann durch Ranginformationen, wie die Spannweite oder den Quartilsabstand, aufgezeigt werden. Der Quartilsabstand be- schreibt die Differenz zwischen dem ersten Quartil (25 Prozent der Messwerte sind klei- ner) und dem dritten Quartil (75 Prozent der Messwerte sind kleiner). Arithmetisches Mittel/Mittelwert Das arithmetische Mittel (meist einfach Mittelwert (𝑥̅ ) genannt) sollte streng genommen nur bei metrischem Skalenniveau berechnet werden. Dabei wird die Summe der beobach- teten Ausprägungen eines Merkmals (𝑥 ) durch die Anzahl der Beobachtungen (n) geteilt (umgangssprachlich: Durchschnitt). Da alle Messwerte in die Berechnung für das arith- metische Mittel einfließen, können Ausreißer und Extremwerte den Mittelwert verzerren. Daher ist es wichtig, neben dem Mittelwert auch die Streuung der Werte in der Stich- probe, also die Stichprobenverteilung, zu berücksichtigen (siehe Eintrag Standardabwei- chung). Die Formel für die Berechnung des Mittelwerts lautet: 1 𝑥̅ =        𝑥 𝑛 304
304

Zur nächsten Seite