zmsbwfb131bevlkerungsumfrage2021

Dieses Dokument ist Teil der Anfrage „Verteidigung

/ 312
PDF herunterladen
Oft werden in und von den Medien Zahlen oder Prozentangaben verschiedener Studien
zum gleichen Thema wiedergegeben, die sich mitunter widersprechen. Die Gründe hier-
für sind vielfältig und basieren zumeist auf Aspekten des totalen Umfragefehlers (siehe
1.4 Umfrage- und Datenqualität). So können z.B. die Grundgesamtheiten in verschiedenen
Studien unterschiedlich definiert worden sein. In der Folge beziehen sich die gemessenen
Meinungen oder Merkmalsausprägungen mitunter auf unterschiedliche Bevölkerungs-
gruppen und weichen daher voneinander ab. Auch verschiedene Stichprobenverfahren
und ungleiche Ausschöpfungsquoten bzw. Ausfallfehler können dazu führen, dass sich
Umfrageergebnisse unterscheiden. Werden Ergebnisse von Studien mit verschiedenen
Messzeitpunkten verglichen, so können die Differenzen das Resultat kurzzeitiger Verän-
derungen der Meinung durch bestimmte Ereignisse oder längerfristige Einstellungsände-
rungen über einen längeren Zeitraum sein. Auch unterschiedlich große Messfehler kön-
nen dazu führen, dass Befragungsergebnisse verschiedener Studien voneinander abwei-
chen.
Viele Untersuchungen zu Fragebögen haben gezeigt, dass Unterschiede bezüglich des
Formates, der Formulierung, der Länge und Position einer Frage sowie die Anzahl, Rei-
henfolge und Formulierung von Antwortmöglichkeiten das Antwortverhalten der befragten
Personen und damit die Untersuchungsergebnisse verändern. So können bspw. Antwort-
vorgaben zur Interpretation der Frage und als Vergleichskriterium verwendet werden. Bei
Untersuchungen in unterschiedlichen Ländern kommen sprachliche und kulturelle Unter-
schiede hinzu, die die Vergleichbarkeit der Erhebungen beeinträchtigen können. Aus den
genannten Gründen könnten die Forschungsergebnisse des ZMSBw zum sicherheits- und
verteidigungspolitischen Meinungsbild in der Bundesrepublik Deutschland von den Er-
gebnissen anderer Studien zu ähnlichen Themen abweichen. Ein gutes Beispiel für die
Effekte unterschiedlicher Frageformulierungen und Antwortskalen innerhalb derselben
Studie bieten die Fragen zur Einstellung gegenüber Deutschlands internationalem Enga-
gement in Abschnitt 5 (vgl. die Abbildungen 5.2).

1.6   Soziale Erwünschtheit
Sozial erwünschtes Antworten ist eine Form der inhaltsbezogenen Verzerrung. Gemeint
ist dabei die Neigung eines Befragten im Interview, bei (sensiblen) Fragen nur vermeint-
lich akzeptierte Antworten zu geben und damit den „wahren“ Wert (also die tatsächliche
Meinung oder Merkmalsausprägung) zu verschleiern. Die Gründe für dieses Verhalten
sind vielschichtig. Sozial erwünschtes Antworten kann als Befriedigungsversuch des Be-
dürfnisses nach sozialer Anerkennung vom Befragten und demnach als Persönlichkeits-
merkmal oder aber als situationsspezifische Reaktion auf die Datenerhebung und die da-
mit verbundenen Folgen und Konsequenzen interpretiert werden. Unabhängig von den




                                          293
293

Beweggründen werden von den Befragten demzufolge Angaben im Interview gemacht,
von denen er oder sie annimmt, dass sie den sozialen Normen und Werten der Gesell-
schaft oder aber des Interviewers entsprechen. Dies kann im Interview eher unbewusst
(Selbsttäuschung) oder bewusst (Fremdtäuschung) geschehen.
Zufällige Antwortfehler der Befragten sind für die Datenqualität eher unproblematisch,
da sie in beide Richtungen um den „wahren“ Wert streuen. Antworten aber viele Befragte
sozial erwünscht, also systematisch anders als der „wahre“ Wert, sind die erhobenen Da-
ten in der Folge in eine Richtung verzerrt. Bei heiklen Fragen können daher bestimmte
sozial unerwünschte Merkmale, Einstellungen oder Verhaltensweisen für die untersuchte
Population systematisch unterschätzt werden. Wie die Umfrageforschung belegt, ist der
Effekt der sozialen Erwünschtheit aufgrund der Anwesenheit des Interviewers in münd-
lichen und vor allem in persönlichen Interviews – wie in der Bevölkerungsbefragung
2021 – am stärksten.

1.7   Repräsentativität
Der Begriff der Repräsentativität einer Umfrage oder der repräsentativen Stichprobe wird
zwar in fast allen empirischen Arbeiten verwendet, wird aber in der Umfrageforschung
stark diskutiert. Bis heute gibt es keine allgemein akzeptierte Definition, da die Markt-
und Meinungsforschung, wissenschaftliche Befragungen und amtliche Erhebungen meist
unterschiedliche Ansprüche an die Messung und dementsprechend an die Verwendung
des Begriffs haben. Allgemein gehört die Repräsentativität einer Umfrage oder Stich-
probe neben Objektivität, Validität und Reliabilität der Messung bzw. des Messvorgangs
zu den Gütekriterien der empirisch-quantitativen Forschung. Um Rückschlüsse aus einer
Stichprobe auf die Grundgesamtheit ziehen zu können, muss die Stichprobe die Grund-
gesamtheit bezüglich bestimmter relevanter Merkmale möglichst gut widerspiegeln.
Wenn die Stichprobe hinsichtlich dieser Merkmale möglichst ähnlich bzw. strukturgleich
ist, können die interessierenden Merkmale (Parameter) – zumindest annähernd – unver-
zerrt geschätzt werden. Repräsentativität ist aber eher als Zielvorgabe zu verstehen, da es
in der Praxis schwierig ist, ein exaktes Abbild der Grundgesamtheit in einer Stichprobe
zu erhalten. In der Markt- und Meinungsforschung werden meist soziodemografische
Merkmale wie Alter, Geschlecht und Bildung verwendet, um den Grad der Repräsentati-
vität zu bestimmen, weil die Verteilung dieser Merkmale in der Grundgesamtheit (durch
den Mikrozensus oder die Volkszählung) bekannt ist. Oft wird Repräsentativität als ge-
geben angesehen, wenn die Stichprobe die Grundgesamtheit bezüglich dieser festgeleg-
ten Merkmale exakt abbildet. Repräsentativ ist eine Stichprobe streng genommen aber
immer nur hinsichtlich dieser Eigenschaften oder Zielvorgaben. Da die Daten der Bevöl-
kerungsbefragung 2021 nach den Merkmalen Alter, Geschlecht, Bildung und Ortsgröße




                                           294
294

gewichtet wurden, ist die Stichprobe repräsentativ bezüglich dieser Merkmale (siehe 1.8
Gewichtung). Eigenschaften der Zielpersonen können auch nicht soziodemografische As-
pekte wie bspw. Persönlichkeitseigenschaften, Einstellungen, Motive oder Ähnliches
sein. Eine wissenschaftliche Definition des Begriffs muss aber mehr berücksichtigen, da
die Repräsentativität einer Umfrage durch verschiedenste Aspekte bestimmt oder beein-
flusst wird. Dazu zählen das Stichprobendesign (Stichprobenverfahren, Schätzmethode,
Stichprobenumfang) sowie methodische Aspekte wie Teilnahmeverweigerungen ((Unit-)
Nonresponse), Antwortausfälle (Item-Nonresponse) und Falschangaben.

1.8   Gewichtung
Die Auswahl einer Stichprobe von Befragten soll ein repräsentatives Bild der Grundge-
samtheit darstellen. Das heißt, die Befragten sollen sich ebenso zusammensetzen wie die
Gruppe aller potenziell zu Befragenden (siehe 1.2 Grundgesamtheit, 1.3 Stichprobe und
1.7 Repräsentativität). In der Praxis ist dies jedoch nicht immer passgenau der Fall. Man-
che Gruppen – etwa männliche und ältere Befragte oder solche mit höherem Bildungsni-
veau – sind typischerweise bei persönlichen Befragungen wie der Bevölkerungsbefra-
gung mit höheren Anteilen in der Stichprobe vertreten als es ihrem Anteil in der Grund-
gesamtheit aller möglichen Befragten entspricht (für die vorliegende Untersuchung die
deutschsprachige Bevölkerung Deutschlands ab 16 Jahren; vgl. aber Tabelle 3.3). Ge-
wichtungen korrigieren diese Verzerrungen von Stichproben mit dem Ziel, dass sich die
Stichprobe hinsichtlich ausgewählter Kriterien genauso zusammensetzt wie die Gesamt-
population, aus der die Stichprobe gezogen wurde. Die Korrektur von Stichprobenfehlern
konzentriert sich in der Praxis auf soziodemografische Variablen, da diese für die Ge-
samtpopulation exakt zu bestimmen sind (siehe 1.7 Repräsentativität).
In der vorliegenden Untersuchung wird die Stichprobe mittels Gewichtung unter Einbe-
ziehung von Geschlecht, Alter, Bildung und Ortsgröße korrigiert (vgl. Abschnitt 3). Dazu
gehen die Angaben jedes einzelnen Befragten entsprechend seiner sozialstrukturellen
Merkmale mit einer spezifischen Gewichtungsgröße in die Analysen ein. Durch Gewich-
tungen soll vermieden werden, dass Unter- und Überrepräsentationen von sozialstruktu-
rellen Gruppen unter den Befragten zu verzerrten Befragungsergebnissen führen.
Einschränkend ist zu berücksichtigen, dass die Verteilung der außen- und sicherheitspo-
litischen Einstellungen, die im Mittelpunkt der Bevölkerungsbefragung 2021 stehen, zu-
meist nicht bekannt ist und daher auch nicht durch Gewichtungen korrigiert werden kann.
Dennoch beeinflusst der Einsatz von Gewichten auf der Basis von soziodemografischen
Merkmalen die Verteilung der anderen, nicht in die Berechnung der Gewichtungsfaktoren
eingehenden Variablen (etwa die Verteilung von Einstellungsvariablen).




                                           295
295

2. Messung und Datenmodifikation

2.1   Reliabilität
Reliabilität ist ein Gütekriterium für Messverfahren in den Sozialwissenschaften. Relia-
bel sind wissenschaftliche Instrumente und Skalen, wenn ihre Messergebnisse reprodu-
zierbar sind, d.h., sie zeigen bei wiederholten Messungen unter den gleichen Bedingun-
gen dasselbe Ergebnis. Reliabilität ist ein zentrales Kriterium für die Zuverlässigkeit einer
Messung. Eine in der Literatur übliche und in diesem Forschungsbericht wiederholt ver-
wendete Kennzahl zur Bestimmung der Reliabilität ist Cronbachs alpha.

Cronbachs alpha
Cronbachs alpha ist ein in den Sozialwissenschaften üblicher Indikator, um die Reliabili-
tät einer Skala auszuweisen. Cronbachs alpha bestimmt die interne Konsistenz einer Skala
und berechnet, inwieweit die Variablen einer Skala miteinander zusammenhängen. Bei
der Verwendung von Cronbachs alpha wird stets von einer eindimensionalen Struktur der
Skala ausgegangen. Im Gegensatz hierzu bestimmen Faktorenanalysen (siehe 3.4 Eintrag
Faktorenanalyse) empirisch, welche Dimensionalität eine Skala aufweist, d.h., es werden
unter Umständen mehrere Dimensionen ermittelt. Cronbachs alpha kann Werte zwischen
minus unendlich und 1 annehmen. In der Literatur hat sich als Konvention etabliert, dass
ein Cronbachs alpha zwischen 0,6 oder 0,7 auf eine ausreichende Reliabilität einer Skala
verweist. Werte größer als 0,8 zeigen eine hohe, Werte größer als 0,9 eine sehr hohe Re-
liabilität an. Skalen mit einem Cronbachs alpha kleiner als 0,6 gelten als wenig reliabel.
Ihre Verwendung sollte nur bei theoretisch zwingenden Argumenten oder zu Vergleichs-
zwecken mit anderen Erhebungen erfolgen. Bei der Einordnung von Cronbachs alpha ist
zu berücksichtigen, dass diese Kennzahl abhängig von der Anzahl der berücksichtigten
Variablen ist. Je mehr Variablen in eine Skala eingehen, desto höher ist – bei sonst glei-
chen Bedingungen – der Wert von Cronbachs alpha.

2.2   Kodierung
Unter Kodierung ist die Zuweisung von Angaben und Antworten der Befragten zu be-
stimmten Variablenwerten zu verstehen (siehe 3.1 Skalenniveau). In der Praxis werden
qualitative Angaben, etwa das Geschlecht oder das Bildungsniveau der Befragten ebenso
wie deren Haltungen und Einstellungen in quantitative Angaben überführt. Als Beispiele:
Aus der Angabe des Geschlechts der Befragten wird im Datensatz die Variable Ge-
schlecht mit den Ausprägungen 0 = Mann und 1 = Frau. In der ZMSBw-Bevölkerungs-
befragung 2021 hat keiner der Teilnehmenden die Geschlechtskategorie „divers“ ausge-




                                            296
296

wählt. Ebenso werden aus der persönlichen Haltung zur Bundeswehr, die auf einer sechs-
stufigen Skala von sehr positiv bis zu sehr negativ reichen kann, die Ausprägungen: 1 =
sehr positiv, 2 = positiv, 3 = eher positiv, 4 = eher negativ, 5 = negativ und 6 = sehr
negativ. Diese Angaben werden zur besseren statistischen Handhabung und zur weiteren
Vereinheitlichung über verschiedene Variablen hinweg in folgende Werte rekodiert: 1 =
sehr positiv, 0,8 = positiv, 0,6 = eher positiv, 0,4 = eher negativ, 0,2 = negativ und 0 =
sehr negativ. Diese Transformationen von Inhalten zu Zahlen sind Voraussetzung, um
statistische Auswertungen durchzuführen.
Für die Auswertungen in diesem Forschungsbericht sind vielfältige Kodierungen durch-
geführt worden. In Kurzform finden sich Angaben zur Kodierung in der Regel in den
Anmerkungen unter den jeweiligen Tabellen oder in Fußnoten. Im Forschungsbericht
werden wiederholt Vergleiche zwischen den Haltungen verschiedener soziodemografi-
scher Gruppen bzw. nach der Wahlabsicht der Befragten durchgeführt (etwa in den Ta-
bellen 4.1 und 6.1). Die diesen Auswertungen zugrunde liegenden Kodierungen werden
nachstehend detailliert dokumentiert:
Geschlecht: Frage: Welches Geschlecht haben Sie? 1: Männlich, 2: Weiblich, 3: Divers.
Keiner der Teilnehmenden hat die Geschlechtskategorie „divers“ ausgewählt.
Rekodierung: 0: Männlich; 1: Weiblich.

Bildungsniveau: Frage: Welchen höchsten Bildungsabschluss haben Sie? 1: Hauptschul-
abschluss (Volksschulabschluss) oder Abschluss polytechnische Oberschule 8. oder 9.
Klasse, 2: Mittlere Reife, Realschulabschluss, Fachschulreife oder Abschluss polytechni-
sche Oberschule 10. Klasse, 3: Fachhochschulreife, Abschluss einer Fachoberschule, 4:
Abitur (Intervieweranweisung: allgemeine oder fachgebundene Hochschulreife), 5:
Hochschul- oder Fachhochschulabschluss, 6: Einen anderen Schulabschluss und zwar:
*OFFEN, 7: noch Schüler, 97: keinen Abschluss, 98: Weiß nicht, 99: Keine Antwort.
Rekodierung: Hauptschulabschluss: Ausprägungen 1 und 97 zusammengefasst, Real-
schulabschluss: Ausprägung 2, Hochschul- bzw. Fachhochschulreife: Ausprägungen 3
bis 5 zusammengefasst, alle anderen Ausprägungen wurden als fehlende Werte definiert.

Alter: Frage: Bitte sagen Sie mir, wie alt Sie sind.
Rekodierung: 1: 16 bis 29 Jahre, 2: 30 bis 49 Jahre, 3: 50 bis 69 Jahre, 4: 70 Jahre und
älter.

Haushaltsnettoeinkommen pro Monat: Frage: Wie hoch ist etwa das monatliche Netto-
Einkommen, das Sie alle zusammen im Haushalt haben, nach Abzug von Steuern und der



                                            297
297

Sozialversicherung? Alle Einnahmequellen zusammen genommen: In welche der folgen-
den Netto-Einkommensgruppen fällt dann Ihr Haushalt? 1: unter 500 Euro, 2: 501–1.000
Euro, 3: 1.001–2.000 Euro, 4: 2.001–3.000 Euro, 5: 3.001–4.000 Euro, 6: 4.001–5.000
Euro, 7: 5.001 oder mehr, 99: Keine Antwort.
Rekodierung: Bis 2.000 Euro: Ausprägungen 1 bis 3 zusammengefasst, 2.001 bis 4.000
Euro: Ausprägungen 4 und 5 zusammengefasst, 4.001 Euro und mehr: Ausprägungen 6
und 7 zusammengefasst, alle anderen Ausprägungen wurden als fehlende Werte definiert.

Wahlabsicht: Frage: Wenn am nächsten Sonntag Bundestagswahl wäre, welche der fol-
genden Parteien würden Sie dann wählen? 1: CDU/CSU, 2: SPD, 3: Bündnis 90/Die Grü-
nen, 4: Die Linke, 5: FDP, 6: AfD, 7: Andere Partei und zwar, 8: Keine Partei, würde
nicht wählen gehen, 97: Nicht wahlberechtigt, 98: Weiß nicht, 99: Keine Antwort.
Rekodierung: Keine Parteipräferenz, Nichtwähler: Ausprägungen 8 sowie 97 bis 99 zu-
sammengefasst, die Ausprägungen für CDU/CSU, SPD, Bündnis 90/Die Grünen, Die
Linke, FDP, AfD und andere Partei wurden beibehalten. Die Ausprägung „Andere Partei“
wird in der Regel nicht separat in den Tabellen des Forschungsberichts ausgewiesen.

Region: Interviewerangabe zum Bundesland der Befragten: 1: Schleswig-Holstein, 2:
Hamburg, 3: Niedersachsen, 4: Bremen, 5: Nordrhein-Westfalen, 6: Hessen, 7: Rhein-
land-Pfalz, 8: Baden-Württemberg, 9: Bayern, 10: Saarland, 11: Berlin, 12: Brandenburg,
13: Mecklenburg-Vorpommern, 14: Sachsen, 15: Sachsen-Anhalt, 16: Thüringen.
Rekodierung: Norddeutschland: Ausprägungen 1 bis 4 zusammengefasst, Ostdeutsch-
land: Ausprägungen 11 bis 16 zusammengefasst, Süddeutschland: Ausprägungen 8 und
9 zusammengefasst, Westdeutschland: Ausprägungen 5 bis 7 sowie 10 zusammengefasst.

Migrationshintergrund: Frage S20: Sind Sie im Gebiet des heutigen Deutschland gebo-
ren? (Intervieweranweisung: ES IST DEUTSCHLAND IN DEN GRENZEN VOM 3.
OKTOBER 1990 GEMEINT. IST JEMAND AUF EHEMALIGEM DEUTSCHEM
GEBIET GEBOREN, Z.B. IN SCHLESIEN ODER OSTPREUSSEN, BEDEUTET DAS
„NEIN, IM AUSLAND“) 1: Ja, im Gebiet des heutigen Deutschland, 2: Nein, im Aus-
land, 98: Weiß nicht, 99: Keine Antwort.
Frage S21: **Filter: WENN S20 = 2 (wenn im Ausland). Bitte sagen Sie mir, wo Sie
geboren wurden. 1: frühere deutsche Ostgebiete (z.B. Schlesien, Pommern, Ostpreußen),
2: Türkei, 3: Polen, 4: Italien, 5: Rumänien, 6: Griechenland, 7: Russland, Russische Fö-




                                          298
298

deration, ehemalige Sowjetunion (UdSSR), 8: Kroatien, Serbien, Bosnien und Herzego-
wina, Kosovo, ehemaliges Jugoslawien, 9: Österreich, 10: Schweiz, 11: Frankreich, 12:
USA, 13: Anderes Land, und zwar _____, 98: Weiß nicht, 99: Keine Antwort.
Frage S22: Wurden Ihre Eltern im Gebiet des heutigen Deutschland geboren? (Intervie-
weranweisung: ES IST DEUTSCHLAND IN DEN GRENZEN VOM 3. OKTOBER
1990 GEMEINT. IST JEMAND AUF EHEMALIGEM DEUTSCHEM GEBIET
GEBOREN, Z.B. IN SCHLESIEN ODER OSTPREUSSEN, BEDEUTET DAS „NEIN,
IM AUSLAND“.) 1: Ja, im Gebiet des heutigen Deutschland, 2: Nein, Mutter im Ausland
geboren, 3: Nein, Vater im Ausland geboren, 4: Nein, Mutter und Vater im Ausland ge-
boren, 98: Weiß nicht, 99: Keine Antwort.
Frage S23: **Filter: WENN S22 = 2, 4 (wenn im Ausland). Bitte sagen Sie mir, wo Ihre
Mutter geboren wurde. Länderliste wie bei S21.
Frage S24: **Filter: WENN S22 = 3, 4 (wenn im Ausland). Bitte sagen Sie mir, wo Ihr
Vater geboren wurde. Länderliste wie bei S21.
Rekodierung: Migrationshintergrund: 1: Wenn S20 gleich 2 und S21 ungleich 1 und S22
ungleich 1. Wenn S22 ungleich 1 und S23 ungleich 1. Wenn S22 ungleich 1 und S24
ungleich 1. 0: alle anderen Befragten. Das heißt, Befragte, die im Ausland (Ausnahme:
deutsche Ostgebiete) geboren sind oder bei denen mindestens ein Elternteil im Ausland
(Ausnahme: deutsche Ostgebiete) geboren ist, haben einen Migrationshintergrund.


3. Methoden der Datenauswertung

3.1   Skalenniveau
Das Skalenniveau ist eine Eigenschaft einer Variablen und beschreibt ihren Informations-
gehalt. Bei einer Messung werden Zahlen zu Objekten auf der Grundlage von verschie-
denen mathematischen Merkmalen zugeordnet. In der vorliegenden Befragung wurde
bspw. die Variable Geschlecht mit den Ausprägungen „männlich“, „weiblich“ und „di-
vers“ gemessen. Allen befragten Männern wurde dabei die Zahl „0“ zugeordnet, die be-
fragten Frauen wurden mit „1“ kodiert, Personen mit der Angabe „divers“ gibt es keine
im diesjährigen Datensatz. Die zugeordneten Zahlenwerte haben dabei keine empirische
Bedeutung und dienen nur der Unterscheidung der Befragten in Gruppen. Je nach Ska-
lenniveau der gemessenen Variablen sind unterschiedliche Rechenoperationen für die
Messung und die Datenanalyse zulässig (siehe 3.2 univariate Maßzahlen, 3.3 bivariate
Zusammenhangsmaße und Verfahren sowie 3.4 multivariate Verfahren).

Nominalskalen



                                          299
299

Das niedrigste Messniveau haben nominale Daten. Beim Messen werden den Objekten
(in der Bevölkerungsbefragung 2021: Befragte) Zahlen (im Interview: Merkmalsausprä-
gungen) zugeordnet. Für die unterschiedlichen Merkmalsausprägungen werden dabei be-
liebige, voneinander verschiedene Zahlen verwendet. Teilt man die Befragten – wie im
vorliegenden Bericht – nach ihrem Geschlecht auf, so erhalten alle Männer eine „0“, alle
Frauen hingegen eine „1“. Diese numerischen Skalenwerte können nur nach Kategorien
unterschieden (gleich/ungleich), nicht aber in eine bestimmte Rangfolge gebracht wer-
den. Beispiele für nominalskalierte Merkmale, die in der Befragung erhoben wurden, sind
Nationalität, Wohnort oder Parteipräferenz. Für diese Variablen können Häufigkeitsver-
teilungen berichtet werden. In der gewichteten Stichprobe dieser Umfrage sind z.B. 49
Prozent der Befragten männlich und 51 Prozent weiblich (vgl. Abschnitt 3, Tabelle 3.3).

Ordinalskalen
Im Vergleich zu nominalen Daten besitzen ordinale Daten ein höheres Skalenniveau. Wie
bei der Nominalskala können Objekte kategorisiert werden. Zusätzlich können diese Ka-
tegorien oder Merkmalsausprägungen in einer Rangfolge geordnet werden. Die Abstände
zwischen den Kategorien sind jedoch nicht gleich, daher kann man nur „Größer-kleiner“-
bzw. „Besser-schlechter“-Aussagen über die Merkmalswerte treffen. Beispiele für Merk-
male mit ordinalem Skalenniveau aus dem vorliegenden Bericht sind der Schulabschluss
und das (klassiert abgefragte) Einkommen der Befragten. Streng genommen besitzen die
meisten in dieser Umfrage gemessenen verteidigungs- und sicherheitspolitischen Einstel-
lungen, wie z.B. das Sicherheitsempfinden, die Einstellung zum außen- und sicherheits-
politischen Engagement Deutschlands oder die Einstellung zur Bundeswehr ordinales
Skalenniveau, da sie mit einer Antwortskala mit mehreren vollständig gelabelten Ant-
wortmöglichkeiten gemessen wurden (sogenannte Likert-Skala). In der Forschungspraxis
werden solche und andere ordinale Einstellungsvariablen allerdings meist als metrische
oder quasi-metrische Merkmale verwendet. Dementsprechend können dann statistische
Verfahren für dieses höhere Skalenniveau verwendet werden. So wurde bspw. für das
Sicherheitsempfinden der Befragten das arithmetische Mittel gebildet, um mithilfe statis-
tischer Tests (Mittelwerttest und Varianzanalyse) das Sicherheitsgefühl zwischen ver-
schiedenen Gruppen vergleichen (vgl. Abschnitt 4, Tabelle 4.1) oder aber mit multivari-
aten Verfahren erklären zu können (vgl. Abschnitt 4, Tabelle 4.7).




                                          300
300

Metrische Skalen
Metrische Daten haben das höchste Skalenniveau, wobei hier nach Verhältnis-, Intervall-
und Absolutskala unterschieden wird. Bei Intervallskalen können Objekte, ebenso wie
bei ordinalen Daten, kategorisiert und geordnet werden. Darüber hinaus sind die Ab-
stände der Merkmalsausprägungen (Intervalle) gleich groß. Ein Beispiel für ein Inter-
vallskalenniveau ist die Messung der Temperatur (in Grad Celsius). Im Kontrast dazu
besitzt eine Verhältnisskala zusätzlich einen natürlichen Nullpunkt (gleichbedeutend mit
der Abwesenheit des Merkmals), der es erlaubt, Aussagen über Größenverhältnisse bzw.
Differenzen zu treffen. So kann der Umsatz eines Geschäfts beispielsweise doppelt so
groß sein wie der Umsatz des Nachbarladens. Andere Beispiele einer Verhältnisskala sind
Länge, Gewicht, Sehvermögen, Einkommen (nicht wie im vorliegenden Bericht in Klas-
sen gemessen) oder das in der Befragung erfasste Alter der Befragten in Jahren. Haben
die Merkmale zusätzlich eine natürliche Maßeinheit, wie beispielsweise die Anzahl von
Kindern, so spricht man von einer Absolutskala.

3.2   Univariate Maßzahlen
Univariate Maßzahlen beziehen sich immer nur auf eine Variable bzw. ein Merkmal. Sie
beschreiben die zentrale Lage (z.B. Mittelwert) oder die Streuung (z.B. Varianz bzw.
Standardabweichung) einer Merkmalsverteilung in der Stichprobe. Neben dieser reinen
Beschreibung der Daten (deskriptive Statistik) lassen andere univariate Kennzahlen wie
der Standardfehler (Güte der Schätzung des Mittelwertes) und Konfidenzintervalle (Be-
reich von möglichen wahren Mittelwerten der Grundgesamtheit) zusätzlich Aussagen
über die Grundgesamtheit zu (Inferenzstatistik).

Lage- und Streuungsmaße
Je nach Skalenniveau (siehe 3.1 Skalenniveau) der Daten können unterschiedliche Lage-
und Streuungsmaße verwendet werden.




                                          301
301

Modus
Der Modus oder Modalwert ist der häufigste Wert bzw. die am häufigsten vorkommende
Ausprägung eines Merkmals in einer Stichprobe. Die Anwendung des Modus ist ab no-
minalem Skalenniveau, also für alle Arten von empirischen Variablen, möglich. Da der
Modus nur die häufigste Merkmalsausprägung ist, wird er nicht von ungewöhnlichen
Werten in der Stichprobe (Ausreißer oder Extremwerte) beeinflusst bzw. verzerrt. Der
Diversitätsindex als Streuungsmaß für nominale Daten beschreibt, wie stark sich die Ob-
jekte (bei der Bevölkerungsbefragung 2021 die Befragten der Stichprobe) auf die Merk-
malsausprägungen verteilen.

Median
Beim Median, auch Zentralwert genannt, werden die Daten der Rangfolge nach geordnet
und die so erzeugte Datenreihe in der Mitte geteilt. 50 Prozent der Messwerte liegen dann
über und 50 Prozent unter dem mittleren Messwert, dem Median. Bei einer geraden An-
zahl von Objekten (Befragten) wird der Mittelwert aus den beiden Datenpunkten gebildet,
die in der Mitte liegen. Durch diese Art der Berechnung ist der Median wenig von Aus-
reißern und Extremwerten beeinflusst. Er kann für Daten ab ordinalem Skalenniveau ver-
wendet werden. Die Streuung von ordinalen Daten kann durch Ranginformationen, wie
die Spannweite oder den Quartilsabstand, aufgezeigt werden. Der Quartilsabstand be-
schreibt die Differenz zwischen dem ersten Quartil (25 Prozent der Messwerte sind klei-
ner) und dem dritten Quartil (75 Prozent der Messwerte sind kleiner).

Arithmetisches Mittel/Mittelwert

Das arithmetische Mittel (meist einfach Mittelwert (𝑥𝑥̅ ) genannt) sollte streng genommen
nur bei metrischem Skalenniveau berechnet werden. Dabei wird die Summe der beobach-
teten Ausprägungen eines Merkmals (𝑥𝑥𝑖𝑖 ) durch die Anzahl der Beobachtungen (n) geteilt
(umgangssprachlich: Durchschnitt). Da alle Messwerte in die Berechnung für das arith-
metische Mittel einfließen, können Ausreißer und Extremwerte den Mittelwert verzerren.
Daher ist es wichtig, neben dem Mittelwert auch die Streuung der Werte in der Stich-
probe, also die Stichprobenverteilung, zu berücksichtigen (siehe Eintrag Standardabwei-
chung).




                                          302
302

Zur nächsten Seite