"Conversation is simply something to begin with": Methodologische Herausforderungen durch Videodaten in der qualitativen Sozialforschung am ...

Die Seite wird erstellt Leonie Reichel
 
WEITER LESEN
Zeitschrift für Soziologie 2021; 50(2): 79–95

Sarah Hitzler*, Daniela Böhringer

“Conversation is simply something to begin
with”: Methodologische Herausforderungen durch
Videodaten in der qualitativen Sozialforschung am
Beispiel der Konversationsanalyse
“Conversation is simply something to begin
with”: Methodological Challenges of Video Data in
Qualitative Research – the Case of Conversation
Analysis
https://doi.org/10.1515/zfsoz-2021-0007                                Abstract: Next to technical challenges, new forms of data
                                                                       also present theoretical and methodological challenges to
Zusammenfassung: Neue Datenformen fordern beste-
                                                                       existing qualitative approaches. The development of video
hende Forschungsansätze heraus, nicht nur technisch,
                                                                       data and the increasing ease with which it can be pro-
sondern auch theoretisch-methodologisch. Eine der tech-
                                                                       duced, stored, and edited has caused significant changes
nischen Neuerungen, die in jüngerer Zeit starke Bewegung
                                                                       in qualitative research. This article discusses central chal-
in die qualitative Forschung gebracht haben, ist die zuneh-
                                                                       lenges which arise from transcribing and analyzing these
mende Vereinfachung bei der Erstellung, Speicherung und
                                                                       ‘moving images’. These specific challenges (the pull of
Bearbeitung von Videomaterial. Der Artikel stellt zentrale
                                                                       detail, the temptations of omniscience, and too high or too
Herausforderungen im Umgang mit solchen „bewegten
                                                                       low degrees of distancing from the data) are demonstrated
Bildern“ und ihrer Transkription und Analyse dar. Diese
                                                                       by drawing on recent developments in conversation anal-
spezifischen Herausforderungen (Detaillierungssog, All-
                                                                       ysis. Conversation analysis presents one of the oldest
wissenheit und zu starke bzw. mangelnde Befremdung im
                                                                       research programs within the spectrum of qualitative
Umgang mit Datenmaterial) werden am Beispiel der Kon-
                                                                       methods. It serves well to demonstrate how ‘new’ forms
versationsanalyse herausgearbeitet. Die Konversations-
                                                                       of data affect primary methodological assumptions and
analyse stellt eines der ältesten Forschungsprogramme
                                                                       call them into question only in passing. The article argues
innerhalb des qualitativen Methodenspektrums dar. An
                                                                       that such profound challenges to methodology ought to
ihrem Beispiel lässt sich zeigen, wie stark „neue“ Daten-
                                                                       be discussed in an active way rather than gradually letting
formen auf ursprüngliche methodologische Grundannah-
                                                                       them happen.
men rückwirken und sie en passant in Frage stellen. Im
Artikel wird dafür plädiert, solche Veränderungen aktiv                Keywords: Conversation Analysis; Qualitative Social Re-
methodologisch zu diskutieren und sie nicht schleichend                search; Methodology; Video Data.
geschehen zu lassen.

Schlüsselwörter: Konversationsanalyse; qualitative
Sozial­forschung; Methodologie; Videodaten.

Anmerkung: Sacks 1985: 26

*Korrespondenzautorin: Dr. Sarah Hitzler, Universität Bielefeld,
Fakultät für Soziologie, Postfach 10 01 31, 33501 Bielefeld, E-Mail:
sarah.hitzler@uni-bielefeld.de
Dr. Daniela Böhringer, Universität Duisburg-Essen, Fakultät für
Gesellschaftswissenschaften, Forsthausweg 2, LE 528, 47057
Duisburg, E-Mail: daniela.boehringer@uni-due.de
80        Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with”

1 Einleitung1                                                       methodologische Begründung für die sozialwissenschaft-
                                                                     liche Relevanz von Erzählungen und einen Vorschlag, wie
Die qualitative Sozialforschung hat sich schon immer auf             narrative Interviews durchzuführen und wie mit ihnen
kreative Weise mit der Frage auseinandergesetzt, wie und             analytisch zu verfahren sei. Ein weiteres bedeutsames Bei-
mit Hilfe welcher Daten sich soziale Wirklichkeit einfan-            spiel für die Verschränkung von (neuen) Daten und metho-
gen, beschreiben, dokumentieren und analysieren lässt.               dischen Entwicklungen ist die Objektive Hermeneutik. So
Immer wieder geben dabei technische Entwicklungen                    verdankt die Sequenzanalyse der Objektiven Hermeneutik
Impulse von außen und irritieren damit methodologische               ihre Entstehung in den 70er Jahren in gewisser Hinsicht
Vorannahmen ebenso wie praktische Abläufe, wodurch                   der Problematik, ihren Umgang mit Daten begründen zu
sie zu Veränderungen und Weiterentwicklungen von Me-                 müssen, die bis zu jenem Zeitpunkt in der deutschsprachi-
thoden und ihren Feldern führen. Eine der technischen                gen Soziologie eher unüblich waren: nämlich Audio-Auf-
Neuerungen, die in jüngerer Zeit starke Bewegung in die              nahmen von natürlichen Interaktionen (in Familien). Im
qualitative Forschung gebracht haben, ist die zuneh-                 Forschungsprojekt „Elternhaus und Schule“, das Ulrich
mende Vereinfachung bei der Erstellung, Speicherung                  Oevermann Anfang der 70er Jahre leitete, standen solche
und Bearbeitung von Videomaterial. Vermehrter Rückgriff              Aufnahmen (Gespräche zwischen Eltern und Kindern im
auf Videoaufnahmen geht mit neuen Anforderungen an                   familiären Umfeld) zur Verfügung. In einem ersten wich-
die jeweiligen Forschungsmethoden einher. Am Beispiel                tigen Text zum Projekt schreiben die Autor_innen, dass
der Konversationsanalyse, die sehr früh und sehr umfas-              „latente Sinnstrukturen der sozialisatorischen Interaktion
send eine Wende zu Videodaten hin vollzogen hat, sollen              nur durch extensive Strukturinterpretation und Sinnaus-
in diesem Text diese methodologischen Implikationen                  legungen beobachtbarer Interaktionen sichtbar gemacht
diskutiert und sich hieraus ergebende Fragen zur Debatte             werden können.“ (Oevermann et al. 1976: 275)
gestellt werden.                                                          Somit gibt es in dieser Hinsicht gelegentlich eine be-
     Die Entwicklung von Forschungsmethoden lässt sich               eindruckende Koinzidenz von theoretischem Argument
als ein Prozess begreifen, in welchem sich methodische,              und verfügbarem neuartigem Datenmaterial. Dies war auch
theoretisch-inhaltliche und methodologische Überlegun-               in der Entstehung der Konversationsanalyse der Fall. Zum
gen mit der ganz pragmatischen Frage verflechten, welches            Zeitpunkt ihrer Entwicklung in den 60er und 70er Jahren
Datenmaterial hierfür eigentlich zur Verfügung steht. In             verknüpften sich theoretische Überlegungen aus der Eth-
der deutschsprachigen Soziologie gibt es bekannte Bei-               nomethodologie zur prozessualen Etablierung von sozia-
spiele dafür, wie sich Forschungsmethoden im Wechsel-                ler Wirklichkeit und der zufällige Zugriff auf vorliegende
spiel von theoretischen Überlegungen, Forschungsfragen               Audio-Aufzeichnungen von Telefonaten, anhand derer
und Datenerhebungsmöglichkeiten entwickelt haben. So                 diese Überlegungen sich erhärten und zu einem stabilen
beschrieb beispielsweise Fritz Schütze in den 70er Jahren            Forschungsprogramm präzisieren ließen (Schegloff 1992).
das Unbehagen über die damalige Gemeindeforschung                    Audio-Aufnahmen von natürlichen Gesprächen ermöglich-
und ihre methodischen Zugänge bei der Datenerhebung                  ten es, der inhärenten Methodizität von Interaktionen, wie
und -analyse. Dieses Unbehagen habe ihn und das For-                 sie sich in deren Verlauf zeigt, auf die Spur zu kommen:
schungsteam dazu bewogen, Gemeindepolitiker nicht
im engeren Sinne mittels Interviewleitfaden zu befragen,                  I started to work with tape-recorded conversations. Such
sondern sie zu sogenannten Stegreiferzählungen zu ani-                    materials had a single virtue, that I could replay them. (…) It
                                                                          was not from any large interest in language or from some theo-
mieren (Schütze 1976: 163). In der Folge entwickelte er eine
                                                                          retical formulation of what should be studied that I started with
                                                                          tape-recorded conversations, but simply because I could get my
                                                                          hands on it. (Sacks 1985: 26)
1 Der Text basiert auf Vorträgen, die im Rahmen des Kongresses der
Amerikanischen Gesellschaft für Soziologie (New York 2013), auf
                                                                     Ausgehend von Aufnahmen von Anrufen bei einer Selbst-
dem Kongress des International Institute for Ethnomethodology and
Conversation Analysis (Mannheim 2019) sowie der Ad-hoc-Gruppe        mord-Hotline und der Audioaufnahme einer Gruppen-
„Videoanalyse als Gesellschaftsanalyse?!“ auf dem 40. DGS-Kon-       therapiesitzung entstanden so in der Folge die ersten Ar-
gress (Berlin/online 2020) gehalten wurden. Wir haben außerdem       beiten zur situativen Ordnungsleistung von Mitgliedern
von produktiven Diskussionen mit den Mitgliedern des Kolloquiums     (zum Sprechenden-Wechsel oder zur Beendigung von Ge-
der AG Qualitative Methoden an der Universität Bielefeld und des
                                                                     sprächen), also zur Interaktion im Gespräch2.
Forschungskolloquiums Qualitative Methoden am Institut für So-
ziologie der TU Dresden sehr profitiert. Den Gutachter_innen und
Herausgeber_innen der ZfS danken wir für weitere konstruktive und
hilfreiche Hinweise.                                                 2 Jenseits der offiziell publizierten Arbeiten von Sacks, Jefferson und
Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with”        81

2 V
   ideo-Daten in einzelnen                                                 Bateson:	 If you put the damn thing on a tripod, you don’t get
                                                                                       any relevance.
  ­methodischen Ansätzen der                                                Mead:      No, you get what happened.

   qualitativen Sozialforschung                                             Bateson: It isn’t what happened.
                                                                            (Brand 1976: 9)

Neue Datenformen sind aber nicht nur ein wichtiges                      Die Art und Weise, wie Feldforschung durch Mead oder
Element in der Gründungsgeschichte von neuen For-                       andere Forscher_innen aus dem Kreis um Franz Boas be-
schungsmethoden. Sie sind auch ein Impulsgeber für die                  trieben wurde, wurde durch technische Möglichkeiten
Veränderung von etablierten Forschungsansätzen. Neben                   herausgefordert: Welcher Dokumentationsstatus sollte
der Entwicklung des Internets hatte in den letzten Jahren               der Kamera zuerkannt werden? Hat sie einen ähnlichen
insbesondere die zunehmende Vereinfachung bei der Er-                   Status wie die vielen Feldnotizen, Skizzen und Verwandt-
stellung, Speicherung und Bearbeitung von Videomaterial                 schaftsschemata, die Feldforscher_innen gewöhnlich aus
bedeutenden Einfluss auf die qualitativen Methoden. Der                 dem Feld mitbringen? Blickt man mit der Kamera, wie das
Einsatz von Videokameras in der Datengenerierung wird                   beispielsweise Mohn (2013) für eine so verstandene Ka-
zunehmend zum Regelfall in der qualitativen Sozialfor-                  meraethnographie sehr pointiert herausgearbeitet hat,
schung, sei es zur Erweiterung des Phänomenbereichs,                    und richtet sie gezielt, die Situation interpretierend, auf
sei es aus Überlegungen der Erhebung und Archivierung                   bestimmte interessante Teilaspekte einer Situation? Oder
möglichst umfassender „Kontext“-Informationen. Diese                    nimmt man an, dass die Kamera lediglich ein relativ neu-
Orientierung an Videomaterial erfordert in den jeweiligen               trales Aufzeichnungsgerät ist, das möglichst viel mitneh-
Methoden Anpassungs- und Reflexionsleistungen, die                      men soll, ohne dass der/die Forscher_in bereits bei der
einerseits innerhalb der Methodendiskurse selbst gesche-                Aufzeichnung eine Vorauswahl trifft?
hen, andererseits auch methodenübergreifend debattiert                       In allen gängigen qualitativen Forschungsmethoden,
werden3.                                                                nicht nur in der Ethnographie, sind Suchbewegungen fest-
     Davon berührt werden zunächst insbesondere prak-                   stellbar, was den Umgang mit Videodaten angeht: In der
tische Fragen, so beispielsweise im Feld Probleme der                   Objektiven Hermeneutik wird die Frage relevant, inwieweit
Positionierung und Anzahl der Kameras oder des Einstel-                 intrinsisch nicht-sprachliches Material so verschriftlicht
lungswinkels, am Schreibtisch Probleme der Bearbeitung,                 werden kann, dass es einer sequenzanalytischen Heran-
Archivierung und Transkription. Dass mit diesen vorder-                 gehensweise zugänglich wird (Corsten 2018, S. 805), oder
gründig praktischen Entscheidungen im Forschungs-                       ob es Begründungen dafür geben kann, die Datenbasis
prozess auch erkenntnistheoretische Annahmen über                       auf visuelle Elemente zu erweitern, und wie dies aussehen
die Rolle der Forscher_in verbunden sind, zeigt beispiel-               könnte (Herrle 2007). Die Grounded Theory Methodology
haft die Diskussion zwischen Margret Mead und Gregory                   diskutiert, welchen Stellenwert visuelle Elemente in der
Bateson (dokumentiert in Brand 1976). Die beiden waren,                 Analyse einnehmen sollen – als elaborierende Beigabe zu
was den Einsatz der Kamera bei ethnographischen Feld-                   Interaktionen (Konecki 2011) oder als sichtbar gewordene
studien angeht, sehr unterschiedlicher Ansicht – sollte die             „Resultate des Sozialen“ (Kautt 2017). Dietrich und Mey
Kamera als Handkamera „künstlerisch-blickend“ oder auf                  (2018) konstatieren für die Grounded Theory Methodology
einem Stativ „neutral-registrierend“ verwendet werden?                  zwar eine „verspätete Erschließung“ audiovisueller Daten
                                                                        (S. 148), gehen aber davon aus, dass die Analyse von Vi-
                                                                        deodaten in Analogie zur Textuntersuchung, wie sie sie in
Schegloff gab es aber auch schon Ansätze, sich mit Video-Daten zu       der GTM überwiegend praktiziert wird, vollzogen werden
beschäftigen. So berichtet Lynch (2019) von Seminaren zu Video-         kann. Auch die Segmentierung relevanter Abschnitte aus
Analyse, die Sacks zu Beginn der 70er Jahre an der Universität von      dem Material, für das Kodieren zentral, erscheint ihnen
Kalifornien in Irvine angeboten hat. 1975 hielten Sacks und Schegloff
                                                                        nicht schwieriger als bei textförmigem Material, wenn man
bei der American Anthropological Association einen dann später in
Gesture veröffentlichten Vortrag zur Home Position, bei dem sie auch    nur das Fokusphänomen konzentriert im Blick behält. Un-
Videomaterial vorspielten (Sacks & Schegloff 2002).                     geachtet der konstatierten unproblematisch möglichen
3 So hat sich in der DGS-Sektion „Wissenssoziologie“ eine Arbeits-      Behandlung von Videodaten mit dem Instrumentarium
gruppe zur „Visuellen Soziologie“ gebildet; am KWI in Essen ist eine    der Grounded Theory Methodology, geben Dietrich und
„Forschergruppe Visuelle Soziologie“ angesiedelt. Der Umgang mit
                                                                        Mey (2018) einem solchen empirischen Vorgehen jedoch
visuellen (nicht ausschließlich Video-) Daten wurde in den letzten
Jahren exemplarisch und methodologisch in Sammelpublikationen
                                                                        einen eigenen Namen („Grounding Visuals“). Ähnliche
verhandelt, etwa Knoblauch et al. 2006, Schnettler und Baer 2013,       Neu-Benennungen finden sich im Bereich der Ethno-
Moritz und Corsten 2018.                                                graphie, wie die schon angesprochene „Kameraethnogra-
82       Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with”

phie“ (Mohn 2013) oder die soziologische „Videographie“             annahmen dar. Wie wir im Weiteren zeigen werden, zielen
(Tuma et al. 2013).                                                 Videotranskripte auf denselben Wahrnehmungskanal wie
     Videoethnographische Ansätze, die oftmals Bezüge               Videoaufnahmen und treten damit in Konkurrenz zum
zur Ethnomethodologie herstellen, (etwa Schindler 2012;             Originaldatum, statt seine Analyse zu komplementieren.
Meyer 2018; Meier zu Verl 2018) verwenden Videodaten üb-            Darüber hinaus sind Videotranskripte notwendigerweise
licherweise zur ergänzenden Dokumentation und setzen                sowohl selektiver als auch interpretativer als Audiotran-
das im Feld erworbene Teilnehmerwissen zentral für eine             skripte, während sie gleichzeitig eine analytische Befrem-
angemessene Analyse. Videodaten bilden dabei das Kor-               dung aber erschweren. In der Konsequenz ändern sich,
rektiv für eine bloße rekonstruierende Registrierung. In            wie zu sehen sein wird, der Umgang mit den Daten, die
Übereinstimmung mit Hirschauers (2001) Argument, das                Identifikation von Fokusphänomenen und deren Analyse
Soziale sei zunächst „schweigsam“ und die Leistung der              grundlegend.
Forschenden liege wesentlich darin, es zum Sprechen zu
bringen, verlässt sich die Ethnographie nicht auf die Aus-
sagekraft von Videos, sondern setzt für deren Analyse und
Interpretation die kontextualisierte Verstehensleistung
                                                                    3 Der ‚Video Turn‘ der
des/der Forschenden voraus.                                            Konversationsanalyse
     Klare methodologische Positionierungen, die die Af-
fordanzen von Videodaten kritisch unter die Lupe neh­               Die Entwicklung der Konversationsanalyse (KA) in den
men, kommen jedoch insgesamt eher selten vor, während               60er und 70er Jahren wurde als Forschungsansatz durch
die Fülle von Studien auf der Basis von Videomaterial               zentrale theoretische und soziologiekritische Argumente
stetig zunimmt. Die Methodik dieser Studien scheint sich            der Ethnomethodologie geprägt (Garfinkel 1967). Außer-
oftmals an der technischen Bewältigbarkeit des Materials            dem profitierte sie von den empirischen und programma-
zu orientieren.                                                     tischen Arbeiten Goffmans, die die Interaktionsordnung
     Das qualitative Methodenspektrum ist vielfältig und            damals als einen eigenen Gegenstand auf der soziologi-
die theoretischen Vorannahmen unterschiedlich, der Ver­             schen Forschungsagenda etablierten. Vor allem in den
such einer Bestimmung der konkreten Herausforderung                 ersten konversationsanalytischen Studien kann man die
von Videodaten für die qualitative Sozialforschung er­              Goffmansche Frage hinter der technischen Sprache, die
scheint uns daher wenig zielführend. Wir möchten die                darin vorherrscht, noch deutlich erkennen: Welche Pro-
besonderen Herausforderungen, die sich durch diesen                 bleme haben Mitglieder aufgrund der Tatsache, dass sie
„neuen“ Datentyp für ein bestehendes Forschungs­                    sich begegnen (z. B. die Organisation des Sprechenden-
pro­gramm ergeben, vielmehr für einen bestimmten                    wechsels) und wie lösen sie diese (Bergmann 1981)?
Forschungs­ansatz erläutern. Die Konversationsanalyse                    In ihrer Beantwortung dieser Frage schlugen Konver-
erscheint uns dafür besonders instruktiv, weil sie, wie             sationsanalytiker_innen allerdings einen anderen Weg
weiter unten zu sehen sein wird, schon sehr früh und sehr           ein als Goffman. Es ging und geht ihnen weniger um das
umfassend eine Wende von reinen Audio-Aufnahmen von                 Selbst und seine Etablierung beziehungsweise Bedrohung
Gesprächen hin zu Videodaten vollzogen hat. In diesem               in der direkten Begegnung mit anderen. Sie folgten eher
Forschungsbereich gibt es außerdem wie in kaum einem                der ethnomethodologischen Argumentation Garfinkels
anderen qualitativen Ansatz eine Vielfalt von Forschungs-           und konzentrieren sich auf soziale Wirklichkeit als ein
ergebnissen, die auf Video-Aufzeichnungen beruhen,                  reziprok und im zeitlichen Handeln situiert hergestelltes
technologische Entwicklungen und Transkriptionskon-                 Produkt von Gesellschaftsmitgliedern. Für die KA stehen
ventionen, die bei der Handhabung dieser spezifischen               weder das forschende noch das beforschte Subjekt und
Datenform helfen sollen und eben jahrzehntelange Er-                deren Intentionen im Mittelpunkt, sondern etwas Drittes,
fahrung im analytischen Umgang mit „bewegten“ Bildern.              eine Struktur auf Zeit, die sich in der Interaktion heraus-
     Wir möchten zunächst einige methodologische                    bildet und nur dort besteht. Die Interaktion zwischen
Grund­annahmen der Konversationsanalyse skizzieren,                 Mitgliedern erfolgt methodisch und ist daher für andere –
die sich aus ihrer engen Verbundenheit mit der Ethno-               auch für Forschende – erkennbar und deutbar. Diese Me-
methodologie ergeben, welche sich auch in der gemein-               thodizität der Interaktion trägt weit; sie ist ebenso kontext-
samen Publikationstätigkeit ihrer beiden Protagonisten              frei wie kontextadaptiv (Sacks, Schegloff & Jefferson 1974:
Harold Garfinkel und Harvey Sacks (für einen histori-               699) und versetzt Mitglieder in die Lage, ihre alltäglichen
schen Überblick: Lynch 2019) ausgedrückt hat. Video-                Angelegenheiten in Begegnungen zu regeln. Der zentrale
daten stellen eine Herausforderung für diese Grund-                 Forschungsgegenstand der KA liegt also in der Frage, wie
Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with”      83

Mitglieder die Wirklichkeit, von der sie annehmen, dass        schaft wünschte (obwohl die damalige Analysepraxis
sie Gültigkeit hat, im zeitlichen Verlauf herstellen, mit      wohl eher darin bestand, Tonbänder abzuhören). Das Be-
welchen Problemen sie dabei konfrontiert werden und            sondere an den Audioaufnahmen, mit denen er arbeitete,
welche methodischen Lösungen sich zeigen.                      war für Sacks, dass er ein empirisches Datum zur Hand
     Die gemeinschaftliche Herstellung von sozialem Sinn       hatte, das sich wiederholt, in immer der gleichen Form
und Ordnung wird als in situ und über den zeitlichen           abspielen lässt und das man anderen vorlegen kann. Dass
Verlauf von in sich geordneten Sequenzen (Rawls 2008)          diese Daten keine vollständigen Abbilder von Situationen
begriffen. Mitglieder nutzen die sequenzielle Positio-         boten, erschien Sacks für seine analytischen Zwecke un-
nierung von eigenen oder fremden Handlungszügen als            problematisch: „The tape-recorded materials constituted
zentrale Ressource, um Bedeutung und Verständigung             a ‘good enough’ record of what happened. Other things, to
fortlaufend herzustellen. Nur ein Beispiel hierfür bildet      be sure, happened, but at least what was on the tape has
die sogenannte „next-turn proof procedure“ (Hutchby &          happened“ (Sacks 1985: 26). Neben dem Hörbaren wenn
Wooffitt 2008), anhand derer die Bedeutung einer Äuße-         möglich auch das Sichtbare auf Band zu konservieren ent-
rung über die Reaktion darauf, nämlich den darauffolgen-       sprach wiederum völlig dem Anspruch, möglichst unver-
den Zug, abgelesen und überprüft wird. Um diese Sequen-        fälschte Abbildungen sozialer Analysen zur Grundlage
zialität in der Analyse nachvollziehen zu können, muss sie     sozialer Analysen zu machen4. Zunehmend jedoch lässt
im Prozess der Datenerhebung, also bei der Aufnahme von        sich an der Entwicklung des konversationsanalytischen
Interaktionen und Situationen, aufrechterhalten werden.        Diskurses beobachten, dass die Entscheidung für Audio-
     Eben weil das Soziale in sich bereits geordnet ist,       oder Video-Daten methodologische Implikationen mit
braucht es auch keine „besonderen“ Arrangements für            einiger Reichweite mit sich bringt.
Aufnahmen, wie das beispielsweise in Laborstudien der               Die aktuelle Diskussion um den Umgang mit Video-
Fall ist. Die verwendeten Daten sind vielmehr Video- oder      daten in der Konversationsanalyse, die gegenwärtig stark
Audio-Aufnahmen von Situationen, die sich so auch ereig-       durch zwei ihr eng verwandte Methoden mitgeprägt wird,
net haben könnten, ohne dass Forscher_innen anwesend           geht darauf noch zu wenig ein. So versteht sich die multi-
gewesen wären oder daran Interesse gezeigt hätten (Potter      modale Gesprächsforschung als konsequente Fortführung
2002). Im Zuge der Datenerhebung und in der weiteren           der Konversationsanalyse (Mondada & Schmitt 2010),
Behandlung (Transkription und Analyse) der Daten wird          welche bislang (auch aus praktischen Gründen) vernach-
davon ausgegangen, dass auch scheinbar unbedeutende            lässigte Modalitäten der Bedeutungsproduktion egalitär
Details im Gesamtgeschehen ihren Platz haben und von           berücksichtigen möchte und damit das Primat des Sprach-
Mitgliedern methodisch eingesetzt und als methodisch           lichen als durch technische Affordanzen verzerrte Schwer-
wahrgenommen werden.                                           punktsetzung zurückweist. In sehr präzisen und kleintei-
     Die ersten konversationsanalytischen Arbeiten zur         ligen Analysen arbeitet sie heraus, wie soziale Phänomene
Interaktion im Gespräch entstanden auf der Basis von           im Zusammenspiel verschiedener Modalitäten hergestellt
Audio-Aufnahmen, und es bildeten sich präzise metho-           werden. Dabei verfolgt sie unter anderem das Ziel, „die Re-
dische Vorgehensweisen im Umgang mit solchen dyna-             flexion und Modifikation konversationsanalytischer Kon-
mischen und vielschichtigen Daten (insbesondere setzte         zepte anzuleiten“ (Schmitt 2005: 26), also insbesondere
Gail Jefferson Standards bei der Transkription, die bis        bereits etablierte Konzepte der Konversationsanalyse auf
heute gelten). Hiermit ging eine langjährige Fokussierung      ihre multimodale Tragfähigkeit hin zu untersuchen und
der Konversationsanalyse auf sprachliche Phänomene             gegebenenfalls auszudifferenzieren. In den letzten Jahren
einher, was auch zu einer intensiven Rezeption ihrer Ein-      hat dieses Forschungsprogramm sehr stark an Einfluss
sichten in Teilen der Linguistik führte. Dennoch war von       gewonnen und seine Interessensgebiete zunehmend auf
Anfang an klar, dass sich Mitglieder nicht nur sprachlich
verständlich machen, sondern sich selbst in Begegnun-
gen ganz und gar und in strukturierter, nachvollziehbarer      4 Ein wichtiger Hinweis dazu, der sich direkt an die Protagonist_
Weise zur Verfügung stellen.                                   innen der Konversationsanalyse richtete, kam schon von Erving
     Deshalb erschien die Hinzunahme einer weiteren            Goffman (1981: 143). Goffman betont dort am Beispiel von zwei Auto-
Datenebene – des Visuellen – zunächst nur folgerichtig.        mechanikern, die gemeinsam an einem Auto arbeiten, dass der Kon-
                                                               text für eine Äußerung nicht immer eine vorangegangene Äußerung
Untermauert wurde der Wunsch, möglichst reichhaltige
                                                               ist, sondern möglicherweise auch ein angereichtes Werkzeug, dessen
Daten zur Verfügung zu haben, durch einige methodo-            Erhalt mit „danke“ quittiert wird. Wie man mit Dingen Worte macht,
logische Äußerungen von Harvey Sacks (1985), der sich          kann also genauso wichtig sein und wird durch Audio-Aufnahmen
die Soziologie dezidiert als eine beobachtende Wissen-         allein natürlich nicht aufgezeichnet.
84         Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with”

durch die klassische Konversationsanalyse weitgehend                       Dass man es bei Videodaten mit einem besonderen
unbeachtete Phänomene wie etwa Nutzung von räumli-                    Datentyp zu tun hat, wird dabei in beiden Ansätzen durch­
chen Gegebenheiten oder die Verfügbarmachung von sen-                 aus diskutiert. Heath, Hindmarsh und Luff (2010) geben
sorischen Wahrnehmungen ausgeweitet. Methodologisch                   etwa in ihrem Enführungswerk in einem eigenen Kapitel
befasst es sich vornehmlich mit Fragen der angemessenen               Hinweise dazu, wie man Videodaten für die Veröffent-
Transkription (Mondada 2016; Greco et al. 2019). Wie                  lichung und die Diskussion mit Fachkolleg_innen präpa-
Schmitt in seinem programmatischen Text 2006 bereits                  rieren, aufbereiten und damit zugänglich machen sollte.
vorhersieht, führt die starke Relevantsetzung des Zusam-              Auch Mondada diskutiert die vielen situierten Entschei-
menspiels aller Modalitäten vornehmlich zur Analyse sehr              dungen, die bei der Generierung von Videodaten getroffen
kleiner Phänomene, wohingegen Fragen nach der kontex-                 werden müssen, und schließt, dass diese Daten demnach
tualisierten, sozialen Bedeutung interaktiver Ordnungs-               reflexive und praktische Hervorbringungsleistungen sind,
leistungen in den Hintergrund rücken.                                 mithin vielleicht eher rekonstruierende als registrierende
     Die ethnomethodologische Interaktionsanalyse, wie                Konserven, und dass dieser Einfluss in das Material ein-
sie vom Lehn (2018a) in der Tradition von Heath, Hind-                geschrieben ist und analytisch berücksichtigt werden muss
marsh und Luff (Luff & Heath 2012; Heath & Hindmarsh                  (Mondada 2006).6
2002; Heath & Luff 1992) und Goodwin (Goodwin 1994,                        Es scheint zwischen diesen Ansätzen aber Einigkeit zu
2018) ausgerufen hat, fokussiert mit dem Einsatz von                  bestehen, dass eine erkenntnisreiche Analyse von Inter-
Videodaten auf die interaktive Ordnungsleistung von Mit-              aktionen am Einsatz von Videodaten nicht mehr vorbei-
gliedern. Auch sie begreift sich als Ergänzung oder auch              kommt. Das Verhältnis dieser Daten zum ursprünglichen
umfassendere Alternative zur Konversationsanalyse mit                 Erkenntnisinteresse der Konversationsanalyse gerät dabei
Daten, die es ermöglichen, „visuelle, körperliche und ma-             ebenso aus dem Blick wie die Reflexion über die Auswir-
teriale Handlungen mit der Analyse von Gesprächen zu                  kungen einer solchen Reorientierung auf die Analysepra-
verknüpfen.“ (vom Lehn 2018b: 190) Der Fokus liegt hier               xis. Im Folgenden werden wir erörtern, welche alten und
allerdings darauf, solche Interaktionen analysierbar zu               neuen methodologischen Probleme demgegenüber durch
machen, die nicht vornehmlich sprachlich verfasst sind,               den Wunsch und die technischen Möglichkeiten, soziale
sondern eine geteilte Bedeutung etwa über die Manipu-                 Situationen möglichst umfassend „einzufangen“, quasi en
lation von Dingen herstellen. So entstehen zunehmend                  passant entstehen. Denn mit der zunehmenden Nutzung
Studien, die sich mit sozialen Situationen befassen, in               von Video-Aufzeichnungen und -Transkriptionen stehen
welchen Sprechen eine untergeordnete Rolle spielt (bspw.              unserer Auffassung nach nicht nur einfach reichhaltigere
Meyer & Wedelstaedt 2013 zur Koordination von Boxer                   Daten („mehr vom Selben“) zur Verfügung, sondern auch
und Trainer im Ring oder Marstrand & Svennevig 2018                   ein grundsätzlich anderer Datentypus. Dies hat grund-
zu Berührungen im Pflegekontext). Während vom Lehn                    legende Auswirkungen auf alle Phasen des konversations-
in Anlehnung an die wegweisenden Arbeiten von Heath                   analytischen Forschungsprozesses.
eher die Vorzüge von Videodaten und ihre Reichhaltigkeit
herausstellt, weil sie eben auch verkörperte Details von
Interaktion zur Verfügung stellen, weisen beispielsweise
Smith (2020) oder Mair et al. (2012), die einen stärker
                                                                      4 Erhebung und Aufbereitung von
ethnographischen Hintergrund besitzen und Videodaten                     Videodaten
als Beobachtungen ergänzendes Material betrachten,
darauf hin, dass gerade die Detailliertheit von Videodaten            Dass in der KA lange Zeit davon ausgegangen wurde, dass
eine Herausforderung für die ethnomethodologische For-                Interaktion weitgehend sprachlich verfasst ist, und dass
schung darstellt5.                                                    diese sprachliche Ebene zum Verständnis der Herstellung
                                                                      der sozialen Situation in der Mehrzahl der Situationen
                                                                      völlig ausreichend sei, schlug sich in der Logik der ver-
                                                                      wendeten, sprachbasierten Transkripte nieder. Gelegent-
5 Zunehmend gerät auch der Körper als Forschungsgegenstand und
Forschungsinstrument in den Fokus (Nevile 2015 spricht vom „embo-
died turn“), was einerseits die Notwendigkeit von Videodaten unter-
streicht, andererseits auch deren Begrenztheit hervorhebt, da sie     6 Die zahlreichen digitalen Hilfsmittel zur Transkription und Auf-
körperliche Erfahrungen nicht angemessen dokumentieren können,        bereitung von Videodaten geben ebenfalls Hinweise darauf, dass der
und so die Diskussion von ethnographischem Wissen zusätzlich re-      analytische Umgang mit Videodaten eine ganz praktische Heraus-
levant macht.                                                         forderung darstellt.
Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with”   85

lich wurde dennoch auch die sogenannte nonverbale                      sprachlichen Beiträgen (etwa Goodwin 1994). Die komple-
Kommunikation mit einbezogen, welche Phänomenberei-                    xen Analysen, die solche Studien präsentierten, schärften
che wie Mimik, Gestik, Proxemik und Blickkontakt um-                   das Bewusstsein dafür, dass eine präanalytische Ausson-
fasste (frühe Überlegungen etwa durch Philips 1976 oder                derung von nicht-relevanten ‚sichtbaren‘ Phänomenen
Burgoon 1980). Ob und auf welche Weise derartige Phäno-                nicht verlustlos möglich ist, sondern dass „there is order
mene in die Transkription und Analyse einflossen, folgte               at all points“ (Sacks 1992: 22) eben auch und ebenso sehr
in der KA im Groben Schegloffs Prinzip der „procedural                 für die nicht-verbalen Handlungen von Interagierenden
consequentiality“ (Schegloff 1992), also der Maxime, dass              gilt.
soziale Tatsachen nur dann von Relevanz für die lokale                       Wie Ayaß (2015) nachzeichnet, haben sich diese Ent-
Situation sind, wenn sich analytisch nachzeichnen lässt,               wicklungen methodologisch vor allem in Debatten über
dass sie von den Beteiligten relevant gemacht werden.                  angemessene Transkription niedergeschlagen. Die dabei
Hatte man also den Eindruck, dass ein bestimmter Blick                 diskutierten Varianten reichen vom additiven Transkript,
oder eine bestimmte Geste für das analysierte Gespräch                 in welchem einzelne Beobachtungen der zeitlichen Struk-
von Bedeutung waren, wurden diese mit in die Analyse                   tur beigeordnet werden, die sich durch die Verschriftli-
aufgenommen. Die ersten Transkripte, die nonverbale                    chung des Verbalen ergibt, bis hin zum multimodalen
Kommunikation mit aufführten, waren somit tendenziell                  Transkript, in welchem verschiedene Ebenen sozialen
eklektisch. Die Anführung nonverbaler Elemente diente                  Handelns in Partiturschreibweise aufeinander bezogen
im Allgemeinen vor allem der Unterstützung oder der                    werden. Aber auch mit Formen der Visualisierung wird
Desambiguierung der verbalen Elemente und folgten                      experimentiert, wie etwa fokussierten Zeichnungen mit
demnach, wie Ayaß (2015) formuliert, einer „additiven“                 Pfeilverweisen, Comics mit Sprechblasen oder komplexen
Logik.                                                                 überlappenden Bildfolgen, die es ermöglichen, Bewe-
     Das Gesprächsanalytische Transkriptionssystem                     gungsabläufe darzustellen. An dieser Vielfalt und den mit
GAT, das 1998 durch Gesprächsforscher_innen aus der                    ihr einhergehenden methodologischen Entscheidungen
Linguistik und Soziologie entwickelt wurde, um ein auf                 lässt sich deutlich erkennen, so Ayaß, dass Transkripte
die Eigenheiten der deutschen Sprache angepasstes Äqui-                in der Konversationsanalyse keine objektiven Ausgangs-
valent zum im englischen Sprachraum vorherrschenden                    daten darstellen, sondern dass schon die Erstellung eines
‚Jeffersonian system‘ bereitzustellen und so die unüber-               Transkripts durch das eigene Erkenntnisinteresse und die
sichtliche Diversität von Darstellungskonventionen etwas               eigenen Hypothesen geleitet ist; Transkripte sind demnach
einzuhegen, weist, ganz in diesem Geist, für die Tran-                 immer bereits epistemische Objekte.
skription von „nicht-lautlichen, sichtbaren Anteilen der                     Mit der zunehmenden Selbstverständlichkeit von Vi­
Kommunikation“ an:                                                     deo­material und damit zunehmenden Erfahrungen mit
                                                                       der materialen Technik und ihren Eigenheiten gerieten
    Sichtbares Handeln wird immer dann transkribiert, wenn es in       neben Fragen nach einer angemessenen Transkription
    bedeutsamer Weise zur Eindeutigkeit – oder auch zur Unein-         insbesondere Fragen nach der angemessenen Erhebung
    deutigkeit – anderer Aktivitätsebenen (wie etwa gesprochener
                                                                       in den Vordergrund. Die Entdeckung der Reichhaltigkeit
    Äußerungen) beiträgt. So sind beispielsweise Blickrichtung und
    Körperorientierung vor allem dort von Bedeutung, wo die Ko­
                                                                       visueller Interaktionsphänomene ging gleichzeitig mit
    orien­tierung der Beteiligten und die Koordinierung ihres Han-     der frustrierenden Erkenntnis einher, dass auch Videoauf-
    delns für die gemeinsame Aktivität erforderlich ist. (Selting et   nahmen immer nur Ausschnitte einer sozialen Situation
    al. 1998: 25–26)                                                   einfangen können – dass Personen aus dem Bild laufen
                                                                       können, Kameras gegebenenfalls die Inhalte von durch
Ayaß (2015: 512) spricht bei diesen Transkriptionsformen               die Beteiligten bearbeiteten Dokumenten nicht erfassen
von einem Logozentrismus, der unhinterfragt davon                      oder Blicke sich auf Dinge oder Gegebenheiten richten,
ausgeht, dass soziale Situationen zuallererst sprachlich               die vom Kameraausschnitt nicht erfasst sind. Methodolo-
strukturiert sind, und dass sämtliche weiteren Informa-                gische Debatten bezogen und beziehen sich demnach aus-
tionen dieser Ebene höchstens sinnhaft beigeordnet sind.               führlich auf konkrete Fragen nach dem passenden Fokus,
    Der Zugriff auf Videoaufnahmen ermöglichte es je­                  der Positionierung der Kamera im Raum oder der Anzahl
doch, zunehmend auch solche Phänomene in den Blick                     von Kameras (Luff & Heath 2012; Heath, Hindmarsh &
zu nehmen, die eben nicht vornehmlich sprachlich ver-                  Luff 2010). Zunehmend wird die Frage nach „Big Video“
fasst sind. Charles Goodwin gehörte zu den ersten, die                 gestellt, die der Vision folgt, eine weitgehend perfekte Ver-
in sozialen Situationen Körpern, Dingen und räumlicher                 doppelung der zu untersuchenden Situation herzustellen,
Organisation ebenso viel Aufmerksamkeit schenkte wie                   die aber, ganz den konversationsanalytischen Prämissen
86         Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with”

der Aufhebung sozialer Flüchtigkeit (Bergmann 1985)                       nung“, wie Simmel sie nennt, als solche nicht mehr wahr-
folgend, verlangsamt, gedreht und gewendet werden                         genommen werden kann. Bergmann vermutet, dass diese
kann. Hierzu wird in sehr kreativer und technisch höchst                  Gefahr darin begründet liegt, dass die registrierende
beeindruckender Form mit dem Zusammenspiel verschie-                      Konservierung zwar die Zeitlichkeit einer Situation zu
dener Kameratypen (360°-Kameras, Drohnen) sowie der                       bewahren vermag, diese aber genau hierdurch einer zen-
Aufstellung mehrerer Kameras und Mikrophone experi-                       tralen Eigenheit, nämlich ihrer Flüchtigkeit beraubt; Mit-
mentiert, was seinen vorläufigen Kulminationspunkt in                     glieder sind aber in der Situation selbst mit genau dieser
einem virtuellen dreidimensionalen Raum gefunden hat,                     Flüchtigkeit, der Unwiederbringlichkeit der aufeinander-
in dem sich die Forscherin nicht nur immersiv bewegen,                    folgenden Details der reziproken Herstellung der Situa-
sondern auch direkte Annotationen an den Phänomenen                       tion konfrontiert, ihre lokale Analyse kann demnach die
selbst vornehmen kann (McIlvenny 2019). Die Lust am Vi-                   zeitmanipulative Perspektive der Analyse ex post niemals
suellen ist ungebrochen, und zunehmend herrscht in der                    einnehmen. Simmel folgend sei demnach in der soziologi-
Community die Ansicht vor, dass Daten, die die visuelle                   schen Analyse darauf zu achten, dass die „Kontinuität des
Ebene nicht berücksichtigen, im Grunde für eine aussage-                  realen Geschehens“ nicht „auf der Strecke bleibt“ (Berg-
kräftige Analyse nicht mehr ausreichen.                                   mann 1985: 316).
                                                                               Der Sog des ‚Trichters des inneren Sinnhorizonts‘
                                                                          gewinnt in der Auseinandersetzung mit Videodaten noch

5 A
   nalytischer Umgang mit Video-                                         einmal an mehr Tiefe. Die potentiell zu beschreibenden
                                                                          Phänomene umfassen verschiedenste Kanäle: unter-
  Daten: Alte Probleme in neuer                                           schiedlichste körperliche Ausdrucksformen wie Mimik,

  Prägnanz                                                                Gestik, Körperhaltung, die Positionierung im Raum, die
                                                                          Manipulation von Dingen, Berührungen und Blickkontakt
                                                                          können alle als prinzipiell situativ geordnet und aufeinan-
5.1 Detaillierungssog                                                    der bezogen wahrgenommen (und müssen daher grund-
                                                                          sätzlich analytisch ernstgenommen) werden. Die kleintei-
Schon 1985 diskutiert Bergmann Risiken, die sich aus zwei                 lige Verflochtenheit all dieser Elemente nachzuvollziehen,
der oben skizzierten zentralen konversationsanalytischen                  erfordert eine Präzision und Tiefe des Blicks, die zu einer
Vorannahmen ergeben. In der Befolgung strenger An-                        zunehmenden Zersplitterung der Phänomene führt. In
nahmen von Sequenzialität und ubiquitärer immanenter                      diesem Anstieg des analytischen Aufwandes und des
Ordnung (Sacks 1992) entsteht für Konversationsanalyti-                   Aufwandes bei der Transkription werden die beobacht-
ker_innen ein gewisser Sog, der geordnete Zusammen-                       baren, beschreibbaren Phänomene zunehmend kleiner.
hänge im immer noch Kleineren entdecken lässt:                            Es besteht die Gefahr, dass Sacks’ Maxime „take it that
                                                                          there is order at all points“ nicht mehr nur als ein Hinweis
     [D]er Interpret [kann] mit diesen methodischen Postulaten in         verstanden wird, Details nicht vorschnell als irrelevant
     einen Strudel der Detaillierung geraten […], der ihn in den immer
                                                                          auszuschließen, sondern eher als Aufforderung, diese
     enger werdenden Trichter des inneren Sinnhorizonts einer Äu-
     ßerung hinunterzieht. Die Forderung, sich in seiner Arbeit von       Ordnung auf allen Ebenen der Detaillierung auch nach-
     der Maxime „Order at all points“ leiten zu lassen bzw. für „jedes    zuweisen. Die technischen Möglichkeiten dafür gibt es.
     Element des Textes“ eine Motivierungslinie zu explizieren,           Liegt aber der Fokus darauf, der Geordnetheit bis ins letzte
     öffnet den Blick des Interpreten für die Details des registrierten   nachzuspüren, wird es zunehmend schwierig, darüber
     Geschehens, ohne jedoch eine untere Detaillierungsgrenze fest-
                                                                          hinaus im Blick zu behalten, welche Probleme hier durch
     zuschreiben. So kann im Prinzip an jedem „Punkt“, an jedem
     Textelement der zergliedernde Blick erneut ansetzen, um auf
                                                                          die Interagierenden eigentlich gelöst werden.
     einem bis dahin in der Interpretation übersprungenen, noch
     feineren Detaillierungsniveau die Suche nach einer bislang ver-
     borgenen Geordnetheit bzw. Motivierungslinie aufzunehmen.            5.2 Verlockungen der Allwissenheit
     (Bergmann 1985: 315f.)

                                                                          Vor dem Hintergrund, dass konversationsanalytische Ar-
In Anlehnung an Simmel (1916) argumentiert Bergmann,                      beiten den Anspruch haben, als „primitive Wissenschaft“
dass diese „Atomisierungstendenz“ letztlich zu einer                      (Lynch & Bogen 1994; Lynch 2000; Sacks 1992; Sacks 1985)
Gefahr für das Verstehen der zu analysierenden Abläufe                    die materiale Grundlage ihrer Erkenntnisprozesse offen-
werden kann; die Zergliederung einer Situation in zu                      zulegen und dadurch nachvollziehbar zu machen, galt
kleine einzelne Elemente führt dazu, dass die „Erschei-                   und gilt das aufgezeichnete und transkribierte Datenmate-
Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with”         87

rial als einzig zulässige Basis für die Analyse7. Ihm wird              situation vollständig und in Gänze einzufangen, wo nötig
ein quasi-objektiver Status zugeschrieben, in dem Sinne,                und möglich mit der Unterstützung weiterer technischer
als diese epistemischen Objekte unter Wissenschaft-                     Geräte. Die Verwendung mehrerer Mikrofone sichert
ler_innen herumgereicht und -gezeigt werden können.                     eine möglichst gute Tonqualität gesprochener Beiträge.
Mochten die Aufnahmen auch punktuell nicht vollständig                  Kameras fokussieren auf Bildschirme und Artefakte,
sein, so war doch grundsätzlich klar, dass alles, was auf-              wodurch Analysierenden schließlich besserer und präzi-
gezeichnet worden war, sich auf diese Weise ereignet hatte              serer Zugriff darauf eröffnet wird, als ihn (einige) Teilneh-
(Sacks 1992). Alle zusätzlichen Informationen über die zu               mende selbst haben.
analysierende Situation, etwa ethnographische Notizen                        In der KA mehren sich inzwischen allerdings mah-
oder Hintergrundinformationen, konnten nicht mit der                    nende Stimmen, bei der Analyse nicht zu vergessen, dass
gleichen Überzeugung miteinbezogen werden. Begrün-                      Teilnehmende diese allwissende Perspektive nicht haben
dungen für Aussagen über Daten müssten stets „from the                  und auch nicht haben müssen. Mit Blick auf konversati-
data themselves“ kommen, schrieben Schegloff und Sacks                  onsanalytische Studien im Kontext von Online-Begegnun-
bereits in einem der ersten konversationsanalytischen                   gen, die sich mit sehr ähnlichen methodologischen Fragen
Aufsätze (1973). Während bei Analysen von Telefongesprä-                befassen müssen, wie sie hier aufgeworfen werden,
chen, die die ersten Daten der Konversationsanalyse dar-                warnen etwa Arminen et al. (2016) davor, der Zugänglich-
stellten, die Frage, was denn zu den „Daten“ gehöre, eini-              keit von umfassenden und detailreichen Daten nicht die
germaßen einfach zu beantworten war (nämlich alles, was                 Teilnehmerperspektive zu opfern:
von beiden Gesprächsbeteiligten wahrgenommen werden
konnte, also die Wortbeiträge), stellte sich mit der Analyse                Caution should be preserved not to confuse the analysis of the
                                                                            situated interactional achievement with data on issues that have
kopräsenter Interaktionen recht bald die Frage, ob die Be-
                                                                            not been accessible to the participants studied and not to alien-
schränkung des Analysierbaren auf das Aufgezeichnete                        ate the researcher from the members’ social realities. That is,
nicht möglicherweise eine deutliche Verzerrung der ge-                      the analyst must take into account the limitations in the data
meinsam hergestellten Situation darstelle.                                  available for participants in action. (Arminen et al. 2016: 304)
     Die Hinzunahme von Videomaterial ermöglichte es,
die analytische Rigidität aufrechtzuerhalten und dabei                  Die Verlockung, erhobene Details in die Analyse einfließen
dennoch Ebenen der gemeinschaftlichen Herstellung von                   zu lassen, ohne zu überprüfen, inwieweit sie tatsächlich
Sinn zu beachten, die sich nicht notwendig sprachlich                   situiert und in der Begegnung für die Beteiligten eine Rolle
manifestierten und so eine breitere Datenbasis zu erhal-                spielen, ist groß. Damit wäre zwar grundsätzlich der For-
ten. Gleichzeitig wurde jedoch offenbar, dass mit der Hin-              derung entsprochen, aus „the data themselves“ heraus zu
zunahme von Videoaufnahmen zwar die beobachtbaren                       argumentieren – diese jedoch bilden möglicherweise weit
Phänomene ausgeweitet wurden, gleichzeitig aber immer                   mehr ab, als tatsächlich für die Interaktion von R  ­ elevanz
auch weitere Phänomene im Dunklen blieben – sei es aus                  ist und können vorschnell zur Begründung von Beobach-
zu schlechter Bildqualität (ist das wirklich ein Lächeln?),             tungen herangezogen werden („Die Lehrerin hat sich um-
sei es aufgrund der gewählten Kameraposition, sei es auf-               gedreht, weil eine Schülerin in der letzten Reihe geniest
grund eines multifokalen Settings, das mit einer einzigen               hat“). Schegloffs Forderung, die „procedural consequen-
Kamera in seiner Komplexität nicht eingefangen werden                   tiality“ von Phänomenen für den weiteren Fortgang der In-
konnte. Die konsequente Reaktion auf diese Erkenntnis                   teraktion stets im Blick zu behalten, wird so auf neue Weise
bestand darin, durch die Hinzunahme weiterer und ver-                   relevant. Und dann wäre eben die relevante Frage: Kann
schiedener Kameras die Daten weiter anzudichten. Zu-                    das Niesen einer Schülerin von einer Lehrerin, die etwas
nehmend besteht der Standard darin, eine Interaktions-                  an die Tafel schreibt, als Anlass benutzt werden, um sich
                                                                        ermahnend zur Klasse umzudrehen? Ist es in diesem Sinne
                                                                        relevant für den weiteren Fortgang der Unterrichtsinter-
7 Auch wenn die KA sich einer positivistischen Sprache bedient,
so bleibt sie ihren ethnomethodologischen Wurzeln in gewisser           aktion? Oder: Kann man aus der Tatsache, dass sie sich
Hinsicht treu, weil sie sich immer noch an konkreten, situativen        nicht umdreht, schließen, dass sie es nicht gehört hat?
Phänomenen abarbeitet, daran, wie Mitglieder etwas hier und jetzt            Wie man es auch dreht und wendet, es braucht ein
(und nicht abstrakt in einem Modell) machen. Entscheidend sind          praktikables Kriterium, um mit Video-Daten umzugehen,
die rohen Daten, die alles enthalten, um für „masters of natural
                                                                        die tendenziell „alles“ einfangen, was in einer umgrenz-
language“(Lynch 2000: 529) verständlich zu sein: „Scientific training
should not be necessary for hearing what speakers say in an ordinary
                                                                        ten Situation (Goffman) vor sich geht und die den Ana-
conversation, recognizing what sort of action is being accomplished     lysierenden eine fast allwissende Perspektive ermöglichen
and explicating how it is accomplished.” (ebd).                         (vgl. auch Bergmann 1985: 314).
88        Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with”

     An diesem Punkt mag es sinnvoll sein, auf eine Grund-           6 Neue Probleme im Umgang
überlegung zurück zu kommen, auf welcher die Konver-
sationsanalyse aufruht. Eine zentrale These in Garfin-
                                                                        mit Videodaten in der
kels Überlegungen betrifft die unheilbare Indexikalität                 Konversationsanalyse
praktischer Handlungen: die Tatsache, dass alles soziale
Handeln kontextualisiert ist und nicht vollständig dekon-
                                                                     6.1 Schwierigkeiten der Befremdung
textualisiert beschrieben oder verstanden werden kann
(Garfinkel 1967: 4ff.). Die „Unheilbarkeit“ dieser Indexika-
                                                                     Wie Bergmann in seinem zumindest für die deutsch-
lität – die Unmöglichkeit, zweifelsfrei und vollständig zu
                                                                     sprachige Konversationsanalyse sehr einflussreichen me-
beschreiben, was eine beliebige Handlung oder Äußerung
                                                                     thodologischen Aufsatz „Flüchtigkeit und methodische
tatsächlich bedeutet – bearbeiten Mitglieder nach Garfin-
                                                                     Fixierung sozialer Wirklichkeit“ aufgezeigt hat, bieten
kel über eine Hinnahme spezifischer Vagheit. Bergmann
                                                                     Transkripte für die qualitative Forschung die Möglichkeit,
fasst pointiert zusammen:
                                                                     soziale Situationen, die üblicherweise ausschließlich in
     Genau dadurch, dass die Gesprächspartner sich vage und ab-      der ihnen eigenen Zeitlichkeit und dem damit verknüpften
     wartend ausdrücken und sich mit tentativen Interpretationen     Verstehensdruck zugänglich sind, dieser Flüchtigkeit zu
     begnügen, also Sinninhalte gerade nicht fixieren (und zwar      entheben und sie damit aus einer gewissen Distanz heraus
     weder als Sprecher noch als Hörer), wissen sie, worüber sie     zu betrachten (Bergmann 1985). Sie dienen damit in erheb-
     sprechen. (Bergmann 1988, SE 1: 39f.)
                                                                     lichem Maße der „Befremdung“, wie sie auch Amann &
                                                                     Hirschauer (1997) propagieren, wenn diese auch betonen,
Interaktionsbeteiligte haben demnach in der Situation
                                                                     dass diese ebenso eine Leistung des_r geschulten ethno-
selbst weder vollständigen Zugriff auf alle relevanten
                                                                     graphischen Beobachtenden sein kann. Die Forscherin
Kontexte, noch benötigen sie diesen. Die Interpretationen
                                                                     wird aus ihrem unmittelbaren, alltagsweltlichen Ver-
der Situation der einzelnen Beteiligten sind keinesfalls
                                                                     ständnis der Situation herausgerissen. Durch die Verlang-
deckungsgleich und müssen es auch nicht sein. Was in der
                                                                     samung und Abstraktion wird das Geschehen in seiner
gemeinsam hergestellten Situation relevant ist und was
                                                                     aufwendigen, reziproken Konstruktion sichtbar, während
es bedeutet, wird in der reziproken, sequenziellen Inter-
                                                                     die technische Registrierung gleichzeitig dafür sorgt, dass
aktion ausgehandelt, unter großzügigen Annahmen, dass
                                                                     es (auf „naive“ Weise, Bergmann 1985: 301) durch dieses
das, was das Gegenüber einbringt, schon seine Richtigkeit
                                                                     Verstehen unverändert, wiederholt zugänglich, anderen
haben wird. Intersubjektivität muss verstanden werden
                                                                     zeigbar bleibt. Bei der Transkription von Videodaten ge-
als lokale Verstehensfiktion für alle praktischen Zwecke
                                                                     schieht diese Befremdungsleistung, wie im Folgenden zu
(„for all practical purposes“, Garfinkel 1967: vii). Demnach
                                                                     zeigen ist, zugleich zu stark und in zu geringem Umfang.
findet sich das, worum es in dieser Situation geht, nicht
                                                                          Während im Zuge des Visual/Video Turn nahelag,
unbedingt in den vielen Facetten des Sichtbaren und Auf-
                                                                     Videodaten auf dieselbe Weise wie Audiodaten in eine
zeichenbaren. Es findet sich im wechselseitigen Bezug der
                                                                     weiter fixierte Form zu überführen, stieß die Konver-
Mitglieder aufeinander und in deren vorläufiger Einigung.
                                                                     sationsanalyse, wie oben beschrieben, bald auf große
So wenig, wie die Mitglieder zweifelsfrei wissen und ver-
                                                                     Herausforderungen. Die Kodifizierung von Transkriptions-
stehen können, worum es eigentlich geht, können Ana-
                                                                     notationen für Videodaten gelangte schnell an Grenzen,
lysierende sich dies über noch präzisere Beschreibung der
                                                                     wie sich etwa daran erkennen ließ, dass die verbesserte
Situation erschließen. Insoweit die soziale Bedeutung der
                                                                     Neuauflage des Gesprächsanalytischen Transkriptions-
Situation eine praktische Aushandlungsleistung der an
                                                                     systems, GAT2, ursprünglich einen Abschnitt zur Tran-
ihr Beteiligten ist, muss sich jegliche Analyse hieran aus-
                                                                     skription von Videodaten enthalten sollte, ein Vorhaben,
richten.
                                                                     das jedoch schließlich aufgegeben wurde8. Zwar hat sich
                                                                     im Kontext der Multimodalen Gesprächsanalyse ein recht
                                                                     stabiles Notationssystem etabliert, dieses scheint jedoch
                                                                     von anderen Zugängen nicht übernommen zu werden. An-
                                                                     dererseits lassen sich in der Gemeinschaft weiter intensive

                                                                     8 Die angekündigte Revision der Notationen „visueller Komponen-
                                                                     ten“, wie sie im ursprünglichen Konzept vorgeschlagen wurde (Sel-
                                                                     ting et al. 2009: 382), wurde nicht umgesetzt.
Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with”       89

Suchbewegungen beobachten, etwa am Sonderheft Repre-                      miotische Korrespondenz zunutze, indem sie die Bedeu-
senting data in video-based studies der im Jahr 2018 neu                  tungsebene der Schrift beibehalten, dieser aber weitere
gegründeten Online-Zeitschrift „Social Interaction. Vi-                   Zeichen zuordnen, die der lautlichen, kontextualisierten
deo-Based Studies of Human Sociality“. Die Herausgeber                    Darbietung entsprechen sollen, vgl. etwa GAT2:
skizzieren in ihrer Einleitung das positivistische Dilemma
der Konversationsanalyse, ohne aber einen Ausweg zu                           Die Transkription erfolgt in literarischer Umschrift und ori-
                                                                              entiert sich an der Orthographie, d. h. einer genormten Um-
präsentieren:
                                                                              setzung der Lautsegmente in die Schrift. … Sprechsprachliche
                                                                              Realisierungen, die der Bezugsnorm entsprechen, werden der
    There is evidently no such thing as a perfect representation (…).         Standardsprache entsprechend verschriftlicht, d. h. also nicht
    But the aspiration has nevertheless always been to get closer to          eigens notiert. (Selting et al. 2009: 360)
    the “reality” by using new technologies, systems and methods
    for representation. Obviously, a slice of positivism is inherent in
    this aspiration. However, no matter what kind of sophisticated
                                                                          Die linguistische Unschärfe, die durch den weitgehenden
    technological setup we can apply and no matter how accurate           Verzicht auf phonetische Umschrift entsteht, wird für die
    the annotation system gets, we are always dealing with interpre-      dadurch gewonnene unmittelbare semantische Zugäng-
    tations. (Mortensen & Due 2019)                                       lichkeit in Kauf genommen. Audiotranskripte ordnen also
                                                                          einem bereits existierenden, stark konventionalisierten
Das Sonderheft versammelt unterschiedliche Zugänge zur                    Zeichensystem einige wenige zusätzliche Zeichen zu, die
Repräsentation von visuellen Daten, die einen Einblick in                 wiederum ebenfalls recht stark konventionalisiert sind.
die unterschiedlichen Lösungen geben sollen, welche For-                  Sie ermöglichen so eine klare Distanzierung und Befrem-
schende mit Blick auf die Frage „what embodied actions to                 dung durch eine ungewöhnliche, ausgebaute Darstellungs-
include in the transcription and how“ (Mortensen & Due                    weise; gleichzeitig bewahren sie die Integrität des in der
2019) entwickelt haben. Weitestgehend unreflektiert (aber                 Originalsituation hergestellten koproduzierten seman-
s. Ayaß 2015) bleibt jedoch die Frage, weshalb Videotran-                 tischen Sinns, indem sie diesen weitgehend verlustlos
skription eigentlich eine so hohe Diversität an Lösungen                  übertragen (trans-skribieren). Die Transkripte bieten, wie
hervorbringt – anders als Audiotranskription, bei deren                   von Bergmann (1985) beschrieben, gegenüber der Origi-
Konventionalisierung es im Wesentlichen lediglich darum                   nalaufnahme eine Aufhebung der Flüchtigkeit und eine
ging, sich auf eine einheitliche Notationsform etwa für                   Distanzierung zum Geschehen, gleichzeitig bleibt der un-
Pausen oder Betonung zu einigen, nicht aber darum, ob                     mittelbar zugängliche Sinn jedoch weitgehend bewahrt.
Pausen und Betonungen angemessene Phänomene der                           Die reduzierte Anzahl und stark konventionalisierte Form
Transkription und Analyse waren. Dieser Frage wollen wir                  zusätzlicher Darstellungsregeln ermöglichen es geübten
im Folgenden nachgehen.                                                   Analytiker_innen, Audiotranskripte ähnlich flüssig zu ver-
                                                                          arbeiten, wie etwa Musiker_innen in der Lage sind, Noten
                                                                          zu lesen. Audiotranskripte, die entlang der in der KA übli-
6.2 Die Eigenheiten der Videotranskription                               chen Systematiken erstellt wurden, haben einen mittleren
                                                                          Verfremdungsgrad, der Analytiker_innen aus ihrer „trans-
Audiotranskripte beruhen in ihrer Beschaffenheit wesent-                  formierenden Rekonstruktionspraxis“ des Alltags (Berg-
lich auf einem kulturell anerkannten, höchst differenzier-                mann 1985: 310) zwar herausreißt, es ihnen aber immer
ten Zeichensystem: auf der Schrift. Schrift wiederum ist                  noch ermöglicht nachzuvollziehen, um was es geht und
dadurch gekennzeichnet, dass sie eine enge (im Deut-                      wie dieses Faktum in der Interaktion prozedural entsteht.
schen: phonetische) Korrespondenz mit der zugrundelie-                         Sollen nun neben sprachlichen (plus parasprach-
genden Sprache aufweist (Chao 1968). Dass diese Korres-                   lichen) auch visuelle Komponenten im Transkript erfasst
pondenz nicht vollständig, sondern in vielen Bereichen                    werden, erhöht sich die Komplexität des Produkts massiv.
konventionalisiert ist, fällt im Alltag im Allgemeinen nicht              Ayaß stellt in ihrer Diskussion um den epistemischen
ins Gewicht: lesend nehmen wir geschriebene Wörter auf                    Status von Transkripten für die Konversationsanalyse fest:
eine Weise als bedeutungstragend wahr, die ihren ge-                      „In transcribing audiovisual material, the time spent on
sprochenen Äquivalenten entspricht. Unabhängig von                        the type of work does not simply increase; it explodes.“
der Darbietung nehmen wir Hund, Hund, Hund zunächst                       (Ayaß 2015: 515) Dies liegt daran, dass ‚das Visuelle‘ nicht
als Zeichen für das Konzept [Hund] wahr, ebenso wie wir                   auf gleiche Weise eingrenzbar ist wie ‚das Sprachliche‘.
das Konzept [Hund] unabhängig davon erkennen, ob es                       Es umfasst grundsätzlich alles, was auf der Kameraein-
laut gesprochen, geflüstert oder besonders nasal hervor-                  stellung zu sehen ist – beispielsweise räumliche Organi-
gebracht wird. Sprachtranskripte machen sich diese se-                    sation, Gesten, Körperhaltung, Berührungen, Mimik, Be-
Sie können auch lesen