"Conversation is simply something to begin with": Methodologische Herausforderungen durch Videodaten in der qualitativen Sozialforschung am ...
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Zeitschrift für Soziologie 2021; 50(2): 79–95 Sarah Hitzler*, Daniela Böhringer “Conversation is simply something to begin with”: Methodologische Herausforderungen durch Videodaten in der qualitativen Sozialforschung am Beispiel der Konversationsanalyse “Conversation is simply something to begin with”: Methodological Challenges of Video Data in Qualitative Research – the Case of Conversation Analysis https://doi.org/10.1515/zfsoz-2021-0007 Abstract: Next to technical challenges, new forms of data also present theoretical and methodological challenges to Zusammenfassung: Neue Datenformen fordern beste- existing qualitative approaches. The development of video hende Forschungsansätze heraus, nicht nur technisch, data and the increasing ease with which it can be pro- sondern auch theoretisch-methodologisch. Eine der tech- duced, stored, and edited has caused significant changes nischen Neuerungen, die in jüngerer Zeit starke Bewegung in qualitative research. This article discusses central chal- in die qualitative Forschung gebracht haben, ist die zuneh- lenges which arise from transcribing and analyzing these mende Vereinfachung bei der Erstellung, Speicherung und ‘moving images’. These specific challenges (the pull of Bearbeitung von Videomaterial. Der Artikel stellt zentrale detail, the temptations of omniscience, and too high or too Herausforderungen im Umgang mit solchen „bewegten low degrees of distancing from the data) are demonstrated Bildern“ und ihrer Transkription und Analyse dar. Diese by drawing on recent developments in conversation anal- spezifischen Herausforderungen (Detaillierungssog, All- ysis. Conversation analysis presents one of the oldest wissenheit und zu starke bzw. mangelnde Befremdung im research programs within the spectrum of qualitative Umgang mit Datenmaterial) werden am Beispiel der Kon- methods. It serves well to demonstrate how ‘new’ forms versationsanalyse herausgearbeitet. Die Konversations- of data affect primary methodological assumptions and analyse stellt eines der ältesten Forschungsprogramme call them into question only in passing. The article argues innerhalb des qualitativen Methodenspektrums dar. An that such profound challenges to methodology ought to ihrem Beispiel lässt sich zeigen, wie stark „neue“ Daten- be discussed in an active way rather than gradually letting formen auf ursprüngliche methodologische Grundannah- them happen. men rückwirken und sie en passant in Frage stellen. Im Artikel wird dafür plädiert, solche Veränderungen aktiv Keywords: Conversation Analysis; Qualitative Social Re- methodologisch zu diskutieren und sie nicht schleichend search; Methodology; Video Data. geschehen zu lassen. Schlüsselwörter: Konversationsanalyse; qualitative Sozialforschung; Methodologie; Videodaten. Anmerkung: Sacks 1985: 26 *Korrespondenzautorin: Dr. Sarah Hitzler, Universität Bielefeld, Fakultät für Soziologie, Postfach 10 01 31, 33501 Bielefeld, E-Mail: sarah.hitzler@uni-bielefeld.de Dr. Daniela Böhringer, Universität Duisburg-Essen, Fakultät für Gesellschaftswissenschaften, Forsthausweg 2, LE 528, 47057 Duisburg, E-Mail: daniela.boehringer@uni-due.de
80 Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with” 1 Einleitung1 methodologische Begründung für die sozialwissenschaft- liche Relevanz von Erzählungen und einen Vorschlag, wie Die qualitative Sozialforschung hat sich schon immer auf narrative Interviews durchzuführen und wie mit ihnen kreative Weise mit der Frage auseinandergesetzt, wie und analytisch zu verfahren sei. Ein weiteres bedeutsames Bei- mit Hilfe welcher Daten sich soziale Wirklichkeit einfan- spiel für die Verschränkung von (neuen) Daten und metho- gen, beschreiben, dokumentieren und analysieren lässt. dischen Entwicklungen ist die Objektive Hermeneutik. So Immer wieder geben dabei technische Entwicklungen verdankt die Sequenzanalyse der Objektiven Hermeneutik Impulse von außen und irritieren damit methodologische ihre Entstehung in den 70er Jahren in gewisser Hinsicht Vorannahmen ebenso wie praktische Abläufe, wodurch der Problematik, ihren Umgang mit Daten begründen zu sie zu Veränderungen und Weiterentwicklungen von Me- müssen, die bis zu jenem Zeitpunkt in der deutschsprachi- thoden und ihren Feldern führen. Eine der technischen gen Soziologie eher unüblich waren: nämlich Audio-Auf- Neuerungen, die in jüngerer Zeit starke Bewegung in die nahmen von natürlichen Interaktionen (in Familien). Im qualitative Forschung gebracht haben, ist die zuneh- Forschungsprojekt „Elternhaus und Schule“, das Ulrich mende Vereinfachung bei der Erstellung, Speicherung Oevermann Anfang der 70er Jahre leitete, standen solche und Bearbeitung von Videomaterial. Vermehrter Rückgriff Aufnahmen (Gespräche zwischen Eltern und Kindern im auf Videoaufnahmen geht mit neuen Anforderungen an familiären Umfeld) zur Verfügung. In einem ersten wich- die jeweiligen Forschungsmethoden einher. Am Beispiel tigen Text zum Projekt schreiben die Autor_innen, dass der Konversationsanalyse, die sehr früh und sehr umfas- „latente Sinnstrukturen der sozialisatorischen Interaktion send eine Wende zu Videodaten hin vollzogen hat, sollen nur durch extensive Strukturinterpretation und Sinnaus- in diesem Text diese methodologischen Implikationen legungen beobachtbarer Interaktionen sichtbar gemacht diskutiert und sich hieraus ergebende Fragen zur Debatte werden können.“ (Oevermann et al. 1976: 275) gestellt werden. Somit gibt es in dieser Hinsicht gelegentlich eine be- Die Entwicklung von Forschungsmethoden lässt sich eindruckende Koinzidenz von theoretischem Argument als ein Prozess begreifen, in welchem sich methodische, und verfügbarem neuartigem Datenmaterial. Dies war auch theoretisch-inhaltliche und methodologische Überlegun- in der Entstehung der Konversationsanalyse der Fall. Zum gen mit der ganz pragmatischen Frage verflechten, welches Zeitpunkt ihrer Entwicklung in den 60er und 70er Jahren Datenmaterial hierfür eigentlich zur Verfügung steht. In verknüpften sich theoretische Überlegungen aus der Eth- der deutschsprachigen Soziologie gibt es bekannte Bei- nomethodologie zur prozessualen Etablierung von sozia- spiele dafür, wie sich Forschungsmethoden im Wechsel- ler Wirklichkeit und der zufällige Zugriff auf vorliegende spiel von theoretischen Überlegungen, Forschungsfragen Audio-Aufzeichnungen von Telefonaten, anhand derer und Datenerhebungsmöglichkeiten entwickelt haben. So diese Überlegungen sich erhärten und zu einem stabilen beschrieb beispielsweise Fritz Schütze in den 70er Jahren Forschungsprogramm präzisieren ließen (Schegloff 1992). das Unbehagen über die damalige Gemeindeforschung Audio-Aufnahmen von natürlichen Gesprächen ermöglich- und ihre methodischen Zugänge bei der Datenerhebung ten es, der inhärenten Methodizität von Interaktionen, wie und -analyse. Dieses Unbehagen habe ihn und das For- sie sich in deren Verlauf zeigt, auf die Spur zu kommen: schungsteam dazu bewogen, Gemeindepolitiker nicht im engeren Sinne mittels Interviewleitfaden zu befragen, I started to work with tape-recorded conversations. Such sondern sie zu sogenannten Stegreiferzählungen zu ani- materials had a single virtue, that I could replay them. (…) It was not from any large interest in language or from some theo- mieren (Schütze 1976: 163). In der Folge entwickelte er eine retical formulation of what should be studied that I started with tape-recorded conversations, but simply because I could get my hands on it. (Sacks 1985: 26) 1 Der Text basiert auf Vorträgen, die im Rahmen des Kongresses der Amerikanischen Gesellschaft für Soziologie (New York 2013), auf Ausgehend von Aufnahmen von Anrufen bei einer Selbst- dem Kongress des International Institute for Ethnomethodology and Conversation Analysis (Mannheim 2019) sowie der Ad-hoc-Gruppe mord-Hotline und der Audioaufnahme einer Gruppen- „Videoanalyse als Gesellschaftsanalyse?!“ auf dem 40. DGS-Kon- therapiesitzung entstanden so in der Folge die ersten Ar- gress (Berlin/online 2020) gehalten wurden. Wir haben außerdem beiten zur situativen Ordnungsleistung von Mitgliedern von produktiven Diskussionen mit den Mitgliedern des Kolloquiums (zum Sprechenden-Wechsel oder zur Beendigung von Ge- der AG Qualitative Methoden an der Universität Bielefeld und des sprächen), also zur Interaktion im Gespräch2. Forschungskolloquiums Qualitative Methoden am Institut für So- ziologie der TU Dresden sehr profitiert. Den Gutachter_innen und Herausgeber_innen der ZfS danken wir für weitere konstruktive und hilfreiche Hinweise. 2 Jenseits der offiziell publizierten Arbeiten von Sacks, Jefferson und
Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with” 81 2 V ideo-Daten in einzelnen Bateson: If you put the damn thing on a tripod, you don’t get any relevance. methodischen Ansätzen der Mead: No, you get what happened. qualitativen Sozialforschung Bateson: It isn’t what happened. (Brand 1976: 9) Neue Datenformen sind aber nicht nur ein wichtiges Die Art und Weise, wie Feldforschung durch Mead oder Element in der Gründungsgeschichte von neuen For- andere Forscher_innen aus dem Kreis um Franz Boas be- schungsmethoden. Sie sind auch ein Impulsgeber für die trieben wurde, wurde durch technische Möglichkeiten Veränderung von etablierten Forschungsansätzen. Neben herausgefordert: Welcher Dokumentationsstatus sollte der Entwicklung des Internets hatte in den letzten Jahren der Kamera zuerkannt werden? Hat sie einen ähnlichen insbesondere die zunehmende Vereinfachung bei der Er- Status wie die vielen Feldnotizen, Skizzen und Verwandt- stellung, Speicherung und Bearbeitung von Videomaterial schaftsschemata, die Feldforscher_innen gewöhnlich aus bedeutenden Einfluss auf die qualitativen Methoden. Der dem Feld mitbringen? Blickt man mit der Kamera, wie das Einsatz von Videokameras in der Datengenerierung wird beispielsweise Mohn (2013) für eine so verstandene Ka- zunehmend zum Regelfall in der qualitativen Sozialfor- meraethnographie sehr pointiert herausgearbeitet hat, schung, sei es zur Erweiterung des Phänomenbereichs, und richtet sie gezielt, die Situation interpretierend, auf sei es aus Überlegungen der Erhebung und Archivierung bestimmte interessante Teilaspekte einer Situation? Oder möglichst umfassender „Kontext“-Informationen. Diese nimmt man an, dass die Kamera lediglich ein relativ neu- Orientierung an Videomaterial erfordert in den jeweiligen trales Aufzeichnungsgerät ist, das möglichst viel mitneh- Methoden Anpassungs- und Reflexionsleistungen, die men soll, ohne dass der/die Forscher_in bereits bei der einerseits innerhalb der Methodendiskurse selbst gesche- Aufzeichnung eine Vorauswahl trifft? hen, andererseits auch methodenübergreifend debattiert In allen gängigen qualitativen Forschungsmethoden, werden3. nicht nur in der Ethnographie, sind Suchbewegungen fest- Davon berührt werden zunächst insbesondere prak- stellbar, was den Umgang mit Videodaten angeht: In der tische Fragen, so beispielsweise im Feld Probleme der Objektiven Hermeneutik wird die Frage relevant, inwieweit Positionierung und Anzahl der Kameras oder des Einstel- intrinsisch nicht-sprachliches Material so verschriftlicht lungswinkels, am Schreibtisch Probleme der Bearbeitung, werden kann, dass es einer sequenzanalytischen Heran- Archivierung und Transkription. Dass mit diesen vorder- gehensweise zugänglich wird (Corsten 2018, S. 805), oder gründig praktischen Entscheidungen im Forschungs- ob es Begründungen dafür geben kann, die Datenbasis prozess auch erkenntnistheoretische Annahmen über auf visuelle Elemente zu erweitern, und wie dies aussehen die Rolle der Forscher_in verbunden sind, zeigt beispiel- könnte (Herrle 2007). Die Grounded Theory Methodology haft die Diskussion zwischen Margret Mead und Gregory diskutiert, welchen Stellenwert visuelle Elemente in der Bateson (dokumentiert in Brand 1976). Die beiden waren, Analyse einnehmen sollen – als elaborierende Beigabe zu was den Einsatz der Kamera bei ethnographischen Feld- Interaktionen (Konecki 2011) oder als sichtbar gewordene studien angeht, sehr unterschiedlicher Ansicht – sollte die „Resultate des Sozialen“ (Kautt 2017). Dietrich und Mey Kamera als Handkamera „künstlerisch-blickend“ oder auf (2018) konstatieren für die Grounded Theory Methodology einem Stativ „neutral-registrierend“ verwendet werden? zwar eine „verspätete Erschließung“ audiovisueller Daten (S. 148), gehen aber davon aus, dass die Analyse von Vi- deodaten in Analogie zur Textuntersuchung, wie sie sie in Schegloff gab es aber auch schon Ansätze, sich mit Video-Daten zu der GTM überwiegend praktiziert wird, vollzogen werden beschäftigen. So berichtet Lynch (2019) von Seminaren zu Video- kann. Auch die Segmentierung relevanter Abschnitte aus Analyse, die Sacks zu Beginn der 70er Jahre an der Universität von dem Material, für das Kodieren zentral, erscheint ihnen Kalifornien in Irvine angeboten hat. 1975 hielten Sacks und Schegloff nicht schwieriger als bei textförmigem Material, wenn man bei der American Anthropological Association einen dann später in Gesture veröffentlichten Vortrag zur Home Position, bei dem sie auch nur das Fokusphänomen konzentriert im Blick behält. Un- Videomaterial vorspielten (Sacks & Schegloff 2002). geachtet der konstatierten unproblematisch möglichen 3 So hat sich in der DGS-Sektion „Wissenssoziologie“ eine Arbeits- Behandlung von Videodaten mit dem Instrumentarium gruppe zur „Visuellen Soziologie“ gebildet; am KWI in Essen ist eine der Grounded Theory Methodology, geben Dietrich und „Forschergruppe Visuelle Soziologie“ angesiedelt. Der Umgang mit Mey (2018) einem solchen empirischen Vorgehen jedoch visuellen (nicht ausschließlich Video-) Daten wurde in den letzten Jahren exemplarisch und methodologisch in Sammelpublikationen einen eigenen Namen („Grounding Visuals“). Ähnliche verhandelt, etwa Knoblauch et al. 2006, Schnettler und Baer 2013, Neu-Benennungen finden sich im Bereich der Ethno- Moritz und Corsten 2018. graphie, wie die schon angesprochene „Kameraethnogra-
82 Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with” phie“ (Mohn 2013) oder die soziologische „Videographie“ annahmen dar. Wie wir im Weiteren zeigen werden, zielen (Tuma et al. 2013). Videotranskripte auf denselben Wahrnehmungskanal wie Videoethnographische Ansätze, die oftmals Bezüge Videoaufnahmen und treten damit in Konkurrenz zum zur Ethnomethodologie herstellen, (etwa Schindler 2012; Originaldatum, statt seine Analyse zu komplementieren. Meyer 2018; Meier zu Verl 2018) verwenden Videodaten üb- Darüber hinaus sind Videotranskripte notwendigerweise licherweise zur ergänzenden Dokumentation und setzen sowohl selektiver als auch interpretativer als Audiotran- das im Feld erworbene Teilnehmerwissen zentral für eine skripte, während sie gleichzeitig eine analytische Befrem- angemessene Analyse. Videodaten bilden dabei das Kor- dung aber erschweren. In der Konsequenz ändern sich, rektiv für eine bloße rekonstruierende Registrierung. In wie zu sehen sein wird, der Umgang mit den Daten, die Übereinstimmung mit Hirschauers (2001) Argument, das Identifikation von Fokusphänomenen und deren Analyse Soziale sei zunächst „schweigsam“ und die Leistung der grundlegend. Forschenden liege wesentlich darin, es zum Sprechen zu bringen, verlässt sich die Ethnographie nicht auf die Aus- sagekraft von Videos, sondern setzt für deren Analyse und Interpretation die kontextualisierte Verstehensleistung 3 Der ‚Video Turn‘ der des/der Forschenden voraus. Konversationsanalyse Klare methodologische Positionierungen, die die Af- fordanzen von Videodaten kritisch unter die Lupe neh Die Entwicklung der Konversationsanalyse (KA) in den men, kommen jedoch insgesamt eher selten vor, während 60er und 70er Jahren wurde als Forschungsansatz durch die Fülle von Studien auf der Basis von Videomaterial zentrale theoretische und soziologiekritische Argumente stetig zunimmt. Die Methodik dieser Studien scheint sich der Ethnomethodologie geprägt (Garfinkel 1967). Außer- oftmals an der technischen Bewältigbarkeit des Materials dem profitierte sie von den empirischen und programma- zu orientieren. tischen Arbeiten Goffmans, die die Interaktionsordnung Das qualitative Methodenspektrum ist vielfältig und damals als einen eigenen Gegenstand auf der soziologi- die theoretischen Vorannahmen unterschiedlich, der Ver schen Forschungsagenda etablierten. Vor allem in den such einer Bestimmung der konkreten Herausforderung ersten konversationsanalytischen Studien kann man die von Videodaten für die qualitative Sozialforschung er Goffmansche Frage hinter der technischen Sprache, die scheint uns daher wenig zielführend. Wir möchten die darin vorherrscht, noch deutlich erkennen: Welche Pro- besonderen Herausforderungen, die sich durch diesen bleme haben Mitglieder aufgrund der Tatsache, dass sie „neuen“ Datentyp für ein bestehendes Forschungs sich begegnen (z. B. die Organisation des Sprechenden- programm ergeben, vielmehr für einen bestimmten wechsels) und wie lösen sie diese (Bergmann 1981)? Forschungsansatz erläutern. Die Konversationsanalyse In ihrer Beantwortung dieser Frage schlugen Konver- erscheint uns dafür besonders instruktiv, weil sie, wie sationsanalytiker_innen allerdings einen anderen Weg weiter unten zu sehen sein wird, schon sehr früh und sehr ein als Goffman. Es ging und geht ihnen weniger um das umfassend eine Wende von reinen Audio-Aufnahmen von Selbst und seine Etablierung beziehungsweise Bedrohung Gesprächen hin zu Videodaten vollzogen hat. In diesem in der direkten Begegnung mit anderen. Sie folgten eher Forschungsbereich gibt es außerdem wie in kaum einem der ethnomethodologischen Argumentation Garfinkels anderen qualitativen Ansatz eine Vielfalt von Forschungs- und konzentrieren sich auf soziale Wirklichkeit als ein ergebnissen, die auf Video-Aufzeichnungen beruhen, reziprok und im zeitlichen Handeln situiert hergestelltes technologische Entwicklungen und Transkriptionskon- Produkt von Gesellschaftsmitgliedern. Für die KA stehen ventionen, die bei der Handhabung dieser spezifischen weder das forschende noch das beforschte Subjekt und Datenform helfen sollen und eben jahrzehntelange Er- deren Intentionen im Mittelpunkt, sondern etwas Drittes, fahrung im analytischen Umgang mit „bewegten“ Bildern. eine Struktur auf Zeit, die sich in der Interaktion heraus- Wir möchten zunächst einige methodologische bildet und nur dort besteht. Die Interaktion zwischen Grundannahmen der Konversationsanalyse skizzieren, Mitgliedern erfolgt methodisch und ist daher für andere – die sich aus ihrer engen Verbundenheit mit der Ethno- auch für Forschende – erkennbar und deutbar. Diese Me- methodologie ergeben, welche sich auch in der gemein- thodizität der Interaktion trägt weit; sie ist ebenso kontext- samen Publikationstätigkeit ihrer beiden Protagonisten frei wie kontextadaptiv (Sacks, Schegloff & Jefferson 1974: Harold Garfinkel und Harvey Sacks (für einen histori- 699) und versetzt Mitglieder in die Lage, ihre alltäglichen schen Überblick: Lynch 2019) ausgedrückt hat. Video- Angelegenheiten in Begegnungen zu regeln. Der zentrale daten stellen eine Herausforderung für diese Grund- Forschungsgegenstand der KA liegt also in der Frage, wie
Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with” 83 Mitglieder die Wirklichkeit, von der sie annehmen, dass schaft wünschte (obwohl die damalige Analysepraxis sie Gültigkeit hat, im zeitlichen Verlauf herstellen, mit wohl eher darin bestand, Tonbänder abzuhören). Das Be- welchen Problemen sie dabei konfrontiert werden und sondere an den Audioaufnahmen, mit denen er arbeitete, welche methodischen Lösungen sich zeigen. war für Sacks, dass er ein empirisches Datum zur Hand Die gemeinschaftliche Herstellung von sozialem Sinn hatte, das sich wiederholt, in immer der gleichen Form und Ordnung wird als in situ und über den zeitlichen abspielen lässt und das man anderen vorlegen kann. Dass Verlauf von in sich geordneten Sequenzen (Rawls 2008) diese Daten keine vollständigen Abbilder von Situationen begriffen. Mitglieder nutzen die sequenzielle Positio- boten, erschien Sacks für seine analytischen Zwecke un- nierung von eigenen oder fremden Handlungszügen als problematisch: „The tape-recorded materials constituted zentrale Ressource, um Bedeutung und Verständigung a ‘good enough’ record of what happened. Other things, to fortlaufend herzustellen. Nur ein Beispiel hierfür bildet be sure, happened, but at least what was on the tape has die sogenannte „next-turn proof procedure“ (Hutchby & happened“ (Sacks 1985: 26). Neben dem Hörbaren wenn Wooffitt 2008), anhand derer die Bedeutung einer Äuße- möglich auch das Sichtbare auf Band zu konservieren ent- rung über die Reaktion darauf, nämlich den darauffolgen- sprach wiederum völlig dem Anspruch, möglichst unver- den Zug, abgelesen und überprüft wird. Um diese Sequen- fälschte Abbildungen sozialer Analysen zur Grundlage zialität in der Analyse nachvollziehen zu können, muss sie sozialer Analysen zu machen4. Zunehmend jedoch lässt im Prozess der Datenerhebung, also bei der Aufnahme von sich an der Entwicklung des konversationsanalytischen Interaktionen und Situationen, aufrechterhalten werden. Diskurses beobachten, dass die Entscheidung für Audio- Eben weil das Soziale in sich bereits geordnet ist, oder Video-Daten methodologische Implikationen mit braucht es auch keine „besonderen“ Arrangements für einiger Reichweite mit sich bringt. Aufnahmen, wie das beispielsweise in Laborstudien der Die aktuelle Diskussion um den Umgang mit Video- Fall ist. Die verwendeten Daten sind vielmehr Video- oder daten in der Konversationsanalyse, die gegenwärtig stark Audio-Aufnahmen von Situationen, die sich so auch ereig- durch zwei ihr eng verwandte Methoden mitgeprägt wird, net haben könnten, ohne dass Forscher_innen anwesend geht darauf noch zu wenig ein. So versteht sich die multi- gewesen wären oder daran Interesse gezeigt hätten (Potter modale Gesprächsforschung als konsequente Fortführung 2002). Im Zuge der Datenerhebung und in der weiteren der Konversationsanalyse (Mondada & Schmitt 2010), Behandlung (Transkription und Analyse) der Daten wird welche bislang (auch aus praktischen Gründen) vernach- davon ausgegangen, dass auch scheinbar unbedeutende lässigte Modalitäten der Bedeutungsproduktion egalitär Details im Gesamtgeschehen ihren Platz haben und von berücksichtigen möchte und damit das Primat des Sprach- Mitgliedern methodisch eingesetzt und als methodisch lichen als durch technische Affordanzen verzerrte Schwer- wahrgenommen werden. punktsetzung zurückweist. In sehr präzisen und kleintei- Die ersten konversationsanalytischen Arbeiten zur ligen Analysen arbeitet sie heraus, wie soziale Phänomene Interaktion im Gespräch entstanden auf der Basis von im Zusammenspiel verschiedener Modalitäten hergestellt Audio-Aufnahmen, und es bildeten sich präzise metho- werden. Dabei verfolgt sie unter anderem das Ziel, „die Re- dische Vorgehensweisen im Umgang mit solchen dyna- flexion und Modifikation konversationsanalytischer Kon- mischen und vielschichtigen Daten (insbesondere setzte zepte anzuleiten“ (Schmitt 2005: 26), also insbesondere Gail Jefferson Standards bei der Transkription, die bis bereits etablierte Konzepte der Konversationsanalyse auf heute gelten). Hiermit ging eine langjährige Fokussierung ihre multimodale Tragfähigkeit hin zu untersuchen und der Konversationsanalyse auf sprachliche Phänomene gegebenenfalls auszudifferenzieren. In den letzten Jahren einher, was auch zu einer intensiven Rezeption ihrer Ein- hat dieses Forschungsprogramm sehr stark an Einfluss sichten in Teilen der Linguistik führte. Dennoch war von gewonnen und seine Interessensgebiete zunehmend auf Anfang an klar, dass sich Mitglieder nicht nur sprachlich verständlich machen, sondern sich selbst in Begegnun- gen ganz und gar und in strukturierter, nachvollziehbarer 4 Ein wichtiger Hinweis dazu, der sich direkt an die Protagonist_ Weise zur Verfügung stellen. innen der Konversationsanalyse richtete, kam schon von Erving Deshalb erschien die Hinzunahme einer weiteren Goffman (1981: 143). Goffman betont dort am Beispiel von zwei Auto- Datenebene – des Visuellen – zunächst nur folgerichtig. mechanikern, die gemeinsam an einem Auto arbeiten, dass der Kon- text für eine Äußerung nicht immer eine vorangegangene Äußerung Untermauert wurde der Wunsch, möglichst reichhaltige ist, sondern möglicherweise auch ein angereichtes Werkzeug, dessen Daten zur Verfügung zu haben, durch einige methodo- Erhalt mit „danke“ quittiert wird. Wie man mit Dingen Worte macht, logische Äußerungen von Harvey Sacks (1985), der sich kann also genauso wichtig sein und wird durch Audio-Aufnahmen die Soziologie dezidiert als eine beobachtende Wissen- allein natürlich nicht aufgezeichnet.
84 Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with” durch die klassische Konversationsanalyse weitgehend Dass man es bei Videodaten mit einem besonderen unbeachtete Phänomene wie etwa Nutzung von räumli- Datentyp zu tun hat, wird dabei in beiden Ansätzen durch chen Gegebenheiten oder die Verfügbarmachung von sen- aus diskutiert. Heath, Hindmarsh und Luff (2010) geben sorischen Wahrnehmungen ausgeweitet. Methodologisch etwa in ihrem Enführungswerk in einem eigenen Kapitel befasst es sich vornehmlich mit Fragen der angemessenen Hinweise dazu, wie man Videodaten für die Veröffent- Transkription (Mondada 2016; Greco et al. 2019). Wie lichung und die Diskussion mit Fachkolleg_innen präpa- Schmitt in seinem programmatischen Text 2006 bereits rieren, aufbereiten und damit zugänglich machen sollte. vorhersieht, führt die starke Relevantsetzung des Zusam- Auch Mondada diskutiert die vielen situierten Entschei- menspiels aller Modalitäten vornehmlich zur Analyse sehr dungen, die bei der Generierung von Videodaten getroffen kleiner Phänomene, wohingegen Fragen nach der kontex- werden müssen, und schließt, dass diese Daten demnach tualisierten, sozialen Bedeutung interaktiver Ordnungs- reflexive und praktische Hervorbringungsleistungen sind, leistungen in den Hintergrund rücken. mithin vielleicht eher rekonstruierende als registrierende Die ethnomethodologische Interaktionsanalyse, wie Konserven, und dass dieser Einfluss in das Material ein- sie vom Lehn (2018a) in der Tradition von Heath, Hind- geschrieben ist und analytisch berücksichtigt werden muss marsh und Luff (Luff & Heath 2012; Heath & Hindmarsh (Mondada 2006).6 2002; Heath & Luff 1992) und Goodwin (Goodwin 1994, Es scheint zwischen diesen Ansätzen aber Einigkeit zu 2018) ausgerufen hat, fokussiert mit dem Einsatz von bestehen, dass eine erkenntnisreiche Analyse von Inter- Videodaten auf die interaktive Ordnungsleistung von Mit- aktionen am Einsatz von Videodaten nicht mehr vorbei- gliedern. Auch sie begreift sich als Ergänzung oder auch kommt. Das Verhältnis dieser Daten zum ursprünglichen umfassendere Alternative zur Konversationsanalyse mit Erkenntnisinteresse der Konversationsanalyse gerät dabei Daten, die es ermöglichen, „visuelle, körperliche und ma- ebenso aus dem Blick wie die Reflexion über die Auswir- teriale Handlungen mit der Analyse von Gesprächen zu kungen einer solchen Reorientierung auf die Analysepra- verknüpfen.“ (vom Lehn 2018b: 190) Der Fokus liegt hier xis. Im Folgenden werden wir erörtern, welche alten und allerdings darauf, solche Interaktionen analysierbar zu neuen methodologischen Probleme demgegenüber durch machen, die nicht vornehmlich sprachlich verfasst sind, den Wunsch und die technischen Möglichkeiten, soziale sondern eine geteilte Bedeutung etwa über die Manipu- Situationen möglichst umfassend „einzufangen“, quasi en lation von Dingen herstellen. So entstehen zunehmend passant entstehen. Denn mit der zunehmenden Nutzung Studien, die sich mit sozialen Situationen befassen, in von Video-Aufzeichnungen und -Transkriptionen stehen welchen Sprechen eine untergeordnete Rolle spielt (bspw. unserer Auffassung nach nicht nur einfach reichhaltigere Meyer & Wedelstaedt 2013 zur Koordination von Boxer Daten („mehr vom Selben“) zur Verfügung, sondern auch und Trainer im Ring oder Marstrand & Svennevig 2018 ein grundsätzlich anderer Datentypus. Dies hat grund- zu Berührungen im Pflegekontext). Während vom Lehn legende Auswirkungen auf alle Phasen des konversations- in Anlehnung an die wegweisenden Arbeiten von Heath analytischen Forschungsprozesses. eher die Vorzüge von Videodaten und ihre Reichhaltigkeit herausstellt, weil sie eben auch verkörperte Details von Interaktion zur Verfügung stellen, weisen beispielsweise Smith (2020) oder Mair et al. (2012), die einen stärker 4 Erhebung und Aufbereitung von ethnographischen Hintergrund besitzen und Videodaten Videodaten als Beobachtungen ergänzendes Material betrachten, darauf hin, dass gerade die Detailliertheit von Videodaten Dass in der KA lange Zeit davon ausgegangen wurde, dass eine Herausforderung für die ethnomethodologische For- Interaktion weitgehend sprachlich verfasst ist, und dass schung darstellt5. diese sprachliche Ebene zum Verständnis der Herstellung der sozialen Situation in der Mehrzahl der Situationen völlig ausreichend sei, schlug sich in der Logik der ver- wendeten, sprachbasierten Transkripte nieder. Gelegent- 5 Zunehmend gerät auch der Körper als Forschungsgegenstand und Forschungsinstrument in den Fokus (Nevile 2015 spricht vom „embo- died turn“), was einerseits die Notwendigkeit von Videodaten unter- streicht, andererseits auch deren Begrenztheit hervorhebt, da sie 6 Die zahlreichen digitalen Hilfsmittel zur Transkription und Auf- körperliche Erfahrungen nicht angemessen dokumentieren können, bereitung von Videodaten geben ebenfalls Hinweise darauf, dass der und so die Diskussion von ethnographischem Wissen zusätzlich re- analytische Umgang mit Videodaten eine ganz praktische Heraus- levant macht. forderung darstellt.
Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with” 85 lich wurde dennoch auch die sogenannte nonverbale sprachlichen Beiträgen (etwa Goodwin 1994). Die komple- Kommunikation mit einbezogen, welche Phänomenberei- xen Analysen, die solche Studien präsentierten, schärften che wie Mimik, Gestik, Proxemik und Blickkontakt um- das Bewusstsein dafür, dass eine präanalytische Ausson- fasste (frühe Überlegungen etwa durch Philips 1976 oder derung von nicht-relevanten ‚sichtbaren‘ Phänomenen Burgoon 1980). Ob und auf welche Weise derartige Phäno- nicht verlustlos möglich ist, sondern dass „there is order mene in die Transkription und Analyse einflossen, folgte at all points“ (Sacks 1992: 22) eben auch und ebenso sehr in der KA im Groben Schegloffs Prinzip der „procedural für die nicht-verbalen Handlungen von Interagierenden consequentiality“ (Schegloff 1992), also der Maxime, dass gilt. soziale Tatsachen nur dann von Relevanz für die lokale Wie Ayaß (2015) nachzeichnet, haben sich diese Ent- Situation sind, wenn sich analytisch nachzeichnen lässt, wicklungen methodologisch vor allem in Debatten über dass sie von den Beteiligten relevant gemacht werden. angemessene Transkription niedergeschlagen. Die dabei Hatte man also den Eindruck, dass ein bestimmter Blick diskutierten Varianten reichen vom additiven Transkript, oder eine bestimmte Geste für das analysierte Gespräch in welchem einzelne Beobachtungen der zeitlichen Struk- von Bedeutung waren, wurden diese mit in die Analyse tur beigeordnet werden, die sich durch die Verschriftli- aufgenommen. Die ersten Transkripte, die nonverbale chung des Verbalen ergibt, bis hin zum multimodalen Kommunikation mit aufführten, waren somit tendenziell Transkript, in welchem verschiedene Ebenen sozialen eklektisch. Die Anführung nonverbaler Elemente diente Handelns in Partiturschreibweise aufeinander bezogen im Allgemeinen vor allem der Unterstützung oder der werden. Aber auch mit Formen der Visualisierung wird Desambiguierung der verbalen Elemente und folgten experimentiert, wie etwa fokussierten Zeichnungen mit demnach, wie Ayaß (2015) formuliert, einer „additiven“ Pfeilverweisen, Comics mit Sprechblasen oder komplexen Logik. überlappenden Bildfolgen, die es ermöglichen, Bewe- Das Gesprächsanalytische Transkriptionssystem gungsabläufe darzustellen. An dieser Vielfalt und den mit GAT, das 1998 durch Gesprächsforscher_innen aus der ihr einhergehenden methodologischen Entscheidungen Linguistik und Soziologie entwickelt wurde, um ein auf lässt sich deutlich erkennen, so Ayaß, dass Transkripte die Eigenheiten der deutschen Sprache angepasstes Äqui- in der Konversationsanalyse keine objektiven Ausgangs- valent zum im englischen Sprachraum vorherrschenden daten darstellen, sondern dass schon die Erstellung eines ‚Jeffersonian system‘ bereitzustellen und so die unüber- Transkripts durch das eigene Erkenntnisinteresse und die sichtliche Diversität von Darstellungskonventionen etwas eigenen Hypothesen geleitet ist; Transkripte sind demnach einzuhegen, weist, ganz in diesem Geist, für die Tran- immer bereits epistemische Objekte. skription von „nicht-lautlichen, sichtbaren Anteilen der Mit der zunehmenden Selbstverständlichkeit von Vi Kommunikation“ an: deomaterial und damit zunehmenden Erfahrungen mit der materialen Technik und ihren Eigenheiten gerieten Sichtbares Handeln wird immer dann transkribiert, wenn es in neben Fragen nach einer angemessenen Transkription bedeutsamer Weise zur Eindeutigkeit – oder auch zur Unein- insbesondere Fragen nach der angemessenen Erhebung deutigkeit – anderer Aktivitätsebenen (wie etwa gesprochener in den Vordergrund. Die Entdeckung der Reichhaltigkeit Äußerungen) beiträgt. So sind beispielsweise Blickrichtung und Körperorientierung vor allem dort von Bedeutung, wo die Ko visueller Interaktionsphänomene ging gleichzeitig mit orientierung der Beteiligten und die Koordinierung ihres Han- der frustrierenden Erkenntnis einher, dass auch Videoauf- delns für die gemeinsame Aktivität erforderlich ist. (Selting et nahmen immer nur Ausschnitte einer sozialen Situation al. 1998: 25–26) einfangen können – dass Personen aus dem Bild laufen können, Kameras gegebenenfalls die Inhalte von durch Ayaß (2015: 512) spricht bei diesen Transkriptionsformen die Beteiligten bearbeiteten Dokumenten nicht erfassen von einem Logozentrismus, der unhinterfragt davon oder Blicke sich auf Dinge oder Gegebenheiten richten, ausgeht, dass soziale Situationen zuallererst sprachlich die vom Kameraausschnitt nicht erfasst sind. Methodolo- strukturiert sind, und dass sämtliche weiteren Informa- gische Debatten bezogen und beziehen sich demnach aus- tionen dieser Ebene höchstens sinnhaft beigeordnet sind. führlich auf konkrete Fragen nach dem passenden Fokus, Der Zugriff auf Videoaufnahmen ermöglichte es je der Positionierung der Kamera im Raum oder der Anzahl doch, zunehmend auch solche Phänomene in den Blick von Kameras (Luff & Heath 2012; Heath, Hindmarsh & zu nehmen, die eben nicht vornehmlich sprachlich ver- Luff 2010). Zunehmend wird die Frage nach „Big Video“ fasst sind. Charles Goodwin gehörte zu den ersten, die gestellt, die der Vision folgt, eine weitgehend perfekte Ver- in sozialen Situationen Körpern, Dingen und räumlicher doppelung der zu untersuchenden Situation herzustellen, Organisation ebenso viel Aufmerksamkeit schenkte wie die aber, ganz den konversationsanalytischen Prämissen
86 Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with” der Aufhebung sozialer Flüchtigkeit (Bergmann 1985) nung“, wie Simmel sie nennt, als solche nicht mehr wahr- folgend, verlangsamt, gedreht und gewendet werden genommen werden kann. Bergmann vermutet, dass diese kann. Hierzu wird in sehr kreativer und technisch höchst Gefahr darin begründet liegt, dass die registrierende beeindruckender Form mit dem Zusammenspiel verschie- Konservierung zwar die Zeitlichkeit einer Situation zu dener Kameratypen (360°-Kameras, Drohnen) sowie der bewahren vermag, diese aber genau hierdurch einer zen- Aufstellung mehrerer Kameras und Mikrophone experi- tralen Eigenheit, nämlich ihrer Flüchtigkeit beraubt; Mit- mentiert, was seinen vorläufigen Kulminationspunkt in glieder sind aber in der Situation selbst mit genau dieser einem virtuellen dreidimensionalen Raum gefunden hat, Flüchtigkeit, der Unwiederbringlichkeit der aufeinander- in dem sich die Forscherin nicht nur immersiv bewegen, folgenden Details der reziproken Herstellung der Situa- sondern auch direkte Annotationen an den Phänomenen tion konfrontiert, ihre lokale Analyse kann demnach die selbst vornehmen kann (McIlvenny 2019). Die Lust am Vi- zeitmanipulative Perspektive der Analyse ex post niemals suellen ist ungebrochen, und zunehmend herrscht in der einnehmen. Simmel folgend sei demnach in der soziologi- Community die Ansicht vor, dass Daten, die die visuelle schen Analyse darauf zu achten, dass die „Kontinuität des Ebene nicht berücksichtigen, im Grunde für eine aussage- realen Geschehens“ nicht „auf der Strecke bleibt“ (Berg- kräftige Analyse nicht mehr ausreichen. mann 1985: 316). Der Sog des ‚Trichters des inneren Sinnhorizonts‘ gewinnt in der Auseinandersetzung mit Videodaten noch 5 A nalytischer Umgang mit Video- einmal an mehr Tiefe. Die potentiell zu beschreibenden Phänomene umfassen verschiedenste Kanäle: unter- Daten: Alte Probleme in neuer schiedlichste körperliche Ausdrucksformen wie Mimik, Prägnanz Gestik, Körperhaltung, die Positionierung im Raum, die Manipulation von Dingen, Berührungen und Blickkontakt können alle als prinzipiell situativ geordnet und aufeinan- 5.1 Detaillierungssog der bezogen wahrgenommen (und müssen daher grund- sätzlich analytisch ernstgenommen) werden. Die kleintei- Schon 1985 diskutiert Bergmann Risiken, die sich aus zwei lige Verflochtenheit all dieser Elemente nachzuvollziehen, der oben skizzierten zentralen konversationsanalytischen erfordert eine Präzision und Tiefe des Blicks, die zu einer Vorannahmen ergeben. In der Befolgung strenger An- zunehmenden Zersplitterung der Phänomene führt. In nahmen von Sequenzialität und ubiquitärer immanenter diesem Anstieg des analytischen Aufwandes und des Ordnung (Sacks 1992) entsteht für Konversationsanalyti- Aufwandes bei der Transkription werden die beobacht- ker_innen ein gewisser Sog, der geordnete Zusammen- baren, beschreibbaren Phänomene zunehmend kleiner. hänge im immer noch Kleineren entdecken lässt: Es besteht die Gefahr, dass Sacks’ Maxime „take it that there is order at all points“ nicht mehr nur als ein Hinweis [D]er Interpret [kann] mit diesen methodischen Postulaten in verstanden wird, Details nicht vorschnell als irrelevant einen Strudel der Detaillierung geraten […], der ihn in den immer auszuschließen, sondern eher als Aufforderung, diese enger werdenden Trichter des inneren Sinnhorizonts einer Äu- ßerung hinunterzieht. Die Forderung, sich in seiner Arbeit von Ordnung auf allen Ebenen der Detaillierung auch nach- der Maxime „Order at all points“ leiten zu lassen bzw. für „jedes zuweisen. Die technischen Möglichkeiten dafür gibt es. Element des Textes“ eine Motivierungslinie zu explizieren, Liegt aber der Fokus darauf, der Geordnetheit bis ins letzte öffnet den Blick des Interpreten für die Details des registrierten nachzuspüren, wird es zunehmend schwierig, darüber Geschehens, ohne jedoch eine untere Detaillierungsgrenze fest- hinaus im Blick zu behalten, welche Probleme hier durch zuschreiben. So kann im Prinzip an jedem „Punkt“, an jedem Textelement der zergliedernde Blick erneut ansetzen, um auf die Interagierenden eigentlich gelöst werden. einem bis dahin in der Interpretation übersprungenen, noch feineren Detaillierungsniveau die Suche nach einer bislang ver- borgenen Geordnetheit bzw. Motivierungslinie aufzunehmen. 5.2 Verlockungen der Allwissenheit (Bergmann 1985: 315f.) Vor dem Hintergrund, dass konversationsanalytische Ar- In Anlehnung an Simmel (1916) argumentiert Bergmann, beiten den Anspruch haben, als „primitive Wissenschaft“ dass diese „Atomisierungstendenz“ letztlich zu einer (Lynch & Bogen 1994; Lynch 2000; Sacks 1992; Sacks 1985) Gefahr für das Verstehen der zu analysierenden Abläufe die materiale Grundlage ihrer Erkenntnisprozesse offen- werden kann; die Zergliederung einer Situation in zu zulegen und dadurch nachvollziehbar zu machen, galt kleine einzelne Elemente führt dazu, dass die „Erschei- und gilt das aufgezeichnete und transkribierte Datenmate-
Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with” 87 rial als einzig zulässige Basis für die Analyse7. Ihm wird situation vollständig und in Gänze einzufangen, wo nötig ein quasi-objektiver Status zugeschrieben, in dem Sinne, und möglich mit der Unterstützung weiterer technischer als diese epistemischen Objekte unter Wissenschaft- Geräte. Die Verwendung mehrerer Mikrofone sichert ler_innen herumgereicht und -gezeigt werden können. eine möglichst gute Tonqualität gesprochener Beiträge. Mochten die Aufnahmen auch punktuell nicht vollständig Kameras fokussieren auf Bildschirme und Artefakte, sein, so war doch grundsätzlich klar, dass alles, was auf- wodurch Analysierenden schließlich besserer und präzi- gezeichnet worden war, sich auf diese Weise ereignet hatte serer Zugriff darauf eröffnet wird, als ihn (einige) Teilneh- (Sacks 1992). Alle zusätzlichen Informationen über die zu mende selbst haben. analysierende Situation, etwa ethnographische Notizen In der KA mehren sich inzwischen allerdings mah- oder Hintergrundinformationen, konnten nicht mit der nende Stimmen, bei der Analyse nicht zu vergessen, dass gleichen Überzeugung miteinbezogen werden. Begrün- Teilnehmende diese allwissende Perspektive nicht haben dungen für Aussagen über Daten müssten stets „from the und auch nicht haben müssen. Mit Blick auf konversati- data themselves“ kommen, schrieben Schegloff und Sacks onsanalytische Studien im Kontext von Online-Begegnun- bereits in einem der ersten konversationsanalytischen gen, die sich mit sehr ähnlichen methodologischen Fragen Aufsätze (1973). Während bei Analysen von Telefongesprä- befassen müssen, wie sie hier aufgeworfen werden, chen, die die ersten Daten der Konversationsanalyse dar- warnen etwa Arminen et al. (2016) davor, der Zugänglich- stellten, die Frage, was denn zu den „Daten“ gehöre, eini- keit von umfassenden und detailreichen Daten nicht die germaßen einfach zu beantworten war (nämlich alles, was Teilnehmerperspektive zu opfern: von beiden Gesprächsbeteiligten wahrgenommen werden konnte, also die Wortbeiträge), stellte sich mit der Analyse Caution should be preserved not to confuse the analysis of the situated interactional achievement with data on issues that have kopräsenter Interaktionen recht bald die Frage, ob die Be- not been accessible to the participants studied and not to alien- schränkung des Analysierbaren auf das Aufgezeichnete ate the researcher from the members’ social realities. That is, nicht möglicherweise eine deutliche Verzerrung der ge- the analyst must take into account the limitations in the data meinsam hergestellten Situation darstelle. available for participants in action. (Arminen et al. 2016: 304) Die Hinzunahme von Videomaterial ermöglichte es, die analytische Rigidität aufrechtzuerhalten und dabei Die Verlockung, erhobene Details in die Analyse einfließen dennoch Ebenen der gemeinschaftlichen Herstellung von zu lassen, ohne zu überprüfen, inwieweit sie tatsächlich Sinn zu beachten, die sich nicht notwendig sprachlich situiert und in der Begegnung für die Beteiligten eine Rolle manifestierten und so eine breitere Datenbasis zu erhal- spielen, ist groß. Damit wäre zwar grundsätzlich der For- ten. Gleichzeitig wurde jedoch offenbar, dass mit der Hin- derung entsprochen, aus „the data themselves“ heraus zu zunahme von Videoaufnahmen zwar die beobachtbaren argumentieren – diese jedoch bilden möglicherweise weit Phänomene ausgeweitet wurden, gleichzeitig aber immer mehr ab, als tatsächlich für die Interaktion von R elevanz auch weitere Phänomene im Dunklen blieben – sei es aus ist und können vorschnell zur Begründung von Beobach- zu schlechter Bildqualität (ist das wirklich ein Lächeln?), tungen herangezogen werden („Die Lehrerin hat sich um- sei es aufgrund der gewählten Kameraposition, sei es auf- gedreht, weil eine Schülerin in der letzten Reihe geniest grund eines multifokalen Settings, das mit einer einzigen hat“). Schegloffs Forderung, die „procedural consequen- Kamera in seiner Komplexität nicht eingefangen werden tiality“ von Phänomenen für den weiteren Fortgang der In- konnte. Die konsequente Reaktion auf diese Erkenntnis teraktion stets im Blick zu behalten, wird so auf neue Weise bestand darin, durch die Hinzunahme weiterer und ver- relevant. Und dann wäre eben die relevante Frage: Kann schiedener Kameras die Daten weiter anzudichten. Zu- das Niesen einer Schülerin von einer Lehrerin, die etwas nehmend besteht der Standard darin, eine Interaktions- an die Tafel schreibt, als Anlass benutzt werden, um sich ermahnend zur Klasse umzudrehen? Ist es in diesem Sinne relevant für den weiteren Fortgang der Unterrichtsinter- 7 Auch wenn die KA sich einer positivistischen Sprache bedient, so bleibt sie ihren ethnomethodologischen Wurzeln in gewisser aktion? Oder: Kann man aus der Tatsache, dass sie sich Hinsicht treu, weil sie sich immer noch an konkreten, situativen nicht umdreht, schließen, dass sie es nicht gehört hat? Phänomenen abarbeitet, daran, wie Mitglieder etwas hier und jetzt Wie man es auch dreht und wendet, es braucht ein (und nicht abstrakt in einem Modell) machen. Entscheidend sind praktikables Kriterium, um mit Video-Daten umzugehen, die rohen Daten, die alles enthalten, um für „masters of natural die tendenziell „alles“ einfangen, was in einer umgrenz- language“(Lynch 2000: 529) verständlich zu sein: „Scientific training should not be necessary for hearing what speakers say in an ordinary ten Situation (Goffman) vor sich geht und die den Ana- conversation, recognizing what sort of action is being accomplished lysierenden eine fast allwissende Perspektive ermöglichen and explicating how it is accomplished.” (ebd). (vgl. auch Bergmann 1985: 314).
88 Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with” An diesem Punkt mag es sinnvoll sein, auf eine Grund- 6 Neue Probleme im Umgang überlegung zurück zu kommen, auf welcher die Konver- sationsanalyse aufruht. Eine zentrale These in Garfin- mit Videodaten in der kels Überlegungen betrifft die unheilbare Indexikalität Konversationsanalyse praktischer Handlungen: die Tatsache, dass alles soziale Handeln kontextualisiert ist und nicht vollständig dekon- 6.1 Schwierigkeiten der Befremdung textualisiert beschrieben oder verstanden werden kann (Garfinkel 1967: 4ff.). Die „Unheilbarkeit“ dieser Indexika- Wie Bergmann in seinem zumindest für die deutsch- lität – die Unmöglichkeit, zweifelsfrei und vollständig zu sprachige Konversationsanalyse sehr einflussreichen me- beschreiben, was eine beliebige Handlung oder Äußerung thodologischen Aufsatz „Flüchtigkeit und methodische tatsächlich bedeutet – bearbeiten Mitglieder nach Garfin- Fixierung sozialer Wirklichkeit“ aufgezeigt hat, bieten kel über eine Hinnahme spezifischer Vagheit. Bergmann Transkripte für die qualitative Forschung die Möglichkeit, fasst pointiert zusammen: soziale Situationen, die üblicherweise ausschließlich in Genau dadurch, dass die Gesprächspartner sich vage und ab- der ihnen eigenen Zeitlichkeit und dem damit verknüpften wartend ausdrücken und sich mit tentativen Interpretationen Verstehensdruck zugänglich sind, dieser Flüchtigkeit zu begnügen, also Sinninhalte gerade nicht fixieren (und zwar entheben und sie damit aus einer gewissen Distanz heraus weder als Sprecher noch als Hörer), wissen sie, worüber sie zu betrachten (Bergmann 1985). Sie dienen damit in erheb- sprechen. (Bergmann 1988, SE 1: 39f.) lichem Maße der „Befremdung“, wie sie auch Amann & Hirschauer (1997) propagieren, wenn diese auch betonen, Interaktionsbeteiligte haben demnach in der Situation dass diese ebenso eine Leistung des_r geschulten ethno- selbst weder vollständigen Zugriff auf alle relevanten graphischen Beobachtenden sein kann. Die Forscherin Kontexte, noch benötigen sie diesen. Die Interpretationen wird aus ihrem unmittelbaren, alltagsweltlichen Ver- der Situation der einzelnen Beteiligten sind keinesfalls ständnis der Situation herausgerissen. Durch die Verlang- deckungsgleich und müssen es auch nicht sein. Was in der samung und Abstraktion wird das Geschehen in seiner gemeinsam hergestellten Situation relevant ist und was aufwendigen, reziproken Konstruktion sichtbar, während es bedeutet, wird in der reziproken, sequenziellen Inter- die technische Registrierung gleichzeitig dafür sorgt, dass aktion ausgehandelt, unter großzügigen Annahmen, dass es (auf „naive“ Weise, Bergmann 1985: 301) durch dieses das, was das Gegenüber einbringt, schon seine Richtigkeit Verstehen unverändert, wiederholt zugänglich, anderen haben wird. Intersubjektivität muss verstanden werden zeigbar bleibt. Bei der Transkription von Videodaten ge- als lokale Verstehensfiktion für alle praktischen Zwecke schieht diese Befremdungsleistung, wie im Folgenden zu („for all practical purposes“, Garfinkel 1967: vii). Demnach zeigen ist, zugleich zu stark und in zu geringem Umfang. findet sich das, worum es in dieser Situation geht, nicht Während im Zuge des Visual/Video Turn nahelag, unbedingt in den vielen Facetten des Sichtbaren und Auf- Videodaten auf dieselbe Weise wie Audiodaten in eine zeichenbaren. Es findet sich im wechselseitigen Bezug der weiter fixierte Form zu überführen, stieß die Konver- Mitglieder aufeinander und in deren vorläufiger Einigung. sationsanalyse, wie oben beschrieben, bald auf große So wenig, wie die Mitglieder zweifelsfrei wissen und ver- Herausforderungen. Die Kodifizierung von Transkriptions- stehen können, worum es eigentlich geht, können Ana- notationen für Videodaten gelangte schnell an Grenzen, lysierende sich dies über noch präzisere Beschreibung der wie sich etwa daran erkennen ließ, dass die verbesserte Situation erschließen. Insoweit die soziale Bedeutung der Neuauflage des Gesprächsanalytischen Transkriptions- Situation eine praktische Aushandlungsleistung der an systems, GAT2, ursprünglich einen Abschnitt zur Tran- ihr Beteiligten ist, muss sich jegliche Analyse hieran aus- skription von Videodaten enthalten sollte, ein Vorhaben, richten. das jedoch schließlich aufgegeben wurde8. Zwar hat sich im Kontext der Multimodalen Gesprächsanalyse ein recht stabiles Notationssystem etabliert, dieses scheint jedoch von anderen Zugängen nicht übernommen zu werden. An- dererseits lassen sich in der Gemeinschaft weiter intensive 8 Die angekündigte Revision der Notationen „visueller Komponen- ten“, wie sie im ursprünglichen Konzept vorgeschlagen wurde (Sel- ting et al. 2009: 382), wurde nicht umgesetzt.
Sarah Hitzler, Daniela Böhringer, “Conversation is simply something to begin with” 89 Suchbewegungen beobachten, etwa am Sonderheft Repre- miotische Korrespondenz zunutze, indem sie die Bedeu- senting data in video-based studies der im Jahr 2018 neu tungsebene der Schrift beibehalten, dieser aber weitere gegründeten Online-Zeitschrift „Social Interaction. Vi- Zeichen zuordnen, die der lautlichen, kontextualisierten deo-Based Studies of Human Sociality“. Die Herausgeber Darbietung entsprechen sollen, vgl. etwa GAT2: skizzieren in ihrer Einleitung das positivistische Dilemma der Konversationsanalyse, ohne aber einen Ausweg zu Die Transkription erfolgt in literarischer Umschrift und ori- entiert sich an der Orthographie, d. h. einer genormten Um- präsentieren: setzung der Lautsegmente in die Schrift. … Sprechsprachliche Realisierungen, die der Bezugsnorm entsprechen, werden der There is evidently no such thing as a perfect representation (…). Standardsprache entsprechend verschriftlicht, d. h. also nicht But the aspiration has nevertheless always been to get closer to eigens notiert. (Selting et al. 2009: 360) the “reality” by using new technologies, systems and methods for representation. Obviously, a slice of positivism is inherent in this aspiration. However, no matter what kind of sophisticated Die linguistische Unschärfe, die durch den weitgehenden technological setup we can apply and no matter how accurate Verzicht auf phonetische Umschrift entsteht, wird für die the annotation system gets, we are always dealing with interpre- dadurch gewonnene unmittelbare semantische Zugäng- tations. (Mortensen & Due 2019) lichkeit in Kauf genommen. Audiotranskripte ordnen also einem bereits existierenden, stark konventionalisierten Das Sonderheft versammelt unterschiedliche Zugänge zur Zeichensystem einige wenige zusätzliche Zeichen zu, die Repräsentation von visuellen Daten, die einen Einblick in wiederum ebenfalls recht stark konventionalisiert sind. die unterschiedlichen Lösungen geben sollen, welche For- Sie ermöglichen so eine klare Distanzierung und Befrem- schende mit Blick auf die Frage „what embodied actions to dung durch eine ungewöhnliche, ausgebaute Darstellungs- include in the transcription and how“ (Mortensen & Due weise; gleichzeitig bewahren sie die Integrität des in der 2019) entwickelt haben. Weitestgehend unreflektiert (aber Originalsituation hergestellten koproduzierten seman- s. Ayaß 2015) bleibt jedoch die Frage, weshalb Videotran- tischen Sinns, indem sie diesen weitgehend verlustlos skription eigentlich eine so hohe Diversität an Lösungen übertragen (trans-skribieren). Die Transkripte bieten, wie hervorbringt – anders als Audiotranskription, bei deren von Bergmann (1985) beschrieben, gegenüber der Origi- Konventionalisierung es im Wesentlichen lediglich darum nalaufnahme eine Aufhebung der Flüchtigkeit und eine ging, sich auf eine einheitliche Notationsform etwa für Distanzierung zum Geschehen, gleichzeitig bleibt der un- Pausen oder Betonung zu einigen, nicht aber darum, ob mittelbar zugängliche Sinn jedoch weitgehend bewahrt. Pausen und Betonungen angemessene Phänomene der Die reduzierte Anzahl und stark konventionalisierte Form Transkription und Analyse waren. Dieser Frage wollen wir zusätzlicher Darstellungsregeln ermöglichen es geübten im Folgenden nachgehen. Analytiker_innen, Audiotranskripte ähnlich flüssig zu ver- arbeiten, wie etwa Musiker_innen in der Lage sind, Noten zu lesen. Audiotranskripte, die entlang der in der KA übli- 6.2 Die Eigenheiten der Videotranskription chen Systematiken erstellt wurden, haben einen mittleren Verfremdungsgrad, der Analytiker_innen aus ihrer „trans- Audiotranskripte beruhen in ihrer Beschaffenheit wesent- formierenden Rekonstruktionspraxis“ des Alltags (Berg- lich auf einem kulturell anerkannten, höchst differenzier- mann 1985: 310) zwar herausreißt, es ihnen aber immer ten Zeichensystem: auf der Schrift. Schrift wiederum ist noch ermöglicht nachzuvollziehen, um was es geht und dadurch gekennzeichnet, dass sie eine enge (im Deut- wie dieses Faktum in der Interaktion prozedural entsteht. schen: phonetische) Korrespondenz mit der zugrundelie- Sollen nun neben sprachlichen (plus parasprach- genden Sprache aufweist (Chao 1968). Dass diese Korres- lichen) auch visuelle Komponenten im Transkript erfasst pondenz nicht vollständig, sondern in vielen Bereichen werden, erhöht sich die Komplexität des Produkts massiv. konventionalisiert ist, fällt im Alltag im Allgemeinen nicht Ayaß stellt in ihrer Diskussion um den epistemischen ins Gewicht: lesend nehmen wir geschriebene Wörter auf Status von Transkripten für die Konversationsanalyse fest: eine Weise als bedeutungstragend wahr, die ihren ge- „In transcribing audiovisual material, the time spent on sprochenen Äquivalenten entspricht. Unabhängig von the type of work does not simply increase; it explodes.“ der Darbietung nehmen wir Hund, Hund, Hund zunächst (Ayaß 2015: 515) Dies liegt daran, dass ‚das Visuelle‘ nicht als Zeichen für das Konzept [Hund] wahr, ebenso wie wir auf gleiche Weise eingrenzbar ist wie ‚das Sprachliche‘. das Konzept [Hund] unabhängig davon erkennen, ob es Es umfasst grundsätzlich alles, was auf der Kameraein- laut gesprochen, geflüstert oder besonders nasal hervor- stellung zu sehen ist – beispielsweise räumliche Organi- gebracht wird. Sprachtranskripte machen sich diese se- sation, Gesten, Körperhaltung, Berührungen, Mimik, Be-
Sie können auch lesen