Sociophonetic Learning in L1 and L2. Christian Langstrof

Sociophonetic Learning in L1 and L2 Christian Langstrof

Table of Contents / Inhaltsverzeichnis Acknowledgements 4 Zusammenfassung der Arbeit in deutscher Sprache 5 1 Introduction 15 2 2.1 2.2 2.2.1 2.2.2 2.3 2.3.1 2.3.2 2.3.3 2.3.4 2.4 2.4.1 2.4.2 2.4.3 2.4.4 2.5 2.6 2.7 Sociophonetic Learning in L2 Background Method US Condition UK Condition Results US condition US condition Occupation US condition Age US condition Likeability Interim Discussion UK condition UK condition Occupation UK Condition Age UK Condition Likeability Discussion perception UK Condition Results II Speech Production and Factor Analysis Overall Discussion Conclusion 26 26 37 37 41 43 43 46 48 49 51 53 55 58 60 63 69 72 3 3.1 3.2 3.3 Sociophonetic Learning in the Lab Background Previous Studies Method 2 74 74 90 97

3.4 3.5 3.6 Results Discussion Caveats and Outlook 106 127 142 4 4.1 4.2 4.3 4.4 4.5 4.6 4.7 Variant Learning in L1 and L2 Introduction Method Results Interim Discussion Further Pilot Studies Interim Discussion Chapter Discussion 144 144 146 151 163 168 175 177 5 Looking Back and Ahead 179 Appendix to Chapters 3 and 4: A Stochastic Afterthought What is successful learning? 188 References 206 3

Acknowledgements First of all, my heartfelt thanks goes to my colleagues at the University of Freiburg s Philologische Fakultät, and the members of the Department of English in particular, who have apart from providing helpful professional feedback and advice on my research throughout the years made my professional environment a pleasant place to work in. I would specifically like to thank Professor Bernd Kortmann for taking me in, as it were, and for creating a stimulating and encouraging work climate throughout the years. My colleagues Alice Blumenthal and Pia Bergmann deserve special mention in this regard, as they have never tired of going though hours of discussions on all things professional and non-; this includes sharpening my views on linguistics in general as well as helping me out with the nitty-gritty aspects of carrying out projects like these, such as helping me in the preparation of stimuli, recruiting test subjects, et cetera. Standing, as we all do, on the shoulders of giants when it comes to conceptualising and designing large-scale research projects, I would like to thank Gerry Docherty and Paul Foulkes for hauling me on board in order to help carry out the original tribe 1 / tribe 2 experiments, the conceptual framework of which I subsequently drew heavily on in much of the work reported on in this book. That I have taken the route towards sociophonetics is ultimately due to Jen Hay, who, from my PhD stage onwards, has never ceased to provide support and professional advice throughout the years in spite of earthquakes and being half a world apart (as well as being notoriously busy running her own lab). On a more personal level, I would like to thank my wife, my parents, and my sister for their wholehearted support in all things personal throughout the years. My special thanks in this regard goes to Vincent Langstrof for boosting my productivity during the formative stages in the preparation of this manuscript. Finally, none of this would have been remotely possible without the participation of hundreds of participants in the various experiments, who endured going through what must have appeared to them as an utterly pointless procedure. It wasn t! 4

Zusammenfassung der Arbeit in deutscher Sprache Dieses Buch befasst sich mit dem Thema Lernbarkeit soziophonetischer Variabilität. Auf Basis zweier unterschiedlicher - jedoch thematisch miteinander verwobenen - sprachperzeptiver Versuchsreihen soll festgestellt werden, ob und inwieweit erwachsene Lerner in der Lage sind, neuartige Assoziationen zwischen soziolinguistischen Variablen und nicht-linguistischen Kategorien zu formen. Neben einem Übersichtskapitel (Kapitel 1) sowie einer Zusammenfassung (Kapitel 5) enthält die Arbeit drei substantielle Kapitel, die im Folgenden beschrieben werden. Kapitel 2 Sociophonetic Learning in L2 Kapitel 2 untersucht auf Basis einer Reihe von Sprachwahrnehmungsexperimenten, ob und inwieweit Nicht- Muttersprachler des Englischen soziolinguistisch stratifizierter Variation in der Zielsprache Englisch gegenüber sensibilisiert sind, und ob sich Prozesse dieser Art aus früheren Erfahrungen mit der Zielsprache im Ausland herleiten lassen. Der zugrunde liegende Datensatz kontrastiert Probanden, die auf einen mindestens sechsmonatigen Aufenthalt in einem englischsprachigen Land zurückblicken können, mit Probanden, die Englisch weitestgehend ausschließlich im Kontext des Zweitsprachenerwerbs in weiterführenden Schulen gehört bzw. gesprochen haben, sowie auch nativen englischsprachigen Kontrollgruppen. Es soll gezeigt werden, dass die entsprechenden Daten im Hinblick auf die im Rahmen der Exemplartheorie entwickelten Rezenzhypothese (siehe hierzu Goldinger (2000): Jüngere hörerbiographische Erfahrungen wirken sich im Vergleich zu älteren in der Ausformung kognitiver linguistischer Kategorien stärker aus) relevante Einblicke erlauben. Zwei miteinander verzahnte Experimentreihen werden vorgestellt und analysiert: (1) Zum einen werden Probanden untersucht, die Erfahrungen mit nordamerikanischem Englisch als Resultat eines Auslandsaufenthaltes haben. Diese werden im Hinblick darauf getestet, ob sie einer bestimmten phonetischen Variable gegenüber nicht-zufallsverteilte Assoziationen hinsichtlich einer Reihe von nicht-linguistischen Evaluationsparametern aufweisen, nämlich Alter, Berufsstand und Sympathie. In dieser Testbedingung sollte herausgefunden werden, ob Hörer phonetisch vergleichbare Variablen unterschiedlich evaluieren, je nachdem, ob diese im Kontext der Muttersprache Deutsch oder der Zielsprache Englisch präsentiert werden. Dass dies der Fall sein sollte, ergibt sich direkt aus 5

neueren exemplartheoretischen Ansätzen zur Sprachwahrnehmung und - verarbeitung bzw. ihrer kognitiven Repräsentation (siehe, inter alia, Johnson 1997, Goldinger 2000, Pierrehumbert 2001). Grundbedingung ist, dass die entsprechende Variable in ihren jeweiligen nativen soziolinguistischen Biotopen tatsächlich unterschiedlich evaluiert wird. Bei der hier untersuchten Variable handelt es sich um Abschwächung stimmloser alveolarer Plosive in intervokalischer Position; dieses Phänomen findet sich sowohl im nordamerikanischen Englisch wie auch in unterschiedlichen Varietäten des Deutschen. Der Unterschied besteht darin, dass die abgeschwächte (d.h. stimmhafte) Variante die weitestgehend neutrale, d.h. standardsprachlich akzeptierte Lautung im nordamerikanischen Englisch darstellt (Eckert 2008), wohingegen diese Variante nicht Teil des gegenwärtigen Standarddeutschen ist. Im Hinblick auf die Rezenzhypothese ließe sich somit prädizieren, dass deutschsprachige Hörer als Resultat eines Auslandsaufenthaltes in Nordamerika ihr episodisches Gedächtnis entsprechend aktualisiert haben, also den beiden Varianten gegenüber fundamental unterschiedliche Evaluationen zeigen, je nachdem, ob sie der Variable im Deutschen oder im Englischen ausgesetzt sind. Beispielsweise wäre davon auszugehen, dass sie Benutzern der abgeschwächten Variante [d] niedrigere Ratings hinsichtlich des Parameters Berufsstand zuweisen, wenn die Variante im Kontext des Deutschen präsentiert wird, als wenn diese vor dem Hintergrund des Englischen präsentiert wird. (2) Eine komplementäre Versuchsreihe untersucht die perzeptiven Korrelate, welche von nicht-muttersprachlern des Englischen mit Bezug auf Variablen geformt werden, die kein vergleichbares Korrelat im Deutschen aufweisen. Die relevante Testgruppe besteht aus Muttersprachlern des Deutschen, die einen mindestens sechsmonatigen Aufenthalt in England aufweisen können. Der diesem Wahrnehmungsexperiment zugrunde liegende Datensatz besteht aus drei soziolinguistisch stratifizierten Variablen des englischen Englisch, welche von den Probanden hinsichtlich der o.g. nicht-linguistischen Kategorien evaluiert wurden: (1) Alveolare vs. glottale Lautungen des intervokalischen /t/ in z.b. butter, city; (2) Diphthongale vs. monophthongale Lautungen des Vokals /i:/, wie in z.b. fleece, cheese; (3) Diphthongale vs. monophthongale Lautungen des Vokals /ei/, wie in z.b. face, fate. Diese Variablen wurden ausgewählt, da sie in ihrem nativen Kontext mit unterschiedlichen nicht-linguistischen Dimensionen korrelieren: Während es sich bei der konsonantischen Variable um eine hochsaliente Variable handelt, die in hohem Grad mit Faktoren wie Alter und sozioökonomischer Status korreliert (cf. Altendorf 2003, Rosewarne 1984), können die vokalischen Variablen /i:/ und /ei/ als insgesamt weniger salient angesehen werden. Darüber hinaus handelt es sich bei der Variable /ei/ um 6

eine stark regional stratifizierte Variable, da der Monophthong [e:] in der Regel ausschließlich im Norden Englands benutzt wird, der Diphthong [ei] hingegen ein Merkmal der südlichen Varietäten einschließlich der Received Pronunciation ( RP ) darstellt. Somit geht diese Experimentreihe einen Schritt weiter als die vorherige: Es soll nicht nur untersucht werden, ob Nicht-Muttersprachler grundsätzlich in der Lage sind, phonetischen Variablen in der Zielsprache nicht-zufallsverteilte Evaluationen hinsichtlich sozial-indexikalischer Kategorien zuzuweisen, sondern darüber hinaus auch, ob dieses Phänomen auch im Hinblick auf unterschiedliche nicht-linguistische Korrelate zu finden ist. Die Ergebnisse der Experimente seien im Folgenden kurz zusammen gefasst: Im Großen und Ganzen kann festgestellt werden, dass die Rezenzhypothese insofern zuzutreffen scheint, als dass Nicht- Muttersprachler eindeutig in der Lage sind, nicht-zufallsverteilte Assoziationen zwischen phonetischen Varianten und sozial-indexikalen Kategorien in der Zielsprache zu formen. Es kann ferner nachgewiesen werden, dass dieses Phänomen auch als Resultat eines Auslandsaufenthaltes begriffen werden kann. Es wird gezeigt, dass die Testgruppe in der ersten Versuchsreihe (also Deutsche mit Auslandserfahrung in Nordamerika) die dem Experiment zugrundeliegende Variable im Englischen ähnlich evaluieren wie die native, d.h. US-Amerikanische Kontrollgruppe, wohingegen die deutsche Kontrollgruppe in weiten Teilen andere Ergebnisse aufweist. Ferner wird nachgewiesen, dass die Testgruppe fundamental unterschiedliche Evaluationen hinsichtlich der beiden Varianten der Testvariable zeigt, je nachdem, ob diese im Kontext deutscher oder englischer Wörter eingebettet ist. Dieses Ergebnis stärkt exemplartheoretische Modelle der Sprachwahrnehmung, die von einer hybridartigen Verarbeitung von Sprachdaten ausgehen, d.h. dass die zugrunde liegenden kognitiven Repräsentationen jeglicher sprachlicher Kategorien sowohl linguistische als auch nichtlinguistische Merkmale umfassen. Die im Rahmen dieser UK condition erhaltenen Ergebnisse lassen allerdings ferner darauf schließen, dass sich nicht-zufallsverteilte Assoziationen zwischen phonetischen Variablen und nicht-linguistischen Kategorien in Teilen auch als Resultat sogenannter classroom standards begreifen lassen; Lerner neuen Varianten gegenüber also nicht absolut neutral gegenüberstehen, sondern einige der im Rahmen der vorherigen Lernerbiographie nicht angetroffenen Lautungsvarianten generell eher mit denjenigen sozial-indexikalischen Kategorien assoziieren, die man vielleicht unter der Metakategorie Nicht-Standard zusammenfassen kann (d.h. niedrigere Ratings bei Faktoren wie sozioökonomischer Status und Alter). 7

Jenseits des neuartigen Ansatzes zur Überprüfung der Rezenzhypothese in exemplartheoretischen Modellen der Sprachwahrnehmung und verarbeitung können die in Kapitel 2 analysierten Daten auch als Brückenschlag zwischen bis dato weitestgehend voneinander unabhängigen Teilbereichen der Linguistik betrachtet werden, nämlich der perzeptiven Soziophonetik auf der einen Seite und der Zweitsprachenerwerbsforschung auf der anderen. Die Beziehung zwischen diesen Teilgebieten ist in der Vergangenheit wenig untersucht worden, da sich die Zweitsprachenerwerbsforschung weitestgehend auf Fragen des Erlernens linguistischer Strukturen beschränkt und deren sozial-indexikalische Dimension weitestgehend ignoriert wurde, während die der empirischen Soziolinguistik zugrundeliegenden Forschungsfragen in der Regel auf Basis von L1-Daten untersucht wurden. Als Beispiel aus der jüngeren Vergangenheit, wo diese Teilbereiche miteinander in Bezug gesetzt werden, seien Drummonds Arbeiten zum Erwerb soziolinguistischer Variablen des Englischen seitens Muttersprachlern des Polnischen in Manchester genannt (Drummond 2010/11/12/13). Im Gegensatz zu dem im Kapitel 2 dieses Buches gewählten Forschungsansatzes nähert sich Drummond dem Thema von einem eher ethnographischen Standpunkt aus, wohingegen die hier vorgestellten Analysen einen laborgestützten, kontrollierteren Ansatz bieten. Des Weiteren fokussiert die Analyse in Kapitel 2 im Gegensatz zu Drummonds Daten im Allgemeinen eher auf die perzeptive Dimension soziophonetischer Varianz, auch wenn eine Reihe von im Rahmen dieser Experimente erhobener Produktionsdaten ebenfalls analysiert wird. Im Hinblick auf zukünftige Untersuchungen lässt sich auf Basis der vorliegenden Arbeit in Verbindung mit ihrer Einbettung in exemplartheoretische Ansätze zur Sprachwahrnehmung sicherlich argumentieren, dass das Thema Soziolinguistisches Lernen eine prominentere Rolle in der Zweitsprachenerwerbsforschung spielen sollte, was wiederum direkt aus den Prämissen der Exemplartheorie folgt: Wenn linguistische Repräsentationen tatsächlich komplex bzw. hybridförmig sind, d.h. sowohl Informationen hinsichtlich einer Reihe linguistischer Merkmale als auch eine ganze Reihe an weiteren Sprecher- und Sprechepisodencharakteristika enthalten und die in der jüngeren Forschung im Bereich Soziophonetik erhaltenen Forschungsergebnisse weisen sehr stark in diese Richtung bedeutet das qua Definition, dass das Konzept des Erlernens einer Sprache die Einbindung des Erlernens sozial-indexikalischer Kategorien und ihrer Relationen zu linguistischen Strukturen zwingend in Betracht ziehen muss. 8

Kapitel 3 Sociophonetic Learning in the Lab Kapitel 3 nähert sich dem Thema Soziophonetisches Lernen aus einer anderen Richtung: Grundsätzlich handelt es sich hierbei um Folgestudien zu einer Reihe explorativer Untersuchungen von Docherty, Langstrof und Foulkes (2008a/b, 2013; von hier an DLF ), deren grundlegende Zielsetzung es war, die vielleicht fundamentalste Hypothese exemplartheoretischer Ansätze der Sprachverarbeitung experimentell zu überprüfen, dass nämlich Hörer nachweislich in der Lage sein sollten, auf Basis von entsprechenden Inputdaten neuartige Assoziationen zwischen linguistischen Variablen und sozialen Kategorien zu entwickeln. Umgesetzt wurde dieser Ansatz seitens DLF, indem Versuchsteilnehmer in einer sog. Trainingssitzung mit nichtzufallsverteilten Assoziationen zwischen Varianten einer phonologischen Variable und hypothetischen Sprechergruppen konfrontiert wurden und diese daraufhin in einer Testsitzung replizieren sollten (siehe Kapitel 3 für eine genauere Beschreibung der zugrunde liegenden Methode). Zwar konnte gezeigt werden, dass der Ansatz funktioniert, da die Probanden in der Lage waren, zumindest einige der in der Trainingssitzung angetroffenen Assoziationen erfolgreich zu rezipieren, allerdings konnte nicht genau bestimmt werden, welche Faktoren letztendlich ein erfolgreiches Lernen in der Hauptsache prädizieren. Die in Kapitel 3 der vorliegenden Arbeit analysierten Daten erweitern diesen Forschungsansatz in verschiedene Richtungen: Zum einen wurden Probanden auch auf Variablen trainiert und getestet, die nicht Bestandteil ihrer Muttersprache sind, wohingegen die Daten von DLF ausschließlich attestierte Variablen umfassten. Hiermit einhergehend wird außerdem untersucht, inwieweit lexikalische Faktoren, die sich in der jüngeren Vergangenheit zunehmender Beliebtheit in der soziophonetischen Forschung erfreuen (Pierrehumbert 2001, Hay 2013), soziophonetisches Lernen beeinflussen. So beinhalten die in Kapitel 3 vorgestellten Experimente sowohl bekannte Variablen, die in echte Wörter eingebettet sind, aber auch eine Reihe von Variablen, die den Probanden vor dem Hintergrund einer Fantasiesprache präsentiert werden. Dadurch soll untersucht werden, ob soziophonetisches Lernen sich zuvorderst auf der Ebene des Wortes abspielt, wobei wir vermutlich Unterschiede hinsichtlich der Erlernbarkeit soziophonetischer Variabilität erwarten würden, je nachdem, ob eine ansonsten identische Variable im Rahmen echter oder Nonsens-Wörter eingebettet ist, oder ob der primäre Lokus soziophonetischen Lernens sich auf der Ebene der Variable selbst befindet, woraufhin wir derartige Unterschiede nicht erwarten würden. Des Weiteren beinhaltet eines der hier vorgestellten Experimente eine ungleichmäßige Verteilung von phonetischen Varianten über unterschiedliche Wörter in der Trainingssitzung, d.h. dass eine bestimmte Variante der zugrunde liegenden 9

Variable in einem der Testwörter öfters anzutreffen ist als in anderen Wörtern. Sollte das Wort der primäre Lokus soziophonetischen Lernens sein, so würde man erwarten, dass die Probanden diese unterschiedlichen Eingangsverteilungen als Funktion spezifischer Wörter in der Testsitzung replizieren. Darüber hinaus manipulieren einige der in Kapitel 3 vorgestellten Experimente sowohl die stochastische Robustheit der in der Trainingssitzung angetroffenen Variantenverteilungen, wie auch deren zugrunde liegende Verteilung über die hypothetischen Sprechergruppen. Während die in den DLF-Experimenten angetroffenen Eingangsdistributionen sowohl symmetrisch als auch relativ robust waren, beinhalten einige der in Kapitel 3 analysierten Folgeexperimente sowohl asymmetrische als auch weniger robust verteilte Eingangsverteilungen. Hiermit soll zum einen untersucht werden, ob erfolgreiches soziophonetisches Lernen eine lineare Funktion der stochastischen Robustheit von Eingangsverteilungen ist oder ob nicht-lineare Schwellenwerte vorliegen. Zum anderen dienen diese Manipulationen der Untersuchung etwaiger stochastischer Stereotypisierungen, d.h. der potentiellen Überassoziierung eines linguistischen Merkmals X mit ebenjener Sprechergruppe, die Merkmal X zwar relativ selten nutzt im Vergleich zum Komplementärmerkmal Y, auf der anderen Seite jedoch die einzige Gruppe ist, die X überhaupt benutzt. Die Ergebnisse zeigen, dass Probanden weitaus bessere Lerner soziophonetischer Variabilität sind, als sich aus den Studien von Docherty et al. ableiten ließ: Zum einen wird gezeigt, dass Probanden zumindest prinzipiell Eingangsverteilungen von soziophonetischen Variablen zu replizieren imstande sind, deren phonetisches Substrat nicht in ihrer Muttersprache vorkommt. Darüber hinaus zeigt sich, dass auch im Vergleich zu den DLF-Studien weniger robuste und asymmetrische Eingangsverteilungen weitestgehend eingangsverteilungsgetreu wiedergegeben werden. Auf der anderen Seite wird gezeigt, dass sich lexikalische Effekte insofern als weitestgehend irrelevant herausgestellt haben, als dass der Lernerfolg in diesen Experimenten unabhängig davon ist, ob die Variable in echten Wörtern eingebettet ist oder den Probanden im Rahmen einer Fantasiesprache präsentiert wird. Im Großen und Ganzen zeigt sich, dass der primäre Lokus soziophonetischen Lernens die phonologische Variable ist. Darüber hinaus werden die Ergebnisse vor dem Hintergrund der Konzepte der Salienz und des Probability Matchings interpretiert. Während das Konzept der Salienz seit geraumer Zeit eine zentrale Rolle in der soziolinguistischen Diskussion einnimmt, bleibt es doch notorisch ungreifbar hinsichtlich sowohl seiner Ontologie bzw. explanatorischen Kraft als auch seiner Messbarkeit. Während das Problem der Ontologie (z.b.: ist Salienz 10

Explanans oder Explanandum?) hier nicht weiter behandelt werden soll (hier sei auf die relevanten Diskussionen in Auer et al. (1998) und Kerswill and Williams (2002) verwiesen), wird argumentiert, dass es sich bei dem den Experimenten zugrundeliegenden methodischen Ansatz um einen nichtzirkulären Ansatz zur Messbarkeit zumindest einer spezifischen Facette der Salienz handelt, nämlich der variablen-intrinsischen (d.h. intern im Labovschen Sinne, also der linguistischen und distributionalen Eigenschaften eines sprachlichen Merkmals, unabhängig von sozialen Faktoren) und paradigmatischen Salienz (siehe Kapitel 3 und 5 der vorliegenden Arbeit für eine detailliertere Darstellung der Abgrenzung unterschiedlicher Teilaspekte eines potentiellen Gesamtkonzeptes der Salienz). Probability Matching ist ein aus den Verhaltens- und Wirtschaftswissenschaften entnommener Terminus (cf. inter alia Cosmides und Toby 1996, Gallistel 1990/2005, Gigerenzer 2000, Harper 1982, Vulkan 2000, Weber 1998), welcher von Labov im Bezug auf die Soziolinguistik diskutiert wurde (1994: 580-88, siehe Kapitel 3 der vorliegenden Arbeit für eine kurze inhaltliche Darstellung). Labov argumentiert, dass die Art des Probability Matchings, wie sie in nichtsprachlichen Mustererkennungsstrategien seitens unterschiedlicher menschlicher und nicht-menschlicher Probanden angewandt wird, auch die grundlegende Herangehensweise von Sprachlernern bei der Verarbeitung soziolinguistisch stratifizierter Variation darstellt. Labov stellt dar, wie sich bestimmte beobachtete Muster des Sprachwandels (hier insbesondere sog. pull chains ) direkt als Resultat einer Probability-Matching-Strategie erklären lassen, allerdings wird nicht experimentell nachgewiesen, dass es sich hierbei um eine universelle Verhaltensstrategie bei soziolinguistischen Lernern handelt. Dieser Sachverhalt wird in Kapitel 3 beleuchtet; zusammenfassend kann festgestellt werden, dass Lerner tendenziell zwar einem dem Probability Matching entsprechenden Ansatz zu folgen scheinen, es allerdings auch dezidierte Ausnahmen gibt. So scheinen Lerner beispielsweise eine prononcierte Abneigung gegen die Replikation von Varianten aufzuweisen, die in den Trainingsdaten eine kategorische Assoziierung mit hypothetischen Sprechergruppen aufweisen. Kapitel 4 Variable Learning in L1 and L2 Kapitel 4 führt den den DLF-Experimenten wie auch den Kapitel 3 zugrunde liegenden methodischen Ansatz in zweierlei Hinsicht weiter: Zum einen wird überprüft, wie sich Probanden mit im Vergleich zu den vorigen Experimenten in verschiedenerlei Hinsicht komplexeren Trainingsdaten verhalten. Auf der anderen Seite wird ebenfalls analysiert, ob und wie Mustererkennung vor dem Hintergrund minimal komplexer Eingangsdaten funktioniert. Darüber 11

hinaus kann Kapitel 4 als Brückenschlag zwischen den Themen der vorherigen Kapitel, nämlich laborgestütztes Lernen soziophonetischer Variabilität (Kapitel 3) und Perzeption/Evaluation von Variablen in einer Fremdsprache (Kapitel 2), betrachtet werden, da sich die Probandenstichproben in einigen der im Kapitel besprochenen Testbedingungen sowohl aus Muttersprachlern, als auch aus Nicht- Muttersprachlern der den Trainingsdaten zugrundeliegenden Sprache (in diesem Fall Englisch) zusammensetzen. Hinsichtlich des Gesichtspunktes der Komplexität sei in Erinnerung gerufen, dass sowohl die DLF-Experimente als auch die in Kapitel 3 der vorliegenden Arbeit besprochenen Folgeexperimente bezüglich der den Probanden in der Trainingsphase präsentierten Eingangsdaten ausnahmslos je zwei Varianten einer linguistischen Variable beinhalteten, die ferner über genau zwei hypothetische Sprechergruppen verteilt waren. Zwei der in Kapitel 4 vorgestellten Testbedingungen erhöhen die intrinsische Komplexität des Datenpools in der Trainingssitzung hinsichtlich der Anzahl der zugrunde liegenden Variablen (hierbei handelt es sich um die Testbedingung condition 4/1, im Rahmen derer die Probanden in der Trainingssitzung drei Variablen anstelle von einer antrafen), sowie auch hinsichtlich der sozialen Komplexität (Testbedingung condition 4/2, im Rahmen derer Varianten über drei anstelle von zwei hypothetische Sprechergruppen verteilt wurden). Die der erstgenannten Testbedingung zugrundeliegende Fragestellung ist die der Variableninteraktion; mit anderen Worten, können wir die Lernbarkeit bzw. Salienz einer Variable und ihrer Varianten überhaupt als Funktion ihrer selbst greifen oder hängt dieses auch von der Präsenz zusätzlicher Variablen im Gesamtdatensatz ab? Die in Kapitel 4 analysierten Ergebnisse zeigen, dass Lernbarkeit soziophonetischer Varianz zumindest in Teilen davon abhängig ist, ob sich weitere Variablen im Datenpool befinden. Auf der anderen Seite wird ebenfalls gezeigt, dass zusätzliche Komplexität bezüglich der Komplexität der sozialen Korrelate (also der Anzahl der hypothetischen Sprechergruppen) so gut wie keine Rolle hinsichtlich der Fähigkeit zur erfolgreichen Mustererkennung spielt. Zusätzlich zu den im Vergleich zu den vorhergehenden Testbedingungen komplexeren Eingangsdistributionen werden in Kapitel 4 ebenfalls die Ergebnisse einer Testbedingung analysiert, die Probanden mit minimal komplexen Variantenverteilungen konfrontiert, welche zudem nicht Teil ihrer nativen Hörerbiographie darstellen (Testbedingung condition 4/3 ). Es handelt sich um eine Gruppe nativ deutschsprachiger Probanden, welche mit glottalen vs. alveolaren Varianten intervokalischer Verschlusslaute im Rahmen englischer Wörter konfrontiert wurden. Es wird gezeigt, dass Probanden nicht-zufallsverteilte Assoziationen zwischen phonetischen 12

Varianten und hypothetischen Sprechergruppen bereits auf Basis der kleinstmöglichen Eingangsverteilung, nämlich eines einzigen gruppendefinierenden Tokens, zu bilden imstande sind. Hinsichtlich des Vergleiches von nativen gegenüber nicht-nativen Probanden in der Testbedingung condition 4/1 wird gezeigt, dass die Antwortdistributionen der nicht-nativen Probanden am besten als Ergebnis einer komplexen Interaktion von unterschiedlichen Faktoren greifbar werden, insbesondere (a) den linguistischen Merkmalen der Muttersprache, (b) soziolinguistischer classroom standards (s.o.), sowie (c) zielsprachenrelevanter Auslandserfahrungen. Schließlich geht Kapitel 4 einen kleinen Schritt in Richtung der Untersuchung von Lernbarkeit nicht-phonologischer Variablen relativ zur Lernbarkeit phonologischer Variablen: So handelt es sich bei einer der in Testbedingung condition 4/1 zugrundeliegenden Variablen um eine morpho-syntaktische, nämlich doppelte Verneinung, welche in den Trainingsdaten in Verbindung mit zwei phonologischen Variablen tflapping sowie Vokalqualität in /æ/ - präsentiert wurde. Abschließend seien hier die zentralen Untersuchungsergebnisse der vorliegenden Arbeit noch einmal stichpunktartig zusammengefasst: (1) Nicht-Muttersprachler sind kompetente Lerner soziolinguistischer Variabilität. Somit lässt sich die Hypothese, dass rezente Erfahrungen bezüglich linguistischer Variablen und ihrer assoziierten nichtlinguistischen Kategorien eine formative Schlüsselrolle in der Repräsentation kognitiver linguistischer Kategorien einnehmen, auf Basis dieser Daten stützen. (2) Bezüglich der perzeptiven Evaluation linguistischer Variablen von Nicht-Muttersprachlern beobachten wir eine Interaktion zwischen im Rahmen der formalen Lernens, d.h. auf Basis negativer Evidenz hinsichtlich der zuvor nicht angetroffenen Variante extrapolierten soziolinguistischen classroom standards auf der einen Seite und der als Resultat entsprechender Auslandserfahrungen erworbenen soziolinguistischen Kompetenz auf der anderen Seite, wobei im Konfliktfall letztere überwiegt. (3) Laborgestütztes Lernen soziophonetischer Variabilität findet primär auf der Strukturebene der phonologischen Variable statt. Alternative potentielle Faktoren wie beispielsweise Variante, Wort oder 13

Robustheit bzw. Form der Eingangsdistribution spielen untergeordnete Rollen. (4) Hinsichtlich der Mustererkennung, also der intrinsischen Salienz linguistischer Merkmale, lässt sich somit eine Prädiktorenhierarchie ableiten (Wichtigster zu Unwichtigster): >Vertrautheit mit der phonologischen Variable / Phonetischen Distanz zwischen den Varianten der Variable >>Form der Eingangsdistribution >>>Stochastische Robustheit der Eingangsdistribution >>>>Phonetische Merkmale spezifischer Varianten/Lexikalische Faktoren (5) Die Lernbarkeit spezifischer linguistischer Variablen interagiert mit dem Vorhandensein zusätzlicher Variablen in einem gegebenen Datenpool, womit Lernbarkeit bzw. intrinsische Salienz linguistischer Merkmale nur bedingt als Funktion variableninterner Merkmale erklärbar ist. Diese Variableninteraktion lässt sich ferner auch über unterschiedliche linguistische Strukturebenen nachweisen; so wird gezeigt, dass das Vorhandensein einer morpho-syntaktischen Variable die Lernbarkeit phonologischer Variablen erschwert. (6) Mustererkennung von nicht-zufälligen Eingangsverteilungen findet bereits auf Basis sehr kleiner Mengen sozial relevanter Daten statt. Es kann nachgewiesen werden, dass bereits ein einziges Token ausreicht, um soziale Kategorien auf Basis linguistischer Variabilität zu identifizieren. Des Weiteren wird nachgewiesen, dass bereits bei zwei gruppen- und sprecherspezifischen Tokens einer Variante einer linguistischen Variable diese seitens der Probanden als Merkmale der Gruppe und nicht etwa individueller Sprecher angesehen werden. 14

Chapter 1 Introduction This is a book on sociophonetic learning. Drawing on two interwoven strands of experiments, it will be investigated whether and to what extent adult learners are able to form novel associations between sociophonetic variants and non-linguistic categories. The topic will be approached from two angles: Chapter 2 will look at the way in which non-native learners evaluate sociophonetic variation in a second language. It will be investigated whether German learners of English display non-random associations of sociophonetic variants with basic nonlinguistic categories such as occupational status, age, and likeability. Specifically, I will compare Germans with some degree of first-hand experience with English in either England or North America to Germans without such prior knowledge as well as native speakers of each of the two varieties of English. A complementary set of experiments will be discussed in chapters 3 and 4, which will adopt a more experimental approach to sociophonetic learning: Based on a methodological framework designed by Docherty et al. (2013, henceforth DLF), listeners were trained on non-random associations between linguistic variants and hypothetical social categories, and subsequently tested on whether they have managed to memorize the distributions of phonetic variants across extra-linguistic labels which they encountered in the training data. In other words, these experiments test whether and to what extent listeners are able to form truly novel associations between linguistic variants and artefactual social categories, an issue that has drawn little attention in the sociophonetics literature so far. Whereas chapter 3 essentially represents a range of fine-grained follow-up tests to the pioneering experiments discussed by Docherty et al., chapter 4 seeks to connect the two approaches as outlined in chapter 2 and 3 by applying Docherty et al.'s methodological framework against the background of sociophonetic learning in L2. In addition, chapter 4 will extend the DLF approach in the direction of investigating data sets of different degrees of inherent complexity in that both more complex and less complex data sets will be investigated. On a theoretical level, I would like to argue that the data analyzed in this volume will shed light on various concepts that have been discussed in 15

various quarters of sociolinguistics, specifically exemplar theory, salience, and probability matching. Sociophonetics and Sociolinguistics There seems to be some degree of terminological fuzziness as regards the concept sociophonetics, which is perhaps unsurprising given the relative youthfulness of the field. Specifically, a broad definition of the term sociophonetics seems to compete with a narrower one. The former kind of view on the subject essentially embodies a methodological take to the extent that under this view, any study that investigates a given range of phonetic features while being sensitive to the non-linguistic factors (such as social characteristics of the speaker) can rightfully be regarded as an instance of doing sociophonetics (cf. the discussion in Thomas 2011: ch. 1). Crucially, this kind of approach would certainly go back to Labov et al s early variationist studies from the 1970s that draw on measurable phonetic variables and their variants in order to arrive at models of structured heterogeneity in various speech communities (Labov, Yaeger, and Steiner 1972). The narrower view, poignantly epitomized by the title of Labov s 2006 article a sociolinguistic perspective on sociophonetics (which essentially amounts to a pleonasm under the broader definition), essentially identifies sociophonetics with an underlying theoretical agenda, specifically exemplarist approaches to speech perception, production, processing, and storage. This perceived discrepancy follows from the fact that the major protagonists in recent sociophonetic research have strongly focused on the role of frequency in the context of sociophonetic alternants embedded in specific lexical items (cf. inter alia Pierrehumbert 2002). Labov correctly states that his caveat is not merely a question of labels. Rather, it exemplifies two different interpretations regarding the prime level of analysis in the perception and processing of linguistic data: Do speakers/listeners operate on the level of the word, or on the level of more abstract structural entities such as phonemes? If we identify the word as the primary predictor of distributions of sociophonetic variants, it is hard to account for the fact that it is ultimately the phonemes and their allophones that act as structural protagonists in the vast majority of attested sound changes. In this book, I hope to be able to show that stochastic learning can be investigated and interpreted against the background of some of the predictions that logically emerge from episodic-memory approaches to phonetic processing without any necessary a priori (nor posteriori) 16

commitment to word-based approaches. In fact, the data as it emerges from the learning experiments that will be reported on in chapters 3 and 4 of this volume strongly suggest that (a) stochastic learning takes place, and that (b) the primary level learners operate on is the sociolinguistic variable. In other words, this work can be regarded as representing an interface between the general interpretation, on the one hand, and the narrower, more theory driven one, on the other hand. The structure of this book Chapter 2 Sociophonetic learning in L2 This book contains three substantive chapters: Chapter 2 will present data from a range of perception experiments that aim at investigating whether and to what extent non-native speakers have any sort of non-random association of phonetic variables and their associated variants with a range of social-indexical categories. Furthermore, it will be investigated whether such associations, if present, are the result of pre-existing universal learnerlanguage defaults or whether they can be shown to be malleable as a result of first-hand experience with the target language in its native environment. In other words, the experiments that will be reported on in chapter 2 involve a comparison of L2 listeners with some measure of first-hand experience with English as opposed to L2 listeners without. On the theoretical level the data will be loosely couched and interpreted against the background of exemplar theory. Specifically, the data was designed to address what can be paraphrased the 'recency hypothesis' (Goldinger 2000), which essentially claims that recent linguistic experiences have a comparably strong impact on the shape and strength of sociophonetic representations in speech perception and processing. It will be argued that the kinds of data that will be discussed in chapter 2, i.e. perception of L2 variants, allow for a more direct assessment of this hypothesis compared to earlier approaches to investigating the topic of recency such as Harrington s analysis of Queen Elizabeth 2 nd s Christmas speeches over the last decades (Harrington et a. 2000a/b, Harrington 2006). Two interwoven strands of data will be analyzed: The first strand consists of data from native speakers of German with some degree of firsthand experience with North American English. This group as well as two control groups Germans without first-hand experience with US English and native US English speakers were asked to evaluate a phonetic variable 17

along a range of non-linguistic categories including age, occupational status, and likeability. The overarching aim of this condition was to investigate whether phonetically similar variables are evaluated differently if they are being presented in the context of different languages, which is very much what we would expect under current exemplar-theoretical approaches to sociophonetic perception and processing. Of course this expectation would only be borne out if the kinds of sociolinguistic associations differ across the two languages in question. The variable that was chosen for analysis is intervocalic t-attenuation, which occurs in US English as well as in a range of accents of German. The difference resides in the fact that attenuated /t/ represents the unmarked baseline i.e. everyday variant in North American English (Eckert 2008), whereas this is never part of the Standard in contemporary Germany. If the recency hypothesis is correct, episodic memory would be expected to lead listeners who have experienced the markedness differences that hold differentially across the two languages with regard to the two variants of intervocalic /t/ to have developed different value judgments as a function of ambient language. For example, they would be expected to associate the attenuated variant with comparably lower occupation ratings when the variant is presented in the context of German data compared to US English data. A related strand of experiments investigated in chapter 2 looks at how L2 listeners deal with variables that do not have a straightforward correlate in their native language. The test group consists of native speakers of German with some amount of first-hand experience with UK English. Participants in this condition were asked to provide value judgments on three variables: (1) Alveolar vs. glottal variants of intervocalic /t/ as in e.g. butter, city; (2) Diphthongal vs. monophthongal variants of /i:/ as in e.g. fleece, cheese; (3) Diphthongal vs. monophthongal variants of /ei/ as in face, fate, etc. The idea behind the selection of these variables was to investigate how non-native listeners handle non-standard variants, which also show different types of correlation with extra-linguistic social-indexical categories on top of showing differential degrees of salience in the native UK speech community: Whereas the intervocalic stop variant represents a highly salient non-standard variant that correlates mainly with age and social class, the vocalic variables (i) and (ei) can be argued to be rather less salient overall (cf. Docherty et al. 2013); in addition, the (ei) variable is primarily associated with the factor region in that the monophthong is a typically Northern English variant contrasting with Southern (including RP) diphthongized [ei]. Hence, this line of experiments aimed at looking beyond the question of 18

whether or not non-native listeners are in principle capable of forming native-like associations of phonetic variants with social-indexical categories in that the underlying question is whether this type of sociophonetic learning applies in a native fashion with regard to socially different types of variables which furthermore do not occur in the test subjects native language. Overall, it will be shown that the recency hypothesis can be upheld since non-native listeners are capable of forming non-random associations between phonetic variants and extra-linguistic categories, which can furthermore be shown to be partly a function of exposure to L2 in its native environment: Germans with first-hand experience with US English show associations that are more similar to the US control group than they are to the German control group. In addition, it will also be shown that fundamental differences exist within the test group in terms of evaluating a phonetically similar variable in the context of German data compared to English data. This finding lends strong support to models of speech perception that recognize hybrid representations of perceptual exemplars including both phonetic and non-linguistic information regarding the relevant data points. The data from the UK test and control subjects furthermore reveals that L2 learners form sociolinguistic defaults as a function of formal learning, that is, control subjects also reply in a nonrandom fashion when evaluating phonetic variants against a range of nonlinguistic categories, which can be regarded as a classroom standard that develops during their learning in an L2 environment. Overall, it will be argued that what we essentially observe is an interaction of classroom defaults with later first-hand experience in a foreign language when it comes to the social evaluation of phonetic variables and their associated variants. In other words, L2 listeners seem at least in parts be able to operate on negative data scenarios. Apart from offering a novel perspective on testing the recency hypothesis in exemplar-based models of speech perception and processing, chapter 2 can also be regarded as a link between what used to be largely unconnected fields of research in linguistics thus far, namely perceptual sociolinguistics and second-language acquisition. This link has remained rather under-researched in the past as research in second-language acquisition has mainly focused on the acquisition of linguistic structure rather than their non-linguistic correlates, whereas sociolinguistics has predominantly focused on data from speakers native language rather than languages that are being learned later on in a given speaker s linguistic biography. Recent steps towards linking the two fields include Drummond s 19

work on the acquisition of local non-standard variants of English on the part of Polish immigrants in Manchester (Drummond 2010/11/12/13). Unlike the data presented in chapter 2 of this book, Drummond s research essentially investigates the issue using a community-research type of approach, whereas the work presented in this book takes a more lab-based approach. In addition, the data that will be analyzed in chapter 2 focuses more strongly on speech perception rather than production. I would like to maintain that the topic of sociolinguistic learning should take a more prominent position in the field of L2 acquisition, which follows directly from the insights gained from exemplar-theory accounts of language acquisition: If linguistic representations are indeed complex in that linguistic representations include both information on linguistic structure and a rich array of social-indexical correlates and an increasing body of evidence in sociophonetics suggests that this is the case - it follows that the concept of learning a language by definition needs to incorporate notions of learning of social-indexical categories. Chapter 3 Sociophonetic Learning in the Lab Chapter 3 will investigate the constraints and capabilities of lab-based learning of sociolinguistic representations. It essentially represents a range of follow-up studies to earlier exploratory studies by Docherty, Langstrof, and Foulkes (2013), who aimed at testing what can be regarded as the basic prediction of episodic-memory theories of sociolinguistic processing, namely that listeners should be able to form novel associations between linguistic variants and non-linguistic categories after previous exposure to appropriate kinds of data. This was implemented by training participants on data that consisted of variants of attested sociolinguistic variables that were tied to hypothetical speaker groups in a training session (cf. ch. 3 for a more indepth description of the methodology involved). Although this approach was shown to work in that listeners are in principle capable of forming such novel associations, the limits and capabilities of de novo sociophonetic learning remained somewhat unclear. The experiments that will be reviewed in chapter 3 of this book have extended the original approach in various ways: First of all, some of the test conditions trained and tested listeners on variables that do not exist in their native language, whereas the DLF experiments focused on training and testing listeners on the basis of known variables. Lexical effects, which have recently gained renewed attention in frequency-based accounts of sociophonetic learning in the exemplartheoretical vein (Pierrehumbert 2001, Hay 2013), will also be investigated: 20

First of all, some of the data involves known (i.e. real-world ) variables presented in the context of nonce-words in order to investigate whether lexical embedding in any way influences the degree to which learners internalize input distributions of phonological variants distributed over hypothetical speaker groups. This addresses the question of whether sociophonetic learners operate primarily on the level of the word in which case we would probably expect differences in terms of learnability between variables embedded in real words as opposed to nonsense words or whether they operate primarily on the level of the phonological variable, in which case we would not expect any particularly striking differences across the two modes of exposure. In a related vein, one of the conditions involves differential degrees of strength across specific lexical items in terms of their likelihood of being associated with one of the hypothetical speaker groups in the input data, the question would then be whether such differences are also found in the output data participants produce in the test session of the experiment. Additional experiments that will be reviewed in chapter 3 manipulate the strength and the shape of the variant distributions participants encountered in the training session. Whereas all of the experiments that were reported on in Docherty et al. (2013) involved input distributions that were both symmetrical 1 as well as relatively robust 2, some of the follow-up conditions that will be analyzed in chapter 3 exposed participants with either asymmetrical distributions or less solidly weighted ones. The main idea behind this approach was to investigate whether learning success in this type of task is a linear function of the robustness of the input data, or whether we observe abrupt cut-off effects. In addition, these conditions also aimed at investigating whether input data is taken at face value, or whether participants can be led to form stochastic stereotypes, i.e. to overascribe a given feature X to a group which uses X rarely in comparison to a complementary feature Y, while at the same time being the only group overall that uses X. Overall, it will be shown that listeners are rather more capable of forming novel associations between phonological variables and social- 1 This relates to the distribution of variants across the two hypothetical speaker in the training session of the DLF experiments: If one of the two groups uses variant x 80% of times while using variant y 20% of times, this weighting was mirrored in the complementary group to the effect that this group would use x 20% of times and y 80% of times. This symmetrical set-up was used in all of the tasks in the DLF experiments. 2 Robustness here relates to the strength of the association of variants with hypothetical speaker groups, where the DLF experiments used either a categorical input distribution in the training session i.e. one group would always use variant x, while the complementary group always used y or a strongly preferential association in the order of 80%<>20%, cf. footnote 1 above. 21

indexical categories than was originally anticipated by Docherty et al.: They are well capable of replicating input distributions even in scenarios where the phonetic substance of the variable is unknown; in addition, they tend to replicate input frequencies rather faithfully even if these are asymmetrical or less robustly weighted in comparison to the kinds of weightings participants encountered in the DLF tasks. Lexical effects, on the other hand, will be shown to be virtually non-existent. Overall, a strong case will be made in favor of regarding the phonological variable as the primary level of sociophonetic learning. In addition, the results will also be interpreted against the background of salience and probability matching. The former concept has a long pedigree in various corners of linguistics, while at the same time being notoriously elusive in terms of measurability and explanatory force. Whereas the latter problem what does the concept of salience buy us? will not be discussed, it will argued that to some extent at least, the kinds of experimental set-up that underlies the data in chapter 3 reflects one aspect of salience rather directly, namely the degree to which differential degrees of noticing hold as a function of the phonetic shape of the variable and its associated variants as well as the distributional properties of the variants. In other words, it will be argued that these tasks represent a way to measure variable-intrinsic salience in a non-circular manner. Probability matching is a term that ultimately stems from research in the behavioral sciences as well as in economics (cf. inter alia Cosmides and Toby 1996, Gallistel 1990/2005, Gigerenzer 2000, Harper 1982, Vulkan 2000, Weber 1998; for an accessible overview cf. http://naturalrationality.blogspot.de/2007/11/probability-matching-briefintro.html) and has been introduced into the field of linguistic by Labov (1994: 580-88, cf. ch. 3 for a brief description of the concept). Labov essentially claims that the probability matching strategy as observed in various pattern-detection tasks also represents the way language learners deal with sociolinguistically stratified variation. An elaborate case is made for probability matching as the underlying mechanism behind specific types of sound changes (pull chains); however, no direct experimental evidence has been shown so far that shows that this is what people actually do when approaching linguistic data sets. This blank will be addressed in chapter 3 below; in a nutshell, it will be argued that listeners can be regarded as probability matchers overall, while at the same time various caveats also apply, which is to say that listeners do not always replicate the training data perfectly. For example, listeners are relatively reluctant to reproduce input 22