3.1. La découverte des sons de la langue

Les langues humaines contiennent une grande quantité d’éléments de base appelés les phonèmes. On en dénombre environ 800 dont 600 consonnes et 200 voyelles (Ladefoged, 2004). Chaque langue utilise une petite partie de ces phonèmes, une quarantaine en moyenne, pour former les mots constituant son vocabulaire. Ainsi, en français nous utilisons 15 voyelles et 23 consonnes soit 38 phonèmes (Canault, 2017) avec quelques petites variations en fonction des accents régionaux.

Les phonèmes correspondent techniquement aux unités sonores minimales de la langue dont la combinaison selon des règles propres à chaque langue, également appelées règles phonotactiques, permettra de construire des mots. La spécificité des phonèmes est, notamment, qu’ils ne sont pas indifféremment interchangeables.

Exemple : le mot « main » est construit par la succession des phonèmes /m/ et /ɛ̃/(ain). Si on substitue /n/ à /m/, le mot produit ainsi que sa signification seront modifiés ; « main » devenant « nain ».

Une sensibilité précoce aux sons de la langue maternelle

L’être humain a une affinité toute particulière avec la langue et le langage. On sait depuis de nombreuses années que le nouveau-né est très sensible aux stimulations sonores humaines, bases de l’acquisition du langage (Gervain & Werker, 2008). L’acquisition de la langue maternelle repose en fait sur un système de perception des sons opérationnel bien avant la naissance (Byers-Heinlein et al., 2010). À 25 semaines d’aménorrhée (± cinq mois de gestation), une stimulation acoustique à proximité de l’abdomen de la mère provoque des clignements des paupières chez le fœtus (Birnholz & Benacerraf, 1983) et une augmentation du rythme cardiaque entre 26 et 28 semaines d’aménorrhée (Kisilevsky et al., 1992). Plus récemment, des études menées par magnétoencéphalographie[1] (Holst et al., 2005) sur des fœtus de 27 semaines et par IRMf[2] (Moore et al., 2001) sur des fœtus de 35 semaines confirment leur perception d’informations auditives extérieures. La maturation de l’oreille et du cerveau serait donc suffisante pendant le dernier trimestre de vie intra-utérine pour permettre au fœtus de percevoir l’environnement sonore interne (bruit du cœur de la mère, pulsations de l’artère placentaire, bruits intestinaux, etc.), mais surtout extérieur (la voix de la mère). Les données d’imagerie cérébrale permettent, par ailleurs, d’objectiver les observations comportementales faites dans les années 1980, à savoir que les nouveau-nés reconnaissent les caractéristiques prosodiques de leur langue maternelle (Mehler et al., 1988), la voix de leur mère (Ockleford et al., 1988) ou, plus récemment, qu’ils sont capables de reconnaître les comptines récitées par la maman quelques jours avant la naissance.

Question 4 : les nouveau-nés exposés in utero à deux langues ont-ils une préférence pour l’une d’entre elles ?

En 2010, Byers-Heinlein et collaborateurs ont mené une étude très intéressante sur la préférence linguistique de nouveau-nés exposés in utero à deux langues rythmiquement différentes, l’anglais et une langue de la branche philippine (le tagalog), comparativement à des nouveau-nés exposés à une seule langue. La procédure utilisée pour évaluer la préférence des nourrissons est celle du calcul de l’amplitude (nombre) de succion sur une tétine, procédure classiquement utilisée en psychologie développementale pour déterminer l’intérêt de tout jeunes enfants pour une stimulation donnée. La Figure 6 illustre la procédure utilisée par les chercheurs.

 

Figure 6 : Préférence linguistique du nouveau-né en fonction de l’exposition linguistique prénatale d’après l’expérience de Byers-Heinlein et collaborateurs (2010).

Au-delà du fait de montrer que les nouveau-nés monolingues ont une préférence marquée pour la langue parlée par la mère pendant la grossesse, l’expérience de Byers-Heinlein et collaborateurs met en évidence que les nouveau-nés exposés à deux langues pendant la période prénatale réagissent de manière similaire à chacune de ces langues lorsqu’ils y sont exposés après la naissance. En d’autres termes, les nouveau-nés n’ont aucune préférence marquée pour une des langues parlées par la maman pendant la grossesse et y réagissent de manière égale, marquant ainsi qu’ils les considèrent toutes deux comme familières.

Question 5 : les nouveau-nés différencient-ils réellement les langues auxquelles ils sont exposés ?

Les résultats détaillés ci-dessus semblent logiques et pourraient même relever d’une lapalissade. Cependant, aussi naturels que ces résultats puissent paraître, on peut se poser la question d’une réelle absence de préférence ou d’une non-différenciation voire d’une confusion des deux langues. En d’autres termes, l’amplitude de succion similaire pour les deux langues ne serait-elle pas plutôt l’indice d’une non-différenciation des langues plutôt que celui d’une absence de préférence ? Afin de départager ces deux hypothèses, Byers-Heinlein et collaborateurs ont complété le premier versant de leur expérimentation par un second également basé sur l’analyse de l’amplitude de succion. Dans la procédure expérimentale illustrée dans la Figure 7, l’enfant est exposé de manière répétitive à l’anglais. Après un intérêt pour l’écoute de l’anglais marqué par une amplitude de succion importante, l’enfant s’habitant à l’écoute de cette langue va diminuer son comportement de succion. Ce n’est que lorsque la stimulation auditive va changer au profit du tagalog que l’amplitude du comportement de succion va de nouveau augmenter, signe que l’enfant a perçu la différence entre la nature des stimulations.

 

Figure 7 : Procédure expérimentale utilisée par Byers-Heinlein et collaborateurs (2010) dans la mise en évidence de la discrimination des langues chez le nouveau-né.

Cette étude est intéressante sur deux points. Premièrement, elle met en évidence la capacité des nouveau-nés à différencier des langues rythmiquement et structurellement différentes (dans notre exemple, l’anglais et le tagalog), et deuxièmement, elle souligne le fait que les enfants bien qu’ils puissent distinguer ces langues vont avoir une préférence marquée pour la (ou les langues) parlée(s) par la mère pendant la grossesse. Ces données sont également confirmées pour des langues rythmiquement et structurellement similaires (par exemple : l’espagnol et le catalan).

Question 6 : les nourrissons bilingues traitent-ils leurs langues maternelles de la même manière que les nourrissons monolingues ?

Comme nous venons de le voir, les langues sont très rapidement différenciées et traitées séparément par le nourrisson bilingue. On peut néanmoins se poser la question de savoir si les langues auxquelles il est exposé sont individuellement traitées de la même manière que par un nourrisson monolingue.

Bosch et Sebastián-Gallés se sont intéressés à cette question dans le cadre de nombreuses études sur le bilinguisme ‘catalan-espagnol’. Une des plus connues date de 1997 et porte sur la rapidité d’orientation de la tête vers une source sonore chez de tout jeunes enfants de quatre mois. Trois groupes d’enfants ont participé à l’étude : (1) monolingues ‘catalan’, (2) monolingues ‘espagnol’ et (3) bilingues ‘catalan-espagnol’. Chacun des trois groupes était exposé à une série de phrases dans sa (ou ses) langue(s) maternelle(s) (à savoir espagnol ou catalan pour les enfants monolingues, et espagnol et catalan pour le groupe bilingue) ou dans une langue non native (l’anglais). La Figure 8 illustre la procédure expérimentale proposée par les auteurs.

 

Figure 8 : Procédure d’orientation du regard en direction d’une source sonore.

De manière attendue, les enfants monolingues orientent plus rapidement leur regard vers la source sonore diffusant une phrase dans leur langue maternelle que vers celle diffusant une phrase dans une langue non native. En revanche, et de manière inattendue, les enfants bilingues se comportent différemment des monolingues. En effet, s’ils orientent leur tête à la même vitesse vers chacune de leur langue maternelle, ils l’orientent plus rapidement vers la source sonore diffusant une langue non native. Ces résultats sont, en première analyse, assez surprenants et pourraient laisser penser que les enfants ne reconnaissent pas leurs langues voire les confondent avec une autre langue qu’elle soit rythmiquement différente ou non. Bosch et Sebastián-Gallés vont proposer une autre explication qui sera reprise et confirmée par les données de Molnar et collaborateurs (2014). Pour eux, contrairement à ce qui se passe chez l’enfant monolingue qui va rapidement déterminer quelle est la langue familière (catalan ou espagnol selon sa langue maternelle) et la langue non familière (l’anglais), les enfants bilingues vont mettre en place une étape supplémentaire qui va ralentir le processus d’orientation du regard. Concrètement, ils vont : (1) déterminer si la langue entendue est familière ou non et (2) identifier la langue familière dont il s’agit, ce qui prendra logiquement plus de temps. En réponse donc à la question que nous nous posions, à savoir « les nourrissons bilingues traitent-ils les langues de la même manière que les enfants monolingues ? », on peut répondre, dans l’état actuel de nos connaissances, qu’ils présentent sans doute des capacités de discrimination similaires, mais qu’ils procèdent qualitativement de manière différente pour discriminer les langues.

Question 7 : les nourrissons bilingues peuvent-ils différencier les langues sur la base d’indices visuels ?

Si les indices auditifs sont les plus clairs pour discriminer les langues parlées, il ne faut pas oublier que la parole est multimodale et que, lorsque nous nous exprimons oralement, une série d’autres indices viennent compléter nos productions sonores. Parmi ceux-ci, on notera l’importance des indices visuels. En effet, lorsque nous parlons, les structures de notre visage bougent en imprimant à notre bouche (pour ne parler que de la structure la plus visible) des allures différentes. L’enfant en phase d’acquisition du langage va utiliser ces indices en plus de la stimulation sonore afin de déterminer les régularités de la langue.

Comme nous le verrons dans la section 3.1.3 consacrée à la production des sons de la langue, ces derniers sont produits en positionnant les organes phonateurs de manière précise les uns par rapport aux autres (par exemple : les deux lèvres se touchent pour un /p/, l’apex de la langue – le bout de la langue – va toucher les dents supérieures pour un /t/, les lèvres sont étirées et légèrement entrouvertes pour un /i/, etc.). En plus des configurations spécifiques à chacun des phonèmes de la langue, certains enchaînements de sons peuvent exister dans une langue A, mais pas nécessairement dans une langue B (par exemple : la succession /p/+/s/ est possible en début de mot en français, mais n’existe pas en anglais[3]). Enfin certains sons existent dans une langue, mais pas dans une autre (par exemple : le ‘th’ anglais se produisant en sortant l’apex de la langue et en l’appuyant contre les dents du haut s’il est sourd – /θ/ –  ou en commençant la prononciation du son /z/ avant de sortir l’apex de la langue et de l’appuyer contre les dents du haut s’il est sonore – /ð/ – n’existe pas en français). En résumé, la production d’une succession de sons propres à une langue particulière va provoquer des mouvements de la bouche caractéristiques de cette langue et visibles de tous. S’il fallait encore donner un exemple de l’importance de ces indices visuels, imaginons comme ils nous ont manqué lorsque nous en avons été privés par le port du masque pendant la pandémie Covid-19.

Revenant à la question qui nous occupe, on peut se demander si les nourrissons utilisent également ces indices visuels et plus précisément si les nourrissons élevés dans un environnement bilingue les utilisent pour différencier les langues auxquelles ils sont exposés. C’est ce qu’ont essayé de découvrir Weikum et collaborateurs (2007) en proposant à des enfants monolingues anglais et bilingues ‘français-anglais’ (âgés de quatre, six et huit mois) des vidéos muettes de personnes parlant soit anglais soit français ; l’indice de discrimination des langues étant le temps passé à regarder les vidéos après le changement de langue[4]. Les chercheurs constatent qu’à l’âge de quatre mois, les enfants monolingues comme les enfants bilingues montrent un regain d’intérêt lors du changement de langue indiquant ainsi la perception du changement. En revanche, à huit mois, seuls les nourrissons bilingues parviennent encore à discriminer les deux langues sur la base des seuls indices visuels. Ces résultats ont été répliqués et confirmés par Sebastián-Gallés et collaborateurs (2012) avec des enfants de huit mois exposés dès la naissance au catalan et/ou espagnol et confrontés visuellement à des langues non natives (l’anglais et le français). Seuls les enfants élevés de manière bilingue arrivaient à discriminer visuellement leurs langues maternelles de langues auxquelles ils n’avaient jamais été exposés. On peut conclure de ces expériences que les enfants élevés dans un milieu bilingue manifestent très précocement une grande sensibilité aux indices leur permettant de différencier les langues et que celle-ci est plus pérenne que chez les enfants monolingues.

Une spécialisation croissante pour les sons de la langue maternelle

La tâche du jeune enfant en phase d’acquisition du langage est de reconnaître et de distinguer les phonèmes les uns des autres pour ensuite pouvoir les combiner de manière à produire les mots du lexique de sa langue maternelle. Pour un enfant élevé dans un milieu bilingue, la tâche est en quelque sorte double puisqu’il devra apprendre à reconnaître, distinguer et produire les phonèmes de ses deux langues maternelles.

Même pour un nourrisson monolingue, cette tâche peut paraître ardue, mais c’est sans compter la sensibilité particulière des jeunes enfants aux changements acoustiques, plus particulièrement au niveau des frontières entre les phonèmes (Eimas, 1975). En effet, dans les premiers mois de la vie, les nourrissons peuvent virtuellement discriminer et produire toutes les unités phonétiques utilisées dans toutes les langues, même dans celles qu’ils n’ont jamais entendues, alors que les adultes ne le peuvent plus. Cette capacité décroît avec le temps et avec l’exposition intensive et répétitive à la langue maternelle. À l’âge d’un an, les capacités de discrimination de l’enfant ne sont d’ailleurs déjà plus qu’à 10 % de leur potentiel initial.

Exemple : des participants japonais sont exposés aux phonèmes anglais /l/ et /r/ (Miyawaki et al., 1975), la distinction entre les deux phonèmes n’existant pas en japonais  :

  • les nourrissons de six mois discriminent les deux phonèmes ;
  • chez les jeunes enfants de douze mois, on observe une diminution significative de la capacité à discriminer les deux phonèmes ;
  • chez les adultes, on constate une impossibilité de distinguer les deux phonèmes.

La période s’étalant de six mois à un an semble donc cruciale dans la structuration des processus de perception des sons de la langue maternelle.

Dans le cadre précis de l’acquisition des sons de notre langue maternelle, l’acte d’apprendre correspond donc à une restriction des potentialités offertes par notre programme génétique  (Habib, 2018) ou, pour reprendre la formule de Changeux (1983) « Apprendre c’est éliminer ».

Question 8 : les sons non acquis sont-ils perdus pour toujours ?

Même si cet ouvrage a pour objet principal le bilinguisme précoce, il nous semble important d’ouvrir une parenthèse sur le bilinguisme séquentiel, voire tardif, et d’expliquer en quelques paragraphes pourquoi il est si difficile de discriminer et de produire les sons d’une langue étrangère à l’adolescence ou à l’âge adulte.

Les études interlangues sont très intéressantes pour la compréhension des mécanismes d’acquisition du langage et notamment du système phonologique (on verra notre exemple ci-dessus ou encore les études de Werker et al., 1981, 1984 confrontant des enfants et des adultes dans la discrimination de contrastes phonétiques en anglais et en hindi). Elles permettent de dégager ce qui relève de la maturation générale des structures anatomiques impliquées dans la production des sons, et donc commun à toutes les langues, de l’acquisition des spécificités de la langue.

Une question qu’on peut légitimement se poser est celle de la raison de cette perte de sensibilité aux contrastes sonores non pertinents dans la langue maternelle au-delà de la première année de vie et de son caractère définitif. Cette question est d’autant plus importante que l’on constate souvent des difficultés de maîtrise des phonèmes d’une langue étrangère lors d’un apprentissage tardif. Pisoni et collaborateurs (1994) ont tenté de répondre à la question en entraînant des adultes monolingues à discriminer des contrastes phonétiques existants dans diverses langues étrangères, mais pas dans leur langue maternelle. Ils constatent que certaines procédures d’entraînement sont efficaces pour certains contrastes suggérant ainsi que la perte n’est ni totale ni définitive. Cette conclusion conforte la théorie de Burnham (1986) qui postule que le caractère discriminable des contrastes dans une langue étrangère tient à leur saillance acoustique. Certains contrastes seraient peu saillants et rares et dès lors « perdus » plus rapidement que d’autres, plus fréquents et saillants, qui résisteraient beaucoup mieux au temps, et ce indépendamment de l’expérience linguistique du sujet.

Cette possibilité de réapprendre ou plutôt de récupérer tardivement la capacité à discriminer des contrastes phonétiques non présents dans la langue maternelle se heurte à la notion de période critique[5] énoncée par Lenneberg (1967) suggérant que l’acquisition des sons d’une langue ne peut se faire au-delà d’un certain âge (± cinq ans). Passé cet âge, les apprenants d’une L2 perdraient leur capacité à utiliser de manière efficace et automatique l’input sonore émanant d’une langue étrangère pour construire un inventaire phonétique. Dans son « Speech Learning Model » Flege (on verra Flege, 2021 pour une revue des versions de 1995 et 2005 du modèle) relativise cette affirmation, car si elle correspond à une réalité pour l’acquisition des sons d’une L1, la notion de période critique ne semble pas être transposable à l’acquisition des sons d’une L2. Il en veut pour preuve la capacité de certains à adultes à percevoir et produire correctement les sons d’une L2 et à l’échec de certains enfants à cette même tâche. Au terme d’une série d’observations expérimentales sur de grands groupes, il conclut que les traces de l’exposition phonétique à une L2 restent accessibles aux apprenants de tout âge. Ils peuvent dès lors exploiter les mécanismes et processus d’apprentissage utilisés lors de l’acquisition de leur L1 pour développer une L2.

Selon Flege, le système phonétique de L1 interférant avec celui de L2 jouerait nécessairement un rôle dans l’acquisition des sons de cette seconde langue. L’apprenant se réfère inconsciemment et automatiquement aux sons de sa langue maternelle et ce n’est que graduellement qu’il parvient à dégager les différences phonétiques qui existent entre les sons de L2 et les sons les plus proches de L1 créant finalement une nouvelle catégorie phonétique indépendante des sons de L1 pour les nouveaux sons de L2. Cette différenciation graduelle entre les sons de L1 et de L2 est naturellement liée à l’augmentation de l’expérience de l’apprenant en L2. En d’autres termes, plus l’apprenant est exposé de manière cumulative à des stimulations en L2 lors d’échanges verbaux et plus la probabilité qu’il puisse distinguer efficacement les sons de L1 et de L2 augmente. Dans ce processus, la qualité des productions langagières entendues (cf. Chapitre 2) joue un rôle déterminant.

Question 9 : l’enfant différencie-t-il les sons des deux langues en présence ?

Comme nous l’avons déjà souligné, lors de l’acquisition de sa langue maternelle, l’enfant monolingue doit détecter et apprendre les régularités qui caractérisent sa langue. Corollairement, dans le cadre d’une acquisition bilingue, les nourrissons doivent détecter et apprendre les régularités de deux langues. Cela implique qu’ils les reconnaissent toutes les deux comme des langues maternelles tout en continuant à les distinguer l’une de l’autre.

Comme nous allons le voir, même si les études menées ces dernières décennies mettent en évidence la capacité du nourrisson bilingue à discriminer les sons de ses langues maternelles, il est relativement fréquent, voire systématique, qu’il éprouve des difficultés à discriminer les contrastes phonémiques proches en raison de la complexité que représente d’acquisition de deux inventaires de sons distincts (Fennell et al., 2016). Cela s’explique logiquement par le fait que le nourrisson exposé à deux langues doit acquérir et affiner la discrimination de davantage de catégories phonémiques que le nourrisson monolingue et cela d’autant plus que les catégories propres à LA et LB peuvent potentiellement se recouvrir (Byers-Heinlein & Fennell, 2014).

Exemple : le français comporte 36 à 38 phonèmes (selon les accents régionaux) alors que l’anglais en comporte 39-40. Ces deux langues partagent néanmoins une vingtaine de phonèmes :

Tableau 5 : Inventaires phonémiques du français et de l’anglais .

L’ analyse du tableau ci-dessus permet de se rendre compte de la complexité de la tâche de discrimination et de classification des sons. Ne prenons que le son que les francophones identifient comme un ‘i’. Le nourrisson monolingue francophone ne devra en identifier qu’une seule forme, le /i/, alors que le nourrisson monolingue anglophone devra en identifier trois: /i/, /ɪ/ et /iː/. Il le fera avec autant de facilité que pour les autres contrastes phonémiques puisqu’il y est confronté depuis sa naissance. En revanche, pour le nourrisson élevé dans un environnement bilingue ‘français-anglais’, la situation sera différente ; pas fondamentalement plus complexe, mais différente.

 

Encart 2L’importance de bien différencier et produire les phonèmes d’une langue.

Dans certaines situations, remplacer un phonème par un autre peut entrainer une modification de sens. C’est particulièrement vrai dans ce qu’on appelle les paires minimales c’est-à-dire des paires de mots ne se différenciant que par un seul son (ce indépendamment de la manière dont les mots s’écrivent). Ce son peut être une voyelle ou une consonne. Ainsi, en français :

·       /m/ ≠ /v/ → main ≠ vin

·       /y/ ≠ /u/ → lu ≠ loup

Les paires minimales déroutent souvent les apprenants d’une langue étrangère. En « confondant » des phonèmes, ils remplacent un mot par un autre changeant ainsi complètement le sens de la phrase. Prenons l’exemple des mots anglais ‘think’  (penser) et ‘sink ‘ (couler). Un francophone natif aura tendance à produire les deux mots de la même manière en prononçant un /s/ comme dans ‘savoir’ ; dans ce cas, seul le contexte permettra à l’interlocuteur de comprendre ce qu’a réellement voulu dire la personne. En revanche, un anglophone prononcera ‘think’ – /θɪŋk/ et ‘sink – /sɪŋk / ; les deux productions pouvant dès lors se différencier aisément sans l’aide du contexte.

Dans l’apprentissage d’une langue étrangère, les substitutions/confusions de phonèmes sont particulièrement observables lorsqu’un qu’un phonème existant en LA mais pas en LB est très proche d’un autre phonème de LB (comme c’est le cas pour le /θ/ anglais avec le /s/ français).

 

Bosch & Sebastián-Gallés (2003) ont exploré le schéma de développement du contraste catalan /e/-/ɛ/ (é – è) chez des enfants monolingues ‘catalan’ ou ‘espagnol’ et des enfants bilingues ‘catalan-espagnol’. Si le catalan et l’espagnol sont deux langues extrêmement proches tant d’un point de vue structurel que rythmique, elles diffèrent notamment par leur inventaire phonologique. Ainsi, le phonème /ɛ/ (è) est spécifique au catalan et n’est pas présent en espagnol. Il est d’ailleurs très difficilement différenciable du /e/ (é) par les adultes monolingues espagnols. Afin de tester le développement du contraste, les auteurs ont présenté à trois groupes d’enfants (monolingues ‘espagnol’, monolingues ‘catalan’ et bilingue ‘catalan-espagnol’) âgés de quatre, huit et douze mois des pseudo-mots contenant pour moitié le phonème /e/ et pour moitié le phonème /ɛ/. Après avoir habitué les enfants à l’écoute du contraste, une phase expérimentale basée sur une procédure d’orientation de la tête (telle que décrite plus haut) pouvait commencer.

Les résultats pour les groupes monolingues furent sans surprise et conformes aux hypothèses posées par Bosch et Sebastián-Gallés : quel que soit l’âge, les nourrissons catalans perçoivent le contraste (puisqu’il est pertinent dans leur langue) tandis que les nourrissons espagnols ne le perçoivent plus à partir de l’âge de huit mois (le contraste n’existant pas en espagnol). En revanche, le groupe d’enfants bilingues, pour lequel on prédisait une discrimination du contraste quel que soit l’âge, ne se comporte absolument pas comme attendu. En effet, au lieu d’observer une stabilité dans le comportement de discrimination, les auteurs ont obtenu une courbe de discrimination dite en ‘U’ ; les enfants de quatre et douze mois discriminant le contraste, les enfants de huit mois n’y arrivant pas. Les chercheurs se sont interrogés sur ces résultats et l’apparente perte de sensibilité au contraste appartenant à une des langues maternelles.

Une des explications avancées par Bosch et Sebastián-Gallés, mais également par d’autres auteurs (on verra notamment Burns et al., 2007 pour le contraste consonantique /p/-/b/ en français et en anglais ; Sundara et al., 2008 pour la différenciation par des bilingues ‘français-anglais’ du /d/ apico-dental français et du /d/ apico-alvéolaire anglais ; ou encore Sebastián-Gallés & Bosch, 2009 pour le contraste vocalique /o/-/u/), est que la fréquence d’utilisation de la voyelle /e/ présente dans les deux langues interfère avec la voyelle /ɛ/ moins fréquente puisqu’uniquement présente en catalan. Si cette interprétation est correcte, alors comment expliquer que la discrimination du contraste /e/-/ɛ/ ne pose aucun problème aux enfants bilingues ‘espagnol-anglais’ (le phonème /ɛ/ existant en anglais) ? Une hypothèse avancée par Sundara et Scutellaro (2011) est que dans le cadre de deux langues rythmiquement différentes comme l’anglais et l’espagnol, les enfants identifient plus aisément des différences phonémiques que dans des langues rythmiquement proches comme le catalan et l’espagnol.

Une explication alternative proposée par Albareda-Castellot et collaborateurs (2011) est que les enfants bilingues ‘catalan-espagnol’ acceptent plus facilement de petites variations phonétiques que les monolingues ‘catalan’. Dès lors, le fait que les nourrissons bilingues de huit mois semblent avoir perdu la capacité de distinguer le contraste /e/-/ɛ/ ne reflèterait en définitive pas une incapacité à différencier les phonèmes, mais bien une plus grande tolérance à la variation. Ces deux phonèmes, bien que distincts et discriminés, pourraient, dans un premier temps, être considérés comme des exemplaires de la même catégorie de phonème en raison de la grande variabilité de prononciation d’un même phonème.

Concrètement, que nous montrent ces études et que pouvons-nous en tirer pour comprendre le développement de l’enfant bilingue ? Tout d’abord, il nous faut souligner que les tout jeunes enfants bilingues et monolingues se développent de la même manière : ils vont se « sur-spécialiser » pour les phonèmes appartenant à leur(s) langue(s) maternelle(s) selon qu’ils sont élevés dans un milieu monolingue ou bilingue. Cependant, la plus grande tolérance des enfants bilingues à la variabilité phonétique les amènera temporairement à considérer des phonèmes très proches comme faisant partie de la même catégorie, et ce plus particulièrement lorsque les langues en présence sont rythmiquement et structurellement proches. C’est la confrontation régulière et croissante aux langues en présence qui va les conduire à réaliser que les deux sons qu’ils considèrent comme faisant partie de la même catégorie sont en fait deux phonèmes différents non indifféremment interchangeables au sein d’un mot.

La production et la combinaison des sons de la langue maternelle

Comme nous le rappellent Bertoncini et Boysson-Bardies, « la production des sons commence dès les premières semaines de vie, mais ne prend tout son intérêt, pour l’étude du développement de la parole, que lorsque  l’enfant peut maîtriser sa phonation, vers cinq mois, et que s’instaure un contrôle articulatoire au cours de la deuxième partie de la première année » (Bertoncini & Boysson-Bardies, 2000, p. 114). La maîtrise des sons de la langue maternelle s’étend sur plusieurs années avec des calendriers différents en fonction de la maîtrise articulatoire nécessaire à la production correcte des sons. Le Tableau 6 ci-dessous reprend les indications développementales pour les phonèmes de la langue française.

 

 

Tableau 6 : Âges indicatifs de la maîtrise des phonèmes de la langue française d’après Rondal (1979).

La production des mots, que nous aborderons plus tard, va de pair avec une maîtrise progressive de la production des sons de la langue. Même si de légères variations inter-individuelles sont observables dans l’ordre d’acquisition de ces sons, les grandes lignes développementales sont semblables d’un enfant à l’autre.

 

Encart 3 – Une maîtrise croissante de la production des phonèmes du français en fonction de leurs particularités et de leur complexité articulatoire.

Les voyelles sont maîtrisées relativement tôt par l’enfant. Elles font rarement l’objet de troubles articulatoires ; leur production consistant principalement (et très schématiquement) en une modulation de l’ouverture de la bouche et de l’étirement des lèvres. La première voyelle à apparaître est généralement le /a/ (ouverture maximale de la bouche pour laisser libre passage à l’air en provenance des poumons).

Les premières consonnes sont généralement les occlusives /p/, /b/ et /g/ ou encore la nasale /m/. Les consonnes sont dites occlusives quand leur articulation se fait par blocage de l’air en provenance des poumons en un point du trajet expiratoire (les lèvres pour le /b/ et le /p/, l’apex de la langue et les dents pour le /d/ et le /t/, le dos de la langue et le palais dur pour le /k/ et le /g/). Le /m/ (tout comme le /n/) est également produit par un blocage de l’air en un endroit précis au niveau de la bouche (les lèvres pour le /m/ et l’apex de la langue et les dents pour le /n/) avec cependant un passage par le nez ; d’où son appellation de consonne nasale.

Les consonnes constrictives sont plus difficiles à produire que les occlusives, car elles nécessitent une plus grande maîtrise et un plus grand contrôle des structures articulatoires. En effet, leur articulation n’implique pas un « simple » blocage de l’air expiratoire, mais un rétrécissement du canal sur son trajet ainsi que le maintien de la position articulatoire pour permettre l’écoulement de cet air par l’ouverture laissée entre les structures articulatoires impliquées.

La consonne latérale /l/ impliquant un écoulement de l’air des deux côtés de la langue ainsi que la vibrante /r/ impliquant la vibration de la luette sont également d’acquisition et de maîtrise tardives en raison du contrôle des structures articulatoires nécessaire à leur production.

Enfin, les consonnes sont dites sonores lorsque leur articulation implique la mise en vibration des cordes vocales (contrairement aux consonnes sourdes). Tant les consonnes occlusives que les constrictives peuvent être sonores ou sourdes.

 

La période de babillage qui précède l’apparition des premiers mots est cruciale dans le développement phonologique de l’enfant. Le babillage est lié à la perception des sons de la langue (Oller & Eilers, 1988). Il est caractérisé par la répétition de séquences ‘consonne – voyelle’ classiquement appelée « babillage canonique ». Ce type de babillage présente des caractéristiques universelles dans le sens où, quelles que soient les langues, les consonnes produites sont majoritairement des occlusives bilabiales ( /b/, /p/ et /m/) et les voyelles sont généralement neutres et ouvertes (classiquement /a/). La structure des séquences produites est également similaire d’une langue à l’autre ; majoritairement ‘consonne-voyelle’ (potentiellement répétée plusieurs fois) plutôt que ‘voyelle-consonne’ (Oller, 1980).

Question 10 : l’enfant bilingue babille-t-il de la même façon que l’enfant monolingue ?

Au cours de la première année de vie, le nourrisson monolingue et le nourrisson bilingue passent par les mêmes étapes de développement qui aboutiront à la production des premiers mots aux alentours de leur premier anniversaire.

Tableau 7 : Étapes du développement des productions vocales de l’enfant au cours de la première année d’après Bertoncini & Boysson-Bardies (2000).

Les études comparatives interlangues menées début des années 1980 ont montré combien la langue est importante dans la nature du babillage produit par le nourrisson. En effet, pendant la seconde partie de la première année de vie, le babillage est de plus en plus marqué par les caractéristiques spécifiques de la langue. Les premiers sons à se conformer aux spécificités de la langue sont les voyelles, car perceptivement plus saillantes que les consonnes[6] qui demandent également un contrôle articulatoire plus fin (Bertoncini & Boysson-Bardies, 2000).

La nature même du babillage semble influencée par la langue à laquelle l’enfant est exposé. Pour illustrer ces propos, on reprendra l’exemple de Boysson-Bardies (1993) montrant que les nourrissons français, anglais ou encore suédois produisent majoritairement un babillage rédupliqué de type ‘consonne-voyelle-consonne-voyelle’ alors que les enfants de l’ethnie ouest-africaine Yorudo produisent davantage de structures de type ‘voyelle-consonne-voyelle-consonne’ conformes à la structure dominante des noms de la langue yorudo.

Que ce soit dans le cadre du monolinguisme ou du bilinguisme, les caractéristiques prosodiques du babillage (par exemple : allongement et rythme syllabiques) sont importantes et influencées par les contours intonatoires de la langue parlée par la personne avec laquelle l’enfant interagit (Andruski et al., 2014 ; Sundara et al., 2020).

Question 11 : comment l’enfant acquiert-il les règles de combinaisons des sons dans deux langues différentes ?

Lorsque nous avons abordé la reconnaissance des langues sur la base d’indices visuels, nous avons fait brièvement référence aux règles d’enchaînement des sons propres à une langue. C’est ce qu’on appelle techniquement les règles phonotactiques. Elles déterminent les combinaisons de phonèmes possibles pour former un mot.

 

Encart 4 – L’importance de dégager les régularités de la langue dans un flux sonore.

Il est important pour le jeune enfant de comprendre que les sons ne peuvent pas se succéder de manière indifférente dans la (les) langue(s) qu’il pratique. Dans un premier temps, lors des jeux vocaux observés vers 3-4 mois, les sons sont produits sans ordre particulier. Ils constituent principalement un entraînement des structures articulatoires et une expérimentation des sons pouvant être produits avec la bouche. L’enfant va devoir ensuite extraire rapidement du langage adulte qu’il entend des régularités sonores et les produire à son tour afin de se conformer à la structure de sa (ses) langue(s).

Il y a deux types de règles de combinaisons des sons dans les langues, les règles universelles valables pour toutes les langues et les règles spécifiques à chacune des langues.

Parmi les règles universelles, on relève par exemple que :

  • Toutes les langues ont des syllabes se terminant par une voyelle (syllabes dites ouvertes)
  • Toutes les langues ont des syllabes à consonne initiale
  • Toutes les langues permettent des syllabes ‘consonne-voyelle’ mais aussi ‘voyelle-consonne’ et ‘consonne-voyelle-consonne’

Parmi les règles spécifiques, on notera par exemple que :

En français :

·       Jusqu’à 3 consonnes peuvent figurer dans une même                      syllabe, dans ce cas il s’agit :

o   d’une syllabe initiale

o   des groupes /stR/ comme dans ‘strapontin’ et /skR/                      comme dans ‘scrupule’

·       Certaines combinaisons de 2 consonnes comme /ml/,                   /nl/, /ms/ ne sont pas autorisées en début de mot

Certaines combinaisons de consonnes ne sont pas possibles en début de mot mais bien au milieu ou en fin de mot, par exemple /gz/ comme dans examen.

En anglais :

·       Le nombre maximal de consonnes en début de mot est de 3          (sprint) et le nombre maximal est de 5 en fin de mot                        (lengths)

Certains groupes de consonnes ne sont pas admis en début de mot /ps/, /spm/, /fs/, /gz/

L’enfant exposé à deux langues devra donc intérioriser et maîtriser ces règles et les utiliser de manière adéquate selon la langue qu’il utilise. Elles serviront d’indice pour délimiter les frontières des mots. Ainsi, le nourrisson devra avoir intériorisé qu’aucun mot français ne commence par la séquence /spr/ mais que celle-ci peut se retrouver au milieu d’un mot (par exemple : esprit) et qu’en revanche des mots anglais peuvent débuter par cette séquence (par exemple : sprint).

Les règles phonotactiques ont une utilité toute particulière dans le développement de la langue puisqu’elles vont permettre au jeune enfant régulièrement exposé à sa langue maternelle de déterminer dans les stimulations sonores qu’il reçoit les séquences de phonèmes qui pourraient être des mots, mais elles vont également servir d’indices pour identifier les frontières entre les mots. Identifier les mots individuels dans un flux de parole continu est bien moins évident que d’identifier des mots individuels dans une production écrite et nécessite de prendre en compte des indices sonores tels que la fréquence d’association des sons dans les productions qu’on a l’habitude d’entendre. En effet, dans le cas de l’écrit, chaque mot est séparé par un espace qui permet d’en déterminer aisément le début et la fin ; ce qui n’est évidemment pas le cas dans une production orale.

Exemple : Si nous reprenons l’exemple proposé par Kuhl (2004) dans la phrase écrite « There are no silences between words », les mots sont clairement séparés par des espaces et donc facilement identifiables. Supprimer les espaces ou modifier leur emplacement complexifie considérablement la tâche. En langage oral, ces espaces ne sont pas marqués ni même remplacés par des silences entre les mots. Le flux de parole est continu et si nous devions faire une analyse acoustique de la production et en analyser le tracé, les pauses imperceptibles dans la production la segmenteraient de la manière suivante « Thereare nos ilen ces bet weenword s ».

Les études développementales menées sur des nourrissons élevés dans un contexte monolingue mettent en évidence une sensibilité aux règles phonotactiques dès neuf mois (on verra notamment Friederici & Wessels, 1993 ; Jusczyk et al., 1993). Qu’en est-il dans un contexte bilingue où l’enfant doit apprendre simultanément les règles phonotactiques des deux langues ? Dans ce cas, sa tâche consiste non seulement à repérer les régularités combinatoires dans le flux de parole, mais également à déterminer parmi les séquences récurrentes lesquelles sont « légales » dans une de leurs langues et pas dans l’autre ou dans les deux.

Dans une étude de 2002, Sebastián-Gallés et Bosch ont tenté d’identifier les facteurs qui permettaient à l’enfant bilingue de repérer les règles phonotactiques de ses langues maternelles. Quatre groupes d’enfants de dix mois (monolingues ‘catalan’ ou ‘espagnol’ et bilingues ‘catalan-espagnol’ avec soit une exposition dominante au catalan soit une exposition dominante à l’espagnol) ont été exposés à des listes de pseudo-mots construits selon les règles de combinaison des phonèmes spécifiques au catalan, mais discordantes avec celles de l’espagnol, et des listes de non-mots[7] violant les règles combinatoires des deux langues. Les enfants bilingues exposés de manière dominante au catalan manifestent la même préférence que les enfants monolingues ‘catalan’ pour les pseudo-mots conformes aux règles combinatoires catalanes. De leur côté les enfants bilingues majoritairement exposés à l’espagnol ne montrent qu’une préférence marginale pour les structures catalanes alors que les enfants monolingues ‘espagnol’ ne montrent aucune préférence pour ces structures. Par cette expérience, Sebastián-Gallès et Bosch mettent en évidence le rôle important de la quantité d’exposition à une langue (cf. Chapitre 2) dans l’acquisition des règles de combinaison des phonèmes d’une langue et, par extension, dans le façonnage de la connaissance de la forme des mots.

Question 12 : les enfants bilingues font-ils les mêmes erreurs que les enfants monolingues lorsqu’ils simplifient des successions de sons ?

La clarté de la parole d’un enfant progresse considérablement pendant les premières années de vie pour atteindre une intelligibilité complète aux alentours de quatre ans (Coplan & Gleason, 1988). Avant d’atteindre cette étape, l’enfant passe, sans que cela ne soit pathologique, par un stade où les mots peuvent être déformés par des simplifications articulatoires. Si on se réfère au Tableau 6, on peut constater qu’à deux ans, aucun phonème n’est vraiment totalement maîtrisé. Les sons de la langue peuvent être déformés principalement à cause d’une mauvaise maîtrise du geste articulatoire ou remplacés au sein d’un mot par d’autres plus simples.

Plusieurs processus de simplification des mots sont observés dans les productions des enfants. Nous en reprenons ici les principaux à titre d’exemple (pour plus d’informations, le lecteur intéressé verra Rondal et collaborateurs, 1999) :

  •  les substitutions d’un phonème par un autre plus simple au sein d’un mot (par exemple : /ʃɔkɔla/ -chocolat- devient /tɔkɔla/ -tocolat- en remplaçant le son /ʃ/ par le /t/ articulatoirement plus simple; le mot /tʁɛ̃/ -train- devient /kʁɛ̃/ -crain – le /k/ étant dans ce contexte plus facile à produire, car se situant comme le /ʁ/ à l’arrière du tractus vocal) ;
  • l’assimilation consistant à assimiler les consonnes de manière prédictible dans un contexte C1-V-C2 (par exemple : /ʃɔkɔla/ -chocolat- devient /kɔkɔla/ -cocolat-) ;
  • les processus touchant la structure syllabique comme la réduction de groupes consonantiques (par exemple : /tʁwa/ -trois- devient /ʁwa/ -roi-) ;
  • la métathèse, processus par lequel l’enfant inverse les phonèmes constitutifs d’un mot (par exemple : /disk/ -disque- devient /diks/).

Paradis (2001) s’est intéressée à ce type d’erreurs chez les jeunes enfants bilingues. Plus précisément, elle s’intéresse à la nature des erreurs faites par l’enfant pour déterminer si ses deux systèmes phonologiques sont fusionnés ou séparés. Dans ce cadre, elle propose à des enfants bilingues ‘français-anglais’ de 2 ½ ans une tâche de répétition de non-mots de quatre syllabes construits soit sur la base de la structure syllabique dominante en français (des syllabes ouvertes ‘consonne – voyelle’)  soit sur la base de la structure syllabique dominante en anglais (des syllabes fermées ‘consonne – voyelle – consonne’). Sans surprise, les erreurs principalement commises par les enfants consistent à supprimer des syllabes lors de la répétition des non-mots et ce, quelle que soit la langue de l’enfant. Ce qui est le plus intéressant dans cette étude, c’est que les syllabes supprimées ne sont pas les mêmes selon que les non-mots sont de base française ou anglaise. En d’autres termes, les enfants bilingues omettront les mêmes syllabes que les enfants monolingues francophones lorsque les non-mots sont de structure française et les mêmes syllabes que les enfants monolingues anglophones lorsque les non-mots sont de structure anglaise. Selon Paradis, ce pattern d’erreurs spécifique à la langue plaide en faveur de l’existence de deux systèmes phonologiques séparés chez l’enfant bilingue : un pour chaque langue (nous reviendrons plus loin dans ce chapitre sur le débat du système langagier unique ou des systèmes langagiers séparés).


  1. La magnétoencéphalographie est une technologie d’imagerie cérébrale reposant sur la captation du champ magnétique résultant de l’activité du cerveau. Elle permet de visualiser et de localiser rapidement une activité cérébrale (http://www.cea.fr/comprendre/Pages/sante-sciences-du-vivant/essentiel-sur-imagerie-medicale.aspx).
  2. L’IRMf (Imagerie par résonance magnétique fonctionnelle) permet de visualiser de manière indirecte l’activité cérébrale en mesurant les variations locales de flux d’oxygénation du sang dans le cerveau lors de l’exécution d’une tâche cognitive.
  3. Attention, nous parlons bien ici de successions de sons en production orale de la langue et non de succession de lettres à l’écrit. Si le mot « psychology » existe en anglais, il ne se prononce pas en produisant de manière marquée le /p/ et le /s/ comme le ferait un francophone pour le mot « psychologie ».
  4. Dans cette procédure (proche de celle illustrée dans la Figure 7), on habitue l’enfant à regarder des vidéos dans lesquelles le personnage parle dans la LA. Au bout d’un temps, l’intérêt de l’enfant va diminuer et les fixations du regard sur la vidéo vont être moins intenses et moins longues. Après un certain temps, on modifie la langue parlée par le personnage. Si l’enfant différencie les langues, il va de nouveau fixer intensément et longuement l’écran. S’il ne perçoit pas le changement, l’intensité du regard sur l’écran va rester inchangée.
  5. Pour rappel, il faut entendre par là une période critique, une période de sensibilité maximale limitée dans le temps pour un apprentissage donné (voir Encart 1).
  6. Les voyelles sont dites perceptuellement saillantes car elles se manifestent par des sons clairs, facilement isolables et repérables dans une syllabe ou un mot tandis que les consonnes se caractérisent par des bruits tels qu'un chuintement, un sifflement, ou encore un roulement.
  7. Les non-mots sont des entités sonores sans signification formées au départ d’une succession articulable et prononçable de sons