Ξ  

 

 Sobre a Deficiência Visual

L'Accès à l'Information parlée chez l'Aveugle

Anita Richaume-Crinquette

 

 

sommaire
PRÉSENTATION DE LA THÈSE
CHAPITRE 1: LENTEUR DANS L'ACQUISITION DES CONNAISSANCES CHEZ L'AVEUGLE
CHAPITRE 2: L'ÉCOUTE ET LE TRAITEMENT DE L'INFORMATION PARLÉE
CHAPITRE 3: LA PRISE DE NOTES
CHAPITRE 4: LA PAROLE COMPRIMÉE ET L'ÉCOUTE RAPIDE
     Section I
     Section II
     Section III
CHAPITRE 5: LA SYNTHÈSE VOCALE DANS LES NOUVELLES TECHNOLOGIES

 

Présentation

Quand la cécité survient à 10, 20 ou 40 ans, la personne qui en est atteinte est un "aveugle tardif" par opposition à "l'aveugle précoce", aveugle congénital ou aveugle-né. L'aveugle tardif a peut-être eu l'avantage de pouvoir organiser ses connaissances à partir des perceptions visuelles, mais il est brusquement face à un problème crucial: celui de la perte de la lecture et de l'écriture.

Confrontée en 82 à cette situation difficile, nous avons résolu les difficultés au coup par coup en nous appuyant essentiellement sur la sélection, la gestion et le stockage des informations auditives. A partir de 1986, de multiples rencontres avec des intellectuels aveugles de nationalité différentes nous ont confirmé la place importante que tient l'accès à l'information parlée dans l'acquisition des connaissances chez l'aveugle. Par ailleurs de nombreuses entrevues avec des responsables d'instituts spécialisés pour déficients visuels, ont mis l'accent sur un problème lié en tout état de cause aux progrès en médecine péri-natale et en ophtalmologie. Les plus anciens d'entre eux nous ont confié: "il y a 20 ans dans notre établissement, l'effectif de nos élèves se partageait entre 70 à 75% d'enfants aveugles et 25 à 30% d'enfants amblyopes, actuellement ces proportions sont inversées. La plupart des enfants amblyopes qui peuvent lire et écrire en noire, délaissent les cours de braille. Or ces enfants pour un bon nombre d'entre eux risquent plus que quiconque à plus ou moins long terme la cécité. Quand on sait le nombre d'années d'étude et de pratique régulière du braille pour aboutir à une lecture encore relativement lente par rapport à celle des voyants, on peut alors deviner aisément les problèmes d'intégration scolaire et sociale que peut engendrer une telle situation. Pourtant ces enfants ou ces adultes privés brusquement de la vision conservent leurs potentialités intellectuelles et leurs capacités de raisonnement, de mémorisation, aussi, en attendant l'acquisition de la lecture et de l'écriture braille et surtout la rentabilité de ce nouveau moyen d'appréhender l'information, nous pensons que celle-ci pourrait être transmise via le canal auditif, tout au moins dans un premier temps. C'est pourquoi, notre étude, qui est une approche essentiellement exploratoire, aborde le thème de l'acquisition des connaissance chez l'aveugle à partir de l'information parlée.

Selon notre point de vue, la déficience visuelle entrave et ralentit les mécanismes qui contribuent à l'acquisition des données informatives, mécanismes relatifs à l'accès à l'information, à la communication et à la locomotion. Nous accordons une priorité à l'accès à l'information qui conditionne les deux autres domaines et interagit avec eux. Notre démarche a suivi deux voies de recherche: l'une a un caractère fondamental et théorique, l'autre appliqué et pratique.

Le premier chapitre rend compte de faits d'observations et de constatations obtenues à partir des entretiens et rencontres avec de jeunes aveugles et leurs enseignants spécialisés. Il relate également des faits théoriques et expérimentaux décrits par des chercheurs dont l'objectif principal est d'évaluer l'influence de la perception visuelle dans le développement cognitif et d'apporter leur contribution à un programme d'éducation et de réadaptation des handicapés visuels. a travers ces différentes sources de faits, il est montré que la privation de la vue entraîne un retard dans le développement cognitif lié essentiellement au déficit de l'accès à l'information sur l'environnement. L'exploration visuelle présente un caractère holistique, spatial et global, alors que les explorations tactiles et auditives ont un caractère analytique, séquentiel et nécessitent l'assemblage de nombreux éléments ponctuels et successifs pour construire l'événement dans sa globalité; ce qui sollicite d'autant plus les mécanismes de la mémoire. Nous avons montré dans cette partie que l'aveugle est confronté à un problème majeur qui est la lenteur dans l'accès à l'information et nous avons souligné que la population des handicapés visuels est très hétérogène en raison de divers facteurs: la nature, l'âge et l'histoire de la déficience visuelle, l'environnement familial et social etc.. Pour accélérer et faciliter l'accès à l'information et l'acquisition des connaissances, nous nous sommes proposés d'étudier:

  • la prise de notes aidée par l'enregistrement,
  • l'utilisation de la parole comprimée,
  • l'utilisation du micro-ordinateur et des technologies nouvelles grâce à la synthèse vocale.

Dans un second chapitre, nous avons exposé quelques rappels sur la perception auditive dans le but d'introduire les étude sur la prise de notes orale, les expérience avec la parole comprimée et les observations sur la sortie vocale. Nous avons également montré que l'écoute est un mode d'accès à l'information appréciable pour l'aveugle de naissance et primordial pour l'aveugle tardif.

Dans le troisième chapitre, nous avons évalué un moyen susceptible de faciliter la prise de notes des élèves et étudiants déficients visuels: l'enregistrement. Les caractéristiques de ce mode un peu particulier de sélection de l'information sont alors considérées et deux types de matériel sont comparés: le magnétophone classique et le magnétophone à enregistrement différé. Conçu par une équipe de l'INSERM de Lille, le magnétophone à enregistrement différé possède une "mémoire-tampon" dans laquelle peut stagné une portion du discours en cours d'enregistrement pendant quelques secondes, ce qui laisse le temps à l'utilisateur de décider si les quelques mots ou les quelques phrases émis par le locuteur sont à conserver ou non et donc à enregistrer ou non sur la bande magnétique. Nous avons montré que des collégiens, des lycéens aveugles ou amblyopes sont capables de sélectionner l'information avec ce type de matériel et qu'il peut être une aide très efficace pour l'étudiant déficient visuel et tous ceux voyants ou non, désireux de procéder à un enregistrement sélectif du discours émis. Nous avons aussi souligné qu'une prise de notes aidée par l'enregistrement ne consiste pas à mettre en marche un magnétophone et à attendre passivement que le cours ou le discours soit terminé, mais consiste plutôt, comme tout autre forme de prise de notes à une sélection active de l'information et à une mise en valeur de la structure et de l'organisation de son contenu. Ainsi, le découpage en chapitre et en sections doit être rendu par des indices sonores. Il est souvent nécessaire de remanier les notes enregistrées afin de les restructurer avec adjonction de pauses, de bip, de repères sonores, d'explications supplémentaires dans le but de les rendre plus compréhensible oralement. L'écoute devient alors une démarche intellectuelle relativement complexe où interviennent les compétences langagières, les capacités de compréhension, les facultés d'analyse , de synthèse et de mémorisation de l'auditeur dont les stratégies dépendent évidemment de ses objectifs et de ses acquis. Pour qu'elle puisse être efficace la prise de notes aidée par l'enregistrement nécessite une formation, un apprentissage et un entraînement.

Mais parce que tous les mots sont prononcés et que le débit de la parole humaine ne dépasse pas 180 mots par minute, l'écoute d'un texte demande plus de temps que sa lecture visuelle. Pour économiser le temps d'écoute des notes ou des texte enregistrés et être ainsi plus proche du temps de lecture visuel, nous nous sommes proposer d'utiliser et d'étudier la compression temporelle de la parole. L'augmentation du débit d'un énoncé pourrait être un moyen d'accélérer l'accès à l'information auditive. Les techniques de compression temporelle de parole permettent de faire varier le débit d'un discours enregistré sans distorsion excessive du signal vocal. Après avoir tracé l'évolution historique de ces techniques, exposé les problèmes méthodologiques et procéduraux liés à l'étude de la parole comprimée, recensé les facteurs susceptibles de modifier l'intelligibilité et la compréhension des discours comprimés et les applications potentielles relatives à la parole comprimée et à l'écoute rapide, nous nous sommes demandés dans quelles limites la compression temporelle produit une économie d'écoute sans diminuer la compréhension et la performance de l'auditeur. Les données des publications montrent que l'intelligibilité et la compréhension de la parole comprimée restent correctes tant que le taux de compression ne dépasse pas 50% et tant que le débit de la parole n'excède pas 275 mots par minute.

Une première série de quatre expériences a eu pour objectif l'évaluation des différences entre les quantités d'information acquises par des étudiants après écoute d'enregistrement de récits en français présentés avec différents débit de parole. Les problèmes considérés sont multiples:

  • est-ce que la compression temporelle d'un enregistrement permet de gagner un temps d'écoute appréciable sans diminuer de façon significative l'intelligibilité, la compréhension et la rétention de son contenu?
  • quelles sont les différences entre les performances des étudiants pour une condition de présentation continue et une condition de présentation segmentée des enregistrements?
  • pour un même taux de compression quelles sont les différences entre les sujets pour deux débits de parole (270 m/mn et 300 m/mn)?
  • dans une condition de présentation continue quelles sont les différences entre les performances des étudiants après écoute de paroles normales et de paroles comprimées?

Dans la première expérience, 60 étudiants écoutent deux récits, l'un abstrait, l'autre concret, en condition de présentation segmentée, pour 20 d'entre eux à un taux de paroles normales (135 m/mn), pour un second groupe de 20 à un taux de paroles accélérée (202 m/mn) et pour un troisième groupe de 20 à un taux de paroles comprimées (270 m/mn). Les résultats montrent un effet du taux des paroles et un effet de la nature des textes. Pour l'intelligibilité, les performances sont plus faibles pour la parole accélérée que pour la parole normale, mais ne sont pas significativement différentes entre la parole normale et la parole comprimée. En ce qui concerne la compréhension et la rétention immédiate, les scores ne présentent pas de différence significative pour les trois taux de parole. Les étudiants qui ont écouté les enregistrements en paroles comprimées sont capables de comprendre la même quantité d'information que les étudiants qui ont écouté la parole normale, mais dans un temps plus court. Les performances des sujets sont plus faibles pour le texte abstrait que pour le texte concret dans les trois modes de présentation.

Dans une seconde expérience, 40 étudiants sont divisés en deux groupes de 20 dont l'un écoute les enregistrements comprimés présentés de façon continue et l'autre les enregistrements comprimés présentés de façon segmentée. Les scores de compréhension et de rétention sont plus faibles pour le mode de présentation continue que pour le mode de présentation segmentée. la différence entre les scores pour les deux modes de présentation est plus faible pour le récit concret que pour le récit abstrait.

Dans une troisième expérience, deux groupes de 10 étudiants écoutent deux récits enregistrés ayant subi une compression temporelle de 50% (pour l'un le débit des mots est 270 m/mn et pour l'autre 300 m/mn). les scores d'intelligibilité et de compréhension sont significativement plus élevés pour les enregistrement à 270 m/mn que pour ceux à 300 m/mn. Toutefois la différence entre les scores des deux groupes pour les épreuves aux questionnaires à chois multiples n'est pas significative.

Dans une quatrième expérience, deux groupes de 20 sujets écoutent les deux mêmes récits enregistrés et distribués sous une même condition de présentation continue. Pour l'un des groupe, le taux de paroles est normale (135 m/mn) pour l'autre comprimé à 50% (270 m/mn). Les étudiants qui écoutent les récits à un débit de 270 m/mn rappellent plus de propositions exactes que les étudiants qui écoutent les récits enregistrés à 135 m/mn. Dans les deux conditions de présentation les scores pour le texte abstrait sont plus faibles que pour le texte concret.

Selon les résultats expérimentaux, il semble que l'intelligibilité, la compréhension et la rétention immédiate de deux récits courts et relativement simples restent bonnes avec une compression temporelle de 50% et un débit de mots de 270 m/mn. Il semblerait même que la compréhension et la rétention immédiate soient meilleures dans une condition de compression temporelle à 50%. Toutefois dans cette condition de grandes variabilités interindividuelles ont été observées. Aussi, nous pensons que des facteurs inhérents aux sujets sont à étudier: âge, vitesse de lecture, âge lexical, motivation...

Dans une cinquième expérience, 80 collégiens sont divisés en quatre groupes en tenant compte de l'âge chronologique et de la vitesse de lecture dans une première phase et de l'âge lexical dans une seconde phase. Les scores d'intelligibilités, de compréhension et de rétention immédiate de 20 phrases écoutées à taux normal et de 20 phrases comprimées sont comparés. Les résultats montrent que chez des collégiens de 11 à 15 ans en moyenne, l'intelligibilité, la compréhension et la rétention immédiate des paroles comprimées sont meilleures pour les lecteurs rapides que pour les lecteurs lents. Les scores d'intelligibilités et de compréhension sont plus élevés quand l'âge lexical est plus élevé. Dans cette expérience, il semblerait également que la rétention immédiate soit meilleure après écoute des paroles comprimées qu'après écoute des paroles normales. Dans toutes ces expériences intelligibilité, compréhension et rétention immédiate font essentiellement appel aux compétences langagières et aux capacités de la mémoire à court terme des sujets. Nous pensons que le stockage de la mémoire à court terme dépendrait du débit des mots émis. Nous pensons que d'autres études utilisant différents taux de compression temporelle sont nécessaires tant sur un plan théorique que sur un plan pratique. D'autre facteurs pourraient être étudiés: le style cognitif des sujets, leur motivation, l'attention, les temps de réaction...

Sur un plan théorique ces études pourraient apporter des éléments nouveaux dans la compréhension de la perception du langage et les processus cognitif liés au traitement de la parole comprimée. Quel serait le débit optimal des paroles pour un fonctionnement optimal de la mémoire à court terme? Quelles pourraient être les incidences de la parole comprimée sur la mémoire à long terme?

Sur un plan pratique, à partir de ces expériences exploratoire et des données sur la prise de notes, la construction de plusieurs prototypes devrait permettre une étude sur le terrain afin d'optimiser les caractéristiques de la parole comprimée dans le but d'une utilisation par des collégiens, lycéens et étudiants aveugles et d'évaluer avec précision l'intérêt de cette technique, ses conditions d'utilisation, ses avantages et ses inconvénients à court terme et à long terme.

Notre expérience personnelle avec la parole accélérée entre 82 et 86 et la parole comprimée depuis 86, nous a conduit à différentes observations. Lorsque le contenu d'un message est connu, a été compris ou déjà étudié par ailleurs, dans le cas d'apprentissage, de ré-apprentissage ou de révision d'un cours enregistré, l'écoute en condition de compression temporelle nous semble être un mode de travail intéressant. En effet, non seulement l'augmentation du débit des mots engendre une économie de temps d'écoute appréciable (pour 45 mn d'enregistrement, 22 mn d'écoute). Mais l'observation la plus curieuse, notée également dans les expériences précédentes, est l'amélioration de la rétention du contenu dans sa globalité. Dans l'état actuel des études nous ne pouvons donner d'explications structurées à cette observation plutôt inattendue. Nous avons noté également que l'entraînement améliore et favorise très sensiblement l'intelligibilité et la compréhension de la parole comprimée. Nous avons aussi utilisé la parole comprimée pour repérer plus rapidement un passage dans un enregistrement. Nous avons plus rarement employé la parole comprimée dans une condition de première écoute d'un thème inconnu, sauf pour les récits faciles ayant uniquement un caractère informatif. Nous pensons que pour un thème difficile, abstrait ou complexe, qu'il soit littéraire ou scientifique, nouveau et contenant des termes inhabituel, il n'est pas souhaitable d'utiliser la compression temporelle pour une première écoute. Des expériences individuelles et prolongées pendant plusieurs mois seraient indispensables pour évaluer avec précision l'intérêt de la compression temporelle et ses conditions d'utilisation. C'est pourquoi, nous travaillons en collaboration avec l'INSERM de Lille pour la construction d'un magnétophone comportant d'une part le système d'enregistrement différé afin de pouvoir sélectionner les notes à enregistrer et d'autre part un système de compression temporelle afin de pouvoir écouter ces notes plus rapidement. Par ailleurs un système d'indexation sonore permettrait en plus de poser des repères entre les différentes section d'un enregistrement.

Outre la prise de notes aidée par l'enregistrement et l'utilisation de la parole comprimée, d'autres outils peuvent actuellement contribuer à améliorer grandement l'efficacité et la compétitivité des étudiants déficients visuels. Nous pensons en particulier à tous les outils qui peuvent être associés à un micro-ordinateur et utilisables grâce à une synthèse vocale. Des technologies nouvelles en pleine évolution depuis 10 ans ont révolutionné le traitement et le stockage de l'information et fourniront probablement des applications encore insoupçonnées. Leur apport effectif et les espoirs engendrés bousculent les conceptions classiques sur l'éducation des aveugles, reculent les limites de la réadaptation et remettent en question des habitudes d'apprentissage et les idées sur l'intégration. Dans le dernier chapitre, nous avons fourni quelques exemples d'application associés à la synthèse vocale. Nous avons essayé de faire connaître les besoins des non voyants aux spécialistes de l'informatique afin qu'ils puissent mieux adapter leurs logiciels et qu'ils puissent à travers les problèmes rencontrés par les déficients visuels trouver des idées nouvelles pour leur propre recherche. Enfin, nous avons présenté à l'utilisateur aveugle les réalisations et les espoirs mais aussi les limites de l'utilisation des nouvelles technologies. Un opérateur aveugle peut avoir accès aux informations affichées à l'écran par l'intermédiaire d'une sortie vocale.

Nous avions montrer qu'un caractère commun à tous les non voyants est la lenteur dans l'accès à l'information et l'acquisition des connaissances. Aussi, tous les moyens actuels permettant de faciliter et de rendre plus rapide la prise d'information, son stockage et sa récupération sont à mettre en œuvre pour faciliter l'intégration et l'autonomie du non voyant. En particulier, dans ce chapitre l'idée principale est que pour poursuivre sa tâche nul n'est besoin pour un opérateur de faire régulièrement l'inventaire de tout ce qui est affiché à l'écran. Seuls certaines informations et certains changements importent. Si, pour un opérateur voyant un simple coup d'oeil au bon moment et au bon endroit suffit, pour l'opérateur aveugle, il lui faudra choisir judicieusement les macro-commandes adéquates pour faire lire sélectivement l'information pertinente.

Toute la question est de trouver les artifices et les bons indices pour transformer un message écrit distribué de façon spatiale en un message oral distribué de façon séquentielle et le transmettre le plus rapidement possible et le plus précisément possible via le canal auditif sans qu'il y ait perte d'information.

 
sommaire


CHAPITRE 1:

LENTEUR DANS L'ACQUISITION DES CONNAISSANCES CHEZ L'AVEUGLE

De nombreux ouvrages ont apporté leur contribution à la connaissance des aveugles. Parmi ces publications, des auteurs ont évalué le retentissement de la déficience visuelle sur le développement cognitif de l'individu, sur ses capacités de communication et ses facultés d'intégration dans le milieu social.

Ce qui est frappant dans ces différentes approches, historiques, philosophiques, scientifiques ou anecdotiques, c'est l'expression de l'extrême variabilité qui réside dans les possibilités d'adaptation des sujets aveugles. Si bien que la cécité peut être un état invalidant pour un individu et ne semble être qu'un fâcheux contre-temps pour un autre.

Pourtant, à travers ces grandes fluctuations individuelles, qui font dire aux enseignants spécialisés que "tout cas est un cas particulier", la perte de la vision entraîne des difficultés communes à tous les aveugles. Une difficulté qui nous semble essentielle est que l'aveugle vit dans un monde sonore et tactile, géré surtout par une dimension temporelle et séquentielle et qu'il doit affronter l'inconnu, le monde visuel, le monde de l'espace et du simultané. Le plus dur sera de reconstruire l'un à partir de l'autre.

Dans cette première partie, les principaux facteurs de variabilité inter-individuelle sont d'abord examinés. Puis, les caractéristiques des modalités visuelles et tactiles sont comparées dans le but de mieux comprendre le développement de la fonction représentative, la conceptualisation de l'aveugle et son retard dans l'acquisition des connaissances.

 

I - LES PRINCIPAUX FACTEURS DE LA VARIABILITE INTER INDIVIDUELLE

Les organes des sens sont des "fenêtres ouvertes sur le monde extérieur". La perception du monde environnant se construit à partir du traitement et de l'intégration des données, tactiles, auditives, olfactives, gustatives, kinesthésiques, ... Ces données ne peuvent pas être classées sur le même plan informatif dans leur contribution au développement cognitif et à l'acquisition des connaissances du jeune enfant. En 1966, dans "Privation Sensorielle et Intelligence", Yvette Hatwell souligne l'impor tance de la perception visuelle sur le développement cognitif de l'enfant et démontre que la perte de la vision précoce engendre un retard du développement des processus cognitifs plus important que la perte de la vision tardive.

a - L'âge de la cécité:

Dans les études relatives à l'influence de la cécité sur l'évolution des processus cognitifs et l'acquisition des connaissances, la plupart des auteurs insistent sur la nécessité de distinguer les aveugles-nés et les aveugles tardifs. Les aveugles-nés ou aveugles congénitaux présentent une perte de vision totale ou un reste de vision non utile (légère perception lumineuse) depuis la naissance ou ont été atteint de cécité dans les quelques mois qui ont suivi la naissance. Les aveugles tardifs sont ceux dont la déficience est acquise après une période de plusieurs années de vision normale. Lorsque la cécité apparaît après 4 ou 5 ans, peu de différences sont observées entre aveugles et voyants. Les aveugles tardifs se situent à mi-chemin entre les aveugles nés et les voyants: ils procèdent "systématiquement à une traduction de leurs représentations tactiles en représenta tions visuelles imagées" (Hatwell 1966.

Il sera donc nécessaire de s'assurer que les sujets aveugles n'ont pas eu d'expériences visuelles depuis la naissance, avant d'effectuer toute investigation dans le domaine de la "représentation" de l'enfant aveugle.

b - L'histoire de la cécité:

D'autres facteurs liés à la cécité doivent être considérés ou contrôlés dans l'analyse des performances des sujets, sous peine d'introduction de biais expérimentaux.

En effet, d'autres handicaps physiques et neuro-moteurs peuvent s'associer à la déficience visuelle et retentir ainsi plus ou moins sur le développement des capacités de l'enfant.

Dans ce cas, la déficience visuelle n'est pas seule respon sable du retard observé.

De plus l'histoire de la cécité, même si elle n'est pas associée à d'autres déficiences sensorielles, physiques ou mentales peut, à elle seule, être la cause de différences inter-individuelles.

Des hospitalisations plus ou moins fréquentes et plus ou moins nombreuses peuvent perturber la petite enfance et la scolarité de l'enfant.

c - L'environnement familial et social:

Un autre problème à considérer est celui de l'interaction du sujet aveugle avec son milieu environnant.

Il importe de souligner les difficultés de communication que rencontrent les enfants aveugles. Ce problème de communication est une source d'extrême variabilité dans les performances des sujets aveugles.

Les parents comprennent plus ou moins bien les réactions de leur enfant handicapé; ils ont des difficultés à comprendre les indices que l'enfant utilise pour exprimer ses besoins. En général ces enfants sont sous-évalués et les parents apprécient mal la nature des progrès de leur enfant (Burlingham 1979). Les réactions des parents ou de l'entourage accentuent plus ou moins les problèmes du petit aveugle, c'est-à-dire la diminution de ses possibi lités de déplacement, la diminution de son autonomie, la limitation des contacts avec les objets et les personnes et la création éventuelle de perturbations affectives.

La perte de la vision nécessite, dès le plus jeune âge, une compensation par de nombreuses stimulations supplémentaires et cet apport est très variable selon l'intervention des parents et de l'entourage. Il importe donc de considérer l'environnement de l'enfant déficient. Il convient aussi de distinguer les aveugles qui vivent en institution des aveugles qui vivent parmi les voyants.

Les aveugles qui "vivent" parmi les voyants ont tendance à utiliser le répertoire linguistique des personnes voyantes, à s'approprier leurs "référents visuels" et à imiter leurs expressions descriptives. Les aveugles en institution, essentiellement entourés d'autres déficients visuels, ont un langage plus spécifique, particulièrement influencé par la perception haptique (tactilo-kinesthésique). Les sujets aveugles ont tendance à représenter la signification de certains items en utilisant des attributs provenant d'autres modalités sensorielles que la modalité visuelle ou en utili sant la signification d'items associés. Ils peuvent ainsi dire "chaleur" pour soleil.

d - La nature de la déficience visuelle:

Nous citerons une définition de la cécité employée avec bon sens par les enfants des instituts spécialisés pour se situer par rapport à leur camarade: "est aveugle celui qui doit appprendre le braille et se servir d'une canne pour ses déplacements".

Selon la définition légale de la déficience visuelle, l'éducation d'un enfant nécessite une prise en charge en institution spécialisée, si l'acuité visuelle de l'enfant pour le meilleur œil corrigé ne dépasse pas 20/200 ou si le diamètre du champ visuel ne soutient pas un angle de plus de 20 degrés (Willis 1979). Cette définition est retrouvée dans de nombreux pays à peu de variantes près. Les américains distinguent neuf catégories de déficience visuelle:

  • catégorie 1: 20/200 à18/200;
  • catégorie 2: 17/200 à13/200;
  • catégorie 3: 12/200 à8/200;
  • catégorie 4: 7/200 à3/200;
  • catégorie 5: 2,5/200 à 1/200;
  • catégorie 6: compte les doigts;
  • catégorie 7: mouvements de la main, formes des objets;
  • catégorie 8: perception de la lumière et des ombres - catégorie 9: cécité totale.

Pour l'O M S (Organisation Mondiale pour la Santé):

  • Catégorie 1: acuité visuelle entre 3/10 et 1/10
  • Catégorie 2: acuité visuelle entre 1/10 et 1/20
  • Catégorie 3: acuité visuelle entre 1/20 et 1/50
  • Catégorie 4: acuité visuelle entre 1/50 et perceptions lumineuses
  • Catégorie 5: pas de perception lumineuse

Outre la notion d'acuité visuelle, il faut considérer la notion de champ visuel: si l'amplitude du champ visuel est compris entre 5 et 10 degré, le sujet appartient à la catégorie 3 et si le champ visuel est inférieur à 5 degré, il appartient à la catégorie 4.

Les trois premières catégories classent les sujets appartenant à l'une d'entre elles parmi les amblyopes, les deux autres les classent parmi les aveugles.

Mais, si cette classification définit un taux de vision,l'utilisation fonctionnelle de ce taux de vision est très variable d'une personne à l'autre. Elle dépend en effet de l'apprentissage perceptif de l'enfant. Quel que soit le degré d'atteinte visuelle, une éducation bien appropriée peut amener l'enfant à utiliser au mieux ces capacités perceptives. Cette rééducation visuelle devrait être mise en œuvre dès le diagnostic de déficience et surtout dès que possible chez le jeune enfant. La perception visuelle normale est le résultat d'une longue période d'apprentissage (Hebb 1958 cité par Reuchlin 1977), apprentissage dans laquelle l'activité du sujet et ses déplacements joueraient un rôle essentiel. Pour Reuchlin, l'apprentissage de la perception ne se ramènerait pas à une association répétée, mais serait plutôt une perception des "invariants", c'est-à-dire "des aspects du tableau perceptif dont les variations sont entièrement prévisibles à partir des informations dont dispose l'organisme sur ses propres déplacements... Ces détecteurs d'invariants pourraient être alimentés par des informations visuelles aussi bien que par des informations tactiles. ou auditives". Ces détecteurs de caractéristiques seraient présents dès la naissance mais ne deviendraient fonctionnel que grâce à l'activité du sujet.

Ainsi, sur le plan fonctionnel et en conséquence sur le plan expérimental, la manière dont est utilisée "un reste" de vision peut être une source de variabilité importante. C'est pourquoi une étude expérimentale avec des sujets déficients visuels doit être entreprise avec beaucoup de précaution. Il est très difficile de constituer des groupes de sujets. Une passation individuelle s'impose dans la plupart des cas.

L'étendue de la classification des déficiences visuelles est le résultat d'étiologies très variées: fibroplasie rétro-lentale, glaucome chronique, décollement de rétine, tumeurs de la rétine...

Ces différentes pathologies aboutissent à des perceptions visuelles de qualités très diverses, que ne révèle pas la mesure de l'acuité.

e - Les facteurs non spécifiques:

Si des techniques efficaces et des méthodes d'apprentissage peuvent contribuer grandement à une bonne intégration du jeune aveugle dans le milieu scolaire, universitaire et dans le monde professionnel, il importe de ne pas minimiser et de favoriser les facteurs qui influencent la réussite professionnelle et l'adaptation de tous, voyants et non voyants. Parmi ces facteurs non spécifiques, citons les principaux:

  • les capacités intellectuelles,
  • l'aptitude à la relation et à la communication avec les autres,
  • la motivation personnelle,
  • les capacités et la volonté d'autonomie,
  • les capacités d'adaptation.

Tous ces facteurs spécifiques ou non spécifiques aux non voyants, peuvent interagir entre eux et contribuer à accentuer les différences inter-individuelles.


II - INFLUENCE DE L'ORGANISATION DU CHAMP PERCEPTIF DE L'AVEUGLE SUR L'ACCES À L'INFORMATION ET L'ACQUISITION DES CONNAISSANCES

A - Caractéristiques du champ perceptif de l'aveugle

La vision joue un rôle considérable dans la prise d'information sur le monde environnant. L'œil est un télérécepteur: il "capte" les informations à distance. C'est le plus complexe des organes sensoriels et celui qui apporte la plus grande quantité d'information à un moment donné.

Le champ perceptif visuel est très étendu. Il permet une perception simultanée des objets. L'œil est l'organe des sens qui possède le plus grand nombre de récepteurs au millimètre carré, soit par exemple 165000 récepteurs au millimètre carré pour la région fovéale. L'organisation de ces récepteurs au centre de la rétine permet une discrimination très fine et une appréciation simultanée des multiples détails d'un objet. De par sa simultanéité, l'approche visuelle facilite l'anticipation, la préparation à l'action et assure ainsi la rapidité et la précision du mouvement.

Contrairement au champ visuel, le champ perceptif tactile est réduit. La perception tactile s'élabore à partir d'informations successives et fragmentées. Le nombre de récepteurs au millimètre carré de la pulpe du doigt est de 370. Pour explorer l'espace avec les mains, l'aveugle utilise des stratégies de palpation, mais la perception tactile qui en découle est une réorganisation des sensations fragmentées dans l'espace et successives dans le temps. Aussi, il est nécessaire, pour l'aveugle, d'adapter et d'affiner ce système perceptif et d'améliorer ses stratégies de palpation.

Si la vision donne une perception globale d'un objet, la perception tactilo-kinesthésique ne permet pas toujours d'aboutir à une perception globale, même après avoir rassemblé toutes les sensations tactiles. Il en est ainsi pour les objets très volumineux ou hors de portée, pour les paysages...

Gibson (1962, cité par Bailes 1986) fait remarquer que la perception visuelle est aussi un processus séquentiel qui aboutit à la construction de la "gestalt" à partir d'une série de fixations oculaires. Pour Gibson, les deux perceptions, visuelle et tactilo-kinesthésique, sont des constructions dont la différence majeure se situe sur le plan temporel. En effet cette "construction" est beaucoup plus rapide pour la vision, si bien que le processus d'assemblage semble être simultané, alors qu'il est par opposition séquentiel et très ralenti dans la perception haptique (tactilo-kinesthésique). Aussi cette forme de perception nécessite-t-elle un effort de traitement plus élaboré et plus soutenu et est-elle moins efficace dans le traitement de l'information spatiale et dans les tâches impliquant une reconnaissance de configuration.

Par rapport aux stimulations visuelles, les stimulations auditives et kinesthésiques sont en général instables. Les sons rarement continus et les sensations cutanées et proprioceptives cessent dès que le contact physique prend fin (Markovitz 1982,p. 435). De plus, la perception de la conti nuité du mouvement est plus facile en modalité visuelle qu'au moyen des autres sens. La vision facilite aussi la mise en relation des actions.

B - Retentissement de la déficience visuelle sur l'accès à l'information

1 - Les informations visuelles inaccessibles:

Pour un nouveau-né aveugle, la plus grande partie du monde qui l'entoure est inaccessible. Seules les stimulations auditives (voix et bruit), les stimulations tactiles immédiatement proches, les stimulations olfactives et gustatives pourront être expérimentées. Le jeune enfant voyant peut observer une mouche, un oiseau qui vole, le feu qui crépite dans la cheminée, le ciel, la lune, les paysages, les maisons... L'enfant aveugle ne pourra, ni voir, ni toucher tout cela. Pour le non voyant, les très grand objets, les objets dangereux, les objets en mouvement, les scènes, les paysages et les dessins sont inaccessibles. Ce défaut d'accès à l'information visuelle peut aboutir à des déficits plus ou moins graves dans la fonction de représentation et à un retard du développement cognitif de l'enfant (Hatwell 1966).

2 - Difficultés dans la communication:

Le petit aveugle ignore tout des expressions faciales, des mimiques, des attitudes, des gestes des gens qui l'entourent. Il ne pourra pas se référer à ce genre d'indices pour imiter les grands ou modifier sa conduite. Il ne pourra savoir si son comportement est accueilli par un sourire ou un froncement de sourcils. Seuls, une parole apaisante, , un soupir, un grognement, une intonation plus marquée, une main qui le repousse ou l'attire pourront orienter son comportement.

Pour l'adolescent et l'adulte aveugle, l'inaccessibilité de la gestualité des autres, aboutit assez souvent à des malentendus et parfois à des difficultés dans la communication. Ces problèmes sont accentués quand le non voyant est confronté à un groupe de personnes. Si les jeunes aveugles ne sont pas préparés à de telles situations, s'ils ne savent pas comment ils "fonctionnent " et comment "fonctionnent" les autres, ils peuvent être confrontés à de réels problèmes de communication qui pourraient secondairement retentir sur leur personnalité.

3 - Les informations spatiales et environnementales

Avant la marche, l'espace du jeune enfant aveugle se réduit à ce qu'il peut atteindre avec les mains, les pieds la tête et à ce qu'il peut entendre. Quand il commence à se déplacer, ses relations avec l'espace environnant dépendent du comportement de son entourage. Des parents inquiets, ne sachant que faire ou craignant un accident, maintiennent l'enfant aveugle attaché sur un siège ou couché dans son lit jusqu'à un âge avancé. Ce maintien de l'enfant dans un environnement spatial déjà trop limité, ne peut avoir que des conséquences fâcheuses sur son développement psychomoteur, sa musculature et plus tard sur ses capacités de déplacement autonome. La locomotion de l'enfant aveugle (possibilité de se déplacer de façon autonome) nécessite la plupart du temps un apprentissage.

À défaut d'informations visuelles, l'aveugle doit s'appuyer sur des indices sonores, tactiles, musculaires, proprioceptifs, parfois olfactifs pour pouvoir se déplacer librement. Ces déplacements nécessitent le plus souvent beaucoup d'attention et de concentration et font appel aux capacités mnésiques du sujet et à sa "conscience" de l'espace (Hatwell 1986). Des chercheurs se sont intéressés plus particulièrement à ces problèmes et ont expérimenté des techniques nouvelles (Sampaïo ).

C - Retentissement de la déficience visuelle sur l'acquisition des connaissances et le développement cognitif

1 - La représentation

Les images mentales, le langage, sont des formes de représentation construites à partir des informations , des événements et des expériences que le sujet tire du monde environnant. Les différentes modalités sensorielles sont engagées dans la formation et la production des concepts. Que se passe-t-il lorsque la modalité visuelle est déficiente, voire absente?

L'analyse différentielle des caractéristiques des perceptions visuelle et tactile permet de comprendre l'avantage des aveugles tardifs sur les aveugles-nés dans la reconnaissance des formes. Cette reconnaissance est facilitée par une expérience visuelle précoce et contribue à améliorer les capacités d'organisation spatiale (Hatwell 1966, Bailes 1986, Hatwell 1986).Pour Bailes (1986), les aveugles tardifs ont acquis la capacité d'encoder les informations successives obtenues de façon tactilo- kinesthésique, sous forme de "représentation visuelle globale" tandis que les aveugles congénitaux utiliseraient un système de codage basé sur le traitement "d'inputs successifs".

En 1966, Hatwell, dans "Privation sensorielle et Intelligence", souligne l'influence d'une modalité sensorielle aussi primordiale que la vision sur le développement cognitif de l'enfant. Pour cet auteur,la composante figurative de ce développement est surtout perturbée, du fait essentiellement de la déficience perceptive qui retentit secondairement sur les activités locomotrices et sur les expériences de l'enfant.

Plusieurs études ont mis en évidence un retard dans le développement cognitif de l'enfant aveugle, en particulier dans les stades de développement définis par Piaget: dans la conservation, sériation, classification (Hatwell 1966, Miller 1969, Friedman et Pasnak 1973), dans la sériation et la classification de certains concepts (Swallow et Poulsen 1972), dans la conservation (Gottesman 1971, 1973, 1976) et dans la résolution de problèmes spatiaux topologiques, projectifs et euclidiens (Tobin 1973).

Dans ces différentes études, les auteurs concluent que le développement cognitif de l'enfant aveugle est plus lent que celui de l'enfant voyant. Ce retard semble être attribué essentiellement au déficit, tant quantitatif que qualitatif, des informations qui peuvent être appréhendées par l'enfant aveugle. Toutefois, les auteurs s'accordent à reconnaître que les enfants aveugles ne sont pas handicapés dans leurs capacités de raisonnement. En particulier, pour Higgins (1973), le retard de développement de l'enfant aveugle n'est pas lié à des déficiences dans les structures intellectuelles, mais est dû à un déficit perceptif.

Le déficit visuel impose à l'enfant une interaction directe avec l'objet, une prise d'information séquentielle, des stratégies de palpation et une reconstruction plus élaborée et plus complexe de l'information perçue. En effet la comparaison entre la perception tactile et la perception visuelle explique la lenteur dans la prise d'information du sujet aveugle.

Les enfants aveugles nés présentent un développement cognitif comportant les mêmes stades que les enfants voyants, mais ce développement est plus lent (Gottesman 1973, 1976, Stephens et Simpkins 1974). Le défaut d'apprentissage incident, l'expérimentation limitée, l'exploration active limitée, expliquent ce retard du jeune enfant aveugle qui s'exprime davantage sur un plan figuratif que sur un plan opératif. Privés d'une grande partie de l'information utili sable par les voyants, les jeunes enfants aveugles possèdent "des concepts fragmentés d'informations déficitaires" et font une utilisation limitée des informations différentielles (Kephart et Schwartz 1974).

L'échelle de Kephart est une mesure de "la prise de conscience conceptuelle" liée aux concepts qui se rapportent à l'image corporelle de soi-même et de l'environnement. Cette échelle permet d'établir l'ordre de l'information que l'enfant a accumulée par ses propres moyens sur son environnement physique: son corps,la rue, le quartier, la ville.

Avant de pouvoir verbaliser l'information, les enfants voyants ont déjà établi des concepts, (le toit, les murs, le plancher...), parce qu'ils ont exploré eux-mêmes, le pré-verbal chez les enfants voyants est "perdu" pour l'enfant aveugle (Kephart et Schwartz 1974). Ces deux auteurs ont appliqué l'échelle de Kephart à 49 aveugles et 47 voyants de 5 à 7 ans. Ils ont effectué une étude différentielle de l'ordre d'acquisition des concepts familiers chez l'enfant voyant et aveugle. Les différents concepts et attributs étudiés sont ceux du corps,de la maison, du jardin, de la rue, de la ville.

Cette expérience souligne tout particulièrement la lenteur de l'acquisition chez l'enfant aveugle. La façon dont l'enfant aveugle traite les informations par rapport à son propre corps et à son environnement semble résulter d'une compréhension fragmentée et déformée des concepts de base. Les expériences effectuées à travers les modalités sensorielles autres que la vision ne peuvent remplacer celles effectuées à l'aide de la modalité visuelle.

Dès les premières années, l'enfant aveugle reçoit les informations à partir du cadre de référence construit par les personnes voyantes qui l'entourent. L'enfant aveugle manque d'expériences qui lui sont propres. Pour Kephart, il est nécessaire de placer l'enfant déficient visuel face à une très grande variété d'expériences, pour qu'il puisse "s'équiper d'un cadre de référence qui lui soit propre". L'expérience étayée de toutes les modalités sensorielles est nécessaire à une bonne conceptualisation. Aussi il est important que l'enfant ait des explications pour tout ce qu'il entend et pour tout ce qu'il sent tactilement (Kehpart et Schwartz 1974).

D'autres auteurs insistent sur l'importance de l'expérience de l'apprentissage dans l'évolution du développement cognitif du jeune enfant aveugle. Pour Simpkins (1979), les enfants aveugles pourraient apprendre à utiliser des stratégies d'exploration dans le but de "se construire une image mentale" et donner ainsi plus de poids et plus de richesse aux concepts qu'ils acquièrent et en particulier aux concepts spatiaux.

"L'espace mental est une construction édifiée par une activité individuelle ou fondée par la construction et la coordination des actions qui conduisent à objectiver l'espace". L'élaboration de la représentation spatiale dépend plus des processus cognitifs que des processus perceptifs (Piaget et Inhelder 1965, Hatwell 1966, Simpkins 1978).

Simpkins (1978) note aussi l'importance de la manipulation et des stratégies de palpation chez l'enfant aveugle. Dans son étude, l'auteur remarque que les enfants de 6-7 ans sont plus exacts pour les reconnaissances de formes que les enfants de 4-5 ans. Les enfants plus âgés palpent l'objet avec la main entière, avec tous les doigts de la main, isolant des traits particuliers de la forme tout en les comparant avec d'autres traits. Cette exploration globale et simultanée est un aspect particulier de "la manipulation active" qui conduit à un jugement plus exact et plus précis de la forme. Ces activités d'exploration peuvent être modifiées par l'expérience et l'apprentissage. Pour Simpkins l'apprentissage est nécessaire pour pouvoir explorer les formes et les arêtes de façon efficace et l'auteur se demande comment "sentir" et évaluer la surface entière dans le but de se construire une image mentale. Il importe de ne pas négliger l'apprentissage et les exercices précoces de manipulation, des techniques d'exploration pour isoler des composantes d'une forme, discriminer des différences et des ressemblances, et définir ainsi une signification pour effectuer une reconstruction mentale du stimulus.

S'appuyant sur la conception de Piaget de l'organisation spatiale, les conclusions de Simpkins dérivent des résultats de deux expériences dans lesquelles l'auteur tente d'identifier certains concepts spatiaux utilisés dans la reconnaissance tactile de forme et dans lesquelles l'auteur compare les relations topologiques utilisées par les enfants voyants et les enfants aveugles. Les formes utilisées sont celles de Laurendeau et Pinard (1970).

La représentation spatiale chez l'enfant aveugle a été également étudiée par Millar (1976):72 enfants aveugles et voyants aux yeux bandés sont testés entre l'âge de 6 et 11 ans dans des tâches de rotations mentales de lignes dans différentes directions. Dans la reconnaissance tactile, le score est similaire pour les enfants aveugles et voyants, mais dans la tâche de rappel, les résultats mettent en évidence une supériorité des enfants voyants. De plus, tous les enfants aveugles qui avaient eu une expérience visuelle avant 6 ans sont supérieurs aux aveugles-nés. Le problème étudié consiste à déterminer comment les enfants aveugles se représentent l'information tactilo-kinesthésique en mémoire.

La représentation spatiale a essentiellement un caractère visuel. Toutefois, en accord avec Piaget, Millar parle de "perception spatiale" plutôt que d'image mentale parce que la représentation spatiale ne dériverait pas uniquement d'images visuelles.

Dans une tâche de rotation mentale, le temps de réaction des aveugles croît en fonction de l'augmentation du déplacement angulaire comme celui des voyants Toutefois, selon ses résultats, Millar (1976) conclut que:

  • l'expérience haptique (tactilo-kinesthésique) apporte moins d'informations sur les directions complexes
  • la mémoire du mouvement (rotation) est organisée de façon séquentielle
  • la mémoire de la perception haptique de l'espace est moins bonne que la mémoire visuelle qui peut être organisée plus facilement de façon spatiale.

En conclusion la comparaison entre la perception visuelle et la perception haptique (tactilo-kinesthésique) permet de comprendre le retard du développement cognitif des enfants aveugles. Ce retard n'est pas permanent et les déficiences observées sont plus nettes sur le plan figuratif que sur le plan opératif des capacités cognitives. Ce qui explique leur retentissement sur la représentation et la conceptualisation de l'enfant aveugle.

2 - La conceptualisation de l'enfant aveugle:

Pour mieux comprendre la représentation et la conceptualisation de l'enfant aveugle des auteurs ont essaye d'évaluer sa capacité à générer une image mentale. Ils ont tenté de comprendre comment l'enfant aveugle construit cette image mentale et ont fait une analyse des concepts que l'enfant aveugle associe aux objets (Richaume 1988).

La formation de concepts et la catégorisation sont fondés essentiellement sur la perception et l'expérience. La cécité prive l'enfant aveugle-né d'une très grande quantité d'informations, limite sa motricité, ses déplacements et l'interaction avec l'environnement et les objets qui l'entourent. Cette limitation s'étend aussi dans la communication avec les personnes. Dès les premiers mois de la vie, le bébé, né aveugle, ne peut voir les expressions du visage de sa mère, ses mouvements, ses gestes, ses allées et venues. L'enfant se trouve ainsi face à des problèmes de communication et à des difficultés pour construire des références extérieures (Rowland 1984, Rogow 1980).

Burlingham (1979) a procédé à de nombreuses observations de jeunes enfants aveugles d'âge pré-scolaire, dans le but d'apporter des éléments de réponses à trois questions principales:

  • l'absence de vision influence-t-elle le développement des autres sens?
  • Comment l'aveugle construit-il une image du monde et celle ci diverge-t-elle de celle des voyants?
  • Comment l'aveugle agit-il pour s'adapter à l'environnement du voyant?

Burlingham note une déficience dans la prise d'information des jeunes enfants aveugles par rapport aux enfants voyants. Elle constate que les enfants aveugles essaient de compenser cette déficience par une utilisation accrue du toucher (à l'aide des mains et des doigts, des pieds et surtout de la bouche) et par une utilisation accrue de l'ouïe. Elle remarque aussi que l'enfant aveugle emploie les mêmes mots que les voyants, mais la représentation des choses peut avoir une signification tout à fait différente pour l'enfant aveugle.Ainsi le mot "regarder" est employé au lieu de "toucher", "voir" au lieu de "entendre". Des comparaisons inattendues pour les voyants et assez originales sont utilisées: elles se rapportent souvent à l'expérience sensorielle propre de l'enfant aveugle. En effet, l'utilisation des impressions engendrées par les stimulations externes et élaborées à partir des sens, donne des significations sensiblement différentes aux choses et aux événements chez l'aveugle si on les compare à celles des voyants.

Des auteurs ont étudié de façon comparative les capacités perceptives tactiles et auditives des aveugles et des voyants. Dans deux expériences de Cobb (1979) des aveugles et voyants adultes sont mis en présence de 150 objets courants et écoutent 194 sons naturels. Les résultats montrent que les aveugles et les voyants ont une même capacité à distinguer et à reconnaître des objets communs et des sons naturels.

Dans une étude comparative de temps de réaction auditifs simples de sujets âgés de 11 à 15 ans, Bernard (1979) n'observe pas de différence significative entre les sujets aveugles et voyants.

Toutefois Lucas (1984) observe que les enfants aveugles discriminent mieux que les enfants voyants le son et la parole.

Les observations et les expériences montrent en général que les jeunes enfants aveugles ont les mêmes capacités "d'écouter" et de "sentir" que les enfants voyants, mais qu'ils essaient d'utiliser avec une plus grande efficacité ces deux perceptions tactiles et auditives afin de compenser le défaut de perception visuelle.

Un facteur non négligeable dans la formation d'image mentale est la capacité de création. Johnson (1979) a étudié la pensée créative et l'originalité verbale chez 95 adolescents voyants et 95 aveugles. Il a fait entendre des sons et a demandé d'imaginer les images correspondantes, de même pour des onomatopées. Les adolescents aveugles présentent des scores significativement plus élevés que les adolescents voyants sur les deux tests d'originalité verbale: son-image et onomatopée-image. De plus, l'auteur note un effet de l'intelligence: les adolescents aveugles ou voyants d'intelligence moyenne ou élevée produisent plus de réponses verbales originales que les adolescents d'intelligence faible pour les deux tests. Ce résultat est en accord avec la conclusion de Halpin et al (1973), selon laquelle les enfants aveugles sont des "penseurs plus créatifs" que les enfants voyants.

Il est à noter que la capacité verbale des adolescents aveugles mentionnée ici, n'est pas le "verbalisme" parfois décrit chez l'aveugle. Le verbalisme est une dissociation entre les mots, le vocabulaire utilisé et l'expérience sensorielle (De Mott 1972).

Les multiples travaux de Kennedy (1983, 1982, 1986) et les études citées auparavant mettent en évidence la capacité de l'aveugle à générer une image mentale. Kennedy (1982, 1983), tout comme Millar (1983) rapportent que les aveugles sont capables de comprendre les graphiques en relief des objets. Des aveugles qui n'avaient pas souvenir d'avoir vu des dessins ou des images et à qui on n'avait jamais expliqué ce qu'était un dessin, reconnaissaient des graphiques en relief et dès les premiers essais, ils effectuaient des dessins en relief.

Il est donc très probable que l'aveugle ait acquis la notion d'imagerie. Mais, comme le pense Cornoldi et al. (1979), la conceptualisation de l'aveugle présenterait des composantes imagées particulières, propre à ses mécanismes de perception.

D - Nature de l'image mentale chez l'aveugle

Dans le but d'étendre la connaissance de l'imagerie et des processus mnésiques des aveugles congénitaux, Cornoldi (1979) place en situation d'apprentissage incident deux groupes de jeunes adultes (aveugles congénitaux et voyants). Les sujets doivent donner une valeur d'imagerie à trois séries de mots. Ils sont ensuite soumis à une tâche inattendue de rappel libre. Les mots évalués et rappelés appartiennent à trois catégories:

  • les items à haute "capacité d'imagerie" dont les référents peuvent être directement sentis et évalués par l'aveugle (exemple: balle, pierre);
  • les items à haute "capacité" d'imagerie (ou pouvoir évocateur d'images, traduit de imageability), dont les référents ne sont pas directement accessibles aux aveugles (exemple: tigre, tour);
  • les items à faible capacité d'imagerie ou à faible pouvoir évocateur d'images;

Les sujet voyants ont donné un taux d'évaluation élevé à la fois aux mots dont les référents sont directement accessibles et à ceux dont les référents ne le sont pas;alors que chez les sujets aveugles, la note d'évaluation est particulièrement basse pour les mots non directement accessibles.

Ainsi, les sujets aveugles congénitaux sont capables de faire "l'évaluation iconique" d'un mot et de différencier cette valeur d'imagerie selon des critères déterminés.

Toutefois, les mots qui se réfèrent à des objets concrets, mais non directement accessibles, de façon sensorielle, à l'aveugle ont reçu des notes très basses, alors que les sujets voyants leur ont donné des notes élevées.

Les mots à faible capacité d'imagerie, ont obtenu des notes élevées de la part des aveugles par rapport aux mots à référents inaccessibles à l'aveugle, et par rapport aux notes données par les voyants.

Les mots à référents inaccessibles représentent des objets avec lesquels l'aveugle n'a pu avoir une expérience sensorielle.

En situation de rappel incident, la meilleure performance des aveugles est obtenue pour les mots dont les référents sont inaccessibles. En rappel intentionnel, la meilleure performance des aveugles est obtenue pour les mots à faible capacité d'imagerie. Le rappel des sujets aveugles ne correspond ni aux normes en valeur d'imagerie obtenues avec des sujets voyants, ni aux notes en imagerie données par les sujets aveugles.

Bien que les sujets aveugles soient capables de différencier la valeur en imagerie des mots, ils n'utilisent pas cette valeur d'imagerie dans les tâches de rappel.

Pour Cornoldi, la capacité d'imagerie d'un mot semble plutôt décrire, comme Paivio le suppose, la susceptibilité qu'a un item d'être codé de façon spécifique (visuo-imagée). Ce type de codage est peut être plus disponible pour le voyant que pour l'aveugle.

La perception peut être considérée comme un système à double encodage dans la mémoire de travail comprenant une composante de stockage mnésique iconique initiale, qui est soit haptique, soit visuelle, et une deuxième composante qui est un stockage mnésique de nature acoustique ou articulatoire (Bailes 1986). Pour Bailes, les aveugles traitent les images spatiales de la même façon que les voyants, mais plus lentement. L'application d'un code verbal est un événement plus tardif dans la séquence du traitement. Pour les sujets aveugles, l'intégration de tous les segments d'un objet n'est pas terminée avant l'intégration du segment suivant. Dans l'expérience de Bailes (1986), les sujets aveugles n'appliquent pas d'étiquettes verbales à des stimulus non familiers comme le font les sujets voyants. Pour Bailes, la perception visuelle permettrait de donner plus facilement une étiquette représentative à une information spatiale abstraite.

Pour essayer de comprendre la nature de l'image mentale de l'aveugle, Hans (1974) a répliqué l'expérience de Paivio et Occovita (1971). L'auteur présente aux sujets 12 paires de noms communs. Chaque paire est composée d'un nom stimulus et d'un nom réponse. Ces 12 paires sont divisées en 4 groupes: 3 paires comportent des noms de haute valeur d'imagerie visuelle pour les termes stimulus et réponse; 3 paires des noms de haute valeur d'imagerie auditive pour les deux termes; 3 paires avec des noms à haute valeur d'imagerie visuelle pour le terme stimulus et haute valeur d'imagerie auditive pour le terme réponse et inversement pour les trois dernières paires.

Les résultats de l'expérience de Hans suggèrent que les sujets aveugles n'utilisent pas une image auditive pour faciliter le rappel, mais ils traitent moins bien les mots avec des référents auditifs que les mots avec des référents visuels. Etant donné que la confirmation de l'hypothèse d'une "cheville conceptuelle" dépend de l'utilisation d'une imagerie de modalité spécifique , cette hypothèse n'est pas validée dans cette expérience. Il semble que les aveugles n'utilisent pas une imagerie de modalité spécifique dans l'apprentissage de paires de mots associés.

Toutefois Jonidès et al. (1975) ont montré qu'une "instruction d'imagerie" améliore non seulement la mémoire des sujets voyants, mais aussi la mémoire des sujets aveugles congénitaux. Ainsi l'effet de l'image mentale sur la mémoire ne peut pas être expliqué uniquement par un mécanisme dépendant de la vision.

L'effet de l'instruction d'imagerie pourrait former un lien sémantique entre les deux mots. Ce qui produirait une meilleure rétention mnésique. Pour Jonidès et al., l'effet d'imagerie n'est pas essentiellement visuel.

Les aveugles congénitaux possèdent des connaissances sur le monde environnant: ils possèdent en particulier des connaissances sur "le monde visuel" qui dérive de leur prospection et de leur expérience tactilo-kinesthésique (Kennedy 1980). Toutefois certaines propriétés des objets ne sont pas "tangibles" pour l'aveugle: la couleur,la taille par exemple,et parfois les objets ne sont pas accessibles de façon tactile: un paysage, une vue d'ensemble, un toit...L'aveugle apprend l'existence des objets et phénomènes non tangibles à partir des descriptions verbales de son entourage, des lectures en braille, de l'écoute d'émissions radiophoniques...

Si les voyants peuvent utiliser une image visuelle pour se représenter les objets tangibles et non tangibles,

Page 35 l'aveugle doit se référer à une autre modalité d'imagerie ou utiliser une représentation sémantique (Zimler 1983). Zimler propose plusieurs expériences dans le but d'évaluer la limitation dans la représentation sur l'information du "monde visuel" chez l'aveugle congénital. Pour apprécier l'évolution des connaissances de l'aveugle, l'auteur teste des enfants aveugles et voyants, puis des adultes aveugles et voyants.

Les deux premières expériences examinent les hypothèses de Paivio sur "la modalité spécifique" de l'imagerie. L'expérience 1 utilise une tâche de rappel de paires associées dont les référents des mots ont une valeur d'imagerie visuelle et auditive élevée. Les aveugles, tout comme les voyants rappellent plus de paires présentant une haute valeur d'imagerie visuelle.

L'expérience 2 utilise une tâche de trois rappels pour des mots dont les attributs sont en rapport avec une modalité spécifique:

  • un groupe "rouge" (sang, cerise)
  • un groupe bruit intense (sirène, tonnerre);
  • un groupe "rond" (bouton, balle).

Les résultats montrent que les adultes rappellent plus de mots que les enfants. Les aveugles rappellent plus de mots "bruits forts" que les voyants, mais il n'est pas observé de différence significative pour le rappel des mots "rond" et "rouge" entre les voyants et les aveugles.

Les auteurs ont demandé aux sujets "l'étiquetage des catégories". Ils notent une différence significative entre aveugles et voyants dans la capacité d'étiqueter la catégorie "rouge": 17 pour cent des enfants aveugles ont reconnu la catégorie "rouge" pour 56 pour cent des enfants voyants. En comparaison cette catégorie a été identifiée par 72 pour cent des adultes aveugles et 89 pour cent des adultes voyants.

Selon les résultats de cette expérience, les aveugles ne présentent pas de déficit dans le rappel de mots organisés suivant des attributs visuels.

Nous reprendrons au dernier paragraphe la discussion sur la classification et l'étiquetage des mots.

Pour Paivio (1971), les voyants utilisent une imagerie visuelle pour faciliter la rétention mnésique plutôt que la représentation sémantique abstraite. Les données des expériences de Zimler ne confortent pas cette conception et Zimler (1983) conclut suivant cette alternative:

  • ou bien que l'imagerie visuelle n'est pas plus facilitatrice de la rétention mnésique que la représentation sémantique abstraite;
  • ou bien que les voyants n'utilisent pas l'imagerie visuelle.

L'auteur note que le seul déficit observé dans les deux expériences se situe chez les voyants dans le rappel des mots dont le référent est lié à la modalité auditive. Ce résultat étant confirmé par d'autres auteurs, Zimler suppose que l'expérience visuelle du voyant le rend moins sensible aux stimulus auditifs et que le voyant a moins de connaissance ou moins "d'images" sur les stimulus auditifs que les aveugles.

L'expérience 3 de Zimler reprend la tâche de Neisser et Kerr (1973), dans laquelle il est demandé aux sujets de former des images de trois types différents d'après une description verbale des objets qui les composent:

  • une image comportant une relation d'interaction "visible" (un oiseau assis sur la torche de la statue de la Liberté);
  • une image comportant une relation d'interaction "invisible" (l'oiseau est à "l'intérieur" de la torche de la statue de la Liberté);
  • une image ne présentant pas de relation entre les objets (la statue de la Liberté et plus loin, dans le ciel, l'oiseau).

Une tâche de rappel incident suit la tâche d'imagination.

Il n'y a aucune différence entre aveugles et voyants en ce qui concerne les temps de production d'images. Pour les voyants et les aveugles, quand une image est construite pour cacher ou dissimuler un objet, cet objet est moins accessible en mémoire que lorsque cette image est "visible". Ainsi les aveugles peuvent comprendre et se représenter la distinction entre les objets "visibles" et "invisibles". Zimler propose que les aveugles utilisent des images tactilo-kinesthésiques et que ces images préservent la distinction entre les objets cachés et non cachés de la même façon que les images visuelles supposées être utilisées par les voyants. Ce point de vue est en accord avec celui de Kennedy (1980).

Les études de Kennedy sur la production graphique des aveugles congénitaux mettent en évidence leur capacité à se représenter une perspective. Kennedy affirme que les aveugles ont la même forme de perception que les voyants pour appréhender tous les traits d'un dessin. De plus, la perspective doit être un facteur important de la perception tactilo-kinesthésique. L'auteur remarque en effet que les sujets aveugles commentent souvent la localisation à partir de laquelle l'objet est décrit et lorsqu'il dessine un objet ils donnent d'abord l'angle à partir duquel l'objet est "vu". Enfin les aveugles sont capable d'apprécier la notion de profondeur et d'occlusion.

En conclusion, un grand nombre d'expériences soulignent que les aveugles congénitaux ont une aussi bonne performance que les voyants pour les tâches qui impliquent des informations sur des phénomènes visuels et la formation d'images sur des configurations spatiales. Il semblerait que l'image mentale de l'aveugle congénital soit essentiellement de nature haptique (tactilo-kinesthésique). L'expérience de Hollins (1985) essaie de déterminer la nature de l'image mentale de l'aveugle selon l'âge de la cécité (congénitale ou acquise). Deux tests d'imagerie sont présentés à 6 adultes aveugles et 4 voyants. Pour l'un d'entre eux les sujets doivent imaginer un damier sur lequel certains carrés spécifiés par l'expérimentateur, sont occupés. Selon la position des cases "occupées", le sujet peut identifier mentalement un dessin. Ce test vise à évaluer le "style visuel" de l'imagerie. Dans l'autre test, les sujets doivent imaginer un assemblage de cubes en trois dimensions pour évaluer le "style haptique" de l'imagerie.Dans les deux tests, la tâche consiste à nommer l'objet qui ressemble au "pattern" imaginé.

Selon les données, chez les sujets aveugles, le taux d'imagerie graphique varie en fonction de "l'histoire visuelle" des sujets. Plus la durée de la cécité est longue, plus le score est faible. La performance dépend aussi de l'âge à laquelle La cécité s'est installée. Ainsi, l'image mentale de l'aveugle est influencée par la nature de son expérience perceptive. Il semblerait que les caractéristiques de la représentation mentale fondées sur l'expérience visuelle et celles fondées sur l'expérience haptique diffèrent.

Il convient cependant, de signaler l'étude de Johnson (1980) sur 91 aveugles et 91 voyants âgés de 10 à 21 ans. Leurs réponses à une forme du questionnaire de Bates sur les images mentales classées en 7 catégories sensorielles (visuelle, auditive,tactile, kinesthésique, gustative, olfactive,symbolique et organique) lui ont permis de conclure que les adolescents aveugles ne sont pas déficients dans la formation d'images mentales. Mais quand un adolescent aveugle dit je "vois", il caractérise peut-être une sensation qui lui est propre plutôt qu'une image visuelle.

E - Nature de la catégorisation et des attributs chez l'enfant aveugle

Les aveugles doivent acquérir leurs connaissances à partir de nombreuses informations qui ne sont pas toujours "tangibles" pour eux. Ils sont forcés de se référer à ce qui leur est décrit verbalement par leur entourage. Ils peuvent donc présenter un retard dans l'acquisition de ces connais sances par rapport aux voyants. Toutefois comme l'a montré Zimler (voir précédemment) l'évolution des capacités d'exploration tactile du jeune enfant, des capacités de loco motion et l'apprentissage atténuent ce retard et à l'âge adulte le groupe de mot "rouge" par exemple est catégorisé par un grand nombre d'adultes aveugles.

En raison d'une perception limitée et d'une expérience particulière, les enfants aveugles sont-ils déficients dans leurs modes de conceptualisation?

La mesure de la conscience conceptuelle personnelle et de l'environnement appliquée à 49 aveugles et 47 voyants de 5 à 7 ans par l'échelle de Kephart (Kephart et Schwartz 1974) a montré que les enfants aveugles présentent des concepts fragmentés de l'information déficitaire et une utilisation limitée de cette information restreinte.

À travers une analyse statistique et qualitative du nombre et du type des attributs que les enfants associent aux objets, des auteurs ont pu comparer les différences entre la conceptualisation des enfants aveugles fondée essentiellement sur le sens tactile et la conceptualisation des enfants voyants fondée sur le sens visuel (Anderson 1984).

Dans l'expérience d'Anderson (1984), 10 enfants aveugles congénitaux et 10 enfants voyants (âgés de 3 à 9 ans) doivent décrire d'abord de mémoire, puis après exploration tactile, des objets communs sélectionnés pour cette tâche.

Est-ce que le langage de l'enfant aveugle reflète le développement des connaissances qu'il a du monde environnant ou la connaissance qu'il a du langage de son entourage?

Le but de l'étude d'Anderson est de déterminer l'effet de l'absence de la vision sur la formation des concepts relatifs aux objets chez les enfants aveugles et de révéler les attributs utilisés par ces enfants pour décrire ces objets.

Les attributs donnés par les enfants sont répertoriés en trois catégories:

  1. égocentrique: pour les réponses liées à une expérience personnelle de l'enfant;
  2. fonctionnelle: pour les réponses donnant la fonction de l'objet ou son but et les actions qui peuvent être effectuées avec cet objet;
  3. perceptive: pour les réponses qui incluent les références de couleur, forme, taille, nombre et caractéristiques physiques de l'objet.

Les résultats, qu'il est prudent de ne pas généraliser trop rapidement du fait du petit nombre de sujets testés, mettent l'accent sur les expériences propres aux sujets. Les expériences des enfants aveugles sont particulières. Chez l'enfant aveugle, les informations provenant de l'environnement leur sont données par le toucher et l'audition. Ce qui est révélé par la nature des attributs proposés par les enfants aveugles.

Les données suggèrent que les enfants aveugles construisent leurs images mentales et forment leurs concepts à partir de leur propre expérience avec le monde. Le langage qu'ils utilisent reflète cette expérience et leur propres représentations mentales plutôt que leur connaissance du langage des voyants. L'auteur propose d'encourager l'exploration tactile de l'enfant aveugle et de lui apprendre toutes les utilisations possibles des objets pour multiplier les informations nouvelles et favoriser sa conceptualisation.

Pour approfondir la compréhension du langage et du développement cognitif des aveugles congénitaux, Anderson et Fischer (1986) effectuent une expérience en reprenant la conception de Piaget sur le "réalisme nominal". Ce qui est réel pour les jeunes enfants doit exister dans les mots: les mots ne sont pas considérés par les jeunes enfants comme ayant une origine sociale arbitraire et conventionnelle: le réalisme nominal est la confusion entre le mot et la chose qu'il désigne. Pour le jeune enfant, le nom est "dans" l'objet et non comme une étiquette attachée à cet objet.

Pour tester le réalisme nominal et l'animisme chez des enfants aveugles et voyants, les auteurs posent une série de questions sur l'origine des noms et la modification possible de ces noms.

L'analyse des résultats met en évidence un développement cognitif normal chez les enfants voyants (au sens de la théorie piagétienne), mais souligne le retard du développe ment cognitif des enfants aveugles. Le réalisme nominal caractéristique de la pensée pré-opératoire est mis en évidence à un âge plus tardif chez l'enfant aveugle que chez l'enfant voyant.

F - Conclusion

En conclusion, le défaut d'expérience visuelle de l'enfant aveugle entraîne un retard dans son développement cognitif. Cependant ce retard n'est pas permanent parce qu'il est lié essentiellement à la lenteur de l'acquisition des connaissances. Les études (peu nombreuses) sur la conceptualisation et le langage chez l'enfant aveugle-né montrent que les images mentales et les concepts des enfants aveugles sont construits à partir d'une expérience qui leur est propre et à partir d'une information tactile complétée par les informations provenant des autres modalités sensorielles qui se sont développées par compensation.

Du fait d'une perception limitée et d'une expérience particulière, les attributs des concepts donnés par les enfants aveugles, sont plus concrets que les attributs donnés par les voyants. De plus les attributs des enfants aveugles se rapportent davantage à des sensations tactiles et auditives. Toutefois la présence d'attributs "visuels" et les capacités des aveugles à comprendre les dessins et la perspective nous amènent à penser que leurs représentations imagées sont assez proches de celles des voyants.

Sur un plan théorique, il serait utile de poursuivre les recherches sur la conceptualisation de l'enfant aveugle pour mieux comprendre le retentissement de la représentation sur la généralisation des concepts, la catégorisation et la formation de prototypes.

Sur un plan pratique, il serait souhaitable d'examiner les caractéristiques de la perception tactile et de la perception auditive, dans le but d'utiliser au maximum ces deux modes sensoriels et de fournir à l'aveugle davantage d'informations par l'intermédiaire de ces deux voies perceptives.

Ainsi, des expériences comme celle de Berla (1972, 1985) permettraient de définir les caractéristiques les mieux appropriées d'un schéma ou d'un dessin en relief pour qu'il soit le plus facilement et le plus rapidement "compris" par l'aveugle.

En ce qui concerne l'accès à l'information, nous nous proposons de poursuivre notre étude dans le domaine de l'audition et de l'écoute, afin de savoir s'il est possible d'acquérir une plus grande quantité d'informations en un temps donné, tout en maintenant une grande efficacité dans la compréhension.


III - LES PROBLÈMES ASSOCIÉS À La CÉCITÉ

A - Problèmes associés à la motricité de l'aveugle

1 - Mimiques et gestualité:

Parce qu'il souffre des yeux ou pour provoquer des réactions lumineuses (phosphènes), le bébé aveugle se frotte souvent les yeux et enfonce épisodiquement les doigts dans les orbites. Ces gestes épisodiques au début peuvent ensuite se transformer en grimaces et en "tic".

Pour le jeune non voyant, le champ des stimulations externes est considérablement réduit, les stimulations tactiles étant limitées au berceau ou à ce qui lui est directement accessible tant qu'il ne marche pas. D'autre part les stimulations auditives sont peu intéressantes tant qu'une relation entre le son entendu et sa cause ne peut être établie. D'une part, l'enfant, "frustré" par ce manque de stimulation, se balance, se cogne et effectue des explorations tactiles désordonnées. D'autre part l'enfant aveugle n'a pas de "modèle gestuel": il ne peut imiter les mimiques, les attitudes et les gestes de ses parents, de ses frères et sœurs. Il peut alors s'installer peu à peu une gestualité particulière. Pour qualifier cette gestualité spécifique à certains aveugles, les anglo-saxons ont introduit le terme de "blindisme". La prudence s'impose dans

l'utilisation de ce terme qui trop souvent se généralise à toutes les attitudes de protection qu'utilisent les non voyants pour éviter les obstacles (bras en avant, tête en arrière, pieds écartés) ou aux mouvements visant à dépenser l'énergie que la sédentarité laisse inemployée.

Regard figé, mobilité inexistante ou anormale des yeux rendent le visage de l'aveugle moins expressif. Ce défaut d'expression peut être accentué chez l'aveugle de naissance par suite de la pauvreté des mimiques et de l'inexistence quasi totale du sourire.

2 - Posture et locomotion

La station debout et la marche sont acquises entre 10 et 18 mois chez le petit voyant et favorisent à la fois son développement musculaire,son sens de l'espace et la confrontation à des expériences nouvelles. L'acquisition de la marche est plus tardive chez l'enfant né aveugle qui n'a pas été soumis à des stimulations suffisantes. Le bébé aveugle adopte de préférence la position couchée sur le dos qui lui permet un champ d'exploration tactile plus vaste. En outre, n'étant pas attiré par les stimulations visuelles,il ne bouge ni ne relève la tête comme le bébé voyant. Par contre le bébé aveugle est plus attentif au bruit: il dirige l'oreille vers la source sonore et s'immobilise pour mieux écouter. Ces différentes postures provoquent une hypotonie axiale et secondairement une hypotonie musculaire générale (Martinez 1984). Pour qu'il s'effectue dans les meilleures conditions, le développement psychomoteur du jeune enfant aveugle a besoin d'apports provenant de son entourage. Très tôt, il aura besoin d'être guidé et éduqué pour l'acquisition du sens de l'orientation, pour l'acquisition de la notion d'espace, pour favoriser son développement musculaire et une bonne gestualité. Ainsi, il pourra plus rapidement se déplacer de façon autonome, sans craindre les chocs et les chutes.

B - Les problèmes de développement du langage

Une grande partie de ce qu'un aveugle peut apprendre sur le monde environnant, est fournie par la voix humaine: celle de l'entourage, de la télévision, de la radio, des disques, des enregistrements sur cassettes...Le langage est un mode d'acquisition des connaissances primordial pour une personne privée de la vue puisqu'il supplée aux informations visuelles inexistantes. Outre un moyen de communication irremplaçable, le langage est un moyen d'apprentissage inestimable pour le non voyant. Nous pensons que le langage doit jouer un rôle primordial dans le développement des enfants atteints de cécité. Pourtant le développement des fonctions langagières de l'enfant aveugle risquent d'être perturbé par le défaut de stimulation visuelle. "Les problèmes associés à la compréhension des termes ayant des référents visuels diminuent dans la mesure où une expérience antérieure peut suppléer à une déficience visuelle acquise" (Markovits 1982 in Troubles du langage. Diagnostic et Rééducation). Un jeune enfant atteint de cécité à 5 ans aura bénéficié d'une expérience visuelle non négligeable pour l'acquisition du langage par rapport à un enfant aveugle de naissance.

Nous avons montré précédemment que la sous stimulation visuelle des enfants aveugles de naissance provoque un retard de leur développement cognitif. Selon Gesell, la vision mène le développement pendant le premier mois et fournit à l'enfant la plupart des indices nécessaires à "la conquête de son environnement physique". Outre l'apport informatif de la vision sur tous les objets de son environnement, elle facilite aussi la mise en relation des actions de l'enfant avec le milieu extérieur et donc retentit sur le développement sensori-moteur.

Chez des enfants aveugles de naissance, il a été noté un retard dans le développement des fonctions langagières: période prolongée de vocalisations imitatives , difficultés pour atteindre le stade de babillage. Ces enfants se contentent de répéter des sons. Une sous stimulation associée à une carence affective peut conduire à des problèmes linguistiques sérieux. Il semblerait que le développement linguistique d'un enfant aveugle soit plus sensible aux conditions affectives et environnementales que celui des enfants voyants.

En ce qui concerne le développement lexical, le rythme d'acquisition des premiers mots chez les enfants aveugles semble nettement ralenti par rapport à celui des enfants voyants. Mais là aussi, le retard n'est pas permanent; il est ensuite compensé. L'enfant aveugle a des difficultés à associer des mots à ses expériences sensorielles de type tactile ou auditif. Les parents ou l'entourage s'appuient essentiellement sur des qualificatifs visuels et utilisent un langage souvent incompréhensible pour le petit déficient visuel. Ces jeunes enfants concentrent surtout leur attention sur les aspects des choses qui leur sont directement perceptibles et fonctionnels. Ce qui explique leur difficulté à acquérir un vocabulaire de base, puisque le langage nécessaire à la description des perceptions d'un aveugle est peu fréquent dans les discours des personnes de son entourage !

En ce qui concerne "l'imitation vocale", étudiée par Fraiberg (1977), elle serait un des seuls moyens de communication entre l'enfant aveugle et ses parents qui ne soit pas touché par la déficience visuelle. L'imitation ayant avant tout un but de communication sociale, elle peut engendrer le "verbalisme": l'enfant peut avoir un vocabulaire mais l'employer à mauvais escient parce qu'il n'en possède pas toute la signification.

Ainsi les enfants aveugles semblent rencontrer plus de difficultés que les enfants voyants dans la production des premiers mots et des premières phrases. Ce retard serait ensuite rattrapé. L'acquisition de la marche et de la

Page 47 locomotion étant plus lente chez les enfants aveugles que chez les enfants voyants, ils ont moins d'expérience et de contacts avec les objets. Un bon nombre d'auteurs ayant étudié les problèmes linguistiques chez l'enfant aveugle, (dont Fraiberg 1977) attribuent les difficultés linguistiques des enfants aveugles à ce défaut d'expériences associé aux carences visuelles. La vision faciliterait la tâche de dénomination des objets ainsi que les premières combinaisons de mots dans les phrases en fournissant à l'enfant un cadre de référence plus stable que celui fourni par les autres sens. La notion de "permanence de l'objet" qui est installée vers 2 ans pour le voyant n'est acquise qu'entre 3 et 5 ans chez l'enfant aveugle.

En ce qui concerne le développement phonologique, les résultats des recherches sont contradictoires. L'interprétation des résultats attestant des difficultés d'articulation et de production de langage chez les enfants aveugles est rendue difficile par l'existence de facteurs souvent associés à la cécité (atteintes neuro-motrices et sensorielles autres que la vision).

En ce qui concerne l'organisation sémantique, la déficience visuelle limite la quantité d'informations disponibles sur le milieu environnant et dans la mesure où cette information est indispensable pour la compréhension de mots ou d'expression linguistique, la compréhension du langage peut être retardée chez l'aveugle (problèmes par rapport aux référents inaccessibles paysages, couleur). .Les jeunes aveugles utilisent le plus souvent un vocabulaire "visuel" au lieu de se servir des mots qui ont des référents plus directement compréhensibles pour eux. Aussi le discours est peut être acceptable sur le plan formel, mais trop éloigné des expériences propres des personnes aveugles (verbalisme). La tendance à s'exprimer en termes visuels pourrait avoir des conséquences néfastes sur l'organisation intellectuelle des personnes aveugles, qui s'appuieraient sur des référents incompréhensibles pour eux.Ce qui conduirait ainsi à une pensée moins bien structurée. Toutefois pour certains auteurs le langage visuel pourrait être utile même si sa signification ne correspond pas nécessairement et directement à celle des sujets voyants. Les données issues des études sur le "verbalisme" montrent que l'utilisation d'un langage qui n'a pas de support visuel mène à la constitution d'un réseau linguistique similaire à celui observé chez les voyants. L'utilisation d'un langage visuel pourrait aider à l'acquisition d'une capacité de compréhension symbolique qui dépasse la simple imitation sociale.

En conclusion sur le problème du langage chez l'aveugle, l'enfant aveugle de naissance a plus de difficultés à acquérir le langage. Cette acquisition est plus lente. Toutefois, l'organisation de la fonction langagière installée, elle permet l'accès à des connaissances aussi complètes que possible. Au niveau de l'articulation et de la syntaxe, le développement du langage chez l'aveugle semble évoluer plus ou moins normalement quand les conditions physiques et affectives sont optimales. Le jeune enfant aveugle est plus sensible à des perturbations du milieu que l'enfant voyant. Une fois le langage acquis, l'interaction entre la compréhension du monde extérieur directement accessible à l'enfant aveugle et son utilisation du langage est d'une importance capitale pour faciliter la connaissance de l'un et améliorer l'organisation de l'autre. En effet au début , les contacts limités avec le monde extérieur peuvent poser des problèmes en ce qui concerne l'acquisition du langage et ce d'autant plus que le langage utilisé par les personnes de son entourage fait référence à des expériences visuelles, mais une fois l'acquisition du langage bien établie, celle ci peut aider à la compréhension au moins partielle des relations existantes dans le monde non perceptible aux personnes aveugles.

L'enfant aveugle utilise le "je" non syncrétique au sens de Zazo, beaucoup plus tard que l'enfant voyant. (Zazo distingue le "je" syncrétique qui se rapporte aux désirs ou aux besoins de l'enfant: "je veux", et le "je" non syncrétique qui désigne la personne qui parle et implique l'utilisation du "tu" ou du "il"). Les enfants aveugles auraient des difficultés à se dissocier des autres personnes et même des objets. La vision facilite les capacités de représentation de soi par rapport aux autres. Cette difficulté à se dissocier des autres peut entraîner pour l'enfant aveugle des malentendus et des problèmes de communication.

C - Les problèmes associés à la communication

Deux points sont à considérer dans les problèmes de communication de l'aveugle:

  • le langage de l'aveugle s'appuie sur une expérience qui lui est propre et surtout sur des perceptions tactiles et auditives;
  • l'aveugle ne peut accéder aux mimiques faciales, à la gestualité et aux attitudes de ses interlocuteurs.

Le "verbalisme", c'est-à-dire la dissociation entre le vocabulaire utilisé et l'expérience sensorielle, peut parfois engendrer des malentendus dans la communication avec les voyants. Dès la naissance, le bébé aveugle est isolé des personnes qui l'entoure, les échanges par le regard étant impossibles. Les parents, non informés sur les problèmes liés à la cécité, peuvent agir avec maladresse: pour la mère il est parfois difficile de comprendre son bébé aveugle, ses besoins et plus tard son langage. La plupart du temps l'enfant aveugle est forcé de s'initier lui-même pour essayer de comprendre le monde extérieur. Pour cela l'enfant aveugle utilise avant tout le toucher et l'audition, mais l'écoute nécessite une certaine concentration et surtout une certaine immobilité: le premier malentendu s'installe alors. La mère peut associer cette immobilité à "une certaine incapacité mentale", à une "anormalité". Plus tard, le jeune enfant aura conscience de sa cécité et de ses problèmes par rapport aux voyants. Mais ce qui est assez contradictoire, c'est que l'enfant a à la fois besoin d'indépendance et en même temps il a besoin de l'aide des voyants. Aussi, son besoin d'autonomie et d'indépendance conduit l'enfant et plus tard l'adulte à utiliser le voyant comme "un outil". Les enfants aveugles considèrent les voyants comme des prolongements d'eux-mêmes et les utilisent comme des outils pour arriver au but qu'ils se proposent. Ils les utilisent comme des "outils" temporairement placés sous leur commande: ce que les adultes voyants ressentent parfois assez mal parce qu'ils ne comprennent pas que c'est pour l'aveugle le seul moyen d'entrer dans une relation vraie (Burlingham 1979).

Le jeune enfant aveugle a des difficultés à converser avec plus d'une personne à la fois. L'enfant ne peut pas diviser son attention entre deux personnes: il ne peut pas en même temps réfléchir, converser et percevoir une tierce personne. C'est là un problème de charge mentale.

Dans une conversation, , "la sémantique du discours verbal dépend beaucoup de la mimique faciale et de la gestualité du locuteur". Des gestes illustratifs sont souvent indispensables à la compréhension du discours: "asseyez-vous là, posez vos affaires ici". Dans ces cas l'énoncé verbal prévoit dans sa structure la présence d'un énoncé gestuel complémentaire sans lequel bien que grammaticalement correct, il resterait sémantiquement incomplet". Les gestes et les mimiques faciales interviennent également dans les processus connotatifs. Les mimiques complètent l'énoncé verbal ou donnent des informations supplémentaires. Dans une conversation, les échanges entre deux personnes sont réglés et nuancés par ces mimiques: sourire, hochement de tête, froncement de sourcils, regard moqueur ou agressif...Les gestes ont également un rôle dans la prise de paroles, le changement de tour, d'autant plus que les personnes qui composent un groupe sont nombreuses. L'aveugle perd toutes ces informations gestuelles et il est forcé de réclamer des informations complémentaires ou des précisions sur les intentions des locuteurs.

D - La personnalité de l'aveugle

Nous ne pouvons ici résumer la psychologie de l'aveugle. C'est un domaine très complexe et d'autant plus que cette population est extrêmement hétérogène. Aussi, nous citerons simplement quelques observations relatant des pathologies pouvant être liées à la cécité. Nous signalons que des à priori et des idées erronées ont été propagées par méconnaissance de ce qu'est réellement la cécité. Nous pensons que c'est un sujet qu'il faut traiter avec prudence et qu'il importe de ne pas généraliser des observations à partir d'un cas de cécité. Si le point commun est la perte de la vision, chaque cas de cécité est pratiquement un cas unique de par son histoire et son évolution. ainsi, il faut déjà distinguer:

  • ceux qui ne voient rien du tout et n'ont jamais rien vu;
  • ceux qui ont toujours eu des perceptions lumineuses faibles;
  • ceux qui recouvrent une parcelle de vision après une intervention chirurgicale;
  • ceux qui après avoir eu une vision normale, sont devenus aveugles;
  • ceux qui, après avoir été amblyopes, deviennent aveugles.

Dans ces dernières catégories, l'âge auquel survient la cécité nécessiterait encore plusieurs subdivisions.

Revenons aux observations: un certains nombre d'auteurs ont noté que l'état de sous-stimulation dans lequel peut évoluer l'enfant né aveugle peut avoir des effets sévères. Fraiberg (1977) a remarqué des symptômes autistiques chez les enfants handicapés de la vue: "ce qui pourrait être dû à une histoire de stimulations affectives inadéquates durant les premiers mois de la vie". Le comportement de certains enfants aveugles a été modifié par un programme d'éducation favorisant l'enrichissement et l'élargissement des interactions parents-enfants.

En ce qui concerne l'adolescent et l'adulte aveugle, il est évident que l'on peut rencontrer plus fréquemment chez eux des distorsions de la personnalité, ne serait-ce que parce que la société est composée essentiellement de voyants et "organisée par ces derniers et pour ces derniers". Un jeune aveugle inadapté a deux solutions: ou il fait des efforts pour s'intégrer ou il se replie sur lui-même. Dans ce dernier cas, on peut rencontrer des aveugles égocentriques, introvertis, exposés aux rêveries éveillées, aux verbalismes, aux blindismes, ... qui ne sont rien d'autres que des réactions d'ajustement à un milieu défavorable !


IV - CONCLUSION ET RESUME DU CHAPITRE 1 La LENTEUR DANS L'ACCES à L'INFORMATION CHEZ L'AVEUGLE

À partir des observations recueillies dans de multiples écoles spécialisées, nous avons essayé de comprendre pourquoi les différences entre les sujets aveugles sont plus frappantes que les différences inter-individuelles des sujets voyants.

Si le point commun à tous les aveugles est la perte de toutes les informations visuelles, il existe une grande variabilité entre les sujets dans leurs possibilités d'adaptation et de réadaptation. En effet, les facultés d'apprentissage et d'adaptation de l'aveugle dépendent des mêmes facteurs que chez les voyants mais dépendent avant tout des facteurs liés à la déficience:

  • l'âge de la cécité
  • l'histoire de la cécité
  • l'environnement familial et social
  • la nature de la déficience visuelle

Ce qui explique les difficultés de toute expérimentation associée à un groupe de sujets aveugles.

Dans un second point, à travers les études relatées dans un certain nombre d'articles, nous avons essayé d'évaluer l'influence de l'organisation du champ perceptif de l'aveugle sur ses fonctions de représentation et de comprendre le retentissement de la cécité sur son développement cognitif.

Tandis que la perception visuelle présente des caractéristiques de simultanéité, de globalité et donc de rapidité, la perception tactile s'effectue à partir de l'intégration de multiples sensations fragmentées dans le temps et dispersée dans l'espace.

Toutes les activités symboliques d'un sujet et par conséquent toutes les formes de représentation sont construites, tout comme le langage, à partir des informations, des événements, des expériences que le sujet tire du monde environnant et participent à la formation des concepts.

Les différentes modalités sensorielles sont donc engagées dans la formation et la production du langage et dans le développement cognitif de tout individu. Que se passe-t-il lorsque la modalité visuelle est déficiente ou même absente?

  • L'absence de la vision influence-t-elle le développement des autres sens?
  • Comment l'enfant aveugle se construit-il une image du monde?
  • Cette image diverge-t-elle de celle des voyants?
  • Quelle est la représentation mentale que les enfants aveugles congénitaux peuvent avoir des objets?

À travers une analyse statistique et qualitative du nombre et du type des attributs que les enfants associent aux objets, des auteurs ont pu comparer les différences entre la conceptualisation des enfants aveugles fondée essentiellement sur le sens tactile et la conceptualisation des enfants voyants fondée sur le sens visuel.

Les expériences de certains auteurs montrent que les images mentales et les concepts des objets des enfants aveugles sont construits à partir d'une expérience qui leur est propre et à partir d'une information tactile complétée par les informations provenant des autres modalités sensorielles qui se sont développées.

Du fait d'une perception limitée et d'une expérience particulière, les attributs des concepts donnés par les enfants aveugles, sont plus concrets que les attributs donnés par les voyants. Ce qui pourrait retentir sur la généralisation de ces concepts et sur la catégorisation et la formation de prototypes.

Toutefois la plupart des auteurs s'accordent sur plusieurs points qui nous semble essentiels:

  • le retard observé dans le développement cognitif de l'enfant déficient visuel est en général temporaire;
  • la stimulation des autres sens doit être aussi variée et aussi riche que possible pour alimenter la capacité de raisonnement de l'aveugle qui est restée intacte.
  • l'information parlée est une source primordiale de prise de connaissance pour le jeune enfant aveugle et nous ajoutons qu'elle reste la principale pour l'aveugle accidentel qui connaît mal le braille et n'est pas bien adapté aux explorations tactiles.

Dans une troisième partie, nous avons présenté sur un plan plus concret les problèmes associés à la cécité, afin de montrer combien une éducation précoce est essentielle pour le déficient visuel et combien un programme d'adaptation et de réadaptation fondé sur toute les potentialités restantes de l'aveugle est indispensable à son intégration sociale et professionnelle.

 
sommaire



CHAPITRE 2:

L'ÉCOUTE ET LE TRAITEMENT DE L'INFORMATION PARLÉE

L'œil, l'oreille, la peau, le nez et la langue sont des organes sensoriels qui apportent au cerveau les informations sur le monde environnant. Ces informations sont détectées, triées, classées, organisées et intégrées parmi les premières acquisitions. Les fonctions perceptives et l'expérience alimentent ainsi le champ des connaissances et contribuent au développement cognitif d'un individu.

Nous avons vu dans un premier chapitre que la privation de la perception visuelle ralentit considérablement la prise d'informations et aboutit chez le jeune enfant à un retard du développement cognitif, chez l'adulte, à des problèmes de locomotion, de communication et d'intégration sociale. Toutefois, chez l'enfant le retard n'est pas permanent et chez l'adulte, les difficultés dépendent beaucoup des capacités d'adaptation ou de réadaptation du sujet.

Un programme d'éducation ou de rééducation prévoyant des stimulations riches, variées, adéquates, bien distribuées dès le plus jeune âge, accélèrent le développement cognitif du jeune enfant aveugle et favorise l'adaptation de l'adulte. Un des buts primordiaux de ce programme sera de favoriser la relation entre perception auditive et perception tactile pour viser à une parfaite coordination oreille-main. L'éducation de l'écoute et du toucher prend une part privilégiée dans ce programme.

L'oreille est l'organe sensoriel le plus complexe après l'œil. Elle permet de détecter, de discriminer des variations de signal sonore très faibles. L'oreille exercée d'un musicien est capable d'apprécier les nuances les plus fines.

Nous pensons que l'écoute occupe la part la plus importante du temps d'apprentissage des enfants scolarisés qu'ils soient aveugles ou voyants. D'autre part, C'est le seul mode d'accès à l'information pour l'aveugle accidentel qui ne connaît pas la lecture braille. C'est pourquoi nous nous proposons d'étudier tout particulièrement l'écoute et l'accès à l'information parlée dans ce chapitre. Notre ambition est de pouvoir fournir des modes d'apprentissage et des outils de travail efficaces à tous les aveugles. Cette recherche a un double objectif:

  • d'une part sur un plan théorique, essayer de comprendre et de définir les différents niveaux d'analyse dans le traitement de la parole;
  • d'autre part sur un plan pratique, étudier un mode d'apprentissage, l'écoute, et des applications directes , la prise de notes aidée par l'enregistrement, "l'écoute rapide" et la parole comprimée et enfin la sortie vocale dans les nouvelles technologies.


I - QUELQUES RAPPELS SUR LA PERCEPTION AUDITIVE

A - Le son

Le son est le stimulus qui active le système auditif. C'est une onde mécanique de pression qui se propage dans le milieu environnant. La représentation des variations de pression sonore en fonction du temps fournit une description complète du son (Buser et al 1988). Dans cette description, deux types de son peuvent être distingués: les sons purs et les sons complexes.

En ce qui concerne les sons purs, la description de l'onde vibratoire est strictement sinusoïdale et peut être définie par différents paramètres:

  • la phase,
  • la fréquence,
  • l'amplitude.

La phase correspond au temps de départ de l'onde.

La fréquence est le nombre d'oscillations recueillies en une seconde. Elle est définie en cycles par seconde ou en Hertz (Hz) ou en période par seconde. La période T est l'inverse de la fréquence F (F=1/T). Par rapport aux mécanismes de perception, la fréquence correspond a la hauteur du son: un son aigu a une fréquence élevée, un son grave a une fréquence basse.

L'amplitude de la sinusoïde est liée à l'intensité du son. Lorsque l'intensité du son est exprimée par rapport à la pression sonore, l'unité utilisée est le Dyn par centimètre carré. Elle peut aussi être exprimée en Watts par centimètre carré. Mais le plus souvent l'intensité du son est associé au mécanisme perceptif, c'est-à-dire à la sensation à laquelle est associée la hauteur et l'intensité du son. Cette sensation progresse proportionnellement au logarithme de l'excitation et est exprimée en unité relative: le décibel (dB). Le décibel correspond au logarithme du rapport de deux intensités:

nombre de dB=10Log(I/Ir),

Ir est l'intensité de référence standard internationale (0,0002 Dyn/cm2). Ce standard correspond à une pression sonore très faible. Il correspond à une intensité sonore minimale perçue par l'être humain pour un son de 1000 Hz.. Par exemple, une différence de 20 dB dans les intensités de deux sons, signifie qu'un son est de 10 puissance 2 000 000 fois plus intense que l'autre. Les sons harmoniques sont ceux qui, compris dans la zone audible se disposent dans la progression F, 2F, 3F, 4F, 5F, 6F, 8F, 9F, 10F, 11F. L'intensité d'un son est plus faible dans l'eau que dans l'air.

Les sons complexes peuvent être décomposables grâce à l'analyse de Fourier: une longueur d'onde complexe peut être représentée par une combinaison d'ondes sinusoïdales, de fréquence, d'intensité et de temps de départ spécifique. La décomposition d'une forme ondulatoire en fréquences et composantes simples est l'analyse de Fourier. La représentation des ondes complexes par leurs composantes sinusoïdales semble s'approcher le plus de la façon qu'à l'oreille de traiter le son (Lindsay et Norman 1981). Le timbre d'un signal sonore est la qualité spécifique individuelle du son complexe donné par les différents composants.

B - La transmission du son

Les récepteurs de l'oreille qui détectent les sons sont des phonorécepteurs qui ont la capacité de transformer les ondes sonores qui les excitent en un flux nerveux. Le son peut être transmis par deux voies: la conduction osseuse grâce à laquelle chacun entend sa propre voix et la voie aérienne grâce à laquelle nous entendons les autres. Au cours de la transmission, le son passe dans l'air, traverse successivement les trois parties de l'oreille: externe, moyenne et interne.

1 - L'oreille externe et l'oreille moyenne:

Les sons sont captés grâce au pavillon de l'oreille qui est destiné à concentrer l'onde sonore dans le canal auditif ou conduit auditif. Ce conduit a la particularité de transformer les ondes sonores "sphériques" (qui se dispersent dans toutes les directions) en ondes planes. L'onde se propage dans une seule direction le long du canal auditif. Celui-ci a une résonance proche de 3000 Hz. Un corps entre en "résonance" lorsque sa fréquence de vibration optimale correspond à la fréquence de l'onde qui le fait vibrer: il y a alors parfaite concordance entre l'onde mécanique qui arrive et les capacités de vibration de ce corps. Les sons qui ont une fréquence de 3000 Hz sont les mieux adaptés à l'oreille humaine.

L'onde sonore aboutit a une membrane: la membrane tympanique. Le tympan oscille et les fréquences de résonance du tympan pour lesquelles il oscille le mieux sont située entre 1000 et 4000 Hz.

2 - De l'oreille moyenne à l'oreille interne

La transmission des sons est réalisée dans l'oreille interne en milieu aqueux. L'onde sonore passe d'un milieu aérien à un milieu aqueux. La propagation des sons est différente selon que les ondes chemine dans l'un ou l'autre milieu. En effet la résistance de l'air n'est pas la même que celle de l'eau. Ainsi l'énergie sonore véhiculée dans l'air n'est pas transmise en totalité dans l'oreille interne.

L'oreille moyenne comprend la chaîne des osselets: le marteau, l'enclume et l'étrier qui relie le tympan à la fenêtre ovale. L'oreille interne comprend la cochlée et également le sacule, l'utricule et les canaux semi-circulaires qui interviennent dans l'équilibration. Pour que la transmission se passe dans les meilleures conditions, c'est-à-dire pour que le maximum de puissance sonore soit transmise à la cochlée, deux types d'adaptation sont possibles. Premièrement la chaîne d'osselets entre le tympan et la fenêtre ovale agit comme un levier: elle diminue l'amplitude des mouvements pour ne pas léser les membranes fragiles et augmente la pression sonore. La deuxième adaptation est le rapport entre la surface du tympan et la surface de la fenêtre ovale. Le tympan a une surface de 55 millimètres carré et la surface de la fenêtre ovale sur laquelle s'appuie l'étrier ne mesure que 2 à 3 millimètres carré. Ainsi, toute la pression qui s'exerce sur 55 mm2 se concentre ensuite sur 3 mm2: c'est un système d'amplification. Une adaptation protège aussi le tympan. L'étrier s'appuie sur la fenêtre ovale et selon l'intensité du son, il ne vibre pas dans le même plan. La fenêtre ovale possède un grand rayon horizontal et un petit rayon vertical. En oscillant autour de son axe vertical, l'étrier enfonce le grand rayon horizontal dans la fenêtre et exerce une pression plus importante que s'il oscillait dans l'autre sens. Pour les faibles intensités l'étrier oscille autour de son axe vertical et amplifie ainsi la pression. Pour les fortes intensités l'étrier oscille suivant l'axe horizontal. C'est le petit rayon qui s'enfonce dans la fenêtre ovale atténuant les effets néfastes d'une trop forte intensité.

La cochlée est une structure membraneuse située à l'intérieur d'une structure osseuse en forme de limaçon. La cochlée est composée de trois canaux enroulés en spirale (2 tours et demi en moyenne). Ces trois canaux sont séparés par deux membranes: l'une très fine, la membrane de Reisner et l'autre au-dessous, la membrane basilaire sur laquelle repose la structure (l'organe de Corti) qui réalise la transduction entre l'onde sonore et les activités électriques dans les cellules nerveuses. Entre les deux membranes de Reisner et basilaire se situent trois canaux. Dans la partie supérieure, la rampe vestibulaire, dans la partie inférieure, la rampe tympanique dans lesquelles circule la périlymphe. Les deux membranes se rejoignent à l'extrémité apicale de la cochlée en laissant un orifice permettant la communication de la périlymphe entre les deux rampes. Dans la partie moyenne de la cochlée, limité en haut par la membrane de Reisner et en bas par la membrane basilaire se situe le canal cochléaire où circule l'endolymphe.La cochlée est en communication avec l'oreille moyenne par la fenêtre ovale et la fenêtre ronde. la fenêtre ovale, sur laquelle s'appuie l'étrier, est en communication avec la rampe vestibulaire et la fenêtre ronde est en communication avec la rampe tympanique.

3 - Le cheminement du son

Après un signal sonore, l'étrier s'enfonce dans la fenêtre ovale, qui enfonce et déplace la périlymphe transmettant la pression à la fenêtre ronde qui bombe légèrement. Les mouvements des liquides de l'oreille interne sont différents selon la fréquence des sons émis. Pour des fréquences faibles jusqu'à 20 HZ, toute la masse de liquide fait X fois le va et vient ( X est égale à la fréquence du son) au travers de l'hélicotrène. Au-delà de 20 Hz, la résistance de cet orifice est telle que le liquide ne peut plus suivre la cadence. Au-dessus de 20 Hz, la pression exercée sur la fenêtre ovale va modifier une zone privilégiée du canal cochléaire: de 20 Hz à 20000 Hz, une portion du canal cochléaire se déforme d'une façon privilégiée. Cela est lié aux caractéristiques de la membrane basilaire.

4 - La membrane basilaire

La membrane basilaire est constituée de tissu conjonctif et d'élastine. Elle s'insère sur la partie osseuse de l'oreille moyenne (la base) l'autre extrémité étant l'apex. a la base, près des fenêtres, la membrane basilaire est plus étroite (0,05 mm) qu'à l'apex (0,5mm). De plus, son élasticité augmente de la base vers l'apex. Lorsqu'un son de basse fréquence est émis, il fait vibrer la portion de la membrane dont la structure est adaptée, c'est-à-dire qui entre en résonance avec cette basse fréquence. Les sons graves sont perçus par la partie apicale, tandis que les sons aigus entrent en résonance avec la partie basale de la membrane basilaire et les sons de fréquences moyennes avec la partie médiane. a chaque point de la membrane basilaire correspond une fréquence donnée qui fera vibrer au maximum ce point privilégié. Grâce à ces points de vibration sélectifs, la membrane basilaire fait une véritable "analyse de Fourier" de l'onde sonore. La transduction de l'onde mécanique en activité électrique dans les cellules nerveuses se situe au niveau de l'organe de Corti.

5 - L'organe de Corti

L'organe de Corti est une structure complexe composée de cellules ciliées qui longent la membrane basilaire. Ces cellules sont situées en repli le long de la membrane. Il existe 3 rangées de cellules ciliées externes (soit au total environ 20000) et une rangée de cellules ciliées internes (environ 3500). Des fibres nerveuses (environ 30000) relient ces cellules ciliées au cerveau. Tout mouvement de la membrane basilaire, même infime, entraîne des fléchissements des cellules ciliées. Ces fléchissements déclenchent une activité nerveuse dans les fibres du nerf auditif. Pour un neurone donné cette activité dépend de la fréquence et de l'amplitude du son qui l'a produite. Les neurones reliés aux cellules ciliées de la partie basale de la membrane basilaire, sont activés par les hautes fréquences, ceux qui sont reliés aux cellules ciliées de la partie apicales, sont excités par les basses fréquences...

Les impulsions nerveuses sont synchrones de la fréquence du signal sonore qui les a déclenchées. Par exemple un son de 200 Hertz provoque une réponse de 200 impulsions par seconde du neurone sensible à cette fréquence.

En physiologie, grâce à des électrodes placées sur un nerf auditif, des expérimentateurs ont recuilli les "potentiels microphoniques cochléaires" au niveau des cellules réceptrices de la cochlée. Le potentiel microphonique cochléaire ressemble à une onde sinusoïdale. Comparée avec l'onde sonore qui lui a donné naissance, la forme de ce potentiel a le même aspect: même forme sinusoïdale, même fréquence. Un délai acoustique est observé: il correspond au temps de parcours de l'onde sonore dans les milieux de propagation de l'oreille jusqu'aux cellules réceptrices. L'amplitude du potentiel microphonique cochléaire augmente lorsque l'énergie sonore augmente (intensité du son). Jusqu'à 80 dB, cette amplitude est proportionnelle à l'augmentation de l'intensité sonore. Au-dela de 80 dB, le potentiel microphonique cochléaire n'est plus représentatif de l'intensité sonore.

La transmision de l'influx nerveux, qui a pris naissance au niveau des cellules réceptrices (cellules ciliées), s'effectue à travers 3 neurones: la voie cochléo-bulbaire (de la cochlée au bulbe), la voie bulbo-thalamique (du bulbe au thalamus) et la voie thalamo-corticale (du thalamus à l'aire sensorielle auditive c'est-à-dire l'aire 42).

C - La perception auditive

La fréquence et l'intensité d'un son sont des caractéristiques physiques qui peuvent être mesurées avec précision par des instruments adéquats tandis que les sensations qu'ils provoquent sont plus difficiles à évaluer.

La force d'un son (caractéristique psychologique) est liée à l'intensité de ce son (caractéristique physique), mais aussi à sa fréquence. Pour une fréquence constante, les sons de forte intensité sont plus forts que ceux de faible intensité. Pour une intensité constante, ce sont les sons de basse ou haute fréquence qui semblent plus faibles que ceux de fréquence moyenne. La hauteur tonale d'un son dépend d'abord de sa fréquence, mais aussi de son intensité. Le timbre d'un son (qualité du son) dépend de la complexité de l'onde sonore.

Deux théories ont essayé d'expliquer la perception auditive: la théorie de la localisation et la théorie de la périodicité. Pour la théorie de la localisation, la hauteur d'un son est déterminée par l'endroit où l'onde atteint son amplitude maximale sur la membrane basilaire. Dans la théorie de la périodicité, les réponses des neurones entrent en synchronisme avec les variations de pression dans l'onde acoustique. Les cellules nerveuses réagissant à une onde sonore déchargent en synchronisme avec la fréquence de l'onde. Cette synchronisation des réponses nerveuses permet ainsi de percevoir la hauteur d'un son. Selon Linsay et Norman, les théories de la localisation et de la périodicité expliqueraient en partie les mécanismes de la perception auditive. Mais, "peut-être faudrait-il songer à une théorie dualiste qui puisse les combiner". Les théories modernes mettent l'accent sur l'existence d'un système d'analyse spectrale centralisé pour la fréquence et un système temporel de forme. Ces analyses se situeraient au niveau du cerveau. Ainsi, au niveau cochléaire, la théorie de la localisation et la théorie de la périodicité détermineraient la hauteur tonale, mais d'autres analyses seraient effectuées à d'autres niveaux.

L'écoute binaurale c'est-à-dire les informations captées par les deux oreilles permettent de localiser le son dans l'espace. Quand la source d'un son est située à égale distance des deux oreilles, le son arrive aux oreilles en même temps. Si la source est décalée par rapport au plan sagittal c'est-à-dire situé à droite ou à gauche, il existe alors un délai entre l'arrivée de l'onde sonore à l'oreille droite et l'arrivée à l'oreille gauche. Ce délai permet de localiser le son dans l'espace. Toutefois ce délai ne peut servir d'indice à une bonne localisation que pour des fréquences inférieures à 1300 Hz. La localisation du son s'effectuerait grâce à un double mécanisme: écart de temps pour les basses fréquences et différence d'intensité pour les hautes fréquences. La forme du pavillon de l'oreille avec ses aspérités particulières facilite également la localisation du son. L'écoute binaurale ajoute une dimension spatiale à la perception auditive et rend les sons plus "clairs".


II - TRAITEMENT DE L'INFORMATION PARLÉE

La parole est le support de la communication humaine. C'est aussi une source d'information importante et un médiateur non négligeable dans l'apprentissage. Toutefois le traitement de la parole ou signal vocal peut être abordé sous différents angles selon le contexte dans lequel il s'inscrit: domaine de l'acoustique, de la perception, de la cognition, de la linguistique, de la production... La connaissance de la parole intéresse de nombreuses disciplines qui, de plus en plus, interagissent entre elles et ce d'autant plus que l'objectif est lié à l'évolution des nouvelles technologies: reconnaissance de la parole, codage, synthèse de la parole. Le traitement de la parole concerne donc des domaines multidisciplinaires qui se sont tous plus ou moins appliqués à évaluer les capacités humaines de perception, de cognition et de production de la parole.

A - L'appareil phonatoire

La structure de la parole est liée directement avec les organes de production de la parole. Sur le plan physique, la parole est produite par une source d'air provenant des poumons et un ensemble de muscles dont le rôle est de faire cheminer l'air de la trachée vers les cordes vocales et la bouche. Un locuteur peut parler pendant 40 secondes entre deux inspirations. Les muscles abdominaux, les muscles respiratoires entrent en jeu dans la production de paroles. Les muscles articulatoires modèlent ensuite cette production.

1 - Le larynx

La fonction phonatoire du larynx dépend de la pression de l'air provenant des poumons, de l'ajustement du larynx déterminé par les commandes nerveuses permettant de tendre et d'écarter plus ou moins les cordes vocales et enfin de l'association entre le larynx et les cavités sus-jacentes et sous-jacentes de la glotte.

Le signal vocal (voir paragraphe suivant) peut être caractérisé par sa fréquence, et son amplitude. La fréquence est surtout liée aux caractéristiques mécaniques des cordes vocales et l'intensité à la pression de l'air subglottique. Mais tous ces facteurs interagissent entre eux. Le débit de l'air est fonction des caractéristiques des cordes vocales, mais aussi de la forme des poumons, de la trachée et du conduit vocal dans sa globalité. Ce qui explique la variablilité des émissions vocales individuelles et interindividuelles.

Le larynx permet de faire une première classification des sons émis. En effet, les voyelles sont des sons pendant lesquels la position des organes phonatoires restent constante et pour lesquels il n'existe pas de rétrécissement important du conduit vocal qui pourrait provoquer un bruit de friction par exemple. Les sons pour lesquels les cordes vocales vibrent sont:

  • les voyelles pour lesquelles il n'existe pas de rétrécissement du conduit vocal,
  • les consonnes liquides (me, de, le et re), ,
  • les consonnes pour lesquels il existe un léger rétrécissment du conduit vocal permettant l'apparition d'un bruit ( fe, che et se),
  • les occlusives, sons pour lesquels il existe une fermeture du conduit vocal à un moment donné (ba, da, ga).

Pour les "silences", les cordes vocales ne vibrent pas et il n'existe pas de bruit. Ils sont indispensables pour l'intelligibilité de mots comme "papa "par exemple.

2 - La langue

Elle est formée de 17 muscles. La variété des sons est due à la richesse de la structure musculaire de la langue. Les sons vocaux peuvent aussi être classés selon la position de la langue:

  • la langue très relevée en avant produit le "i",
  • la langue relevée en arrière produit le "ou",
  • la langue abaissée au centre produit un "a",
  • d'autres positions intermédiaires donnent le "é", "o", "u"...

Le "i", le "o" et le "a" déterminent les 3 positions extrêmes de la langue dans son espace articulatoire.

3 - La mâchoire

Elle peut s'abaisser, se relever, s'avancer ou se reculer. "chou" et "chu" avancent la mâchoire au maximum tout en la fermant. "pa" ouvre la mâchoire.

4 - La bouche

Les lèvres sont les organes essentiels pour la production des consonnes et le français. Selon l'espace intérolabial, l'étirement des lèvres et leur point de contact les sons produits sont différents.


B - Structure de la parole

1 - Le signal vocal

La parole est un signal acoustique produit par l'homme dans le but d'énoncer un message d'information ou de communication. C'est pourquoi les "émissions sonores" de l'homme peuvent prendre des formes très variées: parler rapidement, lentement, à voix haute, à voix basse, chuchoter, murmurer, chanter, crier... D'autre part chaque personne à une voix particulière: voix grave ou aigüe, forte ou faible, timbre et intonation spécifique.

Sur un plan physique, la parole fait partie des ondes sonores complexes. C'est un signal vocal continu dont "la structure est complexe et variable dans le temps, tantôt périodique pour les sons voisés, tantôt aléatoire pour les sons fricatifs, tantôt inmpulsionnel dans les phases explosives des sons occlusifs".

L'information parlée peut être considérée comme une suite de séquences "consonne-voyelle". Les voyelles sont les parties stables (formants) et les consonnes sont les parties transitoires.

Le spectre acoustique est la représentation de la variation de l'amplitude des composants du signal vocal en fonction de la fréquence de ces composants. Les trois premières fréquences de résonance sont par exemple caractéristiques d'une voyelle: ce sont les trois premiers formants.

2 - Structure propre à la parole

Les connaissances propes au langage parlé concernent la phonétique, la phonologie et la prosodie. La phonétique est l'étude des sons utilisées dans les langues naturelles. Le terme de phonétique est apparu au XIX ème siècle et jusqu'au début du XX ème siècle la phonétique était surtout une science descriptive. Chaque changement de son était étudié isolément. Ferdinand de Saussure (1857-1913) fit évoluer les connaissances en linguistique en considérant la langue comme "un système de signes indépendants relevant d'une convention sociale entre les membres d'une communauté linguistique, l'emploi de chaque signe étant délimité par l'emploi des autres". Selon Saussure, la relation entre le "signifiant" (phase phonique) et le "signifié" (phase sémantique) d'un signal est arbitraire. La phonétique était considérée comme une science expérimentale étudiant les sons du langage selon deux points de vue: la manière dont on les produit (phonétique articulatoire) et le phénomène physique qu'ils représentent lié à leur perception (phonétique acoustique). La phonologie qui étudie les relations entre les sons du langage est venue complétée les connaissances linguistiques. La phonétique, science des sons de la langue indépendamment du contexte, est ainsi très liée à la phonologie qui étudie l'organisation des sons. La phonétique étudie la nature physique et physiologique des distinctions entre les sons tandis que la phonologie établit les oppositions entre les sons utilisés à des fins linguistiques dans une langue. Le phonème est un "segment de parole" (Content 19 ). C'est la plus petite unité de parole distincte par rapport à ses caractéristiques physiques. On en dénombre 36 pour la langue française.

La phonétique acoustique mesure les caractéristiques de l'onde sonore produite par le signal vocal: fréquence, intensité et durée. Les sons du langage sont complexes, composés de plusieurs fréquences qui peuvent être déterminées grâce à l'analyse de Fourier. Le spectrographe est un appareil qui analyse les fréquences composant l'onde sonore en fonction du temps. Il donne ainsi une image visuelle des composants physiques des sons (spectrogrammes). Le spectrographe peut être utilisé en filtrage large (300 Hz) ou en filtrage étroit (45 Hz). En filtrage large, le spectrogramme met bien en évidence les ondes périodiques (voyelles) et les transitions (consonnes) qui peuvent être considérées comme des ondes périodiques de période infinie. Ce filtrage permet d'étudier les phonèmes d'une langue. En filtrage étroit, le spectrographe enregistre chaque harmonique séparément et permet d'établir la courbe de la fréquence fondamentale qui caractérise la mélodie de la phrase. Ce filtrage est utilisé pour l'étude de la prosodie. Les différences d'intensités des sons vocaux sont traduites par des différences dans le noircissement du spectrogramme. On peut mesurer, grâce au spectrographe la durée, la fréquence fondamentale et l'intensité des sons vocaux et connaitre leurs fréquences caractéristiques (formants).

La prosodie est un terme qui vient du grec "prosodia". Il signifie accent, quantité dans la manière d'énoncer des propos. Il était autrefois réservé au domaine de la versification. Actuellement l'emploi du terme prosodie concerne le langage parlé et regroupe l'intonation et certains phénomènes physiques associés à la parole: l'effet de hauteur, l'effet d'intensité et la durée des segments phonémiques, syllabiques... L'intonation concerne la variation de la ligne mélodique.L 'intonation pourrait être un indicateur de la segmentation et de la hiérarchie syntaxique (Noizet 1980, Wingfield 1975).

La voix humaine peut être plus ou moins grave. Cet effet de hauteur dépend de la fréquence de l'onde sonore: les voix masculines peuvent varier entre 80 Hz et 160 Hz, les voix féminines entre 150 Hz et 300Hz, et les voix des enfants peuvent atteindre 500 Hz. L'intensité de la voix est aussi très variable: pour le langage parlé, l'intensité varie généralement entre 40 et 60 dB. La durée des segments phonémiques, syllabiques est mesurée en millisecondes: le débit des paroles fait varier la durée de ces segments. La durée d'un phonème peut s'étendre de 30 millisecondes à plusieurs centaines de millisecondes. La durée des pauses et des silences est un paramètre important dans l'intelligibilité d'un mot ou d'une phrase. Les trois paramètres (hauteur, intensité et durée) sont plus ou moins dépendants lors de la phonation. L'intensité dépend de la pression sous glottique et la fréquence laryngienne est le produit de la pression sous glottique et de la tension des cordes vocales. L'accent inclut les paramètres de durée, d'intensité et de hauteur. Le rythme, l'intonation dépendent du locuteur et de ses intentions par rapport au message qu'il souhaite transmettre. L'intonation peut être analysée au niveau des phonèmes ou au niveau de la phrase ou même au niveau du discours. Au niveau de la phrase, l'intonation est différente selon la modalité: assertive, interrogative, injonctive ou exclamative.

3 - Structure commune à la parole et à l'écrit

Les connaissances communes au langage parlé et écrit concernent le lexique, la syntaxe, la sémantique et la pragmatique.

Le lexique comprend l'ensemble des informations acoustiques, phonologiques, syntaxiques et sémantiques concernant le mot.

La syntaxe peut être définie comme l'ensemble des règles permettant de gérer l'ordre des mots et la construction des phrases et des énoncés.

Le Ny (1979) définit la sémantique comme étant"la relation entre la forme des signes linguistiques ou signifiants et ce qui est signifié ou "signifié". La sémantique comprend l'ensemble des informations liées au sens, à la signification des mots.

La pragmatique est l'étude des relations entre "signifié" et l'interprétation. Elle recouvre l'ensemble des relations entre le langage et le contexte d'énonciation.

C - Niveaux de traitement

La parole est un support d'information et de communication. Elle est émise et perçue. Dans l'émission de la parole, le locuteur transmet une idée en mettant en œuvre ses capacités de production de paroles pour aboutir à la commande des nerfs moteurs des organes phonatoires. Dans la perception, l'auditeur reçoit le signal vocal, analyse et organise ses différents constituants jusqu'à la compréhension du message et son intégration parmi ses idées. Dans la production et la perception de la parole, peuvent ainsi être mis en évidence différents niveaux de traitement: un niveau périphérique correspondant aux mécanismes du système de phonation et d'audition, et un niveau central correspondant à la formation ou à la compréhension du message linguistique.

Dans cette étude, l'objectif est d'essayer d'analyser les mécanismes associés à la perception, l'intelligibilité, et la compréhension du langage parlé afin de pouvoir définir les conditions d'une écoute efficace sur un plan pratique et sur un plan théorique, de mieux comprendre les processus cognitifs associés à la perception de la parole.

1 - Le niveau perceptif

Une phrase parlée est un signal sonore continu qui évolue dans le temps. Une phrase écrite est une suite de symboles (lettres) groupées en mots séparés par des espaces. L'analyse et le codage d'une phrase parlée fait appel au système de perception auditive qui utilise des mécanismes d'analyse séquentiels.

Dans la perception de la parole, l'oreille analyse d'abord les paramètres définissant cette onde sonore complexe: amplitude, fréquence et durée des segments. a ce stade, le traitement du signal a pour but de quantifier ces différentes grandeurs pour faire correspondre à l'onde sonore (temporelle), une description multidimensionnelle afin de réaliser l'analyse phonétique de la phrase. La parole a une structure complexe et très variable dans le temps, tantôt périodique, tantôt apériodique, impulsionnelle ou bruitée... Ainsi le "timbre" peut avoir plusieurs significations: le timbre des voyelles, le timbre du locuteur.. L'une qualifie la structure physique du son des voyelles,l'autre l'aspect global de la voix de l'individu. Les caractéristiques propres aux phonèmes se mêlent aux caractéristiques propres au locuteur. Les voyelles et les consonnes ont des caractéristiques acoustiques différentes. L'émission des voyelles produit des sons complexes ayant des composants de différentes fréquences (les formants) qui sont tous des harmoniques de la fréquence fondamentale (note sur laquelle une voyelle est prononcée). L'oreille humaine peut percevoir une différence de fréquence inférieure à 25 Hz. Les différences entre les phonèmes sont supérieures. Les deux ou trois premiers formants des voyelles sont suffisants pour les caractériser. Les voyelles "i" et "u" sont aiguës et les voyelles "ou", "o" sont graves les autres voyelles sont intermédiaires. Les caractéristiques acoustiques des consonnes sont plus complexes: elles comportent toujours un bruit (friction ou explosion) accompagné ou non d'un son pur selon que les cordes vocales vibrent ou non. Parmi les consonnes on distingue par exemple les occlusives, les fricatives, les nasales selon leur mode de production et leurs caractéristiques spectrales. Dans l'émission des paroles, le phénomène de coarticulation complique encore l'analyse: lorsqu'une personne parle, elle anticipe le son suivant dans le son précédent. Ainsi il y a une relation entre la voyelle et la consonne suivante si bien qu'un "a" suivi de "p" n'est pas un "a" suivi de "r". Sur le spectre, les transitions sont les portions de voyelles influencées par les consonnes. Les recherches sur la synthèse et la reconnaissance de la parole ont montré que les paramètres acoustiques (intensité, fréquence, durée), des transitions, des silences, des pauses sont des traits pertinents utilisés par les mécanismes d'analyse perceptive de la parole.

À ce stade, des indices prosodiques peuvent être également utilisés pour affiner l'analyse perceptive, mais aussi pour la quantification de segments de paroles et peuvent fournir des informations sur la structure syntaxique voire sémantique de l'énoncé. Pour les mots plurisyllabiques une "nuance mélodique" différente peut être perçue entre la syllabe initiale, intermédiaire et finale. Pour la phrase, la fréquence et l'intensité sont plus élevées au début, plus basses à la fin. au début d'un discours, la fréquence est toujours plus élevée et ce d'autant plus que le locuteur est émotif. Puis le locuteur "pose sa voix". a la fin du discours, le débit est plus lent et la note mélodique est la plus grave de tout l'énoncé.

Nous avons vu dans la première partie de ce chapitre que la physiologie du système auditif permet de comprendre quelles sont les informations que le système nerveux extrait des signaux sonores qui arrivent aux cellules sensorielles de l'oreille. Ces mécanismes physiologiques expliquent la première phase d'intelligibilité et de reconnaissance de l'information parlée. Toutes les caractéristiques d'un signal sonore n'ont pas la même importance: les cellules sensorielles vont sélectionner les caractéristiques pertinentes dans certaines conditions de limite (intensité, fréquence, durée). Des fréquences et des intensités sont mieux perçues que d'autres. L'existence d'un silence avant certaines consonnes est indispensable à leur intelligibilité...., Au niveau de la cochlée, des cellules ciliées spécifiques sélectionnent les caractéristiques pour lesquelles elles sont sensibles. Les effets consécutifs, de contraste, d'inhibition affinent cette sélection et permettent de comprendre le fonctionnement du système auditif.

Selon un modèle hiérarchique de la perception humaine de la parole (Lieberman 1979) trois niveaux peuvent être distingués dans la compréhension de l'information parlée:

  • la reconnaissance acoustico-phonétique analyse le signal vocal et le traduit en une suite de sons élémentaires (phonèmes),
  • la reconnaissance de phrase aboutit à une représentation syntaxico-sémantique à partir des phonèmes,
  • la phase d'interprétation complète, valide ou modifie les résultats de la reconnaissance de phrase.

Au fur et à mesure du déroulement de l'énoncé, des interactions constantes s'établissent entre ces trois niveaux et il est impossible de les séparer sans aboutir à une schématisation restrictive des mécanismes du traitement de la parole.

2 - Niveau cognitif

En psychologie cognitive, plusieurs modèles ont été proposés pour expliquer le traitement de l'information perceptive, du langage parlé et écrit.

"Lorsque nous écoutons quelqu'un parler, nous percevons des entités significatives, des mots, et non pas une suite confuse de sons qui doivent être traduits d'une façon ou d'une autre afin d'avoir un sens" (Lindsay et Norman 1981). Ces auteurs ont décrit deux systèmes de traitement, l'un "dirigé par données", l'autre "par concepts". Dans un système de traitement dirigé par données, le traitement commence avec l'arrivée des données. Chaque étape de l'analyse effectue son travail recevant des données d'entrée de l'étape précédente. Les données de sortie sont les données d'entrée qui déclenchent l'étape suivante. Mais il est plus facile d'entendre, quand on sait ce qu'il faut entendre. Quand il y a connaissance d'une interprétation possible ou conceptualisation d'un stimulus pour aider à sa perception, le traitement est dirigé par concept. Les mécanismes de ces deux systèmes de traitement s'effectueraient presque toujours simultanément, chaque mode contribuant à l'analyse globale.

Le rôle de la sémantique et de la conceptualisation dans l'étape de reconnaissance de phrases a fait l'objet de plusieurs études (Le Ny 1980). Nous citons ici quelques modèles:

  • un modèle de grammaire sémantique (Burton1976),
  • un modèle de réseau sémantique (Quillian 1968, Anderson 1976, Anderson 1984) composé d'un ensemble de nœuds (concepts) et d'arcs (relation entre les concepts),
  • un modèle hiérarchisé de traits sémantiques dans le lexique qui donne une représentation arborescente du vocabulaire.
  • un modèle de comparaison et de mémoire sémantique (Smith, Schoben et Rips 1973, 1974).

Dans la plupart de ces modèles, les auteurs montrent l'interaction entre les données informatives qui arrivent au sujet et les données acquises qu'il a classées et organisées dans sa propre base de connaissance. Mais dans toute acquisition, les processus cognitifs liés à l'attention et à la mémoire sont présents.

En effet lorsqu'un auditeur écoute un locuteur, il perçoit et décode les derniers éléments d'une phrase alors qu'il a déjà intégré en mémoire et compris les premiers éléments. Pour Spérandio (1986) , la mémoire à court terme permet de gérer les interprétations partielles d'une phrase élémentaire de dialogue et contient les résultats de l'analyse du dernier énoncé du locuteur au niveau acoustique, phonétique, lexical, sémantique. Dans la mesure où le débit moyen d'un locuteur varie entre 120 et 180 mots par minute, la vitesse de traitement de l'information parlée de l'auditeur doit suivre ce rythme.

En conclusion, la compréhension de phrases parlées nécessitent plusieurs approches:

  • une approche ascendante (traitement dirigé par données) dans laquelle l'auditeur émet des hypothèses à partir des caractéristiques de l'onde sonore pour trouver la phrase en suivant les diverses étapes de décodage (phonétique, lexical, syntaxique, sémantique) jusqu'à l'interprétation de la phrase;
  • une approche descendante (traitement dirigé par concept) dans laquelle l'auditeur part du concept, de ses connaissances linguistiques (sémantique, syntaxe), du contexte, de ses attentes, pour prédire les éléments de la phrase (mots, syllabes, phonèmes),
  • une approche horizontale dans laquelle l'auditeur utilise ses connaissances pour sélectionner ou indicer les éléments pertinents dans le but de parfaire les interprétations immédiates ou à venir.

"Le problème de la compréhension de phrases peut être considéré comme un problème de recherche de la solution optimale dans un espace de réalisations partielles correspondant à l'ensemble des phrases ou des sous-phrases possibles compte tenu de trois contraintes: la structure du langage, le lexique, la chaîne ou le treillis phonétique d'entrée. On appelle alors "stratégie de recherche" l'ensemble des règles régissant le parcours qui conduit à la solution retenue. Cette notion de stratégie de recherche d'une solution dans un espace d'états correspond à une des méthodes les plus classiques de résolution de problèmes en intelligence artificielle" (Pierrel 1987).


III - L'ÉCOUTE

L'importance de l'écoute dans la communication humaine est évidente. Mais si la parole est un moyen de communication primordial, elle peut être un moyen d'apprentissage essentiel et même indispensable dans certaines situations: enseignement, de tous ceux qui ne peuvent avoir accès à la lecture. L'écoute nécessite l'intervention de l'attention et de l'éveil et peut être enseigner (Frazier 1966). .

A - Importance de l'écoute

Des auteurs ont essayé d'évaluer la place occupée par l'écoute au cours d'une journée de travail d'un enfant scolarisé et d'un adulte. Les premières études, en 1928 au Etats-Unis ont montré que les adultes passent 42% de leur temps à écouter, 32% à parler, 15% à lire et 11% à écrire. En 1940, toujours au Etats-Unis, ils passent 47% de leur temps à écouter, 28% à parler, 17% à lire et 7% à écrire. Parler occupe 3 fois plus de temps qu'écrire. Ecouter occupe 3 fois plus de temps que lire (toutes ces études ont été citées par Bischoff 1979). Pour cet auteur, les activités d'écoute et de compréhension des informations parlées occupent 50% du temps des enfants scolarisés. Il semblerait pourtant que les enseignants donnent moins d'importance aux facultés d'écoute qu'aux facultés de lecture.

À partir des études qui ont exploré les relations entre les capacités d'écoute et les capacités de lecture, il semblerait que ces capacités soient bien corrélées (Bischoff 1979).

L'écoute pourrait être un mode d'apprentissage avantageux pour les handicapés visuels. En effet, les aveugles sont en général très lents dans la lecture braille. Les amblyopes peuvent également perdre beaucoup de temps à essayer de déchiffrer les grands caractères imprimés. Les collégiens aveugles ont un débit de lecture approximatif de 50 mots/minute et les lycéens de 90 m/mn (mots par minute). si bien que ces enfants passent 2 à 3 fois plus de temps que les enfants voyants pour avoir accès a la même quantité d'information (Myers et al. 1966, Myers 1978, Foulke 1969) Magadur (1987) est plus optimiste pour les bons lecteurs braille:

  • après 1 an d'apprentissage, 40 m/mn,
  • après 2 ans, 60 m/mn,
  • après 3 ans, 80 m/mn,
  • après 4 ans, 90 m/mn,
  • après 5 ans, 100 m/mn,
  • après 6 ans, 110 m/mn,
  • après 7 ans 120 m/mn,
  • après 8 ans, 130 m/mn,
  • après 9 ans, 140 m/mn,
  • après 10 ans, 150 m/mn.

Cet auteur relate une expérience relative à la vitesse de lecture d'un enfant aveugle: "la lecture d'un texte jamais lu de 52 mots a été faite en 5 minutes 6 secondes par un aveugle de 9 ans du cours élémentaire; la lecture du même texte (sans préparation) par un clairvoyant de même niveau scolaire a été faite en 38 secondes. Le jeune aveugle a mis 8 fois plus de temps que le clairvoyant"...."Les élèves aveugles sont plus longtemps au stade de déchiffrage que les élèves clairvoyants. La lecture reste lente plus longtemps et cette lenteur perturbe le déroulement des études primaires, du premier cycle et même au lycée". Magadur expose ensuite les causes de cette lenteur:

  • l'éducation du toucher,
  • l'apprentissage tardif,
  • la possibilités tactiles de chaque enfant,
  • le refus d'apprentissage lié à un résidu visuel ou à la non acceptation du handicap,
  • le manque d'entraînement,
  • la méthode braille appliquée,
  • le système braille lui-même,
  • le toucher qui est un moyen de connaissance lent. L'élève prend ainsi du retard parce qu'il est lent.

Par comparaison avec la lecture visuelle, citons quelques observations et quelques chiffres classiquement admis. La vitesse de lecture à voix haute ou de paroles est environ 9000 mots à l'heure (soit 150 m/mn). La vitesse de la lecture "chuchotée" est environ de 13000 mots à l'heure (soit 215 à 220 m/mn). La lecture silencieuse est plus rapide et sa vitesse dépend des capacités et surtout de l'entraînement du lecteur: 20000 m/h (330 m/mn) pour un lecteur lent, 28000 m/h (470 m/mn) pour un lecteur moyen et 60000 m/h (1000 m/mn) pour un lecteur rapide (Richaudeau 1976). Les observations de Zielke (1970) ont conduit aux résultats suivants:

  • moyenne de vitesse des adultes (lecteurs non exercés) 90 à 160 m/mn,
  • moyenne d'un lecteur normal exercée avec une technique personnelle, 200 à 250 m/mn,
  • moyenne de lecteurs exercés participant à des cours de lecture, 500 à 700 m/mn,
  • moyenne de lecteurs très exercés, 900 m/mn et plus.

Nous sommes convaincu qu'il est nécessaire de favoriser la lecture braille chez l'enfant aveugle et le rendre plus efficace dans sa pratique. Pour l'encourager et le familiariser avec ce mode de lecture tactile, le contact avec des livres braille bien avant la classe préparatoire serait favorable. L'apprentissage de l'écoute "active" (voir paragraphe suivant), l'entraînement à l'écoute, l'analyse et la synthèse de livres enregistrés pourraient pallier les problèmes associés à la lenteur dans l'accès à l'information et compléter les connaissances acquises avec la lecture braille.

Les livres enregistrés peuvent aider considérablement les lycéens aveugle intégrés dans des classes de voyants (Field 1974, Bischoff 1976).

B - Apprendre à écouter

L'apprentissage dépend de l'efficacité de l'écoute qui dépend elle-même de plusieurs facteurs:

  • l'intelligence,
  • la compréhension dans les activités de lecture,
  • l'acquisition d'un vocabulaire riche,
  • les capacités d'adaptation au locuteur,
  • l'expérience et l'entraînement de l'écoute.

L'écoute efficace nécessite un effort de concentration. Elle doit être "active": comme dans une prise de notes, l'auditeur doit analyser, sélectionner et synthétiser les informations perçues.

Bishoff signale le défaut d'étude et de recherche dans le domaine de l'écoute et propose un programme d'entraînement:

  • des leçons d'écoute distribuées à raison de trois par semaine,d'une durée de 15 minutes au début,
  • chaque leçon comporterait trois phases. Une phase de présentation de l'énoncé, un test de compréhension avec un questionnaire à choix multiples, un test de performance (réponse à des questions).
  • tester à chaque leçon la compréhension des idées, la connaissance du vocabulaire, l'interprétation de l'énoncé
  • découvrir l'idée principale de l'énoncé en lui donnant un titre,
  • les leçons devraient être échelonnées en longueur et en difficulté,
  • développer les capacités sélectives par la détection d'indices, de mots-clés, d'idée principale ou pertinente,
  • développer les capacités d'attention et de concentration,
  • les énoncés sont enregistrés par une voix masculine avec un débit de 120 m/mn.

La plupart des éducateurs des déficients visuels ont estimé nécessaire d'enseigner l'écoute. Un grand nombre d'auteurs (Bischoff 1967, Bixler 1963, Cobb 1977, Daughtery 1974, Gore 1969, Hatlen 1976, Morris 1966 et Nolan 1973, cités par Bischoff 1979) jugent que la présentation auditive des énoncés à apprendre est la seule voie d'apprentissage possible pour que les handicapés visuels puissent être intégrés aisément dans un enseignement scolaire.

C - Applications

Le champ d'application de l'écoute est vaste et varié: accueil, communication, échanges, informations radiophoniques et télévisées, cours et enseignement, conférence, renseignements, narrations, témoignage, documentation, publicité... Toutes les informations véhiculées par la parole sont plus ou moins importantes, plus ou moins intéressantes, plus ou moins utiles, plus ou moins utilisables.

Nous nous limiterons à étudier l'utilisation d'un mode de présentation auditive et de l'écoute chez l'aveugle et en particulier chez le collégien, le lycéen, l'étudiant. Il semble en effet primordial d'essayer d'améliorer l'accès à l'information chez les déficients visuels et ce d'autant plus qu'ils ne peuvent avoir un accès aisé à la lecture braille (aveugles tardifs, diabétiques, sensibilité tactile déficiente).

1 - La prise de notes:

Si l'acquisition de la lecture braille est relativement lente pour un jeune aveugle, la maîtrise de l'écriture braille est tout aussi difficile et peut être plus pour les très jeunes. La vitesse reste longtemps faible et il faut de nombreuses années de pratique pour être efficace. D'autre part la tablette et le poinçon ou la machine à écrire le braille sont assez bruyants et peuvent être gênants quand plusieurs aveugles sont intégrés dans une classe de voyants. Un grand nombre d'éducateurs anglo-saxons et quelques éducateurs français estiment que le magnétophone serait un outil précieux dans certaines conditions d'utilisation. Le chapitre suivant est consacré à l'étude de la prise de notes aidée par l'enregistrement. Il n'est évidemment pas pensable d'enregistrer l'intégralité d'un cours, de rester passif devant le matériel en marche, et de réécouter les 30 heures de cours enregistrés dans la semaine ! Comment rendre ce mode de prise de notes efficace? Comment utiliser ce matériel pour sélectionner les informations pertinentes? Sur un plan cognitif, quels sont les mécanismes les plus sollicités? Quel est le rôle de la mémoire et celui de l'attention? Une longue expérience et les problèmes à résoudre au "coup par coup" ont abouti a quelques solutions rentables et à une proposition de fabrication d'un magnétophone spécifique à la prise de notes et à la réécoute rapide.

2 - La parole comprimée et l'écoute rapide

Des techniques nouvelles mises en place dans les années 60 aux Etats-Unis ont permis de réaliser une compression temporelle de la parole enregistrée sans distorsion excessive du signal vocal. L'augmentation du débit de l'enregistrement permet l'écoute d'une plus grande quantité d'information dans un temps plus court. Quel est l'influence de la parole comprimée sur l'intelligibilité des mots, la compréhension du discours, la mémorisation des informations et l'efficacité de l'apprentissage? a partir de quel âge peut-on utiliser ce mode de présentation? Quelles seraient les applications de l'écoute rapide?

Ces questions sont abordées dans le chapitre 4 dans lequel une revue de questions et une étude expérimentale sont exposées.

3 - La synthèse vocale

La synthèse vocale associée à un ordinateur, des logiciels adaptés, des nouveaux supports pour le stockage des informations (CD ROM, DON, ...) offrent des possibilités considérables aux jeunes aveugles.

Quels sont les problèmes posés par une sortie vocale? Un opérateur aveugle peut-il utiliser le matériel informatique utilisé par les voyants sans avoir accès à l'écran? Les mécanismes de la perception auditive et les processus mnésiques pourraient-ils pallier l'inexistence de la perception visuelle? Quelles sont les conséquences de l'utilisation de ces nouvelles techniques sur l'intégration scolaire, sociale et professionnelle des jeunes déficients visuels? Notre expérience et nos investigations dans ce domaine sont relatées dans le chapitre 5.


IV - CONCLUSION ET RÉSUMÉ

La parole est un signal vocal complexe, continu et redondant (formants) composé de segments périodiques et apériodiques, variable pour un même locuteur à des instants différents, et très variable selon les locuteurs (variabilité inter-individuelle). Contrairement à l'écrit, la parole est une suite de segments continue (phonèmes) dont le débit varie entre 120 et 150 mots par minute environ selon les conditions d'émission et les objectifs recherchés.

L'expérimentation en physiologie et en psycho-physiologie a permis de décrire l'information qui circule sur le nerf auditif à partir de l'émission d'un signal vocal.Au niveau périphérique, les mécanisme de la perception auditive ont pu être étudiés: l'onde vocale peut être définie par sa fréquence, son amplitude, sa durée. Dans l'oreille, elle subit des phénomènes de décomposition spectrale capables de discriminer la fréquence fondamentale et les harmoniques d'une voyelle par exemple. La hauteur perçue est liée à la fréquence fondamentale, l'intensité à la notion d'énergie (amplitude, pression acoustique). Une unité de puissance acoustique a été définie permettant de déterminer une unité relative de niveau d'intensité sonore en décibels. L'oreille perçoit des sons dont la fréquence varie entre 20 et 20000 Hertz (jusqu'à 10000 HZ dans la pratique). Des seuils d'audibilité et de douleur sont déterminés pour différentes fréquences (courbes d'audibilité et de douleur) La sensibilité de l'oreille est maximum pour les sons de 1000 Hertz. L'oreille est peu sensible à la variation d'intensité d'un son (supérieur à 10%), mais elle est très sensible à sa variation de fréquence (entre 0,1 et 0,3% en moyenne). L'oreille interne transforme le signal acoustique en un signal nerveux et le codage à ce niveau est tel qu'il produit déjà une bonne analyse acoustique du signal d'entrée. Deux type de codage sont effectués au niveau périphérique: un codage temporel pour une fibre nerveuse et un codage spatial et synchronisé de plusieurs fibres nerveuses suivant la localisation des cellules réceptrices: définissant une sorte de cartographie fonctionnelle au niveau de la cochlée (oreille interne).

Au niveau central, l'énoncé en cours de traitement fait appel à diverses sources de connaissances: acoustiques, phonétiques, lexicales, syntaxiques et pragmatiques. Plusieurs modèles rendent compte des mécanismes centraux. Plusieurs types de modèles ont essayé de décrire le déroulement des processus cognitifs dans le traitement de l'information parlée. Des phénomènes d'interaction multiples compliquent beaucoup cette tâche: phénomènes de coarticulation au niveau des segments (phonèmes) et multiples interactions dans les différentes étapes de l'analyse. Les recherches des acousticiens (Vicard 1987, Wang 1987) et des informaticiens (Pierrel 1987) qui ont pour objectif la synthèse et la reconnaissance de la parole, utilisent les résultats des phonéticiens, des phonologistes, des linguistes, des psychologues, mais en contre partie vérifient ces résultats:

  • la parole est redondante et reste intelligible après élimination de petits segments du signal vocal,
  • la durée d'un phonème varie de 30 millisecondes à quelques centaines de millisecondes,
  • des "silences" sont indispensables pour la reconnaissance de certaines consonnes et l'intelligibilité de la parole,
  • les pauses et la prosodie jouent un rôle important dans la compréhension des informations parlées,
  • la coarticulation et les interactions entre les différentes étapes du traitement rendent ces études très complexes,
  • la schématisation des mécanismes et des processus mis en jeu est toujours réductionniste, même si elle permet d'affiner les résultats et d'améliorer la qualité des synthèses vocales, des progrès sont encore attendus dans la reconnaissance de la parole,
  • l'attention et la mémoire sont importantes dans l'analyse, la compréhension et l'interprétation d'un message parlé.

La parole occupe une place essentielle dans la communication humaine et c'est aussi un support de l'information non négligeable dans l'enseignement. Compte tenu des difficultés et des problèmes de lenteur avec le mode d'accès à l'information tactile, de nombreux éducateurs anglo-saxons jugent le mode de présentation auditif très favorable pour l'accès à l'information et l'apprentissage des jeunes aveugles. D'autre part le développement des nouvelles technologies: machines à lire (scanner), calculatrices parlantes, synthèses vocales permettant la sortie vocale des données d'un micro-ordinateur et l'utilisation de nombreux logiciels rendent nécessaire l'éducation de l'écoute. Comment peut-on transmettre une information visuelle distribuée de façon spatiale sur une feuille ou un écran par la voie orale impliquant des caractéristiques temporelles et séquentielles? La mémoire à court terme, la mémoire de travail, l'attention n'imposent-elles pas leurs lois de fonctionnement? Et comment distribuer l'information parlée pour favoriser la compréhension et réduire la charge mentale? Nous nous proposons d'étudier ces différentes questions dans les chapitres suivants.

 
sommaire


CHAPITRE 3:

LA PRISE DE NOTES

 

SECTION 1: ÉTUDE THÉORIQUE

I - LENTEUR DE L'ACQUISITION DE L'INFORMATION

Même si les étudiants aveugles ont pu acquérir une base de connaissances suffisamment solide et riche pour pouvoir prolonger leurs études, ils sont confrontés à un problème majeur qui est celui de l'accès à l'information. .

Cette lenteur dans l'acquisition des informations et donc des connaissances a été soulignée et expliquée à maintes reprises dans la première partie de notre travail.

Les différences dans l'efficacité et la rapidité de perception des deux fonctions visuelle, et tactile, expliquent les résultats des recherches sur la lecture des caractères brailles et des caractères imprimés.

En effet, pour un temps de lecture donné, un lecteur aveugle qui lit le braille, couvre trois fois moins de texte qu'un lecteur voyant qui lit des caractères imprimés (Myers 1978, Drueger 1982). Un lecteur expérimenté lit avec les yeux environ 300 mots par minute alors qu'un lecteur aveugle lit avec les doigts environ 100 mots par minute (Foulke et Stitch 1969, Foulke 1982). Les explications qui rendent compte de cette différence de rapidité reposent sur des différences de structures physiologiques:

  • la lecture haptique (tactilo-kinesthésique) implique le mouvement des mains, tandis que la lecture visuelle implique le mouvement des yeux;
  • l'acuité tactile est plus faible que l'acuité visuelle (l'acuité est le pouvoir de discrimination entre deux points rapprochés);
  • le champ perceptif tactile est plus petit que le champ perceptif visuel;
  • la lenteur de la lecture tactile est renforcée par son caractère essentiellement analytique qui dérive des caractéristiques de la perception haptique définie précédemment.

L'écriture braille avec poinçon présente également cette caractéristique de lenteur par rapport à l'écriture avec crayon. De plus, la tablette et le poinçon sont assez bruyants lorsqu'ils sont utilisés par plusieurs élèves dans une même salle de cours. En outre l'écriture braille permet plus difficilement la correction, la rectification, l'annulation ou l'adjonction d'une note dans le texte écrit (Postel 1972). Or la prise de notes est une phase importante voire primordiale dans l'acquisition des connaissances de l'élève, du lycéen et de l'étudiant.

II - La TECHNIQUE DE PRISE DE NOTE

Plus le niveau est élevé dans le cursus scolaire et universitaire, plus la quantité d'informations à acquérir s'accroît. Aussi au fur et à mesure de l'évolution des études, la technique de prise de notes occupe une place de plus en plus importante.

Dans les petites classes et suivant les établissements jusqu'à la troisième, c'est l'enseignant qui gère et organise cette activité de prise de notes. Peu à peu, le professeur est moins directif et les lycéens, puis les étudiants doivent accroître leur autonomie dans ce domaine (Ledru et Sizaire 1985). Ils devront sélectionner l'information et choisir dans le discours du professeur les éléments essentiels et pertinents qui se rapportent à un thème donné et qui leur seront utiles pour pouvoir apprendre et restituer cette information (Ledru, Sizaire 1984).

Les notes stockées par les élèves et les étudiants constituent une base de données importante sur laquelle peut s'effectuer le travail de révision en vue d'examens ultérieurs. De la quantité et surtout de la qualité des notes prises, dépendra la réussite aux examens.

Confrontés à un sujet inconnu ou peu familier, les étudiants utilisent une stratégie qui consiste à prendre un maximum de notes en vue de procéder à un tri ultérieur de l'information. C'est une technique classique durant les premières années d'étude à l'université.

Pour que l'élève ou l'étudiant aveugle, intégré dans une classe de voyants, puisse suivre le rythme imposé par le débit du cours, une solution avantageuse est l'utilisation d'un magnétophone.

III - La PRISE DE NOTE AIDÉE PAR L'ENREGISTREMENT

Nous avons enregistré tous les cours de psychologie suivis entre 1982 et 1987 à l'Université de Lille III.

Les premiers cours ont été enregistrés intégralement, soit par exemple 2 heures d'enregistrement pour 2 heures de cours. Puis les enregistrements étaient retranscrits à la machine à écrire, et enfin lus et ré-enregistrés au magnétophone. Ce travail de retranscription et de ré-enregistrement avait pour but principal de condenser toutes les informations, d'éliminer les bruits de fond et les informations inutiles ou redondantes.

Toutefois, un travail de synthèse n'était pas éffectué durant ces premières opérations: toutes les phrases apportant une idée nouvelle étaient retenues. Ces différentes manœuvres avaient pour seul objectif de réduire le temps d'écoute du cours au maximum en vue d'un apprentissage ou d'un travail de révision ultérieur.

Au cours des six premières semaines d'enregistrement, suivant la nature et la densité des cours, nous avons pu constater qu'un cours de 2 heures pouvait être réduit à 20 ou 40 minutes d'écoute en moyenne.

Cependant, le temps passé dans la retranscription des enregistrements était considérable. Par exemple, pour un cours de deux heures, il s'agissait d'additionner les deux heures d'écoute de l'enregistrement d'origine, puis le temps passé à la dactylographie de 5 à 10 pages (environ 3 heures) et enfin le temps de relecture, soit au total 6 à 8 heures de travail !...

Étant donné l'inexistence quasi-totale de cours polycopiés, de livres braille ou de cours enregistrés, l'étudiant aveugle est placé devant deux possibilités: prendre des notes plus ou moins complètes en braille ou enregistrer le cours et passer de longues heures de réécoute.

Le choix des solutions est encore plus réduit pour l'étudiant aveugle accidentel ou pour le mal voyant qui perd (peu à peu ou brusquement ) la vue et qui avait délaissé la tablette braille pour les gros caractères ! Ces cas sont relativement courants.

De multiples entrevues avec des élèves aveugles de naissance ou aveugles accidentels qui avaient une bonne pratique de la tablette braille ont mis l'accent sur les difficultés rencontrées lors de la prise de notes, surtout chez les élèves intégrés avec les voyants.

Après ces six semaines d'observation sur la prise de notes à l'aide du magnétophone, il semblait primordial de réduire:

  • - le temps d'enregistrement du cours;
  • - le temps de la retranscription;
  • - diminuer encore le temps d'écoute.

IV - RÉDUCTION DU TEMPS D'ENREGISTREMENT

La quantité et la qualité des notes prises par un élève ou un étudiant lors d'un cours dépendent de nombreux facteurs relatifs aux sujets:

  • niveau scolaire et universitaire;
  • connaissances antérieures du sujet;
  • utilisation ou non utilisation ultérieure des notes;
  • intérêt et motivation du sujet;
  • attention et éveil du sujet;
  • stratégies utilisées par le sujet...
  • capacité mnésique de l'auditeur,
  • intégrité sensorielle et motrice du sujet...

La quantité et la qualité des notes prises peut dépendre aussi de facteurs relatifs à la nature du cours et relatifs au locuteur. En outre ces différents facteurs pourraient être interactifs.

Lorsque le thème d'un cours est peu familier ou très complexe, les élèves et les étudiants ont tendance à prendre le maximum de détails afin de pouvoir faire un tri ultérieur de l'information et éventuellement une synthèse et un résumé de ce qui a été compris.

Lorsque l'accès à d'autres informations complémentaires est difficile voire impossible, parce que le cours est très spécialisé, que les livres et publications sont inexistants (livres en braille pour les aveugles par exemple), l'étudiant doit se résoudre à cumuler un maximum de données lors du cours.

Nous nous sommes placés dans ces conditions (thème nouveau, accès aux informations complémentaires difficiles) durant "la prise de notes" de la majeure partie des cours suivis pendant les premières années (1982 à 1985) avec pour objectif essentiel: réduire la durée d'écoute et de retranscription du cours enregistré.

Pour réduire le temps d'enregistrement d'un cours, une première solution est d'éliminer tous les "temps sans information", c'est-à-dire de ne pas enregistrer chaque fois que le locuteur cesse de parler et de redémarrer l'enregistrement dès les premières paroles. Pour ce faire, il suffit de placer le magnétophone sur "enregistrement" et un seul appui sur la touche "pause" permet alors l'arrêt immédiat ou la mise en route de l'appareil. Deux stratégies sont alors possibles. La première consiste à appuyer le plus vite possible sur la touche marche-arrêt respectivement dès les premières et dernières paroles. Compte tenu du temps de réaction à un signal auditif (qui peut varier de 150 à 200 millisecondes), la perte de l'information peut être minimale (moins d'un mot) si le temps de réaction est très court et si le débit de la parole du locuteur n'est pas trop élevé.

Toutefois ce procédé présente quelques inconvénients. En effet, même après un certain temps de pratique et l'acquisition d'une grande dextérité, la perte du premier ou des deux premiers mots d'une phrase est parfois inévitable et peut, selon la valeur de ces mots, modifier le sens de la phrase ou rendre celle-ci incompréhensible. De plus, assez souvent, en situation de cours le professeur répète une phrase ou une portion de phrase, soit pour insister sur une idée émise, soit pour aider les élèves à suivre le rythme dans la prise de notes. Aussi, si l'enregistrement est déclenché dès la perception de la première parole émise, les phrases et les séquences répétées seront également enregistrées.

En conséquence, cette redondance allongera inutilement le temps d'écoute. Cette façon de procéder est donc très simple, l'appui automatique sur une touche au début et à la fin d'un signal s'acquiert rapidement. Cette pratique permet de réduire le temps d'écoute de 20 à 30 pour cent en moyenne (cours suivis en première année de psychologie). Toutefois le temps de retranscription sera encore long en raison de la redondance du discours et d'un temps d'enregistrement encore trop long.

Une seconde façon de procéder permet d'éviter ces désavantages. Il s'agit d'attendre 1 à 2 secondes soit l'émission de 2 à 5 mots avant de décider de déclencher ou non l'enregistrement. Ce laps de temps est suffisant pour apprécier si l'idée est à enregistrer ou si elle est une simple répétition d'une phrase ou d'un segment de phrase énoncé et enregistré antérieurement.

Dans le cas ou l'enregistrement est décidé, il est alors nécessaire de superposer à l'enregistrement en cours,les premiers mots de la phrase dont l'absence risquerait de rendre l'idée incompréhensible. Cette pratique a l'avantage de pouvoir éliminer les portions de discours inutiles ou redondantes. Ainsi l'enregistrement étant plus sélectif, la durée d'écoute en sera d'autant plus réduite. Dans ce cas, la durée d'enregistrement représente en moyenne 50 pour cent de la durée d'un cours. Ce pourcentage peut être variable en fonction de la nature du cours. Il peut encore être plus faible pour un cours d'informatique ou de mathématiques. Il peut être plus élevé si le cours est très dense (préparation à un concours).

V - REDUCTION DU TEMPS DE RETRANSCRIPTION

Pour de nombreuses raisons, dont certaines peuvent être déduites des remarques précédentes sur l'enregistrement, la retranscription d'un cours enregistré au magnétophone est pratiquement toujours une nécessité. En effet, la retranscription a pour but d'éliminer les bruits de fond, les portions de discours inutiles et d'augmenter le débit de l'énoncé. Ce qui a pour conséquence de rendre le discours plus clair et surtout considérablement moins long que le discours d'origine. Le temps d'écoute est en moyenne de 10 à 25 pour cent de la durée d'un cours.

La retranscription orale est plus rapide que la retranscription écrite et plus encore que la retranscription braille. Aussi, le mode oral a été choisi ici pour la transcription. Deux magnétophones sont nécessaires: l'un pour écouter l'enregistrement du cours l'autre pour enregistrer la version condensée de cet enregistrement (retranscription orale).

La retranscription consiste à écouter l'enregistrement et à répéter plus rapidement phrase par phrase dans un second magnétophone tout en éliminant éventuellement les segments inutiles. L'écoute d'une portion du discours, l'arrêt du premier magnétophone, l'enregistrement sur le second, puis l'arrêt du second pour revenir au premier, peut faire perdre beaucoup de temps dans les manipulations. Par exemple un cours de deux heures dont la durée d'enregistrement a pu être réduite à 50 pour 100 (voir précédemment) nécessitera une heure d'écoute à laquelle il faut ajouter le temps d'enregistrement de la retranscription (10 à 20 minutes) et la durée des manipulations.Ce qui conduit à un temps de retranscription variant de une heure et demie à deux heures et quart environ. Il convient donc de réduire au maximum la durée de la retranscription.

La durée minimale de la retranscription ne pourra pas être inférieure à la durée de l'enregistrement à moins d'écouter celui-ci à vitesse plus rapide. Il existe en effet des magnétophones qui permettent de faire varier la vitesse de déroulement de la bande magnétique et permettent ainsi de réduire de 20 à 30 pour cent la durée d'écoute. Toutefois les bruits de fond enregistrés en même temps que le cours, la superposition de la voix de l'élève et du professeur pour le début des phrases et la nécessité d'avoir une bonne intelligibilité de l'énoncé en vue d'une retranscription fidèle et claire,contraignent à une écoute de la bande enregistrée à vitesse normale.

Pour réduire la durée de la retranscription, la seule solution est de procéder à l'enregistrement de la version condensée et aux manipulations qu'elle nécessite pendant le temps d'écoute du cours enregistré. Avec un peu d'entraînement cela est tout à fait possible et a été effectué pour tous les cours enregistrés entre 1982 et 1987 (psychologie, mathématique, informatique, physiologie).

En effet pendant un cours le débit de la parole (même s'il varie beaucoup selon les locuteurs) est en général très lent. Il est donc possible de suivre le cours enregistré à l'aide d'un écouteur et dans le même temps, il est possible d'énoncer plus rapidement dans un second magnétophone les portions de discours qu'il est souhaitable de conserver. Un doigt posé sur la touche marche-arrêt de ce second magnétophone, permet de stopper l'enregistrement chaque fois qu'il est nécessaire d'attendre la phrase suivante.

En conséquence la durée de la retranscription sera réduite à la durée d'écoute du cours enregistré, réduit lui- même de 50 pour 100 et parfois plus par rapport à la durée du cours d'origine. Seuls, des retours en arrière, lors de l'écoute du cours enregistré par suite d'une mauvaise intelligibilité, pourraient allonger ce temps de retranscription.

Pour favoriser un bon enregistrement du cours et minimiser les bruits de fond, il convient de se placer le plus près possible du locuteur et de faire ainsi écran entre les "murmures des bavards" et le discours du professeur.

Dans certaines situations de cours, nous avons pu faire une retranscription orale immédiate pendant le cours et ainsi économiser de longues heures de retranscription. Les cours propices à une telle pratique se déroulent en général en amphithéâtre où la dictée orale, c'est-à-dire la répétition dans le microphone des portions de discours sélectionnés, ne peut gêner les autres auditeurs. Cette condition est en fait comparable à celle d'un journaliste en situation de transcription directe de ses commentaires dans son microphone.

Cette prise de note orale au magnétophone est très avantageuse quand elle est possible. Elle permet en effet:

  • d'économiser le temps de la retranscription;
  • de procéder à l'analyse et à la synthèse immédiate de l'énoncé;
  • de sélectionner directement l'information et d'enregistrer immédiatement (pendant le déroulement du cours) l'information condensée;
  • d'ajouter à cette information des points de repères, des indices (des commentaires de graphes par exemple), l'épellation de mots complexes ou de noms propres etc...
  • de mettre en valeur les points essentiels et le plan du cours.

Cette forme de retranscription orale directe en situation de cours est tout à fait comparable à la transcription écrite que pratique tout étudiant ou élève en situation de prise de notes. Toutefois, par rapport à la prise de notes (écrite) classique de l'élève, elle présente des avantages, mais aussi quelques inconvénients.

La transcription orale est plus rapide que la transcription écrite et permet donc de prendre des notes complètes et précises. Elle favorise aussi l'adjonction de quelques brefs commentaires personnels. Cependant elle implique une "lecture auditive" et un apprentissage auditif qui pourraient ne pas convenir à tous les étudiants. D'autre part, ce mode de prise de notes ne pourrait pas être utilisé par plusieurs étudiants dans une même salle de cours, à moins de posséder des cabines d'écoute individuelles.

VI - RÉDUCTION DU TEMPS D'ÉCOUTE

L'un des buts essentiels de la prise de notes est de rassembler un maximum d'informations dans un minimum de place, ou de temps selon le mode de transcription afin de réduire le temps de lecture et d'écoute et donc de rendre l'apprentis sage plus efficace.

La sélection et l'organisation des notes dépendent de nombreux facteurs liés au récepteur (l'élève), au locuteur (le professeur), à la nature du texte émis. Pour un thème peu familier ou inconnu de l'élève, la sélection et l'organisation des idées à retenir seront plus difficiles que pour un thème familier. Aussi la nécessité d'une retranscription et d'une réorganisation des notes prises s'impose-t-elle dans de telles conditions. Une relecture ou une réécoute d'un texte complexe en facilite grandement la synthèse. Un bon nombre d'étudiants en première année de psychologie réorganisent leurs notes dans le but de rendre le texte plus compréhensible, plus synthétique et donc d'un accès plus facile lors d'une utilisation ultérieure (Sizaire et Ledru 1985).

Pour l'étudiant voyant, le plan d'un cours et les idées principales sont mis en valeur par de nombreux artifices: soulignements, adjonction de couleurs, de symboles, utilisation de tableau, marge, tabulation ... Pour l'étudiant aveugle, l'écriture braille rend plus difficile le positionnement de ces indices, voire impossible lorsqu'une adjonction doit s'effectuer après coup. Il en est de même lors de l'écoute d'un cours enregistré.

Aussi, pour faciliter l'accès rapide à une vue d'ensemble d'un cours, il importe d'en énoncer d'abord le plan , puis de mettre en évidence ce plan par des indices sonores: élévation de l'intensité de la voix, modification du débit, pause, adjonction d'un bref commentaire ...

L'expérience nous a montré qu'une relecture visuelle et "auditive" d'un cours dont le plan est connu, peut être très rapide. Aussi lorsqu'une retranscription est bien organisée, elle peut être lue ou écoutée à vitesse rapide.

Au magnétophone, le temps d'écoute peut être réduit en augmentant le débit de la parole lors de l'enregistrement de la retranscription, mais aussi en accélérant la vitesse de défilement de la bande magnétique ou en utilisant une technique de compression de la parole. Ces méthodes et techniques seront brièvement expliquées à la fin de ce chapitre.

Il convient de remarquer que la lecture visuelle s'adresse à une organisation spatiale des éléments lus,alors que la lecture "tactile" et la lecture "auditive" font appel à une organisation temporelle de ces éléments. Ces deux derniers modes pourraient donc nécessiter un travail de mémorisation supplémentaire ou peut être une organisation mnésique différente.

VII - CARACTÉRISTIQUES DE LA PRISE DE NOTES AU MAGNÉTOPHONE

Dans l'activité de prise de notes effectuée de façon manuelle (en noir ou en braille), l'élève ou l'étudiant procède à une transcription plus ou moins fidèle de ce qui est émis par le locuteur. Selon le débit du cours, les connaissances de l'élève, la vitesse de transcription et de nombreux autres facteurs, les notes ont un caractère plus ou moins analytique ou synthétique. Le caractère plus ou moins synthétique des notes qui provient d'un remaniement du discours original par transformation, adjonction, élimination de certains termes, ne peut être de même nature dans la prise de notes au magnétophone.

En effet, lors d'un enregistrement, qu'il soit plus ou moins sélectif, ne prenant pas en compte les phrases superflues, incomplètes ou redondantes, les bruits, les pauses, les séquences enregistrées sont des copies fidèles des séquences émises. C'est seulement au moment de la retranscription des notes enregistrées (retranscription écrite ou orale à l'aide d'un second magnétophone), que le processus de remaniement aura lieu.

D'autre part, les notes écrites ont essentiellement un caractère spatial et visuel. L'indexation des paragraphes, sous-paragraphes, points importants s'effectue à l'aide d'une lettre majuscule ou minuscule, d'un chiffre ou de tout autre symbole sélectionné à cet effet. Le plan peut également être mis en valeur par l'utilisation de marges, de soulignements, d'encadrements, de couleurs. L'accentuation des mots ou des idées importantes utilise des procédés analogues.

Les notes enregistrées ont un caractère temporel et séquentiel. Aussi, la mise en valeur du plan,des mots et des idées importantes, ne peut faire appel aux mêmes processus que les notes écrites.

Toutefois par analogie, il est possible de souligner le plan et les différents paragraphes par un commentaire oral: "premièrement", "deuxièmement"...ou "grand A", "grand B" ou par un silence de une à deux secondes entre les paragraphes.

Les changements de rythme, de ton ou d'intensité peuvent également être des artifices de mise en valeur d'un enregistrement. Des étudiants aveugles adeptes de la "lecture auditive" superposent des petits sons aigus ou des bruits divers pour "souligner" un mot ou groupe de mots dans un enregistrement.

Dans la prise de notes à l'aide d'un magnétophone, il importe de ne pas négliger l'orthographe et de ne pas omettre d'enregistrer l'épellation des mots inconnus ou non familiers, des noms propres, des mots complexes afin de pouvoir procéder à leur utilisation ultérieure de façon correcte.

Dans la mesure où le langage se développe dans le temps et implique deux données essentielles: la durée et la succession (Postel et al. 1972), la prise de notes au magnétophone (et écrite) nécessite une perception correcte d'une succession dans le temps.


SECTION 2: ÉTUDE EXPÉRIMENTALE

Pour que l'élève ou l'étudiant aveugle, intégré dans une classe de voyants, puisse suivre le rythme imposé par le débit du cours, une solution avantageuse pourrait être l'utilisation d'une technique d'enregistrement.

Toutefois, le magnétophone classique entraîne quelques inconvénients, en particulier la perte des premiers mots du discours enregistré. Nous avons testé un prototype, le magnétophone à enregistrement différé qui ne présente pas ce désavantage.

Les différentes expériences ont été réalisées avec l'aide du Centre de Technologie Biomédicale de l'Institut National de la Santé et de la Recherche Médicale de Lille: (C T B I N S E R M), dirigé par Y. Moschetto.


I - UNE TECHNIQUE D'AIDE À LA PRISE DE NOTES: LE MAGNÉTOPHONE

A - ENREGISTREMENT DIFFÉRÉ

Le magnétophone à enregistrement différé a été conçu par F. Steenkeste et D.D. N'Guyen, respectivement ingénieur C N a M et chargé de recherche à l'INSERM de Lille.

Ce système d'enregistrement permet de sélectionner des fragments de discours, sans perdre le début de la séquence estimée intéressante.

Le principe du magnétophone à enregistrement différé repose sur l'insertion d'un codeur, d'une mémoire digitale et d'un décodeur à modulation delta dans la chaîne d'enregistre ment, c'est-à-dire entre le microphone et la tête enregis treuse, (voir la vue synoptique, fig. 1).

Suivant le principe de ce matériel, avant d'être stockée sur la bande magnétique, l'information émise par le locuteur transite dans une mémoire dynamique, dont la capacité, réglable, peut varier de 2 à 20 secondes.

Quand l'utilisateur déclenche l'enregistrement par un simple appui sur la touche marche-arrêt, il envoie sur la bande magnétique l'information contenue dans la mémoire- tampon. Ainsi, selon le réglage de la capacité de la mémoire- tampon, les quelques mots ou les quelques phrases émis avant l'appui sur le bouton "marche" sont enregistrés. L'utilisateur a, suivant le réglage, de 2 à 20 secondes, pour décider s'il enregistre ou non, l'information émise pendant ce laps de temps.

Cette technique permet de procéder directement à une sélection rapide de l'information en situation de cours ou dans d'autres conditions de prise de notes: conférence, travail de secrétariat ...

II - ÉVALUATION DU MAGNÉTOPHONE À ENREGISTREMENT DIFFÉRÉ

1 - Les expériences antérieures:

Les premières expériences furent effectuées avec des élèves de troisième, handicapés physiques, atteints d'infirmité motrice cérébrale (I M C) qui présentaient quelques difficultés à prendre des notes écrites (Ledru et Sizaire 1985).

À ce niveau scolaire, le professeur organisait l'activité de prise de notes des élèves et indiquait les éléments importants à noter. La capacité de la mémoire-tampon était réglée à 5 secondes, ne pouvant varier à cette époque qu'entre 5 et 30 secondes.

Selon les auteurs, les élèves étaient assez capables de faire une sélection de l'information, mais présentaient avant tout des difficultés à évaluer ce qui pouvait être énoncé en 5 secondes.

Après apprentissage de la technique et expérimentation en situation de cours, les auteurs avaient conclu que le magnétophone à enregistrement différé pouvait permettre une sélection et un stockage de l'information essentielle satisfaisants; mais les élèves devaient procéder à une retranscription du cours pour éliminer les informations superflues et les phrases incomplètes.

2 - Évaluation du matériel à l'Université

Pendant l'année universitaire 1986-1987, nous avons expérimenté le magnétophone à enregistrement différé en situation de cours, dans différentes disciplines (informatique, psychologie, physiologie), afin de pouvoir tester le matériel avec une grande variété d'énoncés.

La technique de prise de notes utilisée est celle précédemment décrite et consiste à déclencher l'enregistre ment de façon sélective. Avec un magnétophone classique, cette sélectivité repose sur une prédiction plus ou moins probable, de la phrase suivante, compte tenu du contexte et de la familiarité avec le thème et le locuteur. Avec le magnétophone à enregistrement différé, cette sélectivité est plus objective: elle repose sur une prise de décision à partir de ce qui a réellement été entendu entre 5 et 30 secondes, puisque l'élève ou l'étudiant possède entre 5 et 30 secondes (selon le réglage de la mémoire tampon) pour décider s'il enregistre ou non les paroles émises pendant ce laps de temps.

Le débit des paroles émises lors d'un cours est souvent proche du débit des paroles conversationnelles, qui est de l'ordre de 120 mots par minutes (Foulke 1969). Durant nos propres investigations, nous avons constaté que le débit de la parole varie entre 100 et 180 mots par minutes selon les locuteurs et la nature du cours. En outre, pour une même personne ce débit fluctue très sensiblement d'un moment à l'autre de l'émission. Ainsi, rapide en début de phrase, le professeur peut ralentir son énoncé pour suivre le rythme des étudiants.

Selon le taux de mots émis, une phrase de 10 à 15 mots peut être énoncée en 5 secondes et 4 à 6 mots peuvent être émis en deux secondes.

Lors de nos investigations, nous avons constaté combien il est difficile d'évaluer ce qui a été "dit" en 5 secondes. Ainsi avec un réglage de la mémoire-tampon à 5 secondes, quand l'étudiant décide d'enregistrer une phrase en cours d'émission ou en fin d'émission, les derniers mots de la phrase précédente sont également enregistrés. Des portions de phrases sans signification ou des silences inutiles surchargent l'enregistrement. Elles allongent le temps d'écoute, rendent la compréhension plus difficile et nécessitent une retranscription du cours. Cette difficulté avait déjà été signalée dans les études précédentes (Ledru et Sizaire 1985).

Toutefois, quand le débit du locuteur est régulier l'étudiant bien entraîné est plus sélectif et peut tirer profit d'un temps de réflexion de 5 secondes. Il faut cependant noter que le débit de la parole du professeur fluctue très largement pendant le déroulement d'un cours.

En conséquence, l'utilisation de la mémoire-tampon de 5 secondes nécessite un entraînement long et une bonne adaptation aux fluctuations du débit du locuteur.

3 - Hypothèse théorique

Dans l'activité de prise de notes, le traitement des paroles émises par le locuteur (le professeur) doit s'accomplir le mieux possible, il doit être précis et rigoureux à toutes les "étapes" pour aboutir à une bonne sélection des fragments d'énoncé à conserver ou construire rapidement une phrase synthétique intégrant plusieurs idées informatives. Cette activité sollicite donc au maximum la mémoire de travail.

La mémoire de travail "maintient en disponibilité immédiate les informations reçues de la mémoire à court terme ou retrouvées de la mémoire à long terme". Le nombre des éléments stockés en mémoire à court terme est limité. Il est classique de citer Miller (1956) qui évalue la capacité de la mémoire à court terme à 7 plus ou moins 2 éléments. Par ailleurs, il semblerait que sa limitation temporelle soit environ 2 secondes (Reuchlin 1981).

Dans le traitement de l'information écrite et parlée, outre l'approche ascendante (traitement dirigé par données) et descendante (traitement dirigé par concepts), exposée au chapitre précédent, "l'exécutif central" serait alimenté par deux "systèmes esclaves": l'agenda visuo-spatial (système de stockage d'informations de type visuo-spatial) et la boucle articulatoire (Baddeley 1986). Le traitement d'un message parlé, séquentiel, code et envoie l'information auditive dans le stock phonologique et fait appel essentiellement à la mémoire à court terme. Pour mémoriser cette information séquentielle, après le décodage phonétique, , tandis qu'il procède au traitement syntaxique et sémantique, le sujet effectue "une verbalisation" de l'information reçue. L'auditeur se répète mentalement ce qu'il entend. Ainsi pour Baddeley, ce dispositif de boucle articulatoire entretiendrait la trace phonologique et pour que celle-ci ne s'estompe pas une révision du matériel (répétition mentale) s'impose. Ce codage est central et ne dépend pas obligatoirement des mécanismes moteurs du système phonatoire.

Plusieurs auteurs ont situé la capacité temporelle de la mémoire à court terme entre 1,5 et 2 secondes (Baddeley 1986, Hulme et al. 1984, Schweickert et Boruff 1986 )

Dans la prise de notes, lorsqu'un auditeur écoute un locuteur, il perçoit et décode les derniers éléments d'une phrase alors qu'il a déjà intégré en mémoire et compris les premiers éléments. Si la capacité temporelle de la mémoire à court terme est limitée à environ 2 secondes, et si, par conséquent, l'auditeur est capable de gérer et mémoriser correctement environ 2 secondes d'information parlée, nous posons l'hypothèse qu'un auditeur utiliserait avec plus de facilité le magnétophone à enregistrement différé si la capacité de la mémoire-tampon était réglée à 2 secondes.

À la suite de ces observations, une modification du prototype fut envisagée. Nous avons proposé de déplacer la limite de la capacité de la mémoire-tampon vers des valeurs plus petites (2 secondes) et d'éliminer les valeurs les plus élevées (20 et 30 secondes).

Avec la collaboration de l'I N S E R M, les modifications du prototype permettaient désormais de régler sélectivement la capacité de la mémoire-tampon selon quatre degrés de variation: 2, 5, 10 ou 15 secondes.

Dès lors, nous avons sélectionné alternativement un réglage de 2 ou de 5 secondes pour la suite de notre étude expérimentale.

4 - Résultats expérimentaux en situation de cours

Nous avons procédé à une prise de notes en situation de cours dans trois disciplines différentes: informatique, physiologie, psychologie. Nous avons utilisé un magnétophone classique (Sony, type TCM-6DX) et le magnétophone à enregistrement différé (prototype) avec une capacité de la mémoire-tampon réglée à 2 secondes.

Dans notre étude à visée essentiellement exploratoire, la prise de notes aidée par l'enregistrement classique ou différé, a pour objectif principal la sélection de toutes les phrases susceptibles de contenir un élément descriptif ou explicatif nouveau, associé au thème du cours. La prise de notes aidée par l'enregistrement étant de nature séquentielle, analytique, l'unité d'enregistrement considérée est la phrase: l'appareil démarre dès le début d'une phrase, pour le magnétophone classique, après 2 secondes d'écoute et de réflexion pour le magnétophone à enregistrement différé. La fin de la phrase coïncide avec l'arrêt des appareils.

La durée de l'enregistrement de chaque cours, le temps passé à sa retranscription et le temps d'écoute du ré-enregistrement sont chronométrés en minutes (voir tableaux 1, 2 et 3).

L'économie (E) moyenne de la durée d'écoute, après enre gistrement sélectif et "retranscription" enregistrée a été calculée pour chaque discipline: E=((T-t):T)*100 T représente la durée totale du cours et t, la durée totale de la retranscription enregistrée.

La durée d'écoute de la retranscription enregistrée est calculée également en pourcentage par rapport à la durée totale du cours pour chaque discipline: d =100-E

Dans les tableaux 1, 2, 3, les * signalent que ces cours ont été enregistrés avec le magnétophone à enregistrement différé.

Note des tableaux:

(1): durée de l'enregistrement du cours en minutes
(2): durée de la prise de note enregistrée en minutes
(3): durée de la retranscription du cours en minutes
(4): durée de la retranscription enregistrée en minutes


TABLEAU 1: cours d'informatique

 

1

2

3

4

cours 1

180

78

110

17

*cours 2

180

75

100

15

cours 3

180

   

14

*cours 4

240

90

125

27

Total

780

   

73

      
* Réduction du temps d'écoute (E) = 90,64 %; (d) =9,26 %.


TABLEAU 2: cours de physiologie

 

1

2

3

4

cours 1

130

74

115

28

*cours 2

180

105

120

45

cours 3

180

90

135

34

*cours 4

180

115

120

52

Total mn

670

384

490

159

* Réduction du temps d'écoute (E) = 76,27 %; (d) = 23,73 %.

 

TABLEAU 3: cours de psychologie expérimentale

 

1

2

3

4

cours 1

120

72

115

22

*cours 2

120

82

85

28

cours 3

120

62

65

19

*cours 4

120

50

60

15

Total

480

266

325

84

      * Réduction du temps d'écoute (E) 82,5%; (d) = 17,5%.


Les résultats sont distingués en trois catégories:

  • les résultats relatifs à la réduction du temps d'écoute de la retranscription enregistrée (E et d);
  • ceux relatifs à la charge de travail supplémentaire occasionnée par la retranscription;
  • ceux relatifs à la comparaison des enregistrements avec les deux magnétophones (classique et prototype).

Les deux premières catégories de résultats sont princi palement de nature quantitative et s'expriment en unité de temps (minutes pour T, t ) et en pourcentage (E, d).

La troisième est à la fois de nature quantitative et qualitative.


A - PREMIÈRE CATÉGORIE DE RÉSULTATS: voir tableau 4

TABLEAU 4
(Récapitulation des tableaux 1, 2 et 3)

Discipline

T

t

E

d

         

Informatique  

780

73

90,64

9,26

Physiologie   

660

159

76,27

23,73

Psychologie   

480

84

82,50

17,50

 

Ces résultats montrent que le temps d'écoute de la retranscription enregistrée représente 10 à 25 pour cent de la durée totale du cours. Cette réduction du temps d'écoute de la retranscription peut dépendre de plusieurs facteurs:

  • la nature du cours; certaines matières nécessitent plus de démonstrations et de graphiques, de tableaux que d'autres et dans ce cas le temps de paroles est réduit;
  • la méthode du professeur; si le professeur écrit un maximum de données au tableau, le temps de paroles est plus faible;
  • la densité du cours;
  • la vitesse d'élocution du professeur;
  • la sélectivité de l'étudiant...


b - DEUXIÈME CATÉGORIE DE RÉSULTATS: voir tableau 5


TABLEAU 5
(durée du travail de retranscription)

Discipline

T (mn)

1 (mn)

2 (mn)

3 (%)

4 (%)

           

Informatique  

600

243

335

40,50

55,83

Physiologie   

670

384

490

57,31

73,13

Psychologie   

480

266

325

55,41

67,70

           


Dans le tableau 5, les colonnes T, 1 et 2 exprimées en minutes représentent le total des colonnes 1, 2 et 3 des tableaux 1, 2 et 3, respectivement pour chaque discipline.

Les colonnes 3 et 4 exprimées en pourcentage, représentent les pourcentages des colonnes 1 et 2 par rapport à la durée totale T des différents cours.

Ces résultats montrent que la durée d'écoute de l'enregistrement sélectif d'un cours représente en moyenne 50 pour 100 de la durée totale du cours (colonne 3). En conséquence, la durée de la retranscription (temps d'écoute de l'enregistrement auquel s'ajoute la durée des manipulations de ré-enregistrement) représente en moyenne 65 pour 100 de la durée totale d'un cours.


c - TROISIÈME CATÉGORIE DE RÉSULTATS: voir tableau 6

TABLEAU 6

 

Magnétophone  classique

 

Prototype

Discipline

1

2

3

 

1

2

3

               

Informatique  

43,3

61,1

8,6

 

39,3

53,6

10,0

Physiologie   

52,9

80,6

20,0

 

61,1

66,7

26,9

Psychologie   

50,8

72,9

15,4

 

60,0

62,5

19,6

Le tableau 6 rassemble les résultats des tableaux 1, 2 et 3 calculés en pourcentage par rapport à la durée totale des différents cours, en séparant les résultats obtenus avec le magnétophone classique et le magnétophone à enregistrement différé.

Les colonnes 1 du tableau 6 indiquent la durée moyenne de l'enregistrement (en pourcentage) par rapport à la durée du cours pour chaque discipline. La durée de l'enregistrement est en général plus longue avec le prototype qu'avec le magnétophone classique. Après analyse du contenu des enregistrements, cette différence correspond au fait que les phrases sont entières avec le prototype, tandis qu'elles sont incomplètes avec le magnétophone classique.

Les colonnes 2 indiquent le temps nécessaire pour effectuer le ré-enregistrement du cours en pourcentage par rapport à la durée totale du cours pour chaque discipline. Le temps mis pour le travail de ré-enregistrement est inférieur avec le prototype qu'avec le magnétophone classique.En effet, les phrases complètes, sans superposition de données, enregistrées avec le prototype, ne nécessitent pas des retours en arrière et des réécoutes répétées comme l'exige l'enregistrement avec le magnétophone classique.

Les colonnes 3 indiquent la durée d'écoute des ré-enregistrements (en pourcentage par rapport à la durée totale du cours) obtenus à partir des enregistrements avec le magnétophone classique ou le prototype. Ces durées sont en général légèrement supérieures pour les retranscriptions effectuées avec les enregistrements du prototype.

Une analyse qualitative des enregistrements a été effectuée afin de préciser les avantages ou inconvénients des deux types de matériel (voir discussion).

Considérant la phrase comme unité de base, cette analyse qualitative évalue l'intégrité des phrases enregistrées, la cohérence et la coordination des idées successives et enfin relève les segments de phrases ou de mots inutiles susceptibles de gêner la cohérence ou la compréhension de l'enregistrement.

4 - Discussion et caractéristiques de la prise de notes avec le magnétophone à enregistrement différé:

Les résultats quantitatifs de cette première étude exploratoire ont souligné quelques différences entre les deux techniques de prise de notes utilisant le magnétophone classique et le magnétophone à enregistrement différé. Une analyse qualitative des enregistrements a permis d'expliquer et de compléter ces résultats.

Avec le magnétophone à enregistrement différé, dont la mémoire-tampon est réglée à 2 secondes, trois avantages notables ont été remarqués:

  • la possibilité de sélectionner des phrases complètes dans un discours;
  • la possibilité de "recopier" plus rapidement (tableau 5 et 6) un enregistrement plus "propre", sans sur-ajout de données complémentaires;
  • la possibilité d'obtenir un enregistrement et un ré-enregistrement condensé légèrement plus long (tableau 4 et 6) mais plus complet qu'avec le magnétophone classique.

En outre, nous avons constaté que 2 secondes de délai (réglage de la mémoire-tampon) permettent de s'adapter plus facilement à la fluctuation du débit du locuteur qu'un délai de 5 secondes.

C'est probablement parce que ce délai de 2 secondes est mieux adapté à la capacité de la mémoire de travail de l'utilisateur (environ 2 secondes) que son emploi est plus aisé (voir les expériences suivantes).

Des entrevues avec des étudiants voyants ont permis de souligner qu'un décalage de 2 secondes environ par rapport à l'émission du professeur leur permet de s'adapter avec souplesse au rythme du discours. Si le délai entre ce qui est entendu et ce qui est écrit dépasse 2 secondes l'étudiant prend le risque d'oublier et d'omettre des informations. Si le délai est trop court, l'étudiant prend le risque de noter une information redondante ou inutile.

Pour prolonger l'analogie entre la prise de notes écrites et enregistrées, quelques remarques supplémentaires s'imposent .

En situation de prise de notes écrites ou enregistrées, les étudiants sont confrontés à deux tâches majeures qui font appel à la fois à l'attention, la perception et la mémoire. L'attention est indispensable à une bonne perception et une rétention efficace des informations à noter ou à enregistrer. La décision de noter ou de ne pas noter doit être prise le plus rapidement possible, sous peine de ne pouvoir conserver en mémoire à court terme, les éléments que l'étudiant souhaite écrire ou enregistrer(au moment où il déclenche l'enregistrement).

Cette phase est occupée par une répétition immédiate écrite ou verbale impliquant l'intelligibilité des mots. Cette première tâche, avant tout motrice et automatique, demande une certaine attention, mais ne nécessite pas de gros efforts de réflexion.

La seconde tâche accompagne la première: elle implique les mécanismes de l'attention, de la mémoire à court terme et à long terme et des processus cognitifs. Il importe en effet de comprendre le discours et d'effectuer un travail de réflexion afin d'évaluer la portée des idées énoncées pour les intégrer aux connaissances antérieures.

"Il y a conflit entre les efforts à faire pour se souvenir des informations arrivées il y a quelques instants et les processus impliqués dans la compréhension des données sensorielles qui nous parviennent à l'instant même...Dans un cours magistral, le fait de réfléchir à ce qui vient tout juste d'être dit, empêche d'être entièrement attentif à ce qui se dit au moment même. Ce conflit est attribuable aux limites de de la capacité humaine pour le traitement de l'information." (Lindsay et Norman 1980)

Dans la prise de notes aidée par l'enregistrement, une partie de l'attention peut être libérée au profit d'un effort accru dans la compréhension de l'énoncé à condition de maintenir une écoute active.


III - ÉTUDE EXPÉRIMENTALE AVEC DES ÉLÈVES DE QUATRIÈME

1 - Objectif et problématique:

Pendant le dernier trimestre de l'année scolaire 1986-1987, une étude exploratoire fut entreprise avec des élèves de quatrième de l'Ecole pour la Réadaptation des Déficients Visuels (E R D V ) de Loos.

L'objectif, essentiellement exploratoire de cette expérience, est d'évaluer la capacité des collégiens aveugles ou amblyopes, à utiliser le magnétophone à enregistrement différé pour la prise de notes en situation de cours.

Dans cette perspective, et compte tenu des études antérieures effectuées dans ce domaine (Ledru et Sizaire, 1985), trois questions principales sont à considérer:

  • les collégiens et les lycéens aveugles et amblyopes sont-ils capables d'effectuer une sélection de l'information avec ce système de prise de notes?
  • quelle sera la qualité des notes enregistrées avec ce matériel? L'enregistrement ne comportera-t-il pas trop de fragments de phrases qui pourraient nuire à la cohérence du discours et empêcher une bonne compréhension des notes enregistrées?
  • le temps d'écoute de l'enregistrement sera-t-il suffisamment réduit pour permettre une économie de temps appréciable aux réécoutes ultérieures?

Si les réponses à ces trois interrogations sont affirmatives, est-il alors possible, pour les élèves déficients visuels, d'utiliser directement, sans retranscription les notes enregistrées pour un apprentissage ou des révisions ultérieures?

Dans les classes de quatrième, en général, c'est le professeur qui gère l'activité de prise de notes. L'enseignant donne le plan à suivre; il signale les idées importantes à noter et les détails superflus à ne pas noter. Des observations dans des Collèges d'Enseignement Général ont montré que la quantité minimale d'information que le professeur souhaite voir dans les notes des élèves, à la fin d'une heure de cours, peut être consignée sur 4 à 6 minutes d'enregistrement (Ledru et Sizaire, 1985).

Ainsi, quand les élèves sont suffisamment sélectifs, il est possible de réduire de façon considérable le temps d'écoute de l'enregistrement des informations essentielles du cours.

Pour une capacité de la mémoire-tampon de 2 secondes, les élèves de quatrième aveugles et amblyopes seront-ils capables de sélectionner et d'enregistrer les phrases principales d'un cours? Ces phrases seront-elles complètes et intégrées dans l'enregistrement d'un discours global cohérent?

2 - Entrevues avec les élèves et le professeur principal:

Deux entrevues (d'une durée de trois heures au total), avec 6 élèves de quatrième aveugles et amblyopes et leur professeur principal, ont permis de souligner les difficultés auxquelles les enfants déficients visuels doivent faire face dans l'activité de prises de notes.

Selon les professeurs, tous les élèves déficients visuels sont confrontés de façon plus ou moins cruciale, à des problèmes pendant cette activité.

Le plan, les idées essentielles et le résumé sont dictés par le professeur. Les amblyopes, capables de se relire utilisent un crayon; les autres et les non voyants utilisent la tablette et le poinçon. Le professeur attend les élèves les plus lents: en général ceux qui ne sont pas encore bien familiarisés avec le braille abrégé. En effet l'écriture braille intégrale nécessite plus de temps que l'écriture avec le stylo. L'enseignant souligne aussi la difficulté pour corriger ou ajouter un mot en braille et la lenteur pour retrouver un mot dans une page écrite.Il note également le problème pour représenter des détails dans un schéma en relief.

Cette lenteur dans l'activité de prise de notes est d'autant plus gênante que la matière étudiée nécessite la notation d'un plus grand nombre d'informations: français, sciences humaines, sciences naturelles par exemple.

Les 6 collégiens sont volontaires pour participer à l'expérience.

Les trois prototypes sont mis à la disposition de trois collégiens; le quatrième reçoit un magnétophone classique et effectue en tant que sujet contrôle les mêmes séances d'entraînement que les sujets expérimentaux. Les deux autres élèves,l'une amblyope, écrivant en noir, l'autre aveugle très habile en écriture braille assistent en spectateurs à la première séance d'apprentissage de leurs camarades.

La moyenne d'âge des quatre élèves: 3 sujets expérimentaux (2 filles, l'une aveugle, l'autre amblyope et 1 garçon aveugle), 1 sujet contrôle (fille), est de 14 ans 6 mois, avec une variation s'échelonnant entre 12 ans 9 mois et 15 ans 9 mois.

L'histoire de la déficience visuelle varie beaucoup d'un sujet à l'autre. Les résultats scolaires de ces élèves sont très différents et selon l'appréciation des professeurs cet ensemble comprend à peu prés tous les niveaux de réussite: bon, assez bon, moyen et faible.

3 - Les deux séances d'apprentissage:

Deux séances d'apprentissages et d'entraînement sont organisées dans le but de faire comprendre le principe du matériel d'une part, et la manière d'utiliser l'enregistrement différé en situation de prise de notes, d'autre part.

Chaque séance, d'une durée d'une heure comporte plusieurs séries d'exercices destinés à apprendre à segmenter le discours en séquences pré-déterminées et à sélectionner les segments à enregistrer.

Quelques exemples d'exercices:

  • dans une suite de chiffres de 1 à 50, enregistrer les chiffres entre 20 et 30 et la portion entre 35 et 45.
  • dans la suite de chiffres et de lettres suivante: a B C D E 1 2 3 4 5 F G H I J 6 7 8 9 10 K L M N O 11 12 13 14 15 P Q R S T 16 17 18 19 20 U V W X Y 21 22 23 24 25, enregistrer uniquement les chiffres.
  • dans la suite précédemment décrite, enregistrer
  • uniquement les lettres.
  • dans la suite de chiffres et de lettres suivantes: 1 2 3 a B C D E F G 4 5 6 H I J 7 8 9 K L M N 10 11 12 13 O P Q 14 15 16 17 R S T U V 18 19 20 W X Y Z, enregistrer toutes les lettres, puis tous les chiffres.
  • dans une comptine dans laquelle un vers est répété plusieurs fois, enregistrer uniquement ce vers: dans notre exemple, "La biche brame au clair de lune".

Ces exercices sont distribués dans un ordre de difficulté croissante. Dans la première séance, la capacité de la mémoire-tampon est réglée sur 2 secondes. Dans la deuxième séance, cette capacité est réglée sur 5 secondes.

Les observations effectuées durant ces deux séances d'entraînement, ont permis de déterminer les conditions de l'expérimentation en situation de cours.

En effet, l'apprentissage est nettement plus facile lorsque la mémoire-tampon est réglée à 2 secondes que lorsqu'elle est réglée à 5 secondes. a 2 secondes, les trois sujets expérimentaux réussissent dés les premiers essais, à enregistrer les séquences sélectionnées, avec parfois un mot superflu; mais très rapidement, et souvent dés le deuxième ou troisième essai, l'enregistrement demandé est parfait.

En ce qui concerne le sujet-contrôle, les résultats sont éloquents. Sauf pour les séquences pour lesquelles l'élève peut s'attendre à ce qui suit (suite croissante de chiffres, séquences alternées et régulières de chiffres et de lettres), pour lesquelles le sujet-contrôle peut anticiper la suite du discours et obtenir un enregistrement convenable, pour les exercices plus difficiles, (portions non prévisibles, phrase), les segments enregistrés sont incomplets. Il manque, dans ce cas un ou deux mots selon la vitesse de l'enregistrement.

Avec une mémoire-tampon de 5 secondes, l'apprentissage est plus difficile. Il semblerait que les collégiens aient des difficultés à évaluer ce qui peut être énoncé en 5 secondes et surtout à situer à postériori la portion du discours par rapport à la séquence temporelle de 5 secondes. Si bien, qu'en général, les sujets déclenchent trop tôt le système et les quelques mots (2 à 5) qui précédent le début de la phrase sélectionnée sont enregistrés. a la réécoute ces fragments de phrases rendent l'énoncé moins cohérent et surtout moins compréhensible et cela d'autant plus que le thème de l'enregistrement est peu familier à l'auditeur.

Afin que les notes enregistrées puissent être réutilisées directement par l'élève, il est souhaitable d'éviter l'adjonction de ces portions de discours inutiles . Pour cela, un entraînement plus long serait nécessaire.

En raison des conditions de déroulement des cours dans lesquelles le professeur signale aux élèves les informations à noter, la capacité de la mémoire-tampon est réglée à 2 secondes pour la suite de l'expérimentation.

4 - Expérimentation en situation de cours:

En accord avec le directeur de l'établissement, pour éviter toute perturbation des élèves dont l'emploi du temps est extrêmement chargé, l'étude expérimentale s'est déroulée pendant les deux derniers cours de géographie de l'année scolaire.

Après avoir introduit le sujet du cours, (Le tourisme sur la côte méditerranéenne), l'enseignante expose de façon détaillée la première partie du cours; elle donne des explications complètes des mots difficiles, aide les élèves à trouver les points de repères sur des cartes grand format pour les amblyopes, en relief pour les aveugles. Le cours est divisé en plusieurs grands points, à la fin des explications données pour chacun d'entre eux, le professeur dicte les idées principales à retenir. Elle lit une phrase complète, puis reprend cette phrase par bribes et à plusieurs reprises jusqu'à ce que les élèves les plus lents aient fini de noter.

Le professeur dicte ensuite la phrase suivante selon le même procédé. Plusieurs idées, titres et sous-titres sont ainsi énoncés, parfois épelés pour les mots difficiles et les noms propres. Le paragraphe suivant est alors expliqué et le résumé dicté. Pour l'élève, le déroulement du cours comporte donc des phases d'écoute alternant avec des phases de prise de notes (dictées).

Les collégiens participant à l'expérience ont pour consigne d'enregistrer uniquement ce qu'ils noteraient et ce que doivent noter leur camarades (en noir ou en braille) pour apprendre le cours. Il leur est conseillé de ne pas prendre de mots superflus qui allongeraient le temps d'écoute inutilement.rappelons que la durée d'un cours est de 1 heure.

5 - Les résultats:

Pour cette étude exploratoire, ne comportant que deux séances de cours, seules, la mesure de la durée de l'enregistrement pour chacun des élèves et l'analyse qualitative du contenu de chaque enregistrement, sont effectuées.

Le tableau 7 présente la durée d'écoute des notes enregistrées par les trois sujets expérimentaux avec les magnétophones à enregistrement différé et par le sujet contrôle avec le magnétophone classique.

TABLEAU 7

 

cours 1

cours 2

 

en minutes et secondes

*sujet 1

3 mn 40 s

3 mn 00 s

*sujet 2

4 mn 20 s

3 mn 02 s

*sujet 3

4 mn 00 s

3 mn 05 s

*sujet 4
controle

3 mn 30 s

2 mn 47 s

Le tableau 7 montre que la durée de d'écoute des notes enregistrées par les élèves varie légèrement pour les trois sujets utilisant un prototype (noté par *), mais cette durée est nettement inférieure pour les notes enregistrées par l'élève contrôle avec le magnétophone classique (sujet 4).

L'analyse qualitative du contenu des enregistrements explique cette variation.

En effet, les sujets expérimentaux ont tous enregistré des phrases complètes. Ces sujets ont été sélectifs et ont essayé de réduire le temps d'enregistrement au minimum. Toutefois, le sujet 1 a omis d'enregistrer le plan du premier cours: titre des paragraphes, les a, b, c, des sous-titres. Ce sujet n'a pas enregistré volontairement l'épellation de certains mots (qu'elle connaissait pour certains d'entre eux). Ces omissions volontaires ou non expliquent la durée plus faible de l'enregistrement par rapport à la durée des enregistrement des sujet 2 et 3.

Malgré ces quelques omissions,les notes enregistrées par les trois sujets expérimentaux (enregistrement parfait pour le second cours), peuvent être utilisées directement et ne nécessitent pas de retranscription, les points essentiels de l'énoncé étant enregistrés intégralement et le discours étant parfaitement cohérent.

En ce qui concerne le sujet contrôle,qui déclenche l'enregistrement dès les premières paroles, un à deux mots sont souvent perdus en début de phrase.

Citons quelques exemples de mots "perdu": des articles (un, le, des ...), le mot "après" dans la phrase "Après la seconde guerre mondiale", le mot "soixante" dans "soixante dix millions d'européens.."; "mille neuf cent trente" dans "mille neuf cent trente six: les congés payés.."

Pour réutiliser ces notes, une retranscription avec corrections et compléments d'information s'impose.

6 - Discussion et conclusion:

Pendant le premier cours, les sujets se sont attachés à sélectionner l'information qu'ils enregistrent, considérant comme unité de base la phrase. Les trois collégiens qui ont à leur disposition un magnétophone à enregistrement différé, réussissent parfaitement cette tâche, tandis que l'élève qui possède un magnétophone classique doit procéder à une retranscription pour corriger et compléter les notes enregistrées.

En effet, les pertes répertoriées dans le contenu de l'enregistrement de l'élève-contrôle ne sont pas négligeables.

Quand les mots "perdus" sont des articles, des mots d'introduction, de coordination ou de liaison, la signification de la phrase n'est pas trop perturbée du moins dans les cas rencontrés et la perte d'information est minimale. Mais quand les mots placés en début de phrase expriment une information importante (date, lieu, nombre, complément de temps...) ou modifient le sens d'une phrase, leur élimination ne peut être sans conséquence sur la compréhension et la cohérence de la suite du discours.

Avant le déroulement de la deuxième séance de cours, nous avons donné une appréciation sur le premier enregistrement à chacun des sujets. Nous avons également insisté sur l'importance des indices de plan dans l'organisation et la classification des idées de tout énoncé. Deux des sujets avaient en effet volontairement omis d'enregistrer les indices du plan et parfois même les titres (sujet 1 et sujet contrôle 4).

Pendant le second cours, l'attention de tous les élèves s'est portée à la fois sur l'énoncé des phrases et du plan.

Cette mise au point explique l'excellente qualité de l'enregistrement obtenu par les sujets expérimentaux pour le deuxième cours.

L'élève contrôle, a également bénéficié de ces nouvelles indications et l'effet de l'exercice a modifié ses stratégies d'enregistrement et diminué son temps de réaction (temps entre le début d'une phrase à enregistrer et le déclenchement de l'enregistrement). Toutefois, pour être utilisables, les notes enregistrées nécessitent encore quelques compléments d'information (nom de villes, par exemple). Ces quelques pertes d'information expliquent la différence de 18 à 23 secondes entre la durée des notes enregistrées par ce sujet contrôle et la durée d'écoute des enregistrements des sujets expérimentaux.

Les résultats de cette expérience présentent un intérêt pour l'étude des possibilités d'aide à la prise de notes chez les déficients visuels.

Dans cette classe de quatrième, où les informations essentielles sont dictées aux élèves, la prise de notes au magnétophone est relativement facile dans la mesure où le professeur prévient "maintenant vous pouvez notez". Ainsi avec un élève bien exercé et quelques compléments d'informations, le magnétophone classique pourrait être une aide à ne pas négliger pour l'enfant aveugle accidentel qui ne peut maîtriser le braille avant une longue période d'adaptation ou pour tout enfant déficient visuel ayant des difficultés dans la pratique de l'écriture braille.

La supériorité du magnétophone à enregistrement différé sur le magnétophone classique réside dans sa capacité à mémoriser l'information pendant 2 secondes, lui attribuant ainsi une véritable "capacité d'anticipation" dont est dépourvu le magnétophone classique.

IV - EXPÉRIENCE AVEC DES LYCÉENS

1 - Objectif et problématique:

Si, dans les petites classes, c'est l'enseignant qui dirige l'activité de prise de notes, peu à peu les élèves doivent accroître leur autonomie dans ce domaine. Ainsi, dès la seconde, et parfois plus tôt (selon les établissements), les lycéens doivent sélectionner l'information, c'est-à-dire choisir dans le discours du professeur, les éléments essentiels et pertinents qui se rapportent à un thème donné et qui leur seront utiles pour pouvoir apprendre et restituer cette information.

En outre la quantité d'information à prendre en compte, ne se réduit plus à 4 ou 5 minutes de notes par heure de cours et le débit du professeur est plus rapide.

À partir de la seconde, un bon nombre d'adolescents aveugles et amblyopes sont intégrés dans des classes de voyants et sont forcés de s'adapter au mieux au rythme imposé par le professeur lui-même guidé par le niveau moyen de l'ensemble de la classe.

Compte tenu de ces contraintes supplémentaires: quantité et qualité de l'information à respecter, rythme plus rapide à suivre, le lycéen aveugle intégré dans une classe de voyants pourrait-il bénéficier de l'aide de l'enregistrement dans l'activité de prise de notes?

Pour évaluer cette possibilité, nous nous sommes placés dans des conditions expérimentales plus difficiles qu'en situation de cours.

En effet, dans notre situation expérimentale, le débit de la parole du locuteur est plus élevé que le débit moyen de parole d'un professeur, et pour les deux premières séances les thèmes proposés sont totalement inconnus des adolescents.

Dans de telles conditions, le magnétophone à enregistrement différé permet-il d'effectuer une sélection correcte de l'information?

  • les phrases enregistrées par les lycéens sont-elles complètes et contiennent-elles l'information principale?
  • les fragments de phrases et les informations superflues sont-ils réduits au minimum?
  • les notes enregistrées mènent-elles à un discours cohérent et compréhensible permettant une utilisation directe de l'enregistrement pour une réécoute ou un apprentissage ultérieur.

2 - Entrevues avec les lycéens et le conseiller d'éducation

Des rencontres avec des lycéens aveugles et amblyopes du lycée polyvalent de Beaupré à Haubourdin, sont organisées dans le but de mettre en évidence les difficultés éventuelles des déficients visuels pour s'adapter au rythme des voyants.

Plusieurs entretiens avec 6 lycéens , deux filles et trois garçons en classe de seconde, un garçon en terminale, ont rapidement orienté les investigations dans le domaine de l'acquisition de l'information.

En effet, les adolescents apprennent rapidement à s'orienter dans l'établissement seuls et à acquérir une autonomie totale de déplacement. La communication avec les professeurs et leurs camarades voyants est relativement aisée et dépend avant tout de la personnalité des uns et des autres. Les principales difficultés des lycéens non voyants résident donc dans l'accès à l'information.

En raison de la lenteur de l'écriture braille pour certains aveugles et des difficultés à se relire, rencontrées par quelques lycéens amblyopes, les lycéens déficients visuels sont tous plus ou moins confrontés aux problèmes posés par la prise de notes. En général, ils sont amenés à compléter leurs informations, le soir, dans le collège spécialisé qui les héberge. En outre, ce collège met à leur disposition les aides techniques et matérielles nécessaires à la transcription en braille de textes imprimés (énoncés de devoirs, sujets de contrôle...). Des séances de soutien et d'aide sont dispensées par une éducatrice spécialisée.

Des professeurs signalent que la prise de notes avec la tablette braille est assez bruyante quand plusieurs élèves aveugles sont placés dans une même salle de cours.

Les lycéens soulignent que les matières présentant le plus de difficultés concernant la prise de notes sont le français, les sciences humaines et les sciences naturelles.

3 - Les séances d'apprentissage:

À la suite des entretiens, 6 lycéens ont accepté d'expérimenter le magnétophone à enregistrement différé. Ces adolescents n'avaient pas eu de problèmes d'audition, mais n'avaient jamais utilisé le magnétophone pour travailler: prendre des notes ou apprendre un texte. Certains avaient utilisé l'enregistrement pour écouter des romans.

Pendant la première séance d'apprentissage, nous suggérons aux lycéens la possibilité de prendre des notes à l'aide d'un magnétophone . Les réactions sont assez variées.

Pour certains, cette idée leur semble totalement dépourvue de vraissemblance et au mieux assez difficile à réaliser; pour d'autres c'est une idée originale qu'ils aimeraient tenter, mais ils craignent que les enseignants ne soient pas d'accord pour être enregistrés; pour d'autres enfin l'enregistrement pourrait être d'une grande utilité et faire gagner beaucoup de temps, mais ils se demandent s'il est aussi facile d'apprendre en écoutant les notes enregistrées qu'en lisant (tactilement ou visuellement) les notes écrites.

Malgré des avis partagés, les six adolescents volontaires sont très intéressés par l'expérience. L'histoire du handicap, les difficultés rencontrées et le niveau de réussite scolaire sont très variables selon les sujets.

Pendant la première séance d'apprentissage, le principe du magnétophone à enregistrement différé est expliqué et les exercices décrits antérieurement sont effectués, la mémoire- tampon étant d'abord réglée à 2 secondes, puis à 5 secondes.

Pendant la seconde séance, l'entraînement est complété pour le réglage de la mémoire-tampon à 5 secondes. En effet si la maîtrise du matériel est acquise très rapidement avec la mémoire-tampon réglée à 2 secondes, cette acquisition nécessite un apprentissage plus long avec 5 secondes.

Les différentes étapes de l'expérimentation sont décrites en partie et les tâches qui seront à effectuer sont expliquées en détail dès cette seconde séance.


4 - Expérimentation en laboratoire:

a - Les sujets:

Les trois sujets expérimentaux, deux garçons aveugles et un garçon amblyope et le sujet contrôle (une fille amblyope) ont une moyenne d'âge de 17 ans, s'échelonnant entre 16 ans et 18 ans 3 mois.

Ces quatre adolescents fréquentent deux classes de secondes avec des lycéens voyants. Pour l'un d'entre eux (aveugle) les résultats scolaires sont bons, pour les trois autres moyens (appréciation donnée par le conseiller d'éducation).

b - Le matériel:

Les trois sujets expérimentaux ont chacun à leur disposition un magnétophone à enregistrement différé et le sujet contrôle utilise un magnétophone classique dont les facilités d'accès et de manipulation sont équivalentes à celles des prototypes.

Quatre textes sont enregistrés sur cassette à l'aide d'un magnétophone Sony:

  • les deux textes a et B sont lus par une même voix masculine dont le débit de la parole est en moyenne de 110 mots par minutes.
  • les deux textes C et D sont lus par une autre voix masculine dont le débit de la parole est en moyenne de 120 mots par minute (débit de la parole conversationnelle).

Les enregistrements a (Les bonzai) et B (Le chant des oiseaux) sont obtenus à partir d'articles de la revue"ça m'intéresse" (respectivement numéros 50 d'Avril 1985 et 65 de Juillet 1986). La revue et les informations contenues dans ces articles ne sont pas connues par les adolescents.

Les enregistrements C (Les mégalithes: dolmen et menhir) et D (La terre) sont des séquences d'une "revue parlante", envoyée par la Ligue Braille de Bruxelles aux jeunes aveugles qui en font la demande. Ces articles ne sont pas connus par les sujets de notre expérience, mais contrairement aux articles a et B dont les thèmes sont totalement ignorés des sujets, les thèmes des articles C et D sont bien connus des élèves de seconde.

Dans ces quatre articles, les phrases principales (information essentielle opposée à l'information superflue) ont été sélectionnées par la "méthode des juges". Trois personnes (les juges) ont trié séparément les phrases essentielles des phrases superflues, puis se sont consultées pour décider du choix à retenir en cas de litige.

c - La tâche et la consigne:

La tâche consiste à sélectionner et à enregistrer les phrases essentielles d'un discours parlé ( a B C ou D).

La consigne est exposée de la façon suivante:

""Vous allez entendre un texte dont le titre est le suivant (est alors énoncé le titre de l'article enregistré a B C ou D correspondant à la séance en cours).

Vous aurez à enregistrer toutes les phrases que vous estimerez être principales dans ce texte. Pour guider votre choix, vous pouvez considérer comme "principales" toutes les phrases qui apportent une information nouvelle et importante en rapport avec le thème du texte, c'est-à-dire toutes les phrases à partir desquelles vous pourriez obtenir l'information nécessaire à l'élaboration d'un résumé.

Vous ne devez pas enregistrer les idées qui se répètent ou qui contiennent des détails que vous n'estimeriez pas importants à retenir lors d'un apprentissage.

Essayez de n'enregistrer que des phrases complètes. Evitez d'enregistrer des fragments de phrases afin que toutes les portions enregistrées puissent former un énoncé cohérent, c'est-à-dire de telle sorte qu'une personne naïve, ne connaissant pas cet article, puisse comprendre les idées essentielles du texte en écoutant votre enregistrement.""

Pour chaque enregistrement de chaque sujet, le nombre de phrases principales et le nombre de phrases superflues sont répertoriés et comparés aux nombres de phrases principales et superflues du texte d'origine.

d - La passation:

L'expérimentation s'est déroulée en quatre séances. Chaque séance comporte les étape suivantes:

  • une période de mise en route durant laquelle les sujets doivent sélectionner et enregistrer des portions de discours bien déterminées.
  • une phase de questionnaire pendant laquelle le titre du texte est d'abord énoncé; puis quelques questions sont posées à chaque sujet: "Avez-vous déjà entendu parler de cela? Si oui, que pouvez-vous en dire? Si non, avez-vous une idée de ce que cela peut être, ou de ce qui peut être dit sur ce thème?
  • une phase pendant laquelle la consigne est exposée. Si les sujets le souhaitent quelques explications supplémentaires sont données.
  • la phase d'expérimentation proprement dite, dont la durée varie selon le temps d'écoute des différents textes, commence alors.

La prise de notes est d'abord effectuée avec une capacité de la mémoire-tampon réglée à 2 secondes, puis à 5 secondes.

Chaque séance expérimentale dure en moyenne une heure. Les quatre séances se sont déroulées sur une période de un mois, à raison d'une séance par semaine.

5 - Les résultats:

Les résultats, (les nombres de phrases principales et superflues pour chaque enregistrement) ont été recueillis uniquement pour les sujets expérimentaux ayant utilisé la mémoire-tampon de 2 secondes. En effet en raison de leurs obligations scolaires, tous les sujets n'ont pu enregistrer tous les textes avec la capacité de la mémoire-tampon de 5 secondes. Toutefois l'analyse qualitative est effectuée pour tous les enregistrements que nous possédons.

Les résultats quantitatifs n'ont pu être exprimés pour le sujet contrôle; la majorité des phrases enregistrées étant incomplètes, le tri correct entre les phrases principales et superflues est pratiquement impossible.

TABLEAUX DE RÉSULTATS

Élèves aveugles et amblyopes en seconde. Les thèmes des texte A et B sont inconnus pour les élèves. Ils enregistrent des informations tout-à-fait nouvelles pour eux.

Première séance: TABLEAU 8

 

Texte A

Sujet 1

Sujet 2

Sujet 3

Durée d'écoute en secondes

625

195

105  

292  

nombre phrases essentielles

24

19

14  

24

nombre phrases superflues   

37

6

2

13  

nombre total de phrases

61

25

16

37

 

Deuxième séance: TABLEAU 9

 

Texte B

Sujet 1

Sujet 2

Sujet 3

Durée d'écoute en secondes

780

285

250

390  

nombre phrases essentielles

29

29

23

29

nombre phrases superflues   

63

11

3

25

nombre total de phrases

92

40

26

54

  

Les thèmes des textes C et D sont connus des élèves. Ils enregistrent des informations qui leur sont familières.

Troisième séance: TABLEAU 10

 

Texte C

Sujet 1

Sujet 2

Sujet 3

Durée d'écoute en secondes

540

130

168

245

nombre phrases essentielles

21

12

14

21

nombre phrases superflues   

42

2

0

8

nombre total de phrases

63

14

14

29

 

Quatrième séance: TABLEAU 11

 

Texte D

Sujet 1

Sujet 2

Sujet 3

Durée d'écoute en secondes

300

102

83

115

nombre phrases essentielles

15

14

11

15

nombre phrases superflues   

28

1

0

1

nombre total de phrases

43

15

11

16


Données des 3 sujets transformées en pourcentages par rapport aux paramètres des textes A, B, C et D


1- Pourcentages par rapport au texte A
TABLEAU 12

   

Sujet 1

Sujet 2

Sujet 3

Durée d'écoute

 

31,2

16,8

46,72

phrases essentielles

 

79,16

58,33

100

phrases superflues   

 

16,22

5,4

35,13

phrases totales

 

40,98

26,23

60,65

 

2-Pourcentages par rapport au texte B
TABLEAU 13

   

Sujet 1

Sujet 2

Sujet 3

Durée d'écoute

 

36,54

32,05

50

phrases essentielles

 

100

79,31

100

phrases superflues   

 

17,46

4,76

39,68

phrases totales

 

43,48

28,26

58,7

 

3-Pourcentages par rapport au texte C
TABLEAU 14

   

Sujet 1

Sujet 2

Sujet 3

Durée d'écoute

 

24,07

31,11

45,37

phrases essentielles

 

57,14

66,66

100

phrases superflues   

 

4,76

0

19,05

phrases totales

 

22,22

22,22

46,03

  

4-Pourcentages par rapport au texte D
TABLEAU 15

   

Sujet 1

Sujet 2

Sujet 3

Durée d'écoute

 

34

27,66

38,33

phrases essentielles

 

93,33

78,57

100

phrases superflues   

 

3,57

0

3,57

phrases totales

 

34,88

15,58

37,21

 

TABLEAU 16

Temps d'enregistrement: pourcentage du temps d'enregistrement des notes enregistrées par les sujets par rapport à la durée d'écoute des textes A et B.

Indice T: Taux moyen (pour les textes A et B) du nombre de phrases essentielles enregistrées par les sujets par rapport au nombre total des phrases essentielles.

Indice S: Taux moyen (pour les textes a et B) de phrases essentielles enregistrées par chaque sujet par rapport au total des phrases enregistrées.

 

Données pour texte A + texte B:

   

Sujet 1

Sujet 2

Sujet 3

Temps ( en mn) d'enregistrement

 

33,87

24,40

48,36

Indice T (A,B)

 

89,58

68,82

100,00

Indice S (A,B)

 

73,85

88,10

58,24

 

TABLEAU 17
Données pour Texte C + Texte D:

   

Sujet 1

Sujet 2

Sujet 3

Temps ( en mn) d'enregistrement

 

29,04

29,39

41,85

Indice T (A, B)

 

75,23

72,26

100,00

Indice S (A, B)

 

89,66

100,00

80,00

   

Fig. 2: diagrammes (texte A)

Fig. 3: diagrammes (texte B)

Le thème des textes A et B est inconnu des lycéens. Chaque figure comporte 3 groupes de 4 colonnes pour les sujets 1, 2 et 3.

LEGENDE:

Colonne 1 (en hachures): Pourcentage du temps d'écoutes des notes enregistrées par rapport au temps d'écoute du texte entier.

Colonne 2 (en pointillés): Pourcentage du nombre total de phrases enregistrées par rapport au nombre total de phrases dans le texte.

Colonne 3 (en blanc): Pourcentage du nombre de phrases essentielles enregistrées par rapport au nombre de phrases essentielles du texte.

Colonne 4 (en noir): Pourcentage du nombre de phrases superflues enregistrées par rapport au nombre de phrases superflues du texte.

Fig. 4: diagrammes (texte C)

Fig. 5: diagrammes (texte D)

Les thèmes des textes C et D sont bien connus des lycéens.

Chaque figure comporte 3 groupes de 4 colonnes pour chacun des 3 sujets expérimentaux (1, 2 et 3).

LEGENDE: La légende est la même que celle des figures 2 et 3.

 

Fig. 6: diagrammes (textes a et B)

Fig. 7: diagrammes (textes C ET D)

Chaque figure comporte 3 groupes de 3 colonnes pour chacun des sujets 1, 2 et 3.

LEGENDE:

Colonne 1 (en noir): Pourcentage du temps d'écoute des notes enregistrées par rapport au temps d'écoute des 2 textes (a et B pour la figure 6 , C et D pour la figure 7).

Colonne 2 INDICE T (en pointillés): Pourcentage des phrases essentielles enregistrées par chaque sujet par rapport aux phrases essentielles des textes a et B (Fig. 6), C et D (Fig. 7).

Colonne 3 INDICE S (en blanc): Pourcentage des phrases essentielles enregistrées par chaque sujet par rapport au nombre total de phrases enregistrées des textes a et B (Fig 6) , C et D (Fig. 7).

La quantité de fragments de discours ou de phrases incomplètes enregistrés par chaque sujet quand la capacité de la mémoire-tampon est 2 secondes, est inférieure à 2 pour cent par rapport à l'ensemble des phrases enregistrées. Ce nombre, considéré comme négligeable, est additionné au nombre de phrases superflues.

Les tableaux 8 et 9 et les tableaux 10 et 11 , dans lesquels sont exprimés pour le texte d'origine et pour les notes enregistrées de chaque sujet, la durée d'écoute de l'enregistrement, le nombre de phrases essentielles, de phrases superflues et de phrases totales, met en évidence trois points essentiels:

  • la durée d'écoute des notes enregistrées est inférieure à la durée d'écoute des textes originaux;
  • le nombre de phrases essentielles semble être relativement important par rapport au nombre de phrases enregistrées et au nombre de phrases essentielles des textes originaux;
  • le nombre de phrases superflues est relativement faible par rapport au nombre de phrases essentielles enregistrées et au nombre de toutes les phrases enregistrées.

Pour objectiver ces données, le nombre de phrases essentielles, superflues et totales est respectivement exprimé en pourcentage par rapport au nombre de phrases essentielles, superflues et totales des textes originaux. De plus, les données pour les textes a et B d'une part, les textes C et D d'autre part, sont rassemblées.

Les diagrammes fig 2 et 3 illustrent les données des tableaux 12, 13 et 14 et 15 . Ils différencient les tendances des lycéens par rapport à la sélection de l'information.

Les diagrammes fig 6 et 7 illustrent les données des tableaux 16 et 17 . Ils mettent en évidence la sélectivité des sujets expérimentaux.

6 - Discussion et conclusion:

Cette expérience, réalisée en laboratoire avec quatre lycéens aveugles et amblyopes, s'est déroulée en 6 séances.

Dans les deux premières séances d'apprentissage, il est noté que les lycéens réussissent la sélection et l'enregistrement des séquences, dès les premiers essais, quand la capacité de la mémoire-tampon est de 2 secondes, mais nécessite un apprentissage plus long pour une capacité de la mémoire-tampon de 5 secondes.

Ainsi, bien que plus âgés, les lycéens semblent avoir également des difficultés à évaluer ce qui peut être dit en 5 secondes ou encore à apprécier la durée d'une séquence temporelle de 5 secondes.

L'analyse qualitative des notes enregistrées à partir du texte A, quand la mémoire-tampon est réglée à 5 secondes, souligne aussi cette difficulté. En effet, les notes enregistrées par les sujets expérimentaux pour une seconde écoute du texte a avec une mémoire-tampon de 5 secondes, contiennent beaucoup plus de phrases incomplètes (plus de 5 pour cent) que les notes enregistrées avec la mémoire-tampon de 2 secondes.

Les réponses aux questions posées sur les impressions et les stratégies des sujets traduisent que les élèves ont des difficultés à "localiser" une portion de discours dans une séquence temporelle, si cette séquence temporelle est supérieure à 2 secondes.

La prise de notes enregistrées ou écrites implique les mécanismes de l'attention,de la perception et de la mémoire. Elle nécessite à la fois la compréhension du discours et une prise de décision concernant les derniers mots énoncés:

  • apportent-ils des éléments importants?
  • constituent-ils une information essentielle et pertinente par rapport à l'ensemble de l'énoncé précédemment émis, par rapport au thème du cours et aux connaissances antérieures de l'élève?

Les mots prononcés par le professeur sont retenus par l'élève en mémoire à court terme dont la capacité est limitée. Cette limitation concerne d'une part le nombre des éléments stockés (5 à 6) et d'autre part la durée de la rétention: "l'oubli en mémoire à court terme tient autant d'une dégradation due au temps, que d'une interférence produite par la présentation de matériel nouveau" (Lindsay et Norman 1980, p. 315 à 318.

Nous rappelons que la mémoire à court terme se rapporte à l'étape où sont conservées pendant un temps relativement bref les informations dont le sujet a besoin temporairement ou qu'il essaie d'organiser pour être stockées de façon permanente.

Or, la trace mnésique de la mémoire à court terme se dégrade rapidement (qualitativement et quantitativement) après 2 secondes de rétention.

Dans notre expérience, il semble que la capacité réglée à 2 secondes de la mémoire-tampon du magnétophone à enregistrement différé est particulièrement bien adaptée à la capacité de rétention de la mémoire de travail des sujets expérimentaux. Ce qui expliquerait pourquoi les sujets ont des difficultés dans la prise de notes quand la mémoire- tampon du prototype est réglée à 5 secondes.

Etant donné le débit de la parole du locuteur (en moyenne de 120 mots par minutes) pour les textes présentés aux sujets de l'expérience, 4 à 5 mots sont émis pendant ce laps de temps de 2 secondes. Ainsi, la facilité avec laquelle tous les élèves ont pu utiliser le magnétophone à enregistrement différé quand la mémoire-tampon est réglée à 2 secondes, semble être expliquée par la limitation (dans le temps et dans le nombre d'éléments retenus) de la capacité de la mémoire de travail.

Les 5 premiers mots d'une phrase sont-ils suffisants pour juger la valeur de cette phrase? Compte tenu des résultats obtenus avec les trois sujets expérimentaux, il semblerait que le magnétophone à enregistrement différé ait permis une sélection convenable de l'information. En effet, pour les textes a et B dont les thèmes sont totalement inconnus des lycéens, l'indice T, représentant le taux de phrases essentielles enregistrées par rapport au nombre de phrases essentielles du texte est en moyenne de 86 pour 100 (variant de 69 à 100 pour 100 selon les sujets); l'indice S représentant le taux de phrases essentielles enregistrées par rapport au nombre de phrases totales enregistrées par les sujets est en moyenne de 73 pour 100 (variant de 58 à 88 pour 100 selon les sujets). Ces données prouvent que les sujets ont procédé à une sélection de l'information. La comparaison des deux indices met en évidence une plus grande sélectivité chez le sujet 2 et une moindre sélectivité chez le sujet 3. De plus la comparaison des indices T et S pour les textes a et B d'une part et les textes C et D d'autre part montrent que ces indices sont plus élevés pour les textes dont les thèmes sont bien connus des lycéens: la sélection des notes enregistrées est meilleure quand le thème du discours est familier pour l'élève.

D'un point de vue qualitatif, pour les trois sujets expérimentaux qui utilisent le magnétophone à enregistrement différé, toutes les phrases enregistrées sont complètes à quelques exceptions près. L'analyse des portions de phrases et le questionnaire des sujets ont montré qu'en fait les fragments sont des propositions entières ayant une signification et contenant des éléments informatifs que le sujet souhaite conserver. En outre présentés à des sujets "naïfs", ne connaissant pas les textes originaux, les différents enregistrements condensés sont jugés cohérents et compréhensibles (présentant une suite d'idées logiques);

En ce qui concerne les enregistrements du sujet contrôle, utilisant un magnétophone classique, la plupart des phrases sont incomplètes: un à trois mots sont absents en début de phrase, donnant à celle-ci une signification différente ou la rendant peu compréhensible. De plus,la succession de ces portions de phrase produisent un enregistrement hâché et incohérent, rendant la majorité du discours enregistré incompréhensible. En outre cette succession de fragments de phrases a rendu impossible l'analyse quantitative des enregistrements.

Après quelques minutes de pratique, les sujets expérimentaux disaient "se sentir plus détendus pour réfléchir à la phrase à enregistrer".

V - CONCLUSION

Nos investigations et les expériences en situation de cours et de laboratoire effectuées avec des collégiens et des lycéens aveugles et amblyopes, ont validé notre hypothèse sur la mémoire à court terme d'une part et ont prouvé d'autre part que l'enregistrement pourrait être un moyen de prendre des notes.

En ce qui concerne la mémoire à court terme, deux explications semblent justifier nos résultats. La première est le choix de la capacité de la mémoire-tampon du magnétophone à enregistrement différé qui a été guidé par les résultats des recherches sur la mémoire de travail: la plupart des auteurs situent la limite temporelle de la mémoire à court terme entre 1,5 et 2 secondes. La deuxième est associée au nombre de mots émis par le locuteur en 2 secondes. Le locuteur, ici le professeur en situation de cours, émet au maximum 6 mots en 2 secondes, ce qui est en accord avec le chiffre 7 plus ou moins 2 de Miller. La combinaison de ces deux facteurs, c'est-à-dire le respect des conditions de limitation temporelle et de limitation du nombre des éléments de la mémoire à court terme, justifie la facilité avec laquelle les sujets ont utilisé le magnétophone à enregistrement différé dans une condition de prise de notes. Par ailleurs, l'existence d'une boucle articulatoire associé au niveau cognitif du traitement de la parole introduirait un autre facteur: la vitesse de la parole ( Baddeley, Thompson et Buchanan 1975, Baddeley 1986). L'empan mnésique serait fonction linéaire du taux de prononciation du sujet (Baddeley 1986, Hulme et al. 1984, Schweickert et Boruff 1986 ). Nous étudierons plus particulièrement ce facteur dans le quatrième chapitre.

En ce qui concerne l'application de notre étude, bien qu'elle ait un caractère essentiellement exploratoire, elle met en évidence les avantages du magnétophone à enregistrement différé.

Ce matériel permet en effet de sélectionner de façon plus précise et plus sûre, sans perdre d'informations les phrases que l'étudiant souhaite conserver. Cette technique a de plus l'avantage de pouvoir suivre aisément le rythme du locuteur.

Il est à noter que les notes enregistrées par les collégiens et les lycéens peuvent être utilisées directement pour un apprentissage ultérieur ou une révision. En ce qui concerne le magnétophone classique, quelques manipulations supplémentaires (définies précédemment) sont nécessaires pour permettre l'utilisation des notes enregistrées.

Le magnétophone à enregistrement différé nous semble être un matériel d'un grand intérêt pour tous ceux qui ont besoin de sélectionner rapidement une information orale.

D'un point de vue théorique, des recherches sur la lecture et l'apprentissage par "l'écoute" pourrait intéresser les domaines de la psychologie cognitive et la psycho-pédagogie.

Sur un plan pratique, il serait très profitable d'étudier la possibilité d'utiliser ce mode d'apprentissage. Bien que l'utilisation de l'enregistrement ne nous semble pas être une panacée pour l'enseignement de tous les déficients visuels, le magnétophone pourrait être une aide précieuse pour tous les aveugles accidentels et les amblyopes confrontés à des difficultés insurmontables dans l'utilisation du braille.

Dans le chapitre suivant, , nous nous proposons d'étudier " la parole comprimée et l'écoute rapide" qui pourrait être un mode d'apprentissage efficace pour l'aveugle (Foulke et Stitch, 1969).

VI - RÉSUMÉ

Même si les étudiants aveugles ont pu acquérir une base de connaissances suffisamment solide et riche, pour pouvoir prolonger leurs études, ils sont confrontés à un problème majeur qui est celui de la lenteur de l'acquisition de l'information.

L'œil est l'organe sensoriel qui apporte la plus grande quantité d'informations à un moment donné. Le champ perceptif visuel très étendu permet une perception simultanée des objets. De par sa simultanéité, l'approche visuelle facilite l'anticipation, la préparation à l'action et assure ainsi la rapidité et la précision d'une action ou d'un comportement. En revanche, la perception tactile qui est une réorganisation des sensations fragmentées dans l'espace et successives dans le temps est considérablement plus lente.

Pour un temps de lecture donné, un lecteur aveugle qui lit le braille couvre trois fois moins de texte qu'un lecteur voyant qui lit les caractères imprimés (Myers 1978, Krueger 1982). Un lecteur expérimenté lit avec les yeux environ 300 mots par minutes, alors qu'un lecteur aveugle lit avec les doigts environ 100 mots par minutes (Foulke 1982, Nollan et Késéris).

L'écriture braille avec poinçon présente également cette caractéristique de lenteur par rapport à l'écriture avec crayon. De plus la tablette et le poinçon sont assez bruyants lorsqu'ils sont utilisés par plusieurs étudiants dans une même salle de cours. En outre l'écriture braille permet plus difficilement la correction, la rectification, l'annulation ou l'adjonction d'une note dans le texte écrit(Postel 1972).


LA TECHNIQUE DE PRISE DE NOTES

Plus le niveau est élevé dans le cursus scolaire et universitaire, plus la quantité d'information à acquérir s'accroît. C'est pourquoi, au fur et à mesure de l'évolution des études, la technique de prise de notes occupe une place de plus en plus importante.

Dans les petites classes, c'est l'enseignant qui gère et organise cette activité de prise de note. Peu à peu le professeur devient moins directif et les lycéens, puis les étudiants doivent accroître leur autonomie dans ce domaine. Il leur faut sélectionner l'information et choisir dans le discours du professeur les éléments essentiels et pertinents qui se rapportent à un thème donné et qui leur seront utiles pour pouvoir apprendre et restituer cette information.

De la quantité, et surtout de la qualité des notes prises, dépendra essentiellement la réussite aux examens.

LE MAGNÉTOPHONE À ENREGISTREMENT DIFFÉRÉ

Pour que l'élève ou l'étudiant aveugle, intégré dans une classe de voyants puisse suivre le rythme imposé par le débit du cours, une solution avantageuse est l'utilisation d'un magnétophone.

Une étudiante aveugle a expérimenté en psychologie le magnétophone à "enregistrement différé". Ce système permet de n'enregistrer que les parties importantes du cours, c'est-à-dire d'enregistrer des notes. L'intérêt d'une phrase ou d'une idée n'est perçu par l'auditeur qu'à postériori, et donc seulement après son émission par le locuteur. Dans ces conditions, l'auditeur ne peut l'enregistrer sur bande magnétique que s'il en dispose dans une mémoire, car il a besoin d'un temps de réflexion et de décision.

L'insertion d'une mémoire numérique, d'un codeur et d'un décodeur à modulation delta dans la chaîne d'enregistrement d'un magnétophone, c'est-à-dire entre le microphone et la tête d'enregistrement, permet d'obtenir un magnétophone à enregistrement différé. Grâce à une commande marche-arrêt, l'utilisateur transfère sur la bande magnétique les informations contenues dans la mémoire-tampon. Ainsi, selon la capacité de la mémoire-tampon, variable de 2 à 20 secondes, les quelques mots ou les quelques phrases émises avant l'appui sur la commande marche-arrêt sont enregistrés sur la bande magnétique. L'utilisateur dispose, suivant le réglage, de 2 à 20 secondes, pour décider d'enregistrer ou non l'information émise durant ce laps de temps.

Cette technique permet de procéder directement à une sélection de l'information rapide en situation de cours.

LES EXPÉRIENCES AVEC LE MAGNÉTOPHONE À ENREGISTREMENT DIFFÉRÉ

1- Les premières expériences furent effectuées en 1985 avec des élèves de quatrième, handicapés physiques. La capacité de la mémoire-tampon était réglée à 5 secondes. Selon les auteurs, les élèves étaient peu sélectifs et avaient des difficultés à évaluer ce qui pouvait être dit en 5 secondes. Après apprentissage et expérience en situation de cours, les auteurs avaient conclu que le magnétophone à enregistrement différé pouvait permettre une sélection et un stockage de l'information essentielle satisfaisant . Mais les élèves devaient procéder à une retranscription du cours, pour éliminer les informations superflues et les phrases incomplètes (Capelain et al.1985, Canivet et al. 1984, Ledru et Sizaire 1985, Steenkeste et al. 1985).

2- Une étudiante aveugle a enregistré, avec un magnétophone classique, tous les cours de psychologie suivis à l'Université de Lille III entre 1982 et 1987. Elle a constaté:

  • Selon le débit de la parole et la redondance du texte, le temps d'enregistrement d'un cours peut être réduit environ de moitié. Ce qui réduit d'autant le temps d'écoute ultérieur.
  • À l'aide d'un second enregistrement en répétant les phrases bout à bout plus rapidement, il est encore possible de réduire le temps d'écoute de 50 pour cent.
  • Toutefois, pour chaque déclenchement de l'enregistre ment, les premiers mots d'une phrase sont perdus. Ce qui peut modifier ou rendre inaccessible la signification de la phrase.
  • Il est possible de pallier cet inconvénient en superposant à l'enregistrement en cours le début de la phrase. Cela représente une charge mentale supplémentaire pendant l'écoute du cours et lors de son ré-enregistrement ultérieur.
  • Avec le magnétophone à enregistrement différé utilisé en 1986, 1987, ces problèmes trouvent une solution:
  • En réduisant la capacité de la mémoire-tampon à 2 secondes, il est possible d'enregistrer des phrases complètes de sélectionner les phrases à enregistrer sans perte d'information.
  • Avec une bonne sélection et des énoncés rapides, les notes (enregistrement condensé) peuvent être conservées pour une utilisation ultérieure. Ce qui permet d'éviter la retranscription.

3- Une expérience avec des élèves de quatrième aveugles et amblyopes est réalisée en situation de cours. L'apprentissage du système avec une capacité de la mémoire-tampon réglée à 2 secondes est plus facile qu'avec une mémoire-tampon réglée à 5 secondes. Pour un cours de géographie d'une heure le temps d'écoute de l'enregistrement sélectionné est de 5 minutes en moyenne. Pour 2 des élèves, l'enregistrement très correct ne nécessite pas de retranscription. Pour la troisième, l'enregistrement des phrases est correct, mais elle a omis de prendre le plan du cours. L'élève contrôle, qui utilise un magnétophone classique a perdu le début de certaines phrases. Ce qui se traduit par des pertes d'information importantes: dates, chiffres, noms propres. Il est nécessaire d'apporter un complément d'informations pour pouvoir utiliser cet enregistrement.

4- Une expérience avec quatre élèves aveugles et amblyopes d'une classe de seconde est réalisée en laboratoire. Cette expérience s'est déroulée pendant 6 séances. Les deux premières sont des séances d'apprentissage avec une capacité de la mémoire-tampon de 2 et 5 secondes. Dans les deux suivantes, les élèves doivent enregistrer les idées principales de deux textes dont le thème leur est inconnu. Dans les deux dernières séances, les sujets doivent enregistrer les phrases principales de deux textes dont le thème leur est familier. Les résultats montrent que tous les élèves sont capables de sélectionner les idées essentielles d'un texte. Cette sélection est d'autant plus satisfaisante que le thème de l'énoncé est plus familier. Pour les trois sujets qui utilisent le magnétophone à enregistrement différé, les phrases de l'enregistrement "condensé" sont complètes et peuvent être utilisées pour un apprentissage ultérieur. Pour l'enregistrement du sujet contrôle, les phrases sont incomplètes. De ce fait, la signification est modifiée et l'énoncé devient incompréhensible et n'est pas utilisable pour un apprentissage ultérieur.

La technique de l'enregistrement sélectif, rendue plus confortable et plus efficace grâce à l'utilisation du magnétophone à enregistrement différé, permet:

1- de sélectionner rapidement l'information et d'être ainsi compétitif par rapport à l'étudiant voyant dans une condition de prise de notes,

2- d'effectuer ultérieurement un travail d'analyse et de synthèse sur les notes enregistrées; ce qui peut améliorer la compréhension et l'apprentissage du cours.

3- de réduire et de condenser un texte enregistré; ce qui réduit le temps d'écoute pendant la période de révision.

4- d'écouter éventuellement la version condensée à vitesse rapide; de ce fait la durée d'écoute de l'étudiant aveugle sera équivalente à la durée de lecture de l'étudiant voyant (voir chapitre 4).

Ces expériences ont mis en évidence l'influence de la capacité de la mémoire de travail dans l'activité de prise de notes. En effet, l'utilisation du magnétophone à enregistrement différé est rendue plus difficile pour un réglage de la mémoire-tampon supérieur à 2 secondes. Ce résultat peut être expliqué par la limitation de la capacité de la mémoire de travail qui se situe approximativement à 2 secondes.

 
sommaire


CHAPITRE 4:

LA PAROLE COMPRIMÉE ET L'ÉCOUTE RAPIDE

SECTION 1: ÉTUDE THÉORIQUE

Le matériel verbal sous sa forme écrite fut une source d'étude particulièrement riche pour les psychologues s'intéressant à la perception du langage. Avant l'avènement de nouvelles technologies de production et d'enregistrement de la parole, le caractère séquentiel et éphémère du matériel verbal sous sa forme parlée présentait des difficultés de manipulation et d'analyse qui en limitaient l'étude. Aussi les travaux sur la parole comprimée sont-ils relativement récents. Ils coïncident d'ailleurs avec l'apparition des nouvelles technologies liées à la synthèse et au traitement de la parole.

La parole comprimée permet d'entendre dans un temps donné une plus grande quantité d'informations que ne le permet la parole normale. Les premières études ont commencé aux États-Unis dans les années 50: il est classique de citer à ce propos le premier système de compression de Fairbanks et al. (1954). Le développement de nouvelles techniques de compression de la parole dans les années 60 et 70 a contribué à améliorer la qualité de la parole comprimée. Les chercheurs ont alors pu tester avec une plus grande précision un mode d'accès à l'information prometteur: "l'écoute rapide" (par analogie avec la lecture rapide.

Pour prolonger la comparaison entre un texte écrit et parlé, les phrases écrites peuvent être lues à une vitesse choisie par le lecteur en fonction de ses intérêts ou de ses objectifs. La variation du taux de lecture peut occuper une marge importante: de quelques mots à 600 mots par minute pour les plus doués. Dans l'écoute, la modalité auditive n'autorise pas une telle variation de débit de paroles. De plus, l'auditeur a peu ou pas de contrôle sur le débit de la parole du locuteur qui peut varier approximativement entre 125 et 175 mots par minute. Aussi l'accès à l'information par l'écoute est-il peu efficace comparé à l'accès par la lecture visuelle et cela d'autant plus que le sujet ne peut utiliser ce dernier mode d'apprentissage: personne aveugle ou ne pouvant lire des caractères imprimés.

L'homme peut traiter l'information à un débit plus élevé que celui du langage parlé (Nichols 1955, cité par Leroy 1982). L'augmentation du débit d'un énoncé pourrait être un moyen d'accélérer l'accès à l'information par la modalité auditive. Les techniques de compression de la parole et la mise au point d'un nouveau système appelé compresseur de paroles (speech compressor) permettent de faire varier le débit d'un discours enregistré, sans distorsion excessive du message. L'évolution des recherches tant sur un plan pratique que théorique a donné naissance à un nouveau concept: "speed listening" que nous avons traduit par "l'écoute rapide". Il s'agit d'une technique utilisée par un auditeur pour déterminer de façon volontaire le taux d'écoute d'un discours enregistré, en accord avec ses objectifs plutôt qu'avec ceux du locuteur dont la voix est enregistrée (Leroy 1982).

Dans cette revue, nous proposons:

  • de rappeler l'évolution historique des techniques de compression de la parole,
  • d'exposer les problèmes méthodologiques et procéduraux liés à l'étude de la parole comprimée,
  • de recenser les facteurs susceptibles de modifier l'intelligibilité des mots et la compréhension d'un discours comprimé,
  • de résumer les applications relatives à la parole comprimée et à l'écoute rapide.


I - PAROLE NORMALE ET PAROLE COMPRIMEE

1-Le signal vocal

La parole est un signal vocal complexe, continu et redondant, composé de segments périodiques (formant des voyelles) et apériodiques, variable pour un même locuteur à des instants différents, et très variable selon les locuteurs. Contrairement à l'écrit, la parole est une suite de segments continue (phonèmes) dont le débit varie entre 120 et 150 mots par minute environ selon les conditions d'émission et les objectifs recherchés.

2-Le niveau périphérique du traitement de la parole

L'expérimentation en physiologie et en psycho-physiologie a permis de décrire l'information qui circule sur le nerf auditif à partir de l'émission d'un signal vocal.Au niveau périphérique, les mécanismes de la perception auditive ont pu être étudiés: l'onde vocale peut être définie par sa fréquence, son amplitude, sa durée. Dans l'oreille, elle subit des phénomènes de décomposition spectrale permettant de discriminer la fréquence fondamentale et les harmoniques d'une voyelle par exemple. La hauteur perçue est liée à la fréquence fondamentale, l'intensité à la notion d'énergie (amplitude, pression acoustique). Une unité de puissance acoustique a été définie permettant de déterminer une unité relative de niveau d'intensité sonore en décibels. L'oreille perçoit des sons dont la fréquence varie entre 20 et 20000 Hertz (jusqu'à 10000 HZ dans la pratique). Des seuils d'audibilité et de douleur sont déterminés pour différentes fréquences (courbes d'audibilité et de douleur) La sensibilité de l'oreille est maximum pour les sons de 1000 Hertz. L'oreille est peu sensible à la variation d'intensité d'un son (supérieur à 10%), mais elle est très sensible à sa variation de fréquence (entre 0,1 et 0,3% en moyenne). L'oreille interne transforme le signal acoustique en un signal nerveux et le codage à ce niveau est tel qu'il produit déjà une bonne analyse acoustique du signal d'entrée. L'amplitude de l'onde sonore est codée par l'amplitude de la réponse nerveuse. Pour l'analyse de la fréquence du son, deux types de codage sont effectués au niveau périphérique: un codage temporel pour une fibre nerveuse et un codage spatial et synchronisé de plusieurs fibres nerveuses suivant la localisation des cellules réceptrices: définissant une sorte de cartographie fonctionnelle au niveau de la cochlée (oreille interne).

3-Le niveau central du traitement de la parole

Au niveau central, l'énoncé en cours de traitement fait appel à diverses sources de connaissances: phonologiques, morphologiques, lexicales, syntaxiques et pragmatiques. Plusieurs modèles rendent compte des mécanismes centraux. Plusieurs types de modèles ont essayé de décrire le déroulement des processus cognitifs dans le traitement de l'information parlée. Des phénomènes d'interaction multiples compliquent beaucoup cette tâche: phénomènes de coarticulation au niveau des segments et multiples interactions dans les différentes étapes de l'analyse.

En psychologie cognitive, plusieurs modèles ont été proposés pour expliquer le traitement de l'information perceptive, du langage parlé et écrit.

"Lorsque nous écoutons quelqu'un parler, nous percevons des entités significatives, des mots, et non pas une suite confuse de sons qui doivent être traduits d'une façon ou d'une autre afin d'avoir un sens" (Lindsay et Norman 1981). Ces auteurs ont décrit deux systèmes de traitement, l'un "dirigé par données", l'autre "par concepts". Dans un système de traitement dirigé par données, le traitement commence avec l'arrivée des données. Chaque étape de l'analyse effectue son travail recevant des données d'entrée de l'étape précédente. Les données de sortie sont les données d'entrée qui déclenchent l'étape suivante. Mais il est plus facile d'entendre, quand on sait ce qu'il faut entendre. Quand il y a connaissance d'une interprétation possible ou conceptualisation d'un stimulus pour aider à sa perception, le traitement est dirigé par concept. Les mécanismes de ces deux systèmes de traitement s'effectueraient presque toujours simultanément, chaque mode contribuant à l'analyse globale.

Les auteurs montrent l'interaction entre les données informatives qui arrivent au sujet et les données acquises qu'il a classées et organisées dans sa propre base de connaissance. Mais dans toute acquisition, les processus cognitifs liés à l'attention et à la mémoire sont présents.

En effet lorsqu'un auditeur écoute un locuteur, il perçoit et décode les derniers éléments d'une phrase alors qu'il a déjà intègré en mémoire et compris les premiers éléments. Pour Spérandio (1986) , la mémoire à court terme permet de gérer les interprétations partielles d'une phrase élémentaire de dialogue et contient les résultats de l'analyse du dernier énoncé du locuteur au niveau acoustique, phonétique, lexical, sémantique. Dans la mesure où le débit moyen d'un locuteur varie entre 120 et 180 mots par minute, la vitesse de traitement de l'information parlée de l'auditeur doit suivre ce rythme.

4-La parole comprimée

Dans un discours, le locuteur qui accélère la parole augmente le débit des mots prononcés. L'augmentation du taux des mots émis réduit le temps de communication d'un message donné. Aussi la parole accélérée se réfère souvent à la parole comprimée dans le temps que nous nommerons plus simplement: la parole comprimée.

Les méthodes et techniques utilisées pour modifier le taux d'émission des mots d'un discours parlé (paroles d'entrée ou input) influencent la nature du vocabulaire employé pour caractériser le discours final (paroles de sortie ou output). Les articles abordant ce thème de recherche contiennent une grande variété d'expressions. Citons quelques exemples:

  • rapide speech (parole rapide),
  • accelerated speech (parole accélérée),
  • rate controled recording (enregistrement à taux contrôlé),
  • compressed speech (parole comprimée).

Ces termes relevant en général de la technique employée pour modifier le débit de paroles seront expliqués en même temps que nous exposerons l'évolution des méthodes de compression temporelle.

5-Implications théoriques

Le décodage de l'information auditive est régi par des mécanismes de reconnaissance de formes et de perception. Ces mécanismes effectuent l'analyse des caractéristiques sensorielles du signal vocal et font intervenir les indices contextuels et les attentes du sujet. L'analyse des caractéristiques est limitée par des seuils de discrimination (intensité, fréquence et de durée). Les processus cognitifs impliquent le fonctionnement de l'attention, de la boucle articulatoire, de la mémoire. Le traitement d'un message parlé passerait par une étape articulatoire: après le décodage phonétique par feed-back articulatoire, tandis qu'il procède au traitement syntaxique et sémantique, le sujet effectue "une verbalisation" de l'information reçue. L'auditeur se répète mentalement ce qu'il entend (Baddeley 1986). Ainsi pour Baddeley, le dispositif de boucle articulatoire alimenterait le stock phonologique et pour que les "traces" ne s'estompent pas une révision du matériel (répétition mentale) s'impose. Ce codage est central et ne dépend pas obligatoirement des mécanisme moteur du système phonatoire. D'autre part, la mémoire de travail "maintient en disponibilité immédiate les informations reçues de la mémoire à court terme ou retrouvées de la mémoire à long terme". Le nombre des éléments stockés en mémoire à court terme est limité. Il est classique de citer Miller (1956) qui évalue la capacité de la mémoire à court terme à 7 plus ou moins 2 éléments. Par ailleurs, il semblerait que sa limitation temporelle soit environ 2 secondes (Reuchlin 1981). Plusieurs auteurs ont situé la capacité temporelle de la mémoire de travail entre 1,5 et 2 secondes (Baddeley 1986, Hulme et al. 1984, Schweickert et Boruff 1986 ). Selon ces auteurs, cette durée d'environ 2 secondes serait l'intervalle de temps pendant lequel la trace mnésique peut être récupérée. Le stockage en mémoire de travail maximum pendant ces deux secondes ne dépendrait pas seulement du nombre des éléments ou "shunk" mais plutôt d'un autre facteur: la vitesse de la parole. L'empan mnésique serait fonction linéaire du taux de prononciation du sujet (Baddeley 1986, Hulme et al. 1984, Schweickert et Boruff 1986 ).

La parole comprimée pourrait être un matériel d'étude intéressant pour contrôler et affiner ces résultats. Par exemple pour un débit normal de paroles (120 mots par minute), les 4 premiers mots d'une phrase seront parfaitement répétés dès la fin de leur émission (après 2 secondes), mais qu'en est-il des 8 premiers mots pour un débit de 240 mots/minute ou des 10 premiers mots pour un débit de 300 mots/minute? Le sujet qui articule vite traiterait-il mieux la parole rapide? Existe-t-il un seuil d'intelligibilité de la parole associé à son débit?

6-Applications

La parole occupe une place essentielle dans la communication humaine et c'est aussi un support de l'information non négligeable dans l'enseignement. Compte tenu des difficultés et de la lenteur de l'accès à l'information tactile, de nombreux éducateurs anglo-saxons jugent le mode de présentation auditif très favorable pour l'accès à l'information et l'apprentissage des jeunes aveugles. D'autre part le développement des nouvelles technologies: machines à lire (scanner), calculatrices parlantes, synthèses vocales permettant la sortie vocale des données d'un micro-ordinateur et l'utilisation de nombreux logiciels rendent nécessaire l'éducation de l'écoute. Comment peut-on transmettre une information visuelle distribuée de façon spatiale sur une feuille ou un écran via une modalité sonore impliquant des caractéristiques temporelles et séquentielles? La mémoire à court terme, la mémoire de travail, l'attention n'imposent-elles pas leurs lois de fonctionnement? Et comment distribuer l'information parlée pour favoriser la compréhension et réduire la charge mentale


II-ETUDE HISTORIQUE DES TECHNIQUES DE COMPRESSION DE La PAROLE

1-Un critère de référence: la parole normale

Le débit des mots parlés varie sensiblement d'un locuteur à un autre, mais aussi pour une même personne d'un moment à l'autre de son énoncé(Richaume 1988). Les variations inter-sujets peuvent être influencées par des facteurs d'ordre constitutionnel, physiologique, des facteurs de personnalité, de niveau social et culturel. Les différences intra-sujets peuvent être influencées par des variables liées:

  • aux conditions d'émission des paroles (conversation libre, lecture d'un texte);
  • aux objectifs du locuteur (ordre, explication, démonstration...).

Les variations les plus importantes sont observées dans les comparaisons entre le taux des mots émis lors d'une conversation spontanée et le taux des mots prononcés lors d'une lecture orale. Nichols et Stevens (1957) ont trouvé que le débit des paroles conversationnelles était de 125 mots par minute en moyenne. Johnson et al. (1963, p.220) ont trouvé un taux moyen de lecture orale de 176,5 mots par minute. Foulke (1967) a observé un taux moyen de lecture orale de 174 mots par minute.

Lors des enregistrements des cours de psychologie, des échantillons de différents professeurs et différents cours ont montré des variations de taux de mots s'échelonnant entre 90 et 150 mots par minute avec des moyennes approximatives de 110-120 mots par minute.

Par conséquent, afin de pouvoir situer le taux des mots d'un discours "accéléré" et d'un discours "comprimé" par rapport au taux des paroles normales, deux taux sont à retenir: 125 mots par minute pour la parole conversationnelle et 175 mots par minute pour la lecture orale.

Dans un discours, le locuteur qui accélère la parole augmente le débit des mots prononcés. L'augmentation du taux des mots émis réduit le temps de communication d'un message donné. Aussi la parole accélérée se réfère souvent à la parole comprimée dans le temps que nous nommerons plus simplement: la parole comprimée.

Les méthodes et techniques utilisées pour modifier le taux d'émission des mots d'un discours parlé (paroles d'entrée ou input) influencent la nature du vocabulaire employé pour caractériser le discours final (paroles de sortie ou output). Les articles abordant ce thème de recherche contiennent une grande variété d'expressions.

2-La parole rapide:

En l'absence de technique et de matériel approprié,les premières recherches ont fait appel aux seules capacités du locuteur à pouvoir faire varier son débit de paroles. Toutefois même bien entraînés, les sujets se heurtent rapidement à des limites insurmontables. En effet, les premières études (Goldstein 1940, Nelson 1948, Hardwood 1955, cités par Foulke 1969 et Leroy 1982) ont fait appel à des locuteurs bien entraînés à qui il était demandé d'essayer d'accroître leur débit de paroles jusqu'à 300 mots/minute. Ce score est très difficile à atteindre et son approche provoque des distorsions dans l'inflexion et l'intensité vocale, la durée relative des voyelles, consonnes et pauses. Outre ces modifications, des difficultés d'articulation rendaient le plus souvent ces énoncés rapides peu compréhensibles (Calearo et Lazzaroni, 1957).

Dequiros (1964), Miron et Brown (1968) ont ainsi observé que des locuteurs entraînés ne peuvent soutenir un taux d'élocution supérieur à 225 mots par minute pendant une longue période lors d'un énoncé continu. Le taux de la parole "rapide" ne peut donc excéder de beaucoup celui de la parole normale approchant 175 mots/minutes dans les meilleures conditions de lecture à voix haute.

Bien que peu concluants, les premiers travaux sur la parole rapide ont eu le mérite d'encourager la mise au point de techniques ou de systèmes capables de produire une parole accélérée de meilleure qualité (Leroy 1982).

3-Parole accélérée ou à taux modifié

Avec l'introduction des techniques d'enregistrement et l'utilisation du magnétophone, les expérimentateurs étaient désormais capables d'accélérer la vitesse de déroulement de la bande magnétique. La vitesse d'écoute d'un enregistrement pouvait alors être supérieure et même être double de celle du discours d'origine enregistré. Toutefois, l'augmentation de la vitesse de déroulement de la bande magnétique entraînait des modifications des caractéristiques du signal sonore non négligeables. Ainsi, par exemple, dans le cas d'une vitesse double, la fréquence de tous les composants du signal vocal étant doublée, le ton de la voix enregistrée est nettement modifié et s'élève d'une octave (voix plus aiguë). Ces distorsions sont considérées comme insupportables par une majorité d'auditeurs. Seul un accroissement de vitesse de l'enregistrement de 25 pour cent est tolérable (Latz 1967). Actuellement de nombreux modèles de magnétophone à cassettes ou à bandes magnétiques possèdent ce système d'accroissement de vitesse de déroulement et permettent de réduire de 25 à 30 pour cent le temps d'écoute. Il est à noter que les voix masculines sont transformées en voix féminines avec ce système. Les voix les plus graves restent les plus audibles après augmentation de la vitesse de déroulement.

4-Méthode d'échantillonnage et appareil de Fairbanks (cut and spliced speech)

En 1950, Miller et Licklider de l'université de Harvard, ont mis en évidence la redondance du signal vocal. Ils ont effacé de très petites portions d'enregistrement (quelques millisecondes, 10 fois par seconde). Bien qu'amputés de nombreux fragments, les mots restent intelligibles. L'intelligibilité des mots monosyllabiques ne descend pas en dessous de 90% jusqu'à 50% d'interruption. Il semblerait donc qu'une bonne portion d'un énoncé puisse être éliminée sans modification sensible d'intelligibilité. Mais il n'est pas encore possible de parler de compression: le temps d'écoute de ce discours parsemé de multiples petits effacements, reste toujours le même.Garvey(1953) a eu l'idée de rapprocher les portions de paroles restantes après ces brefs effacements d'enregistrement, le résultat fut alors une parole comprimée dans le temps, intelligible, sans modification de ton, sans distorsion excessive de la parole. Fairbanks, Everitt et Jaeger (1954) ont mis au point un appareil électro-mécanique capable d'effectuer la fonction d'échantillonnage proposée par Miller et Licklider.

Le système de Fairbanks et al. produisait de façon aléatoire des coupures de très faibles durées dans l'enregistrement, de sorte que la portion éliminée ne puisse contenir un son entier.

a partir de la technique de Fairbanks et al. (1954) deux compresseurs de paroles furent commercialisés aux Etats-Unis: le "Eltro Information Rate Changer" et le "Whirling Dervish". Ces compresseurs étaient relativement chers à l'achat (3 à 5000 dollars).

5-Methode d'échantillonnage et informatique

Le système de Fairbanks ne permet pas de sélectionner les portions à éliminer de l'enregistrement . Avec l'évolution des techniques informatiques, cette sélection est désormais possible. En effet, un programme informatique peut permettre un échantillonnage sélectif des portions à éliminer d'un signal redondant (Ball 1961, Scott 1965, Qureshi 1974, Seo 1974). Cette sélection peut s'appliquer également à des pauses trop longues ou aux voyelles (Miron et Brown 1968). Les techniques de compression faisant appel à l'informatique sont les plus satisfaisantes, mais elles sont complexes et trop coûteuses pour justifier leur emploi dans toutes les recherches (Leroy 1982).

6-Méthode d'échantillonnage et synthèse vocale

L'utilisation d'un synthétiseur de voix permet de générer une compression de qualité (Canpanella 1967, Canpanella et Coldberg 1973). Avec cette technique, le signal d'entrée est analysé en termes de "caractéristiques standardisées de paroles" et digitalisé. Après échantillonnage, le signal de sortie est synthétisé pour ressembler au mieux à la voix d'origine, mais sous forme comprimée.

Breuel et Levens (1974) ont montré que la parole peut être comprimée au moyen d'un compresseur harmonique: un diviseur de fréquence permet d'obtenir un débit de parole deux fois supérieur au taux d'origine. Toutefois, le compresseur harmonique ne peut effectuer qu'une seule compression: deux fois le taux d'origine; aussi, a-t-il peu de valeur pratique.

Les différentes techniques décrites précédemment sont à l'origine de l'élaboration d'un bon nombre de prototypes, puis à la commercialisation de compresseurs:

  • le "Varispeech I" et le "Varispeech II" produits par Lexicon Inc.
  • variable speech control copycorder model CC-103 produit par Magnetic Video Corporation.
  • Vocom-I et Vocom-II produit par PKM Corporation, et plus tard le modèle A7 commercialisé par la Variable Speech Control Company (VSCC) .


III-LES PROBLEMES METHODOLOGIQUES ET PROCEDURAUX

1-La compression de la parole

Selon le système utilisé, l'accélération et la compression de la parole peuvent être obtenues par différentes méthodes. La parole accélérée est produite le plus souvent par accélération de la vitesse de déroulement de la bande magnétique sur laquelle est enregistré le texte parlé. La parole comprimée peut être produite par de nombreuses techniques, mais la méthode la plus couramment utilisée est la méthode dite d'échantillonnage. Selon son principe, des petits segments d'enregistrement, de très courtes durée (10 à 80 millisecondes) sont supprimés à des intervalles réguliers. Les portions restantes sont ensuite mises bout à bout.

Le résultat obtenu, est une parole dite comprimée qui réduit le temps d'écoute, de la version d'origine, mais sans les distorsions de qualité et de hauteur produites par l'augmentation de la vitesse de déroulement d'un enregistrement (parole accélérée).

Ainsi, avec la technique de compression temporelle, la réduction d'un discours s'effectue de la manière suivante:

  1. des interruptions temporelles périodiques sont effectuées sur le message enregistré par extinction et allumage instantanés du signal. Les périodes "off" peuvent être variables: 20 ou 30 millisecondes par exemple, parfois davantage.
  2. les périodes "on" restantes sont rapprochées pour former un signal ou message continu.
  3. le taux de compression est déterminé par la longueur et la fréquence des périodes "off".
  4. le débit de la parole du message comprimé qui peut être défini par le nombre de mots émis par minute, dépend:
    • de la longueur et de la fréquence des périodes "off";
    • du débit de la parole du message initial.

Exemple: un message comprimé de 250 mots par minute peut être produit par 50 pour 100 de compression d'un message enregistré à 125 mots par minute ou par une compression de 33 pour 100 d'un message enregistré à 188 mots par minute.

L'intelligibilité et la compréhension d'un message comprimé pourront donc dépendre:

  • du nombre de mots par minute émis lors de l'enregistrement du message d'origine.
  • de la longueur des interruptions (périodes "off"); - de la fréquence des périodes "off";
  • de l'intensité en décibels des sons émis.

2-Le degré de compression

La diversité des méthodes de production de la parole comprimée engendre des compressions différentes tant sur le plan quantitatif (degré de compression) que sur le plan qualitatif. Bien que les études expérimentales se soient multipliées depuis les années 60, l'absence de pratique commune, de vocabulaire précis et bien défini pose des problèmes non négligeables quand il s'agit de rassembler les résultats de plusieurs études. En effet, ce défaut d'unicité dans les termes employés peut conduire à une confusion ou une interprétation erronée quand les résultats de différentes expérimentations sont comparés.

Dans les multiples études que nous avons consultées, le degré de compression est exprimé de diverses façons. Le montant de la compression peut être défini par le pourcentage du temps de l'enregistrement d'origine qui est conservé quand le message parlé est reproduit à un taux plus élevé. Dans ce cas, par exemple une compression de 40 % signifie que le temps d'écoute de la version comprimée représente 40 % du temps de production de la version originale. Ainsi, un enregistrement de 60 minutes pourrait être écouté en 24 minutes dans cet exemple.

Le degré de compression est aussi défini très souvent comme étant le pourcentage du temps économisé par l'écoute de la version comprimée. Dans notre exemple 40 % de compression signifie que le temps d'écoute de la version comprimée est réduit de 40 % , c'est-à-dire qu'un enregistrement de 60 minutes pourra être entendu en 36 minutes.

Le degré de compression peut également être défini en termes de coefficient d'accélération du taux des mots dans l'énoncé comprimé par rapport au taux des mots dans l'énoncé d'origine. Par exemple, un indice de 1,5 signifie que le taux des mots après compression est 1,5 fois le taux des mots avant la compression. Lorsque ces deux indices (pourcentage de compression et augmentation du taux des mots) sont comparés, il convient de rappeler que la relation entre eux n'est pas linéaire. Ainsi, pour un coefficient d'accélération s'élevant de 1,1 à 1,2 correspond une augmentation de pourcentage de compression de 9% à 17%; alors que pour un coefficient d'accélération s'élevant de 1,9 à 2 correspond une modification de compression variant de 47% à 50% (Foulke 1969). En outre, ces deux indices, pourcentage de compression et coefficient d'accélération du taux des mots, n'indiquent pas directement le taux des mots de l'énoncé comprimé.

3-Le taux des mots

Le débit des paroles d'un discours parlé peut être défini comme étant le nombre de mots émis par minute. Le taux des paroles comprimées ou accélérées dépend avant tout du taux des paroles de l'énoncé d'origine et cela quel que soit le mode de compression utilisé.

Dans un paragraphe précédent, nous avons signalé que le taux des mots émis par un locuteur dépend de nombreux facteurs et qu'il varie en moyenne entre 125 (paroles conversationnelles) et 175 (lecture à voix haute) mots par minute. Or, cet indice (nombre de mots par minute)n'est pas un indice fidèle du débit de la parole d'un orateur qui peut dépendre de la nature du discours prononcé. En effet, selon le thème développé et le vocabulaire utilisé, un texte peut être plus ou moins dense et contenir des mots plus ou moins longs. Un indice plus précis pourrait être le nombre de syllabes émises par minute plutôt que le nombre de mots (Carroll 1967, cité par Foulke 1969).

Le taux de lecture orale dépend de la nature du texte lu, mais aussi du style du lecteur. Ce taux varie considérablement d'un lecteur à un autre et même d'un passage de lecture à un autre pour un lecteur donné (Foulke 1967). Le débit de la parole reflèterait "le niveau d'éveil" d'un sujet. Dans une revue, Johnson et al. (1963) concluent que la perception d'un taux de paroles donné pour un sujet est lié à son taux de lecture orale: un sujet perçoit d'autant mieux les paroles rapides que sa vitesse de lecture est élevée. On pourrait donc s'attendre à de grandes variations inter et même intra sujets dans les études concernant l'intelligibilité et la compréhension des paroles comprimées.

Dans la plupart des études sur la parole comprimée, la compression est faite sur un texte lu à voix haute et enregistré. Seul le taux des mots d'un texte énoncé par un synthétiseur de voix sera régulier et invariable pendant toute la durée de l'émission.

Il convient de remarquer que dans les expériences sur l'intelligibilité de la parole comprimée utilisant une présentation de mots individuels, l'indice de compression ne peut être exprimé en taux de mots. L'indice de compression peut s'exprimer dans ce cas par un taux ou un coefficient de compression.


IV-INTELLIGIBILITE ET COMPREHENSION DE La PAROLE COMPRIMEE:

1-Définitions:

L'intelligibilité est " l'état ou le caractère de ce qui peut être entendu distinctement ": c'est une reconnaissance phonétique. Elle dépend du niveau périphérique du traitement de la parole. qui analyse les caractéristiques propres à la structure d'un message parlé (phonétiques, phonologiques et prosodiques).

L'intelligibilité peut être considérée comme une propriété de la communication parlée impliquant la reconnaissance des sons et faisant essentiellement appel à la perception auditive (Foulke et Stitch 1969, Lehiste et Peterson 1959), tout comme la lisibilité dépend d'abord des propriétés physiques d'un message écrit.

Par contre la compréhension est une reconnaissance sémantique, c'est-à-dire la saisie du sens d'un message (parlé ou écrit), ce qui implique la prise en compte du contexte. Un mot isolé, hors contexte peut avoir de multiples significations ou "ne rien vouloir dire". La compréhension par l'écoute implique la présentation d'un énoncé continu. La compréhension est définie comme étant la faculté de concevoir, de pénétrer le sens de ce que dit quelqu'un, de ses explications ..etc., de se faire d'une chose une juste idée, une idée conforme à sa nature".

Dans la mesure où les premières étapes de l'analyse et du traitement du signal vocal retentissent sur la compréhension du message, , l'intelligibilité d'un discours comprimé ou non retentit de façon évidente sur sa compréhension. Toutefois selon Lindsay et Norman (1981), toute prise d'information est le résultat de l'interaction de deux mécanismes, l'un dirigé par données, l'autre dirigé par concepts. Il sera donc très difficile, en présence d'un discours continu de dissocier l'influence des facteurs liés à l'intelligibilité de ceux liés à la compréhension dans l'analyse des résultats d'un sujet.

2-Les indices de mesure:

La mesure de l'intelligibilité de la parole comprimée dans le temps est définie par la mesure de la capacité à répéter de façon exacte un mot, une phrase ou quelques lignes.Une procédure classique dans ce domaine consiste à faire subir une compression temporelle à plusieurs phrases selon un même procédé, puis les mots sont distribués individuellement à l'auditeur dont la tâche est de reproduire oralement ou par écrit le mot entendu. Le score du sujet qui traduit l'indice d'intelligibilité des mots perçus est défini par le pourcentage des mots identifiés correctement.

Un autre indice d'intelligibilité est le temps de réaction du sujet. Quand un stimulus est difficile à discriminer le temps de réaction de choix est allongé. Cet indice serait plus sensible dans la mesure où un changement dans le taux de compression pourrait produire une même réponse exacte, mais un temps de réaction de choix plus élevé. Cet allongement du temps de réaction donnerait donc une information supplémentaire sur l'intelligibilité des paroles comprimées (Foulke et Stitch 1969).

Un seuil d'intelligibilité de la parole comprimée peut également être défini par le minimum d'intensité nécessaire pour qu'un certain pourcentage (habituellement 50 %) des mots d'une liste soit correctement identifiés (Calearo et Lazzaroni 1957, DeHaan et al. 1978, 1980).

La compréhension est plus difficile à objectiver. Différents tests sont proposés.

Pour évaluer la compréhension de jeunes enfants par exemple Woods (1965, cité par Foulke 1969), utilise des ordres que les enfants doivent exécuter: s'asseoir, se lever, lever un bras, faire l'abeille etc.

Belamy (1966) a utilisé un questionnaire à choix multiple, puis un entretien (interview) pour compléter l'analyse. D'autres auteurs ont employé des questionnaires nécessitant des réponses précises, mais très courtes (Friedman et al. 1966, Myers 1978).

3-Les facteurs influençant l'intelligibilité de la parole comprimée dans le temps:

a - Les caractéristiques du signal:

L'intelligibilité de la parole comprimée est influencée par la méthode utilisée pour effectuer la compression temporelle. Le signal vocal est plus altéré et rapidement moins intelligible par la méthode d'accélération de la vitesse que par la méthode d'échantillonnage (Nixon et al. 1968, Nixon et Sommer 1968, cités par Foulke 1969).

Un message comprimé par la méthode d'échantillonnage peut être conçu comme étant une succession de segments temporels, appelés périodes d'échantillonnage. C'est la fraction restante des échantillons qui détermine le taux de compression. Si 10 ms (milliseconde) d'une période de 20 ms ou 30 ms d'une période de 60 ms sont restantes, le montant de la compression est le même soit 50%. L'intelligibilité de la parole comprimée dépend de la longueur de la portion éliminée et de la fréquence de ces coupures. Quand la durée de la fraction éliminée dépasse 80 ms, l'intelligibilité diminue de façon significative (Fairbanks et al., 1957). Pour Gerber et al. (1977), l'intelligibilité des mots décline rapidement quand l'intervalle d'interruption excède 60 millisecondes.

Retarder le signal de 7,5 ms dans un écouteur améliore l'intelligibilité, ce retard provoquant une redondance binaurale (Cramer 1965, cité par Foulke 1969). Scott (1965) utilise un écouteur pour faire entendre les échantillons restants de la paroles comprimées et l'autre écouteur pour faire entendre en même temps les échantillons supprimés. Il obtient ainsi un résultat favorable avec cette écoute dichotique.

Considérons deux messages identiques: dans l'un de courtes portions sont effacée mais non enlevées, le message est "interrompu", dans l'autre les périodes "on" sont seules gardées, les périodes "off" étant éliminées, le message est alors comprimé. Tant que le montant des portions "off" ne dépasse pas 50%, il n'y a pas de différence entre le message interrompu et le message comprimé, mais au-delà les mots interrompus sont plus intelligibles que les mots comprimés (expériences citées par Foulke 1969).

b-Les facteurs linguistiques:

la méthode d'accélération de vitesse dégraderait davantage les sons contenant des voyelles que ceux contenant des consonnes, alors que la méthode d'échantillonnage modifierait davantage les consonnes que les voyelles (Garvey 1953 Tarte et al. 1982).

Dans une expérience dans laquelle le nombre des phonèmes par mot peut varier de 3 à 9, l'augmentation du nombre des phonèmes améliore l'intelligibilité des mots ayant subi une compression temporelle par la méthode d'échantillonnage (Henry 1966). Des phrases courtes entendues à vitesse accélérée sont plus intelligibles que des mots isolés (Lump et Webster 1961). Les mots longs ou les phrases courtes apportent davantage d'information auditive et sémantique que les mots courts et isolés. En outre, quelques mots ou une phrase permettent d'orienter l'attention et de prédire avec plus ou moins d'exactitude ce qui peut suivre: ces indices contribuent à améliorer l'intelligibilité d'un discours continu comprimé dans le temps. mais une question peut égale ment se poser: la perte d'information provoquée par la compression temporelle d'un discours continu ne pourrait -elle engendrer une diminution croissante et cumulative du nombre des indices au fur et à mesure du déroulement de l'énoncé?

c-Les facteurs liés à l'auditeur:

Une exposition répétée à la parole comprimée améliore son intelligibilité (Gade et al. 1984). l'entraînement du sujet, la familiarité et la nature concrète ou abstraite du texte écouté sont des facteurs qui influencent l'intelligibilité de la parole comprimée (Foulke et Stitch 1969).

4-Les facteurs influençant la compréhension de la parole comprimée:

a-Les facteurs liés au signal sonore:

Trois études citées par Foulke (1969) montrent que l'augmentation du taux des mots au-delà du taux normal provoque d'abord une diminution modérée de la compréhension,mais au-delà de 275 mots par minute, le déclin de la compréhension est brutal et s'accélère. L'efficacité de l'apprentissage définie par Myers (1978) par un indice qui exprime la quantité d'information comprise et retenue pour un temps d'écoute donné s'accroit jusqu'à ce que le débit de la parole ne dépasse pas 280 mots-minute.

b-Compréhension et méthodes de compression:

Des sujets peu habitués à écouter des textes enregistrés et n'ayant jamais entendu de paroles comprimées, comprennent mieux un discours enregistré à un taux de 275 mots/minute par la méthode d'échantillonnage qu'un même texte enregistré au même taux avec la méthode d'accélération de vitesse (McMaine 1962, Foulke 1962). Toutefois des collégiens aveugles habitués à écouter des énoncés enregistrés, ne présentent pas de différences dans la compréhension de discours comprimés avec les deux méthodes (Foulke 1966 a,).

Selon les auteurs (Foulke 1969, Leroy 1982), l'intelligibilité des paroles comprimées serait plus sensible à la méthode de compression temporelle que la compréhension.

Pour évaluer l'intelligibilité d'un message parlé, les expérimentateurs utilisent des mots isolés, des ordres ou de très courtes phrases. L'auditeur ne peut s'appuyer sur le contexte pour prédire les paroles à venir comme il le ferait dans un énoncé continu utilisé pour tester la compréhension.Ce résultat pourrait être expliqué par le fait que la compréhension de la parole comprimée est influencée par des processus de traitement perceptifs et cognitifs de l'auditeur.

c-La nature du matériel comprimé:

En s'appuyant sur les réponses à un questionnaire à choix multiple, Foulke et al. ( 1962) évaluent la compréhension d'un texte littéraire et d'un texte scientifique quand ils sont entendus à taux normal. Ils trouvent que la compréhension du thème scientifique est plus difficile que celle du thème littéraire, mais quand le taux des mots augmente la compréhension de l'énoncé scientifique ne diminue pas aussi rapidement que celle de l'énoncé littéraire.

Pour Fairbanks et al. (1957), l'effet du taux de compression sur la compréhension d'un discours ne dépend pas de la complexité de son contenu.

Les difficultés d'un texte écouté ne sont pas les mêmes que celles d'un texte lu. Les différences qui existent entre un matériel oral et un matériel écrit oblige l'auditeur et le lecteur à traiter l'information de manière différente. Une page imprimée est un matériel spatial, le langage parlé, séquentiel est traité dans une dimension temporelle. Contrairement au lecteur devant une page, l'auditeur a recours essentiellement à sa mémoire et ne peut exercer aucun contrôle sur l'ordre dans lequel il rencontre les composants syntaxiques et sémantiques d'une phrase. Selon Foulke (1969), il n'est pas possible d'utiliser les mêmes tests pour évaluer la difficulté d'un texte lu et celle d'un texte écouté.

Newman (1982) a trouvé que la compression temporelle diminue davantage la perception des items et phrases comprimés non prévisibles que celle des phrases prévisibles.

Pour cet auteur, sous une condition de stress temporel, des sujets normaux traitent plus difficilement l'information phonémique et sémantique contenue dans des phrases réelles mais non prévisibles. Selon lui,dans ces conditions , les sujets relient l'information linguistique et sémantique contenue dans les phrases. Les auditeurs déficients dans le traitement linguistique seraient donc incapables de tirer avantage des données distribuées selon un débit trop élevé.

d-La compréhension et les variables liées à l'orateur:

Les caractéristiques de la voix humaine varient considérablement selon les sujets. Le timbre, la tonalité, la fréquence et l'intensité d'une voix, le rythme des paroles diffèrent d'une personne à l'autre et pour un même orateur ces caractéristiques peuvent varier selon l'état d'éveil du sujet, ses objectifs, la nature du discours ... Chaque orateur a un style de lecture particulier. .

Une expérience de Foulke (1964) a montré que l'effet de l'orateur sur la compréhension des auditeurs ne dépend pas du taux des mots auquel le discours est présenté.

Les pauses et l'intonation sont des facteurs de compréhension de la parole comprimée (Buttet 1980, Wingfield 1980). Miron et Brown (1968) constatent que la meilleure méthode de compression est celle qui conserve les temps de pause proportionnellement au taux de compression et qui maintient une bonne distribution des pauses même si celles-ci sont réduites. Pour Friedman et Johnson (1969), l'insertion de pauses entre les principaux segments d'une phrase permet un meilleur rappel qu'une insertion de pause entre les phrases. Selon Goldman-Eisler (1964) et Youngsoo (1984), les pauses donnent un temps de codage et de décodage de l'information. Tantiblarphol et al. (1984) ont observé 144 lycéens écoutant individuellement une histoire de 20 phrases à 225 m/mn ou 300 m/mn. De façon significative, ils notent un meilleur rappel à 300 m/mn pour une condition d'insertion d'un temps de pause entre les phrases.

e-La compréhension et les facteurs liés à l'auditeur:

Les caractéristiques liées à l'auditeur peuvent influencer sa compréhension de la parole comprimée dans le temps. Plusieurs études ont analysé l'influence du sexe de l'auditeur. En dépit des contradictions dans les résultats, il semblerait que le sexe ait peu d'influence sur la compréhension d'un discours comprimé (Foulke et Stitch 1967, et Friedman 1964).

L'âge et le niveau scolaire d'un enfant influencent sa capacité à comprendre des paroles comprimées (Fergen 1955,Wood 1965). Beasley et al. (1976) montrent que la discrimination de mots monosyllabiques (présentation comprimée) s'améliore avec l'âge . Freeman et Beasley (1978) ont répliqué cette expérience. Veasley et Flaherty-Rintelmann (1976) et Beasley et al. (1980) ont trouvé les mêmes résultats avec des phrases comprimées. Tous ces auteurs sont cités par May (1984) qui étudie l'influence de l'âge sur la discrimination de phrases comprimées à 50 %. Quatre groupes d'âge sont étudiés: 6, 8, 10 et 21 ans. L'auteur conclut que les capacités de discrimination de la parole comprimée s'améliorent avec la maturité et que les capacités de traitement auditif maximales atteignent une asymptote vers 11 ou 12 ans. Selon May (1984), le temps de traitement phonémique est équivalent à celui des adultes vers l'âge de 12 ans et l'évolution ontogénétique de l'efficacité du traitement auditif atteint un stade optimal au début de la deuxième décade de la vie.

Plusieurs auteurs signalent une relation positive entre l'intelligence de l'auditeur et sa performance dans la compréhension d'un énoncé comprimé en fonction de l'augmentation du taux des mots (Fairbanks et al. 1957, Godstein 1940, Nelson 1948). Teach (1979) a mis en relation le facteur quotient intellectuel du sujet avec le débit des mots:le quotient intellectuel n'aurait pas d'influence sur l'intelligibilité des paroles ayant subi une compression temporelle, mais l'auteur a observé une influence de ce facteur sur la compréhension.

La compréhension d'un discours comprimé pourrait être améliorée par l'entraînement à l'écoute de la parole comprimée. Plusieurs études illustrant cet effet de pratique sont citées par Leroy (1982). Pour Stitch (1970) les sujets non entraînés feraient d'abord attention aux "éléments mots" du message. Après entraînement, ces mêmes sujets s'intéressent davantage aux concepts présentés.

Les sujets "indépendants à l'égard du champ", capables d'effectuer rapidement une analyse sémantique pourraient comprendre la parole rapide avec ou sans expérience (Leroy 1982). Alcala (1984) a utilisé deux taux de compression (225 m/mn et 300 m/mn) et deux modes de présentation: présentation orale seule et présentation orale associée à des images et observe les effets sur la compréhension des sujets de style cognitif différent (dépendants et indépendants à l'égard du champ). Les résultats mettent en évidence une interaction double entre les variables image, taux de compression et style cognitif. Les sujets indépendants à l'égard du champ sont capables de traiter des discours comprimés sans avoir recours à une redondance iconique. Olson (1984) a observé 80 étudiants, dépendants et indépendants à l'égard du champ, écoutant un discours selon les débits suivants: 90 m/mn, 120 m/mn, 150 m/mn et 250 m/mn. Les sujets indépendants sont plus performants pour les débits élevés que les sujets dépendants à l'égard du champ. Alcala en 1985 a obtenu les mêmes résultats.

Les traitements perceptifs et cognitifs responsables des différences interindividuelles dans la vitesse de lecture d'une page écrite, pourraient également contribuer aux différences interindividuelles dans les capacités à comprendre la parole comprimée. Ainsi, les lecteurs rapides pourraient être capables de comprendre la parole comprimée à un taux plus élevé que les lecteurs lents. Cette hypothèse étudiée par Goldstein (1940) et par Orr et al. (1965) a conduit à deux expériences (citées par Foulke 1969) dans lesquelles il existe une corrélation positive entre la vitesse de lecture d'un sujet et sa capacité à comprendre la parole rapide. De plus il est démontré également que la pratique de l'écoute d'une parole rapide conduit à améliorer la vitesse de lecture.

Un autre facteur pourrait influencer la compréhension de la parole rapide: la préférence de l'auditeur (Lass et al. 1974, Gade 1979, Gade et al. 1980). Dans une étude concernant la préférence d'écoute d'auditeurs adultes, Cain et Lass (1974) ont testé 9 taux de mots s'échelonnant de 100 m/m, (mots par minute) à 300 m/mn. Le taux préféré est de 175 m/mn. Dans une expérience de Orr (1968) dans laquelle les participants peuvent faire varier eux-mêmes le taux de présentation orale, le taux choisi est environ 1,5 fois le taux normal. Dans les mêmes conditions, pour Foulke et Stitch (1966), le taux préféré de lycéens est de 207 m/mn. Pour Nath et al. (1981), dans un cours de formation continue pour adulte âgés de 22 à 55 ans, les sujets ont bien accepté un débit de 250 mots/minute correspondant à une compression de 50%. Leeper et Thomas (1978) ont testé le taux de mots préféré par des enfants de 7 à 9 ans en utilisant un paradigme de comparaison par paires et neuf taux de mots variant de 100 à 300 m/mn avec des intervalles de 25 m/mn. Les enfants préfèrent le débit de 200 m/mn et n'apprécient pas le taux de 100 m/mn.

Pour Lambert et al. (1980), la compréhension de la parole comprimée serait fonction de l'entraînement du sujet.

5-La rétention de la parole comprimée:

La plupart des expériences citées par Leroy (1982) ne concluent pas à une moins bonne rétention d'un texte entendu avec un débit de paroles élevé (Foulke 1966, Friedman et al.1967). George (1970) n'a pas observé une moins bonne rétention d'un discours écouté à vitesse rapide s'il a été compris. Arrasjid (1973) a présenté un test de rétention à des lycéens, une semaine après l'écoute d'un enregistrement comprimé et d'un enregistrement à taux normal. L'auteur n'a pas observé de différences en ce qui concerne la rétention des informations présentées sous ces deux formes.

V-APPLICATIONS POTENTIELLES DE La PAROLE COMPRIMEE ET DE L'ECOUTE RAPIDE

Nous suggérons ici quelques pistes d'études pour des applications potentielles. Toutes les expériences exposées ont été effectuées avec la langue anglaise. Il est bien entendu que des recherches approfondies avec la langue française sont nécessaires pour proposer des applications effectives.

1-Les applications pédagogiques:

La plupart des recherches relatées ici ont été effectuées aux Etats-Unis et associent une écoute rapide à d'autres formes de présentation de l'information (Leroy 1982).

a-Ecoute rapide et informations visuelles:

La parole comprimée est présentée en même temps que des schémas ou des images filmées. Dunathan et al. 1975 ont présenté à des lycéens un film vidéo et un enregistrement audio au même taux de compression (50%, 33%, 25% et 0%). Les sujets avaient pour objectif la construction d'un bateau. a 50 % de compression, les deux présentations simultanées auditives et visuelles ont conduit à la même performance motrice (construction d'un bateau) qu'avec les taux de compression plus faibles (0 %, 25 %, 33 %). Ludrick (1974) a utilisé un vidéo enregistrement à deux taux de présentation (150 et 211 m/mn). Les étudiants pour qui le taux de présentation était le plus élevé ont obtenu le meilleur résultat. Clements (1985) a utilisé des schémas associés à l'audition de paroles comprimées par des collégiens.

b-La présentation orale:

Un groupe de 29 étudiants écoutent un cours de biologie à un taux normal (entre 113 et 138m/mn) tandis qu'un autre groupe de 28 sujets écoute le même cours enregistré et comprimé (193 à 238 m/mn) par suppression des pauses (Sarenpa 1971). Aucune différence significative ne fut observée entre les connaissances des étudiants utilisant les enregistrements à taux normal et les connaissances des étudiants utilisant les enregistrements à taux comprimé; toutefois ce dernier groupe gagne du temps dans l'apprentissage. Lass (1974) compare les performances des étudiants placés dans deux conditions d'étude. D'une part ils écoutent des enregistrements comprimés à 50 % par la méthode d'élimination des pauses, d'autre part, ils sont placés en condition de lecture libre. Lors d'un examen final, la performance des étudiants est meilleure pour les réponses aux questions concernant les enregistrements comprimés que sur les réponses aux questions concernant les lectures libres. Sur les 150 étudiants interrogés, 82 % préfèrent associer l'écoute d'enregistrements comprimés à des discussions plutôt que la lecture libre.

D'autre auteurs ont mis en évidence l'utilité et l'efficacité de l'écoute d'enregistrements comprimés (Challies 1973,Primerose 1973, Shore 1975). En général les résultats sont favorables à la parole comprimée tant que la compression ne dépasse pas 50 % et une grande majorité d'étudiants préfèrent "l'écoute rapide". Les groupes d'étudiants qui utilisent un compresseur gagnent un temps appréciable. Au-delà de 50 % de compression ou au-delà de 280 m/mn, la compression est mal acceptée par les auditeurs et entraîne une diminution de la compréhension pouvant retentir sur la performance (Leroy 1982).

c-La parole comprimée et la lecture:

Plusieurs chercheurs ont proposé d'étudier l'apport de la compression temporelle dans l'augmentation de la vitesse de lecture. L'audition d'un enregistrement dont le débit augmente progressivement, associée à la lecture silencieuse du même texte pourrait améliorer la vitesse de lecture (Orr 1964, Bradtmueller 1978 et 1979, Freeman et Beasley 1978, Leroy 1983). Toutefois, les résultats sont contradictoires dans ce domaine. (Reland 1966, Leroy 1982). Cependant, l'effet bénéfique ou non de la compression temporelle d'un enregistrement sur la lecture pourrait dépendre de l'âge du sujet et de son développement cognitif. Pierce (1978) a mis en évidence l'importance du facteur développemental: pour cet auteur, l'effet bénéfique de la compression sur l'augmentation de la vitesse de lecture pourrait être observé chez les lycéens.

d-Apprentissage d'une langue étrangère:

Les méthodes d'expansion et de compression temporelle sont utiles pour développer les capacités d'écoute et de compréhension et pour favoriser l'apprentissage d'une langue étrangère (Flahorty 1979, Harvey 1984, Vernick, 1985).

e-Formation continue et études supérieures:

Une autre application de la compression temporelle fut proposée pour accélérer l'acquisition d'une grande quantité d'informations chez les étudiants à l'université et chez les professionnels en formation continue (Rippey 1975). Nath et al.en 1981, ont utilisé la technique de compression temporelle dans le cadre d'une formation continue de pharmaciens et Drake en 1981 pour la formation continue des enseignants.

Short (1978) utilise la compression temporelle pour l'enseignement et l'auto-formation des étudiants à l'université de Syracuse. Beatty et al. (1980), Miner et al. (1980), Olson (1986) notent une plus grande efficacité de l'apprentissage dans l'enseignement supérieur grâce à l'utilisation de la compression temporelle.

2-Education spécialisée:

a-Handicap visuel:

Une application proposée et étudiée par un bon nombre d'expérimentateurs se situe dans le domaine de l'acquisition des connaissances chez les sujets aveugles (Bischoff 1979). En effet, la lecture braille est relativement lente comparée à la lecture visuelle silencieuse (Myers 1978, Colleen 1980). En moyenne, un bon lecteur en braille lit avec les doigts 100 à 120 m/mn alors qu'un lecteur voyant lit avec les yeux plus de 300 m/mn ( Myers 1978). Foulke à Louisville fut le premier à s'intéresser à cette application dans les années 60; de nombreux auteurs ont poursuivi les recherches dans ce domaine (Myers 1978, Bancroft 1981 et Bendinelli 1982).

b-Retard scolaire:

Des applications de la compression temporelle de la parole ont été proposées par différents auteurs pour favoriser l'éducation des enfants en difficultés scolaires à l'école primaire (Zucker et D'Alonzo 1981) et au lycée (D'Alonzo et Zucker 1981).

3-Tests et diagnostic des pathologies auditives:

Riensche et al. (1983) ont proposé des données normatives sur l'intelligibilité de la parole comprimée chez 40 auditeurs normaux âgés de 18 à 26 ans. Ils ont proposé aux sujets 5 séquences de rimes extraites du test de Fairbanks (1958), présentées de façon monaurale à l'aide d'écouteurs à 40 décibels. Les sujets doivent répéter les phonèmes initiaux dans l'ordre entendu. Les séquences sont présentées à débit normal ou comprimées à 60%, associées à un masquage multivoix ou non. Les auteurs considèrent que leurs données normatives permettront une application dans la détection des problèmes auditifs. Ils ont prolongé cette étude avec 72 enfants droitiers distribués en trois groupes d'âges différents: 7- 8, 9-10 et 11-12 ans. Beasley et al. (1980) ont établi des données pour 96 jeunes adultes sans problèmes d'audition avec des compressions de 40, 50, 60 et 70% et deux degrés d'intensité (24 et 40 décibels).

4-Marketting et publicité:

Schlinger et al. (1983) ont étudié une application originale de la compression de paroles dans le domaine du marketting et de la publicité. Selon leurs observations, les consommateurs apprécieraient davantage la parole rapide plus dynamisante et optimiste. Les personnes qui parlent vite sont mieux considérées par les auditeurs (Mc Lachlan 1982).

VI - CONCLUSION

Les recherches des acousticiens (Vicard 1987, Wang 1987) et des informaticiens (Pierrel 1987) qui ont pour objectif la synthèse et la reconnaissance de la parole, utilisent les résultats des phonéticiens, des phonologistes, des linguistes, des psychologues, mais en contre partie vérifient ces résultats:

  • la parole est redondante et reste intelligible après élimination de petits segments du signal vocal,
  • la durée d'un phonème varie entre 30 millisecondes à quelques centaines de millisecondes,
  • des "silences" sont indispensables pour la reconnaissance de certaines consonnes et l'intelligibilité de la parole,
  • les pauses et la prosodie jouent un rôle important dans la compréhension des informations parlées,
  • la coarticulation et les interactions entre les différentes étapes du traitement rendent ces études très complexes,
  • la schématisation des mécanismes et des processus mis en jeu est toujours réductionniste, même si elle permet d'affiner les résultats et d'améliorer la qualité des synthèses vocales, des progrès sont encore attendus dans la reconnaissance de la parole,
  • l'attention et la mémoire sont importantes dans l'analyse, la compréhension et l'interprétation d'un message parlé.

Étudiées sur un plan théorique et pratique surtout à partir des années 60, les techniques de compression temporelle de paroles ont conduit à différentes applications. Des revues de questions de Foulke (1969) et Leroy (1982), ainsi que des différentes expérimentations effectuées dans les années 80, plusieurs idées générales peuvent se dégager.

À un niveau théorique, deux catégories d'études sont à envisager:

1-Les expériences qui analysent les relations entre le taux des mots d'un discours et l'intelligibilité de cet énoncé. La compression temporelle produite par la méthode d'échantillonnage, permet une intelligibilité relativement correcte avec des taux de compression relativement élevé (50 et 60 %) et avec une élimination de signal sonore assez importante (jusqu'à 60 millisecondes). Toutefois, il semblerait que les durées des segments éliminés, pour lesquelles l'intelligibilité reste optimale, soient comprises entre 10 et 30 millisecondes.

Pour l'intelligibilité associée à un niveau périphérique du traitement du signal vocal, tous les paramètres n'ont pas la même importance. Par exemple les deux ou trois premiers formants d'une voyelle sont suffisants pour la discriminer. D'autre part, l'oreille humaine ne peut percevoir des durée de signal sonore inférieures à 30 millisecondes. Pour la discrimination de certaines consonnes, la présence de "silence" étant indispensable, l'élimination d'une trop grande portion de signal pourrait affecter l'intelligibilité du message. C'est pourquoi nous pensons que des périodes "off" comprises entre 10 et 30 millisecondes sont préférables.

2-Les études qui évaluent la compréhension liée à l'écoute par rapport à différents taux de mots. La compréhension décroît modérément en fonction de l'augmentation du taux des mots jusqu'à une certaine limite qui est de 275 mots par minute. La compréhension d'un discours diminue brusquement et très rapidement pour un débit de parole dépassant 275 mots/minute.

L'augmentation du taux de compression a un effet différent sur la compréhension liée à l'écoute et sur l'intelligibilité des mots.

Enfin il convient de signaler que l'intelligibilité et la compréhension d'un discours accéléré par la méthode d'accélération de la vitesse de déroulement d'une bande magnétique, sont fortement diminuées au-delà de 30 %.

Ces résultats montrent que l'intelligibilité des mots ne suffit pas à prédire le taux de compréhension du discours. La compréhension du langage parlé implique l'enregistrement continu (codage et stockage) des informations parlées. Elle nécessite un traitement de l'information et par conséquent un minimum de temps. Quand le taux des mots est trop élevé, ceux- ci ne peuvent être traités aussi rapidement qu'ils sont reçus. En conséquence, des informations sont perdues.

La présentation séquentielle d'un énoncé parlé, le temps nécessaire au traitement perceptif et cognitif d'un signal auditif expliqueraient ce seuil de 275 mots/minute. L'étude de la compréhension d'un discours implique l'écoute d'une parole continue et de nombreux facteurs peuvent alors être influencés par la compression temporelle: la coarticulation, la prosodie, l'accès au lexique, l'intégration syntaxique, la mémoire à court terme (Chodorow 1979). Les premières expériences que nous avons effectuées avec des étudiants (Richaume 1987, 1988) ont mis en évidence une variabilité interindividuelle assez prononcée dans l'intelligibilité et la compréhension de la parole comprimée. En reprenant le point de vue de Baddeley (1986) le rôle de la mémoire à court terme et de la vitesse d'articulation du sujet sont probablement des facteurs importants. Quand le sujet doit maintenir une information en mémoire à court terme, il procède à une auto-répétition de maintenance. L'auto-répétition mentale dépendrait de la vitesse d'articulation ou du moins de sa vitesse de répétition intérieure. Plus le sujet articule vite, plus le nombre de mots répétés est élevé. Nous pensons que le traitement et la mémorisation de L'information auditive sont favorisés par une articulation rapide: les sujets qui articulent vite et qui lisent vite comprendraient mieux la parole comprimée.

Au niveau pratique, l'évolution des techniques électroniques, a pu rendre possible l'insertion de processeurs dans un magnétophone de petite taille et différents modèles sont en vente actuellement (France, Etats-Unis ect...). Des compresseurs de paroles plus sophistiqués et des logiciels existent également à des prix plus élevés.

Le taux de mots correspondant au seuil d'efficacité d'écoute d'un discours comprimé est environ deux fois le débit normal d'émission des paroles. De plus ce seuil pour les énoncés familiers, déjà entendus et compris semblerait être plus élevé. Ainsi, l'intérêt de gagner du temps sans perte dans la compréhension et l'apprentissage, semble alors évident. La compression temporelle d'un signal auditif pourrait donc avoir des applications très appréciables tant dans le domaine de l'enseignement et de l'apprentissage que dans celui de la réhabilitation des personnes handicapés.

Toutefois, le premier obstacle à cette innovation pédagogique, pourrait être la non acceptation de cette nouvelle méthode par les utilisateurs potentiels. Les premières expériences dans ce domaine ont mis en évidence un effet de pratique et les effets de différents facteurs tels que l'âge, le niveau mental, le stade du développement cognitif du sujet. Des études théoriques et expérimentales sont nécessaires pour préciser l'intérêt de la compression et pour déterminer à quelle population elle s'adresserait de façon préférentielle.

 
sommaire


CHAPITRE 4:

La PAROLE COMPRIMÉE ET L'ÉCOUTE RAPIDE

SECTION 2:
ÉTUDE EXPERIMENTALE

Le problème qui détermine l'organisation et la mise en place de cette étude expérimentale, concerne la possibilité de la prise de connaissance rapide d'une information orale.

Avant d'étudier les avantages de l'écoute rapide et les applications aux sujets susceptibles de bénéficier de ces avantages: lecteurs lents (voyants et aveugles) et les étudiants qui sont confrontés à une grande quantité d'information, il convient de déterminer les caractéristiques optimales d'une compression temporelle. Ces caractéristiques devront être celles qui ne produisent pas une diminution de l'intelligibilité et de la compréhension du texte et donc de la performance du sujet (expérience 1). Mais, pour évaluer l'intelligibilité d'un enregistrement comprimé, une présentation segmentée du matériel auditif s'impose: présentation mot par mot ou par portion de phrase. Aussi, une comparaison entre la compréhension des sujets en situation d'écoute segmentée d'un enregistrement comprimé d'une part et des sujets en situation d'écoute continue du même enregistrement d'autre part (expérience 2) est nécessaire pour contrôler si la présentation continue d'un enregistrement comprimé ne détériore pas excessivement la compréhension et la rétention du discours. Le seuil, c'est-à-dire la limite de 275 mots par minute à ne pas dépasser, sous peine de détérioration de l'intelligibilité et de la diminution de la compréhension et de la performance est étudiée dans l'expérience 3. Enfin, nous vérifions si en condition de présentation continue, un taux de parole normale (135 mots/minute) et un taux de paroles comprimées (270 mots/minute) conduisent à des différences dans la compréhension et la performance des sujets (expérience 4).

Ces quatre expériences utilisent les deux mêmes textes, l'un qualifié d'abstrait et relativement difficile, l'autre concret, plus facile.

Notons enfin que la plupart des études théoriques et expérimentales sur la parole comprimée ont été effectuées aux Etats-Unis et s'adressent donc à la langue anglaise .

Très peu d'expérience emploient la langue française (Butet 1981).

EXPERIENCE 1

I-PROBLEMES THEORIQUES

En 1950, les travaux de Miller, portant sur la compréhension d'un discours amputé de segments courts, montrent que des portions peuvent être éliminés dans un discours sans altérer profondément sa compréhension. Ces résultats offrent des possibilités théoriques et expérimentales nouvelles. Empruntées par Fairbanks et al. (1954), elles conduisent ces auteurs à à l'élaboration d'un nouveau procédé d'augmentation du débit de la parole: La compression temporelle.

Depuis 1954 des auteurs ont étudié l'effet du débit de la parole (vitesse et compression) sur l'intelligibilité et la compréhension d'un message comprimé ou d'un message accéléré. Les résultats expérimentaux montrent que pour une variation de débit de parole d'un message comprimé qui passe de 175 mots par minute à 275 mots par minute, la compréhension diminue peu et lentement (faiblement décroissante), mais qu'au delà de 275 mots par minute, la compréhension diminue rapidement. D'autre part, l'intelligibilité d'un mot (exactitude avec laquelle un mot est rapporté quand il a été entendu,pour une présentation mot par mot) n'est pas inférieur à 90 pour 100 avec un taux de compression inférieur à 50 pour 100.

Pour Foulke et Sticht, la diminution rapide de la compréhension avec des taux de compression supérieur à 275 mots par minute, n'est pas due seulement à la diminution de l'intelligibilité, mais plutôt à une surcharge de la mémoire à court terme dans le traitement de l'information. Selon ces deux auteurs:

  1. la perte de l'intelligibilité de mots individuels ou connectés (associés dans une phrase ou un texte) est minimale avec 50 pour 100 de compression;
  2. des indices syntaxiques et sémantiques compensent la diminution de l'intelligibilité produite par la compression;
  3. indépendamment du taux de compression employé, la compréhension diminue rapidement au delà de 275 mots par minute.

De Haan (1977, 1982) a trouvé un seuil de compréhension de la parole comprimée qu'il situe à environ 52 pour 100 de compression. La diminution du taux de compréhension pourrait être due à une diminution du taux d'intelligibilité, quand la compression de la parole atteint ou dépasse 50 pour 100.

Un taux final de 275 mots par minute pourrait être produit avec moins de 50 pour 100 de compression si le taux initial de mots parlés est assez élevé. Le débit final d'un message est fonction à la fois du taux de compression et du débit initial d'émission du message.

Plusieurs études expérimentales citées par Foulke et Stitch (1969) et Leroy (1982) mettent en évidence la supériorité de la parole comprimée sur la parole accélérée pour un même gain de temps (50 % par exemple.

Dans une première expérience, nous proposons de vérifier les résultats obtenus par la plupart des auteurs ayant utilisé la langue anglaise: en particulier quelle est l'influence de trois modes de présentation orale (normal, accéléré et comprimé) sur l'intelligibilité, la compréhension de deux textes et la rétention (performance des sujets aux questionnaires à choix multiples).

II-PROBLEMES METHODOLOGIQUES

1-Compression et accélération:

la compression de la parole peut être obtenue par différentes méthodes. Nous utilisons la méthode dite "d'échantillonnage" comme exemple; Cette méthode supprime périodiquement de petits segments d'enregistrement (20 millisecondes) à des intervalles réguliers et met ensuite bout à bout les segments restants.

Le résultat obtenu, est une parole reproduite en moins de temps que pour la version d'origine, mais sans les distorsions de qualité et de hauteur que l'on produirait en faisant fonctionner le magnétophone à une vitesse trop rapide.

le débit des paroles d'un enregistrement comprimé ou accéléré , qui peut être défini par le nombre de mots émis par minute, dépend:

  • du degré d'accélération ou de compression,
  • du débit de la parole du message initial. .

Exemple: un message comprimé de 250 mots par minutes peut être produit par 50 pour 100 de compression d'un message enregistré à 125 mots par minute ou par une compression de 33 pour 100 d'un message enregistré à 188 mots par minute.

Notons que la différence essentielle entre une compression temporelle et une accélération est une différence de quantité de signal. Comme avec la plupart des processus de compression utilisés, dans cette expérience, le mode comprimé est obtenu par élimination régulière de portions d'enregistrement, les portions restantes d'abord "dilatées" sont ensuite déroulées 2 fois plus vite que dans le mode normal. Dans le mode accéléré, la bande enregistrée est déroulée 1,5 fois plus vite que dans le mode normal.

Conformément aux remarques méthodologiques présentées dans le chapitre précédent, pour chaque mode de présentation de l'enregistrement, seront précisés:

  • un coefficient d'accélération ou de compression,
  • un taux d'accélération ou de compression,
  • un nombre de mots par minute.

Le coefficient d'accélération ou de compression est le nombre de fois par lequel il faut multiplier la vitesse de déroulement de l'enregistrement normal pour obtenir la vitesse de déroulement de l'enregistrement accéléré ou comprimé.

Le taux de compression ou d'accélération est le pourcentage de temps économisé à l'écoute.

Les coefficients ont été choisis pour cette étude en accord avec les résultats expérimentaux relatés dans les nombreux articles consultés.

Pour le mode de présentation accéléré, au-delà de 33 %, d'accélération, les distorsions sont trop importantes,tandis que pour le mode de présentation comprimé (élimination de portions associée à une accélération), l'intelligibilité et la compréhension déclinent rapidement. Dans le mode de présentation normal, le débit de la parole a été évalué après l'enregistrement à 135 mots/minute.

2-Intelligibilité et compréhension:

L'intelligibilité et la compréhension d'un message accéléré ou d'un message comprimé dépendent donc des trois paramètres définis précédemment: coefficient d'accélération, taux de compression et nombre de mots par minute dans l'enregistrement initial et enfin de l'intensité en décibels des sons émis.

L'intelligibilité est définie par le pourcentage de mots correctement identifiés. Ce pourcentage est lié à la fois à la perception auditive du sujet et à sa mémoire à court terme.

La compréhension d'un message comprimé peut être mesurée par le nombre de réponses exactes données aux questions posées sur le contenu du message comprimé, mais aussi par le nombre de propositions sémantiquement exactes. La compréhension fait appel à la mémoire à court terme, aux facultés interprétatives et à la mémoire à long terme du sujet.

L'intelligibilité de phrases ou de mots comprimés peut être mesurée par le nombre de mots exacts répétés oralement ou par écrit après écoute des paroles comprimées. Toutefois il convient de remarquer que le score d'intelligibilité de mots individuels ne peut pas permettre de déduire l'intelligibilité des mots dans un message continu.

En effet pour évaluer l'intelligibilité des mots deux conditions peuvent être étudiées:

  • une condition de présentation de mots individuels dans laquelle, après la présentation du mot, l'auditeur a un certain temps pour décider quel est ce mot;
  • une condition de présentation de texte continu dans laquelle les sujets ont très peu de temps, entre chaque mot, pour décider quel est le mot entendu. Dans cette deuxième condition, la diminution, même minimale, de l'intelligibilité de chaque mot pourrait engendrer un effet cumulatif sur la compréhension du texte écouté.

Aussi, nous introduisons une variable indépendante supplémentaire: la variable "Essai" dont chaque degré correspond à un groupe de 7 propositions parmi les 35 propositions de chacun des 2 textes présentés.

III - BUT DE L'EXPERIENCE

L'objectif expérimental est d'effectuer une étude exploratoire concernant la comparaison entre trois modes de présentation de discours enregistrés à trois groupes d'étudiants d'Université.

Avant de prolonger nos investigations sur une population de déficients visuels, dans un premier temps, nous étudierons chez les voyants, l'efficacité de l'écoute d'un discours dont le débit de mots est augmenté. Si un mode de présentation orale permet d'appréhender en un temps donné une plus grande quantité d'information qu'un autre, nous en déduisons alors qu'il est plus efficace (revues de Foulke et Stitch 1969, Leroy 1982). La quantité d'information par unité de temps présentée aux sujets est modifiée par les deux procédés suivant: accélération d'un enregistrement initial et compression de ce même enregistrement. Une prise d'information orale met en jeu la perception auditive, la mémoire et la compréhension. La perception dépendant directement de l'intelligibilité, notre propos est de mesurer l'intelligibilité et la compréhension d'un discours à un débit de mots normal, puis supérieur grâce à deux procédés favorisant cette augmentation.

IV - LES VARIABLES

1-Les variables indépendantes:

La première variable indépendante est le mode de présentation du discours oral. Elle comporte trois degrés:

  • le mode normal (135 mots par minute),
  • le mode accéléré (202,5 mots par minute),
  • le mode comprimé (270 mots par minute).

les paramètres caractérisant chacun des trois degrés de cette variable sont présentés ci-dessous:

MODE        

 

NORMAL 

ACCELERÉ

COMPRIMÉ

COEFFICIENT 

 

1

1,5

2

TAUX %

 

0

33

50

MOTS/MINUTE

 

135

202,5

270


La deuxième variable indépendante est la nature du texte enregistré. Elle possède deux degrés:

  • un texte A de type abstrait,
  • un texte B de type concret.

La troisième variable indépendante concerne le déroulement de l'écoute. C'est la variable Essais qui comporte 5 degrés: chaque texte est découpé en 5 groupes de 7 propositions.

La quatrième variable indépendante est l'heure de la passation. Elle comprend 4 degrés:

9h, 10h30, 14h, 15h30.

Cette variable permet de contrôler un effet éventuel de l'heure de la journée sur la performance des sujets (en particulier sur la mémoire à court terme).

2-Variables dépendantes:

a-Intelligibilité:

Elle s'exprime en pourcentage de mots correctement identifiés (rappel immédiat) par rapport aux mots du texte. Elle est en rapport avec la perception auditive et la mémoire à court terme.

b-Compréhension:

Elle s'exprime par le pourcentage des propositions sémantiquement correctes, notées par les sujets par rapport aux propositions des textes. Elle concerne la mémoire à court terme, des processus de traitement sémantique et les capacités interprétatives des sujets.

c - Performance:

Elle est définie par le nombre de réponses bonnes à un q c m (questionnaire à choix multiples). Elle fait appel au traitement sémantique de l'information, à la compréhension et à la mémoire à long terme.

V - LES HYPOTHESES

Les données expérimentales exposées par les nombreux chercheurs intéressés au domaine de la parole rapide, nous permettent de formuler quatre hypothèses.

1-Hypothèse 1:

Lorsque le débit de paroles ne dépasse pas 270 mots/minute, l'intelligibilité des mots reste bonne et les pertes seront inférieures à 10 % quel que soit le mode de présentation des textes enregistrés (normal, accéléré ou comprimé).

Par conséquent le pourcentage des mots corrects notés par les sujets qui écoutent deux textes a et B enregistrés à un taux normal (135 m/mn), accéléré (202 m/mn) et comprimé (270 m/mn) est supérieur à 80.

2-Hypothèse 2:

Pour un débit de paroles inférieur à 270 mots/minute, l'écoute de la parole comprimée est un mode d'accès à l'information plus efficace que l'écoute de la parole accélérée, elle-même plus efficace que l'écoute de la parole dite normale. "Plus efficace" signifie que les sujets ont eu besoin de moins de temps pour aboutir à une performance relativement correcte.

Par conséquent lors du rappel et de la compréhension le nombre de propositions correctement rappelées est différent pour les trois modes de présentation des textes enregistrés a et B, mais reste supérieur à 80 %.

Hypothèse 2b: le pourcentage des propositions sémantiquement correctes notées par les sujets par rapport au temps d'écoute des texte a et B est plus élevé pour le mode parole comprimée que pour le mode paroles accélérées, lui-même plus grand que pour le mode normal.

Hypothèse 2c: le rapport des notes obtenues aux q c m au temps d'écoute des textes enregistrés est supérieur pour le mode comprimé par rapport au mode accéléré, lui-même supérieur par rapport au mode normal.

3-Hypothèse 3:

La compréhension et la performance des sujets est meilleure pour l'écoute d'un texte concret que pour l'écoute d'un texte abstrait.

Hypothèse 3a: les pourcentages des mots exacts et des propositions exactes seront plus élevés pour le texte B (concret) que pour le texte a (abstrait) pour les trois modes de présentation.

4-Hypothèse 4:

L'intelligibilité et la compréhension varient durant l'écoute des textes, soit en raison d'un effet de pratique, soit en raison de l'accumulation des pertes d'information.

Hypothèse 4a: pour un effet de pratique, les pourcentages des mots corrects et des phrases sémantiquement exactes seraient plus élevés pour les derniers groupes d'essais.

Hypothèse 4b: pour un effet de pertes d'information ou de stress, les pourcentages de mots corrects et de propositions correctes seraient plus faibles pour les derniers groupes d'essais.

VI-METHODE

1-Les sujets:

L'échantillon est composé de 60 étudiants (48 filles et 12 garçons) âgés de 18 à 25 ans, la moyenne d'âge étant de 20 ans 1 mois. Les sujets sont tous français, de langue maternelle française et aucun d'entre eux ne présente des problèmes d'audition. Les étudiants sont répartis de façon aléatoire, dans trois groupes principaux:

  • 20 en écoute de paroles à taux normal,
  • 20 en écoute à taux accéléré,
  • 20 en taux comprimé.

2-Matériel:

L'expérience se déroule dans une pièce bien éclairée de 3 mètres sur 5 mètres environ contenant une grande table et des sièges. Cette salle est relativement isolée des salles de cours et possède une assez bonne isolation phonique.

Un magnétophone General Electric SNH 00978 (petit modèle) permet d'écouter un message enregistré sur cassette en mode normal, accéléré, comprimé ou dilaté, et dont le coefficient d'accélération peut varier de 0,85 à 2.

Six écouteurs individuels de très bonne qualité sont reliés à une boite relais assurant la diffusion simultanée du message.

Le message enregistré se compose de trois textes (voir annexes), lus par une voix féminine, c'est-à-dire celle de l'expérimentateur qui donne la consigne aux sujets. Le premier texte est un extrait du Petit Prince de Saint- Exupéry. les deux autres, le texte a "L'île du cercle", de type "abstrait" contenant 245 mots (lus en 109 secondes) et le texte B "Le vieux fermier", de type "concret", contenant 231 mots (lus en 103 secondes) sont tirés d'un article de Le Bouedec (1985 ). Pour ces deux histoires une dernière proposition est ajoutée afin d'obtenir 5 groupes de 7 propositions.

3-Procédure:

a-Le calendrier des passations:

Pour contrôler l'effet des deux variables: ordre de présentation des textes ( AB ou BA), et moment de la passation dans la journée, chaque groupe principal est divisé en deux sous-groupes suivant l'ordre de présentation des textes (exemple NAB pour présentation normale ordre a B et NBa pour présentation normal ordre B A). Chaque sous-groupe est partagé en deux sous-groupes de 5 sujets, l'un passant le matin, l'autre l'après-midi. Ainsi sont constitués 12 groupes de 5 sujets selon le calendrier de répartition ci- dessous:

heure 

 

LUNDI

MARDI

MERCREDI

9 h

 

NAB

ABA

CAB

10h30

 

AAB

CBA

NBA

13h30

 

CAB

NAB

ABA

15h

 

NBA

AAB

CBA

  • Passation des groupes:

Pour chaque groupe on cherche à établir par essais successifs, un volume de son permettant un confort d'écoute acceptable pour chaque sujet.

Avant d'écouter le premier texte (Le Petit Prince), les 5 étudiants entendent la consigne suivante: "Vous allez entendre une histoire que vous écouterez attentivement car il faudra ensuite faire un résumé et noter à la fin du résumé si ce texte vous est connu ou non".

Cette première écoute a pour objectif de mettre les sujets en contact avec le type de paroles auquel ils seront soumis pendant l'expérience, afin d'éviter une perturbation possible des performances due à l'effet de surprise et de mise en route. En outre, , la perspective d'un résumé à faire, devrait stimuler l'attention des sujets. .

Les deux histoires a et B ou B et a sont ensuite présentées selon le plan décrit ci-dessus et les instructions suivantes sont données:"Vous allez entendre successivement deux histoires dont le titre, pour celle qui vous intéresse présentement est inscrit sur la feuille placée devant vous. Vous entendrez une portions de phrase et vous noterez sur la feuille, à côté du numéro 1, dès que possible, exactement ce que vous avez entendu. Vous ferez de même jusqu'à la fin de l'histoire. Puis, vous répondrez à un q c m". Les sujets ont à leur disposition un crayon et une feuille de protocole comprenant 35 lignes numérotées et après l'écoute de l'enregistrement un q c m imprimé (annexe ). Après chaque écoute d'une portion de phrase (c'est-à-dire d'une proposition), l'expérimentateur attend que le dernier sujet ait fini d'écrire pour déclencher le suivant. , et ainsi de suite jusqu'à la fin de l'histoire. Puis les feuilles sont retirées aux étudiants et un questionnaire à choix multiple est distribué après un délai de 1 minute en condition de paroles comprimées et 30 secondes en condition de paroles accélérées.

Afin d'évaluer la difficulté des Q C M et leur équivalence, un groupe contrôle de 10 étudiants ont subi les épreuves sans avoir au préalable entendu les enregistrements. Les scores de réponses justes sont respectivement: 36 pour cent pour "L'île du cercle" et 35,7 pour cent pour "Le vieux fermier".

4-Plan de l'expérience:

Nous utilisons un plan factoriel avec 3 groupes de 20 sujets indépendants pour tester la variable mode d présentation N normal, a accéléré, C comprimé.

Nous avions également introduit la variable H (4 degrés correspondant aux 4 heures de passation) et une variable O correspondant à l'ordre de présentation des deux textes a et B. Après une première analyse de variance les variables H et O n'ayant pas d'effet significatif, les variables étudiées sont les suivantes:

  • P mode de présentation, 3 degrés): N normal, a accéléré, C comprimé correspondent à des groupes de mesures indépendants;
  • T (textes, 2 degrés): a abstrait, B concret correspondent à des groupes de mesure appareillés;
  • E (essais, 5 degrés) de E1 à E5 correspondent à des groupes de mesures appareillés. Notons que cette dernière variable est abandonnée pour l'étude de la variable dépendante "performance".

Les résultats sont traités par le programme d'analyse de variance VAR3 pour lequel le plan d'expérience est de la forme S20<P3>*T2*E5 pour les variables dépendantes intelligibilité et compréhension et de la forme S20<P3>*T2 pour la variable dépendante "performance".

VII-RESULTATS

1-Les données expérimentales:

Elles sont présentées en annexe. En lignes de S01 à S20 sont exposées les données pour les 20 sujets du groupe P1 (présentation à taux normal). De S21 à S40 et de S41 à S60 sont respectivement exposés les résultats des groupes P2 et P3 correspondant à la présentation à taux accéléré et à taux comprimé. En colonne T1 (E1 à E5) et T2 (E1 à E5) sont exprimés pour chaque sujet, les pourcentages des mots exacts par rapport au total des mots de chaque groupe de propositions (5) pour chaque texte (2) pour l'intelligibilité des mots; le nombre de propositions sémantiquement exactes par rapport au nombre de propositions (7) pour chaque groupe de propositions (E1 à E5) pour chaque texte, en ce qui concerne la compréhension et enfin le pourcentage de bonne réponses pour chaque texte (2 colonnes) pour la performance.

Les diagrammes illustrent les principaux résultats et expriment les moyennes des résultats des sujets pour les trois modes de présentation et pour les deux textes pour l'intelligibilité, la compréhension et la performance.

Le tableau des moyennes et écarts-type est en annexe.

2-Résultats globaux:

Les résultats concernant l'intelligibilité des mots, la compréhension et la performance des sujets sont tous supérieur à 90 %, pour les trois modes de présentation et pour les deux textes.

Pour ce qui est de l'intelligibilité l'analyse de variance met en évidence un effet significatif de la variable mode de présentation (P) sur l'intelligibilité des mots (F=6.38 (2-57) p<.01), et un effet significatif de la variable nature du texte (T) sur l'intelligibilité (F=9.89 (9-513) p<.01). L'effet du facteur "essai" (E) est significative (F'=8.93 (4-228) p<.01) et enfin l'interaction E*T est significative (F'=10.03 (4-228) p<.01). En ce qui concerne l'intelligibilité des mots les autres interactions ne sont pas significatives.

En ce qui concerne la compréhension et mémoire à court terme c'est-à-dire le nombre de propositions sémantiquement exactes, le facteur "mode de présentation" a un effet significatif (F=4.53 (2-57) p<.05), l'effet du facteur "texte" est significatif (F'=78.68 ((1-57) p<.001), l'effet du facteur "essai" est significatif (F'=13.20 (4-228) p<.01), l'interaction E*T est significative (F'=12.31 (4-228) p<.01) et enfin l'interaction P*T est significative (F'=4.09 (2-57) p<.05). Les autres interactions ne sont pas significatives.

En ce qui concerne la rétention (performance aux questionnaires à choix multiples) seul l'effet du facteur "texte" est significatif (F=7.23 (1-57) p<.01). Les effets du facteur "mode de présentation" et les interactions ne sont pas significatifs.

3-Les résultats spécifiques:

Les analyses de variance sont complétés par des tests T de Student. Ces tests montrent que l'effet du facteur "mode de présentation" sur l'intelligibilité , est dû essentiellement à la différence entre le mode normal et le mode accéléré. L'intelligibilité est plus faible pour le mode accéléré que pour le mode normal, mais il n'y a pas de différence significative entre le mode comprimé et le mode normal.

Toutefois pour les scores de compréhension, les résultats sont plus faible pour la parole comprimé que pour la parole normale eux-mêmes plus faibles pour la parole accélérée que pour la parole comprimée (uniquement pour le texte abstrait).

Il n'y a pas d'effet du mode de présentation sur la compréhension du texte concret.

Pour les trois variables dépendantes, le facteur "texte abstrait ou concret" est significatif et les tests de Student tout comme les diagrammes, montrent que toutes les données concernant le texte a (abstrait) sont inférieures aux données recueillies pour le texte B (concret).

L'effet du facteur "essai" est dû à la différence entre les essais E1 associé à E5 d'une part et les essais E2, E3, E4 d'autre part.

VIII - DISCUSSION/CONCLUSION

1-Intelligibilité:

Pour un débit de mots inférieur à 270 m/mn, l'intelligibilité des mots d'un discours enregistré est supérieur à 90 % quel que soit son mode de présentation normal, accéléré et comprimé et quelle que soit la nature de son contenu.(abstrait ou concret). Ces résultats ont été observés dans de nombreuses expériences relatées dans les revues de Foulke et Stitch (1969) et Leroy (1982). Toutefois, le pourcentage des mots corrects notés par les étudiants, n'est pas sensiblement le même quel que soit le mode de présentation. L'effet du mode de présentation est surtout expliqué par la différence entre le mode de présentation normale et le mode de présentation accélérée. Ces résultats sont en accord avec ceux de nombreux expérimentateurs ayant utilisé la langue anglo-saxonne. L'accélération d'un enregistrement détériore beaucoup plus un signal vocal que la compression dans le temps et tant que cette compression ne dépasse 50% et que le débit de la parole ne s'élève pas au-delà de 275 mots/minute, l'intelligibilité des mots parlés reste bonne.

Dans cette étude expérimentale, les résultats sont liés à la perception auditive des sujets: les facteurs liés à la mémoire à court terme sont peu influents en particulier pour les propositions courtes. En effet les étudiants écrivent ce qu'ils entendent au fur et à mesure du déroulement de l'enregistrement. Une analyse qualitative des résultats montrent que les erreurs sont plus fréquentes sur les mots très courts: articles et mots de liaison (et, la, le , des etc..), en particulier pour la parole comprimée. Ce qui se conçoit bien puisque la compression temporelle implique l'élimination d'un fragment du signal vocal. Enfin, l'intelligibilité des mots est moins bonne pour le texte abstrait que pour le texte concret sauf dans le cas du mode de présentation normale où aucune différence n'est observée. Ces données peuvent être expliquées par la redondance du texte concret. En effet, bien que plus courts en moyenne, les mots du texte B (concret) sont répétés plusieurs fois: chien, chat, âne, étable, lait, etc... En outre ces mots sont fréquents dans la langue et ne présentent aucune difficulté de compréhension ou de représentation. Les mots du texte a (abstrait) sont peu redondants dans le texte et moins fréquents dans la langue.

2-Mémoire à court terme et compréhension:

La seconde catégorie de résultats (pourcentage des propositions sémantiquement exactes) implique des facteurs principalement liés à la mémoire à court terme et aux facultés interprétatives des sujets. La variable "mode de présentation" (normal, accéléré ou comprimé) a globalement un effet sur ces données dans le cas du texte abstrait, mais n'a pas d'effet dans le cas du texte concret. Ainsi, les étudiants écoutant un texte concret ont des performances de rappel de propositions qui ne présentent pas de différences significatives quel que soit le mode de présentation. Toutefois lors de l'écoute d'un texte abstrait, des différences significatives sont observées entre la parole normale et comprimée d'une part et entre la parole normale et accélérée d'autre part. En outre, quel que soit le mode de présentation envisagé, les performances concernant le texte abstrait sont toujours inférieures à celles concernant le texte concret.

L'analyse qualitative concernant la nature et la localisation des erreurs a montré qu'elles sont de nature interprétative et sont plus souvent localisées à la fin des propositions les plus longues du texte abstrait. Pour un texte abstrait plus difficile à comprendre les facultés mnésiques (mémoire à court terme) et interprétatives des sujets sont plus affectées par l'accélération et la compression temporelle de l'enregistrement. Un exemple d'erreur: "un scientifique de Lille" au lieu de "un scientifique de l'île" semble montrer que le sujet n'a pas le temps nécessaire pour faire une analyse approfondie de ce qu'il entend: même si l'intelligibilité du discours est bonne, le traitement de cette information distribuée trop rapidement est plus difficile.

3-Les performances au q c m:

Les résultats relatifs aux réponses des questionnaires à choix multiples, ne présentent pas de différences significatives quel que soit le type de paroles écoutées (normale, accélérée ou comprimée) et cela aussi bien pour l'écoute du texte concret que pour l'écoute du texte abstrait. Toutefois, les performances au q c m pour le texte abstrait sont inférieures à celles concernant le texte concret pour un mode de présentation normal, mais non pour les modes de présentation accéléré et ou comprimé.

Les q c m évoquent dans les choix de réponses possibles la bonne réponse en reprenant les termes ou l'idée du texte. Il s'agit avant tout d'une tâche de reconnaissance, de rétention immédiate.

4-Conclusion générale:

Pour un texte concret, (mots redondants, fréquence des mots élevée par rapport aux mots de la langue ), les performances des sujets impliquant la perception auditive, les facultés de mémorisation (à court et à long terme), les facultés interprétatives et de compréhension nécessitant un traitement sémantique de l'information, ne présentent pas de différences significatives quel que soit le débit de paroles et le mode de présentation utilisé . Ainsi, pour une même quantité d'information véhiculée selon les trois débits de mots différents (135 m/mn, 202 mots/mn et 270 mots/mn), la quantité d'information comprise reste sensiblement la même et aboutit à la même performance. Or, le temps nécessaire à cette prise d'information diffère d'un mode de présentation à l'autre.

Avec un débit de mots de 270 mots /mn, la parole comprimée est le mode de présentation le plus efficace puisqu'il permet l'accès à une même quantité d'information dans un minimum de temps soit un gain de temps de 50% avec la parole comprimée et environ 30% avec la parole accélérée.

Avec le texte abstrait , les performances des sujets pour l'intelligibilité et la mémoire à court terme accompagnée d'un traitement sémantique présentent des différences selon le mode de présentation. En revanche aucune différence significative n'est observée en ce qui concerne le rappel à long terme accompagné d'un traitement sémantique (réponses aux q c m). En conséquence, nous pouvons conclure qu'avec les deux types de textes sélectionnés pour cette expérience, la parole comprimée est un mode de présentation auditive plus efficace que la parole accélérée, elle-même plus efficace que la parole normale rejoignant ainsi les travaux de plusieurs chercheurs portant sur des sujets déficients visuels ( Bankrof et Bandinelli 1982, Myers 1978, Bischoff 1979) et sur des sujets voyants (Nath et al. 1981, Drake 1981).

Après analyse des résultats, nous constatons que les performances les moins bonnes ont été obtenues en général, pour l'écoute de la parole accélérée. De plus les différences inter-individuelles (écart-type) les plus marquées sont observées pour l'écoute de la parole accélérée. Or, avec ce mode de présentation, le signal vocal est modifié (hauteur des sons plus élevée). Par contre, avec la parole comprimée, le signal sonore est peu modifié bien qu'il existe des effacements courts et réguliers de ce signal et donc une perte d'information. Il semblerait que les sujets humains soient plus affectés par le "stress" auditif que par la perte d'une partie du signal vocal.

EXPERIENCE 2

I-PROBLEMES THEORIQUES

Dans notre première expérience, pour tester l'intelligibilité des mots, les étudiants notent sur une feuille les mots perçus au fur et à mesure de l'écoute de l'enregistrement. Ils ont quelques secondes pour finir d'écrire la portion de phrase entendue. Le fait de voir les mots le temps nécessaire à l'écriture de la proposition, permet de faire intervenir des mécanismes d'analyse, de mémorisation, d'interprétation et de compréhension peut être plus élaborés et permet donc d'effectuer un traitement sémantique plus soutenu de l'information entendue. Aussi le score d'intelligibilité des mots individuels ou de fragments de phrases ne peut induire l'intelligibilité des mots d'un message continu et encore moins sa compréhension. En effet pour un mot individuel ou un fragment de phrase, les sujets ont un temps de discrimination et de prise de décision plus long que dans le cas de l'écoute d'un message continu. Aussi, dans le cas d'un message continu, la diminution même minime de l'intelligibilité de chaque mot pourrait avoir un effet cumulatif sur la compréhension de son contenu. Les mots mal perçus produiront des indices sémantiques et syntaxiques faux pour les mots qui suivront (Heiman et al. 1986). Heiman et al. ont étudié les deux facteurs ("vitesse" et "degré de compression") et ont émis les deux hypothèses suivantes:

  1. Si la vitesse est un facteur critique et si 275 m/mn est un seuil, alors ce sont les contraintes temporelles imposées par la compression qui entraînent la diminution de la compréhension.
  2. Si le taux de compression est le facteur critique de compréhension et si 50% est un seuil, alors c'est la quantité d'information éliminée qui entraîne la diminution de la compréhension.

Ces auteurs complètent leurs supposition en proposant que si c'est le facteur contrainte temporelle qui influence la compréhension, des pertes majeures seront observées avec un taux de mots supérieur à 275 m/mn indépendamment du taux de compression et si c'est la quantité de signal sonore qui importe, des diminutions de compréhension importantes résulteront pour des taux de compression supérieurs à 50% indépendamment du nombre de mots par minute.

Ces hypothèses sont testées dans deux expériences: dans une première expérience, les enregistrements de 500 mots présentés en continu, sont interrompus (et non comprimés) et lorsque 60% du signal vocal est éliminé la compréhension est réduite malgré l'absence de compression temporelle; dans une seconde expérience, utilisant une procédure de masquage, il est montré que des mots masqués, présentés isolément sont moins intelligibles quand ils sont comprimés. Les auteurs concluent que la diminution de la compréhension d'un message comprimé résulte de la diminution de l'intelligibilité des mots et de la quantité des informations qu'il contient.

Par ailleurs, dans notre première expérience nous avions observé un effet du mode de présentation sur le texte abstrait et non sur le texte concret. Aussi, il est probable que la nature des enregistrements comprimés ( la familiarité des mots et la redondance des informations qu'ils contiennent) ait un effet sur leur compréhension quand ils sont présentés en continu.

II-BUT DE L'EXPERIENCE

Dans cette expérience, la comparaison de deux conditions de présentation auditive segmentée et continue) de deux textes (abstrait et concret) dont l'enregistrement a été comprimée dans le temps (50%) et dont le débit des mots de l'enregistrement d'origine est 135 m/mn (soit 270 m/mn après compression), a pour objectif d'évaluer l'effet de la compression temporelle sur la compréhension du message selon la nature de son contenu.

Etant donné qu'en présentation continue du message auditif comprimé, les étudiants auront moins de temps pour traiter l'information qu'en présentation segmentée (avec pauses), on peut s'attendre à des scores de compréhension plus élevés pour le texte concret (redondant) que pour le texte abstrait dans cette condition de contrainte temporelle. .

Mais puisque le débit de la parole est inférieur à 275 m/mn (soit ici 270) et que le taux de compression ne dépasse pas 50%, on peut s'attendre à ce que les scores de compréhension restent bons, c'est-à-dire supérieur à 80% pour les deux conditions de présentation auditive.

III-LES HYPOTHESES

Quand on passe de la condition de présentation segmentée à la condition de présentation continue, la compréhension des étudiants est moins perturbée pour le texte concret que pour le texte abstrait.

La différence entre le nombre de propositions sémantiquement correctes notés par les étudiants est plus faible pour le texte concret que pour le texte abstrait quand on passe de la condition de présentation segmentée à la condition de présentation continue des enregistrements comprimés.

IV-LES VARIABLES

1-Les variables indépendantes:

Après avoir été soumis à une compression temporelle de 50%, l'enregistrement de deux textes a et B (abstrait et concret)est distribué à deux groupes d'étudiants suivant deux conditions de présentation (segmentée et continue). Ainsi deux variables principales sont étudiées:

a- Présentation (P): 2 degrés (S segmentée et C continue);

b- Textes (T): 2 degrés (a abstrait et B concret).

Deux autres variables sont contrôlées: l'heure de passation des sujets (H) et l'ordre de présentation des textes (O).

2-Les variables dépendantes:

Deux variables dépendantes sont considérées dans cette expériences:

a-la compréhension des sujets s'appuyant sur le pourcentage des propositions sémantiquement exactes relativement au total des propositions des textes pour le groupe P S et relativement au total des propositions notées par les étudiants pour le groupe P C. Pour l'évaluation des scores de compréhension du groupe "présentation continue", les récits des étudiants ont été segmentés en propositions. Sont répertoriées les propositions exactes et les propositions fausses. Sont fausses toutes les propositions contenant un terme sémantiquement inexact ou inventé. Pour évaluer l'exactitude de chaque proposition, nous adoptons la méthode des juges: trois personnes ont à décider si le mot écrit a le même sens ou non que le mot d'origine.

b- la performance s'appuyant sur les scores des sujets obtenus aux q c m.

V-METHODOLOGIE

1-Les sujets:

40 étudiants de l'Université de Lille (filles et garçons) ont participé à cette expérience.Tous les étudiants sont volontaires et ont été recrutés dans les différentes universités de Lille (Lettres, Sciences et Droit).

L'âge moyen des sujets est de 20 ans 5 mois s'échelonnant de 18 ans 3 mois à 25 ans 2 mois. Tous les étudiants sont de langue maternelle française et n'ont pas de problème d'audition connu.

Les sujets sont répartis de façon aléatoire dans deux groupes principaux: 20 sont ceux provenant du groupe 3 (présentation segmentée mode comprimé) de l'expérience 1; les 20 autres n'ont pas participé à l'expérience précédente. Pour ces derniers les enregistrements sont présentés en continu et non proposition par proposition.

2-Le matériel:

L'expérience se déroule dans la même pièce et avec le même matériel que ceux utilisés pour la première expérience, c'est-à-dire un magnétophone General Electric, une boite relais et 6 écouteurs.

Les enregistrements sont également les mêmes que ceux de l'expérience précédente, c'est-à-dire un extrait du Petit Prince pour la mise en route et les deux récits a (L'île du cercle) et b (Le vieux fermier).

Toutefois pour le groupe des 20 nouveaux sujets, la passation diffère.

3-La passation:

Pour contrôler l'effet de la variable H moment de la journée, les 20 sujets sont divisés en 4 groupes de 5 sujets et qui subissent les épreuves aux mêmes heures respectives que le groupe 3 de l'expérience précédente, soit à 9h 30, 11h, 14h et 15h 30. Pour contrôler l'effet de l'ordre de présentation des textes a et B, 10 sujets écoutent d'abord le texte a après la mise en route et les 10 autres écoutent d'abord le texte B.

Tous les sujets opèrent une première écoute d'un extrait du Petit Prince qui a pour objectif de mettre les sujets en contact avec le type de paroles auquel ils seront confrontés au cours de la suite de l'expérience. Ce travail de mise en route permet d'éviter une éventuelle perturbation des performances qui pourrait être due à un effet de surprise. De plus, la perspective d'un résumé à faire stimule la concentration et l'attention des sujets.

Pour le premier groupe (présentation segmentée ), la consigne et la passation ont été décrites dans l'expérience précédente.

Pour le deuxième groupe (présentation continue), la consigne est la suivante:

"Vous allez entendre deux enregistrements. Vous écouterez attentivement chaque histoire, car ensuite vous aurez à raconter sur une feuille, avec le plus de détails possible tout ce que vous savez sur ce récit. Puis vous aurez à répondre à un questionnaire à choix multiple pour chacun des textes écoutés.

Avez-vous des questions à poser? "

Pour les 4 sous-groupes de 5 sujets sous la condition de présentation continue chaque séance se déroule ainsi:

  • réglage du volume sonore dans les casques,
  • écoute du récit de mise en route (Le Petit Prince)et résumé de l'histoire,
  • écoute attentive du texte a ou B (suivant les sous- groupes) ,
  • compte-rendu détaillé de l'histoire,
  • réponses au q c m,
  • repos de 2 minutes,
  • écoute de la seconde histoire avec compte-rendu puis réponses au questionnaire.

4-Plan d'expérience:

Nous utilisons un plan factoriel avec 2 groupes de 20 sujets (groupes indépendants) afin de tester la variable condition de présentation (P) à 2 degrés (S segmentée ou C continue).

Une seconde variable indépendante, la nature des textes T (2 degrés, abstrait ou concret) correspond à des groupes de mesures appareillés.

Nous avions également introduit les variables H (4 degrés, moments de la journée) et O (2 degrés, ordre de présentation des récits a et B).

Une première analyse de variance n'ayant pas montré d'effets significatifs des variables contrôlées, les données ont été regroupées, puis traitées par le programme d'analyse de variance VAR3 (Lecoutre )

En définitive, le plan d'expérience est de la forme:

  • S20<P2>*T2


VI-RESULTATS

1-Présentation des données expérimentales:

Les tableaux des données expérimentales sont exposée en annexes.

En ligne sont présentés les groupes P1 et P2 de 20 sujets chacun allant donc de S1 à S40;

En colonne, sont exposées les résultats pour chaque textes a et B, c'est-à-dire les pourcentages de propositions correctes pour le tableau "compréhension" et le pourcentage de bonnes réponses pour le tableau "performance".

Les 4 diagrammes illustrent les données expérimentales pour chaque variable dépendante (compréhension et performance) et pour chacun des textes (abstrait, à gauche et concret à droite).

2-Analyse et description des résultats:

a-Compréhension:

La moyenne des pourcentages des bonnes propositions pour le groupe "présentation continue" est supérieure à 80% pour le texte a (84.34%) mais il est supérieur à 90% pour le texte B (99.12%).

La moyenne des pourcentages des propositions sémantiquement exactes pour le groupe "présentation segmentée" est supérieure à 90% pour les deux récits: texte a (95.14%), texte B (99.57%).

TABLEAU DE LA VARIABLE DEPENDANTE "compréhension"

 

A

B

   

A

B

P. SEQUENTIELLE

95.14

99.57

 

P. SEQUENTIELLE

2.95

1.05

P. CONTINUE

84.34

99.12

 

P. CONTINUE

8.28

1.81

MOYENNES

 

ECART-TYPE

L'analyse de variance met en évidence l'effet significatif du facteur mode de présentation (segmentée ou continue). Les pourcentages de propositions sémantiquement exactes sont plus élevés pour le mode de présentation segmentée que pour le mode de présentation continue (F=29.74 (1-38) p<.01).

Le facteur nature du texte présente également un effet significatif: les pourcentages de propositions sémantiquement correctes sont plus élevés pour le texte B (concret) que pour le texte a (abstrait) (F=94.55 (1-38) p<.01).

L'interaction entre les deux facteurs P et T est significative: les pourcentages de propositions sémantiquement exactes diminuent davantage pour le texte a (abstrait) que pour le texte B (concret), quand on passe du mode de présentation segmentée au mode de présentation continue (F=27.48 (1-38) p.01). De plus on ne note aucune différence entre les scors de compréhension pour les deux types de présentation quand le texte est concret (B).

b-La performance:

En condition de présentation segmentée , les scores aux q c m sont supérieurs à 99% pour les deux récits.

En condition de présentation continue, les scores aux q c m sont supérieurs à 80% pour le texte a (87.66%) et à 90% pour le texte B (98.57%).

TABLEAUX DE La VARIABLE DEPENDANTE "PERFORMANCE"

 

A

B

   

A

B

P. SEQUENTIELLE

99.33

100.0

 

P. SEQUENTIELLE

2.06

0

P. CONTINUE

87.66

98.57

 

P. CONTINUE

8.73

4.40

MOYENNES

 

ECART-TYPE

Le facteur "condition de présentation" a un effet significatif: pour la présentation segmentée , les scores aux q c m sont plus élevés que pour la présentation continue (F=33.38 (1-38) p<.01).

L'effet du facteur "nature du texte" est significatif: les scores aux q c m sont plus élevés pour le texte B que pour le texte a (F=27.72 (1-38) p<.01).

L'interaction entre les deux facteurs "condition de présentation" P et "nature des textes" T est significative: quand on passe de la condition de présentation segmentée à la condition de présentation continue, les scores aux q c m diminuent moins pour le texte B (concret) que pour le texte a (abstrait) (F=21.68 (1-38) p.01).


VII - DISCUSSION - CONCLUSION

1-Mémorisation et compréhension:

Les enregistrements écoutés par les 40 étudiants ont subi une compression temporelle de 50% et le débit des paroles entendues est de 270 mots par minute pour les deux conditions de présentation. Toutefois, les 20 étudiants qui écoutent les récits en condition de présentation segmentée (proposition par proposition) et qui écrivent ce qu'ils entendent, ont plusieurs secondes pour "voir" chaque séquence de phrase.

La compréhension de messages comprimés à 50% (dont le débit es 270 m/mn), est présentés de façon segmentée est relativement haute et plus élevée que la compréhension de ces mêmes messages présentés de façon continue. Deux raisons peuvent expliquer ce résultat: l'existence d'une redondance perceptive de l'information et d'un temps de traitement supplémentaire dans la condition de présentation segmentée . En effet dans cette condition, les étudiants ont non seulement une information auditive donnée par les enregistrements, mais aussi une information visuelle puisque les sujets écrivent chaque item entendu dans cette condition. Même si les notes comportent quelques erreurs, la perception visuelle de la séquence de phrase écrite donne une information supplémentaire au sujet. En outre, ce mode de présentation segmentée met en jeu essentiellement les mécanismes de la mémoire à court terme et les facultés interprétatives des étudiants, puis le temps de traitement supplémentaire nécessaire à l'écriture d'une portion de phrase, permet d'améliorer l'organisation des informations dans la mémoire à long terme et ainsi, d'obtenir non seulement un meilleur résultat dans les scores de compréhension, mais aussi dans les scores de réponses aux q c m.

En présentation continue, les mots, les portions de phrase et les phrases "arrivant" les uns derrière les autres à un débit de 270 mots/minute jusqu'à la fin du récit, les sujets n'ont pas de pause pour traiter de façon plus approfondie l'information. La diminution de l'intelligibilité des mots, même légère, produit des pertes d'information qui sont cumulatives. Cet effet cumulatif de la diminution de l'intelligibilité est surtout mis en évidence dans l'analyse qualitative des résultats. En effet, pour le texte abstrait les sujets ont noté en moyenne 12 propositions pour lesquelles la majeure partie des propositions sémantiquement correctes correspondent au compte-rendu du début et de la fin des récits. La majeur partie des erreurs correspond au résumé des deux blocs de propositions situés au centre de l'histoire. Ce qui ressemble de façon étonnante à un effet de primauté et de récence.

En ce qui concerne l'analyse qualitative des compte- rendus du texte B (concret) pour la présentation continue, les étudiants ont noté en moyenne 22 propositions avec très peu d'erreurs. Ils ont tous raconté le déroulement logique de l'histoire avec de nombreux détails. Les résultats tant quantitatifs que qualitatifs montrent que le texte B (concret) nécessite moins de temps de traitement que le texte a (abstrait). Tous les sujets ont trouvé ce texte plus "facile". La présentation continue à 270 m/mn après une compression temporelle de 50%, modifie très peu la compréhension du discours et la performance des sujets au q c m. Pour un récit plus "difficile", un temps de traitement supplémentaire est nécessaire . Une seconde présentation continue de l'enregistrement comprimé pourrait-elle améliorer les résultats? Est-ce que la présentation continue à taux normal (135 m/mn) aboutirait à de meilleurs résultats? Cette dernière question sera examinée dans une autre expérience.

Dans l'expérience précédente, sous une condition de distribution segmentée , l'intelligibilité d'un message auditif ayant subi une compression temporelle de 50% (270 m/mn), bien que légèrement plus faible n'est pas significativement différente de l'intelligibilité d'un message présenté à taux normal (135 m/mn). Sous cette condition de distribution, les scores de compréhension et de réponses aux q c m ne sont pas significativement différents pour les deux modes d'enregistrement: normal et comprimé.

Sous une condition de distribution continue, les faibles pertes d'intelligibilité des messages comprimés peuvent être cumulatives et ainsi diminuer la compréhension et la performance des sujets quand le thème du discours est plus complexe.

Toutefois, les scores de compréhension ne diminuent pas significativement pour le texte concret quand on passe de la condition de présentation segmentée à la condition de présentation continue et les deux hypothèses d'interaction pour les variables dépendantes "compréhension" et "rétention" sont vérifiés. Deux explications sont à invoquer:

  1. La compression temporelle efface une partie du signal sonore. La diminution de la redondance acoustique dans le signal vocal du message comprimé fait diminuer la vitesse de perception auditive de ce message, un stimulus évoluant dans un contexte non redondant nécessite un temps de traitement plus élevé (Heiman 1986).
  2. Dans une condition de distribution continue, les pauses nécessaires à un traitement plus élaboré de l'information sont considérablement réduites.

Il n'est donc pas étonnant que le récit B (concret) dont la plupart des mots (fréquence élevée dans la langue) sont répétés plusieurs fois soit plus facilement traitée dans une condition de distribution continue du message comprimé.

Nous présentons ci-après les résultats des sujets à l'épreuve de compréhension en présentation continue qui donnent un apperçu plus détaillé des différences interindividuelles et des différences entre les scores pour les deux textes.

EXPERIENCE 2: COMPREHENSION EN PRESENTATION CONTINUE

PAROLES COMPRIMEES

Text A
1 2 3
5 6 83,33
9 13 69.23
11 13 84.61
7 8 87.50
9 13 69.23
13 15 86.67
8 9 88.89
15 15 100.00
12 15 80.00
11 13 84.61
7 10 70.00
12 15 80.00
7 9 77.78
20 21 95.24
9 10 90.00
11 12 91.67
10 12 83.33
13 15 86.67
12 14 85.71
12 13 92.31

Text B

1

2

3

19 19 100,00
23 24 95.83
24 24 100.00
22 22 100.00
25 25 100.00
25 26 96.15
20 21 95.24
27 27 100.00
26 26 100.00
22 22 100.00
22 22 100.00
20 20 100.00
20 20 100.00
25 25 100.00
20 20 100.00
22 22 100.00
17 17 100.00
25 25 100.00
20 21 95.24
22 22 100.00

(1) nombre de propositions sémantiquement exactes notées par le sujet.
(2) nombre total des propositions notées.
(3) pourcentage des propositions sémantiquement correctes par rapport au total des propositions notées.

Les sujet ont noté en moyenne 12 propositions pour le texte A et 22 propositions pour le texte B.

EXPERIENCE 3

I-PROBLEMES THEORIQUES

Plusieurs revues de questions (Foulke et Sticht 1969, Leroy 1982) et de nombreuses données expérimentales ont montré que l'intelligibilité et la compréhension d'un message sonore après compression temporelle diminuent rapidement pour un taux de compression supérieur à 50%. De Haan (1977, 1982) situe le seuil du taux de compréhension d'un message comprimé à environ 52% de compression. Dans les deux premières expériences ainsi que dans cette troisième étude, le taux de compression temporelle utilisé est 50%, puisque c'est le taux de compression maximum qui, selon les résultats expérimentaux, permet encore une bonne compréhension du message sonore. En outre comme l'intelligibilité et la compréhension d'un message auditif dépendent également du débit des paroles émises (nombre de mots par minute) elles diminuent rapidement au-delà de 275 mots/minute. Dans les deux expériences précédentes, le débit des mots après compression de 50% était de 270 m/mn. Avec de tels paramètre l'intelligibilité et la compréhension du discours restent bonnes c'est-à-dire supérieures à 90% dans une condition de présentation segmentée (proposition par proposition) et supérieure à 80% dans une condition de distribution continue.

Le taux de mots final d'un enregistrement comprimé est fonction à la fois du taux de compression et du taux de mots initial du message parlé. Dans une compression temporelle deux éléments entrent en jeu: d'une part une élimination de signal (la moitié du signal sonore est éliminé pour 50% de compression) et d'autre part une augmentation du débit de la parole qui dépend du taux de la compression temporelle mais aussi du débit des mots dans l'enregistrement initial. Dans la première expérience, dans une condition de distribution segmentée du message, les scores d'intelligibilité, de compréhension et de performances ne sont pas différents pour les deux modes d'écoute: parole normale (135 m/mn) et paroles comprimées (270 m/mn). Toutefois, dans une condition de distribution continue du message, avec le même débit de paroles et le même taux de compression (50%) les scores de compréhension et de rétention sont moins élevés que dans une condition de distribution segmentée (expérience 2). La diminution des scores pourrait être due à la diminution du temps de traitement des éléments sonores (mots et phrases) imposé par la distribution continue. Dans une condition de distribution continue les différences entre les scores pour un mode de paroles normales et pour un mode de paroles comprimées pourraient déterminer la nécessité d'allouer un temps de traitement supplémentaire pour le mode comprimé. Ce qui sera testé dans une quatrième expérience.

Après avoir testé l'influence de la distribution (segmentée ou continue ) de l'information auditive sur la performance des sujets, nous nous proposons de tester l'influence du taux des mots de l'enregistrement initial sur les scores d'intelligibilité, de compréhension et de rétention des sujets. Est-ce que l'élévation du débit des mots au-delà de 270 m/mn aura un retentissement sur le traitement mnésique des éléments du discours.?

II-BUT DE L'EXPERIENCE

L'objectif de cette expérience est de tester l'influence de l'élévation du débit des paroles initiales sur l'intelligibilité et la compréhension d'un message auditif ayant subi un taux de compression temporelle de 50% et présenté aux sujets de façon segmentée .

III-LES HYPOTHESES

1-Avec un débit de paroles supérieur à 275 m/mn, les taux d'intelligibilité et de compréhension d'un message comprimé seront inférieurs à 90%.

2- Les taux d'intelligibilité et de compréhension d'un message comprimé seront moins élevés pour un débit de paroles de 300 m/mn que pour un débit de paroles de 270 m/mn.

3- Les scores de rétention (réponses aux q c m) seront moins élevés pour un débit de paroles de 300 m/mn que pour un débit de paroles de 270 m/mn.

4-Les scores d'intelligibilité, de compréhension et de rétention seront plus élevés pour le texte B (concret) que pour le texte a (abstrait).

5-Pour une augmentation du débit des mots de 270 à 300 m/mn, la différence entre les scores d'intelligibilité et de compréhension sera moins élevée pour le texte B que pour le texte A.

IV-LES VARIABLES

1- Les variables indépendantes:

  • le débit de la parole P: 2 degrés (270 et 300 m/mn),
  • la nature du texte T: 2 degrés (a abstrait et B concret);
  • l'essai E: 5 degrés (5 blocs de 7 propositions);
  • l'ordre de présentation des textes O: 2 degrés (AB ou BA).

2- Les variables dépendantes:

  • L'intelligibilité sera définie par le pourcentage des mots correctement notés par les sujets par rapport au nombre total des mots dans le texte;
  • La compréhension définie par le nombre des propositions sémantiquement exactes;
  • La performance définie par le pourcentage des bonnes réponses aux q c m.

V-METHODOLOGIE

1-Les sujets:

Les sujets participant à cette expérience sont 20 étudiants des Universités de Lille, tous volontaires. L'âge moyen est de 20 ans 8 mois s'échelonnant de 18 ans 3 mois à 25 ans 2 mois. Les sujets sont français et n'ont pas de problèmes auditifs.

2-Le matériel:

Le lieu d'expérimentation et le matériel sont les mêmes que ceux utilisés pour les deux premières expériences. Toutefois pour un groupe expérimental, les 3 récits sont enregistrés au préalable par la même personne mais avec une vitesse de lecture plus élevée (environ 150 mots/minute). Avec 50% de compression temporelle ces enregistrements ont un débit de 300 mots/minute.

3-Procédure:

Les 20 étudiants sont répartis dans deux groupes, eux- mêmes divisés en deux sous-groupes (présentation AB et BA). Le groupe de 10 sujets à qui sont présentés les enregistrements comprimés à 50% dont le débit de la parole est de 270 m/mn, est composé des deux sous-groupes de 5 sujets de la première expérience ayant subi les épreuves expérimentales l'après-midi. Les données expérimentales proviennent de ces deux sous-groupes et sont comparées aux données provenant des 10 sujets à qui sont présentés les enregistrements comprimés à 50% dont le débit est de 300 m/mn.

La passation se déroule comme dans la première expérience et la consigne est la même.

En définitive, les enregistrements de trois récits sont présentés de façon segmentée (proposition par proposition) à deux groupes de 10 sujets. Pour l'un des groupes les enregistrements comprimés sont présentés selon un débit de 270 m/mn et pour l'autre groupe selon un débit de 300 m/mn.

4-Plan d'expérience:

Les données expérimentales sont traités par le programme d'analyse de variance VAR3 selon le plan expérimental suivant:

  • S5<P2*O2>*T2*E5

Le facteur O ordre de présentation des textes a et B, n'ayant pas d'effet significatif, les données sont regroupées selon le plan:

  • S10<P2>*T2*E5
  • le facteur P: le débit des paroles à 2 degrés, 270 m/mn et 300 m/mn;
  • le facteur T est la nature des textes à 2 degrés, a abstrait et B concret;
  • le facteur E est l'essai à 5 degrés, soit 5 blocs de 7 chacun.


VI-RESULTATS

1-Les données expérimentales:

Les données sont présentées en annexe. En ligne de S1 à S10 sont exposées les données pour les 10 sujets écoutant les enregistrements à 270 m/mn et de S11 à S20 sont exposées les données pour les 10 sujets écoutant les enregistrements à 300 m/mn.

En colonnes, les pourcentages des scores concernant chacun des 5 blocs de propositions pour chacun des texte a et B;

Trois tableaux de données sont présentés pour chacune des trois variables dépendantes: pourcentage des mots exacts, pourcentage des propositions correctes, pourcentage des bonnes réponses aux q c m.

2-Analyse des résultats:

a-Intelligibilité:

L'effet du facteur "débit des mots" (270/300 mots par minute) est significatif. Les scores d'intelligibilité (pourcentages des mots exacts notés par les étudiants) sont plus élevés pour le débit de 270 m/mn que pour 300 m/mn (F=22.57 (1- 18) p<.01).

L'effet du facteur "nature du texte" T est significatif. Les scores d'intelligibilité sont moins élevés pour le texte a (abstrait) que pour le texte B (concret) (F=8.81 (1-18) p<.01).

Les autres facteurs et les interactions n'ont pas d'effet significatif.


b-Mémoire à court terme et compréhension:

Le facteur "débit de mots" a un effet significatif: les scores de compréhension (pourcentage de propositions sémantiquement correctes) sont plus élevés pour un débit de 270 m/mn que pour un débit de 300 m/mn (F:21.33 (1-18) p<.01).

Le facteur "nature du texte" T a un effet significatif: les scores de compréhension sont plus élevés pour le texte B concret) que pour le texte a (abstrait) (F=38.53 (1-18) p<.01).

Le facteur "essai" E n'a pas d'effet significatif. Toutefois l'interaction P*E est significative: les variations entre les scores pour les différents essais sont plus élevées pour la présentation à 300 m/mn qu'à 270 m/mn (F=4.87 (4-72) p<.05).

L'interaction E*T est significative: les scores pour les blocs d'essais varient différemment pour le texte a et pour le texte B, les différences entre les essais étant plus élevées pour le texte a que pour le texte B, et les graphes des blocs d'essais montrant une élévation des scores pour les derniers blocs en ce qui concerne le texte a et non pour le texte B (F=5.06 (4-72) p<.01).

Enfin l'interaction P*E*T est significative: les différences entre les blocs d'essais sont plus élevées pour le texte a que pour le texte B quand on passe de la présentation à 270 m/mn à 300 m/mn et les différences entre les scores diminuent pour les derniers blocs d'essais du texte a quand on passe de la présentation à 270 m/mn à la présentation à 300 m/mn alors qu'elles changent peu pour le texte B (F=5.24 (4-72) p<.01).

En ce qui concerne les réponses aux q c m, les effets des facteurs et interactions ne sont pas significatifs.

VII-DISCUSSION - CONCLUSION

En ce qui concerne l'intelligibilité et la compréhension des enregistrements ayant subi une compression temporelle de 50%, les scores sont moins élevés pour un débit de mots de 300 m/mn que pour un débit de 270 m/mn. Toutefois les performances concernant les réponses aux q c m ne sont pas affectés par une élévation du débit des mots à 300 m/mn.

Les premiers résultats concernant l'intelligibilité et la compréhension sont en accord avec ceux de nombreux expérimentateurs: l'intelligibilité et la compréhension d'un texte déclinent rapidement au-delà de 270 m/mn (Foulke 1969, Leroy 1982). Mais le résultat concernant la performance des sujets est plus inattendu bien que différentes explications pourraient en rendre compte. Les scores pour l'intelligibilité et la compréhension des paroles à 300 m/mn restent relativement bons (supérieur à 80 %). De plus les sujets sont face aux portions de phrases qu'ils recopient pendant quelques secondes. L'écriture et la vision des mots perçus auditivement amélioreraient donc la rétention mnésique des sujets.

Par ailleurs, l'existence des différentes interactions pour les scores de compréhension met en évidence l'influence de la nature d'un texte sur sa compréhension, mais surtout un effet d'apprentissage ou d'habituation aux débits des mots pour le texte a (abstrait) et non pour le texte B (concret) dont les scores restent relativement élevés. Le fait de passer de 270 mots/minute à 300 mots/minute diminuent la compréhension des deux textes toutefois, cette détérioration plus forte au début (trois premiers blocs d'essais) pour le texte abstrait est plus faible ensuite. Pour le texte concret et redondant, cette diminution de la compréhension est plus irrégulière et reste relativement faible. Il semble que les étudiants soient capables de s'adapter aux débits des mots d'un discours en optimisant leur capacité d'écoute pour des enregistrements courts.

EXPERIENCE 4

I-PROBLEMES THEORIQUES

Une quatrième expérience est effectuée pour compléter les résultats de l'expérience 2. En effet, dans une condition de parole comprimée à 50% avec un débit de 270 mots/minute, les résultats sont meilleurs pour un mode de distribution segmentée (proposition par proposition) que pour un mode de distribution continue (l'énoncé intégral). Nous avons alors conclu qu'une pause de quelques secondes entre chaque proposition favorise la compréhension et la rétention de la parole comprimée.

Dans l'expérience 2, deux conditions de présentation auditive sont comparées: une présentation segmentée et une présentation continue pour deux récits (abstrait et concret) dont l'enregistrement a subi une compression temporelle de 50% et dont le débit des paroles est 270 mots/minute après compression. En présentation continue, les étudiants avaient moins de temps pour traiter l'information qu'en présentation segmentée . Dans l'expérience 1, en condition de présentation segmentée , les performances des sujets ne diffèrent pas significativement après écoute de l'enregistrement normal ou comprimé. Mais, obtiendrait-on le même résultat en condition de présentation continue de la parole comprimée et de la parole normale? En effet, en écoute continue, les suites sonores "s'écoulent" sans interruption à un débit de 270 m/mn pour la parole comprimée et 135 m/mn pour la parole normale. Est-ce que l'écoute continue d'un récit présenté à 135 m/mn permet une meilleure performance que l'écoute continue d'un récit présenté à 270 m/mn? Sur un plan théorique, étant donné les résultats de la première expérience, le traitement de l'information au niveau périphérique (intelligibilité) n'est pas détérioré par la compression temporelle de 50%, pour un débit de l'enregistrement original de 135 m/mn. Il importe de vérifier l'influence du débit des mots sur la compréhension et la rétention du discours. Sur un plan pratique, est-ce que la parole comprimée et donc "l'écoute rapide" est un mode d'accès à l'information parlée intéressant pour les auditeurs qui ont besoin de gagner du temps (Bishoff 1979, Myers 1978, Leroy 1982, Foulke et al. 1969).

Par ailleurs, dans la seconde expérience, outre l'effet des facteurs mode de présentation et nature des textes enregistrés, nous avions observé une interaction entre ces deux facteurs pour les scores de compréhension et de rétention. Dans, une même condition de distribution continue des informations, il est possible que seuls les effets des facteurs débit des mots et nature des textes soient observés.

II-LES HYPOTHESES

Si le niveau central du traitement des informations parlées est influencé par le débit de la parole, la compréhension et donc le pourcentage des propositions sémantiquement correctes notées par les étudiants sera plus faible pour les paroles comprimées que pour les paroles normales dans une même condition de distribution continue.

Les scores de compréhension et de rétention seront plus élevés pour le texte B (concret) que pour le texte a (abstrait).

III-LES VARIABLES

1-Les variables indépendantes

L'enregistrement de deux textes abstrait et concret est écouté par deux groupes d'étudiants: pour un groupe l'enregistrement est normal (135 m/mn), pour l'autre groupe il a subi une compression temporelle de 50% (270 m/mn).

Deux variables principales sont observées::

a-Présentation p à 2 degrés N (normal) et C (comprimée).

b-Textes T à 2 degrés A(abstrait) et B (concret).

Deux variables sont contrôlées: l'heure de passation des sujets et l'ordre de présentation des textes.


2-Les variables dépendantes

Deux variables dépendantes sont considérées ici:

a-La compréhension des sujets définie par le pourcentage des propositions sémantiquement exactes par rapport au total des propositions notées par les étudiants. Ce calcul a été effectué selon les mêmes critères et avec la même méthode que dans l'expérience 2.

b-La rétention traduit par les scores des sujets obtenus aux Q C M.

IV-METHODE

1-Les sujets

40 étudiants de l'université de Lille ( filles et garçons) ont participé à cette expérience. Tous les étudiants sont volontaires et ont été recrutés dans les différentes universités de Lille. L'âge moyen des sujets est de 20 ans 9 mois. La langue maternelle de tous les étudiants est le français et les sujets n'ont pas de pathologies auditive connue. Les sujets sont répartis de façon aléatoire dans deux groupes: 20 sont ceux provenant de la deuxième expérience (présentation continue mode comprimé), les 20 autres n'ont pas participé aux expériences précédentes. Pour ces derniers, les enregistrements sont présentés en continu mais à vitesse normale (135 m/mn).

2-Le matériel

L'expérience se déroule dans la même pièce et avec le même matériel que ceux utilisés pour les autres expériences.

3-La passation

Les sujets sont divisés en groupes de 5. L'heure de passation et l'ordre de présentation des enregistrements sont contrôlés comme dans les trois expériences précédentes.

Chaque groupe de 5 sujets écoute d'abord l'extrait du Petit Prince pour mettre les étudiants en contact avec le type de paroles avec lequel ils seront confrontés au cours de la suite de l'expérience.

La consigne est la même pour les deux groupes. Elle a été exposée dans l'expérience 2 pour le groupe en condition de présentation continue.

Chaque séance se déroule ainsi:

  • réglage du volume sonore dans les casques,
  • écoute du récit de mise en route (le Petit Prince) et résumé de l'histoire,
  • écoute attentive des textes a ou B suivant les sous-groupes,
  • pour les groupes écoutant l'enregistrement normal, compte rendu détaillé de l'histoire immédiatement après l'écoute,
  • pour les groupes écoutant l'enregistrement comprimé, compte-rendu détaillé de l'histoire après un délai équivalent au temps d'écoute (laissé inoccupé )afin de placer les deux groupes de sujets dans les mêmes conditions de rétention,
  • réponses au Q C M,
  • repos de 2 minutes,
  • écoute de la seconde histoire, compte-rendu et réponses au Q C M.

4-Plan d'expérience

Nous utilisons un plan factoriel avec deux groupes de 20 sujets (groupes indépendants) pour tester la variable "présentation" (P) à 2 degrés normal (N) et comprimé (C). Une seconde variable indépendante la nature des textes T à 2 degrés abstrait (A) et concret (B) est testée dans des groupes de mesures appareillées.

Les données ont été traitées par le programme d'analyse de variance VAR3. Le plan est de la forme: S20<P2>*T2

 

V - RESULTATS

EXPERIENCE 4:
COMPREHENSION EN PRESENTATION CONTINUE

PAROLES NORMALES

TEXTE A

 

TEXTE B

1

2

3

 

1

2

3

14 17 82.35   23 23 100.00
8 14 57.14   21 21 100.00
8 10 80.00   18 18 100.00
15 22 68.18   24 24 100.00
13 15 86.67   19 19 100.00
6 9 66.67   23 23 100.00
17 17 100.00   21 21 100.00
19 19 100.00   21 22 95.45
9 12 75.00   17 18 94.44
9 12 75.00   19 19 100.00
12 16 75.00   17 17 100.00
12 16 75.00   16 19 84.44
14 16 87.50   18 18 100.00
8 13 61.54   11 14 78.54
8 11 72.73   17 19 89.47
8 10 80.00   18 19 94.74
12 14 85.71   22 22 100.00
9 13 69.23   10 11 90.91
12 17 70.58   14 14 100.00
17 19 89.47   19 19 100.00

En moyenne les sujets ont noté 15 propositions pour le texte A et 19 propositions pour le texte B.

Pour les résultats en paroles comprimées voir tableau à la fin de l'expérience 2.

1-Présentation des données expérimentales

Les tableaux des données expérimentales sont exposés en annexe; En ligne sont exposés les résultats des groupes P1 et P2 de 20 sujets chacun distribués de S1 à S40.

En colonnes, sont exposés les résultats pour les textes a et B, c'est-à-dire les pourcentages de propositions correctes pour le tableau "compréhension" et le pourcentage de bonnes réponses pour le tableau "performance".

2-Analyse et descriptions des résultats

a-Compréhension

La moyenne des pourcentages des propositions sémantiquement exactes notées par les sujets pour le groupe "paroles normales" est 77.89% pour le texte a et 96.36% pour le texte B.

La moyenne des pourcentages des bonnes propositions par rapport au total des propositions notées par les sujets pour le groupe "parole comprimée" est 84.34% pour le texte a et 99.12% pour le texte B.

TABLEAU DE LA VARIABLE DEPENDANTE "compréhension"

 

A

B

 

A

B

P. NORMALE 77.89 96.36 P. NORMALE 11.42 6.18
P. COMPRIMEE 84.34 99.12 P. COMPRIMEE 8.28 1.81

MOYENNES

ECART-TYPE


L'analyse de variance met en évidence l'effet significatif du facteur P type de paroles normales ou comprimées: les pourcentages de propositions sémantiquement exactes sont plus élevés pour les enregistrements de paroles comprimées que pour les enregistrements de paroles normales (F=5.87 (1-38) p<.05).

Le facteur "nature du texte" a également un effet significatif: les pourcentages de propositions sémantiquement correctes sont plus élevés pour le texte B (concret) que pour le texte a (abstrait) (F=115.59 (1-38) p<.01).

L'interaction entre les deux facteurs P et T n'est pas significative.

Pour les enregistrements d'origine (135 m/mn) les étudiants ont noté en moyenne 15 propositions au total pour le récit a et 19 propositions au total pour le récit B.

Pour les enregistrements comprimés (270 m/mn), les étudiants ont noté en moyenne 12 propositions pour le texte a et 22 propositions pour le texte B.

b-La rétention

Tous les scores de réponses aux Q C M sont supérieurs à 87% pour le texte a et supérieurs à 98% pour le texte B

TABLEAUX DE La VARIABLE DEPENDANTE "rétention"

 

A

B

 

A

B

P. NORMALE 89.37 99.28 P. NORMALE 7.63 3.19
P. COMPRIMEE 87.66 98.57 P. COMPRIMEE 8.73 4.40

MOYENNES

ECART-TYPE

Le facteur "nature du texte" T a un effet significatif: les scores sont plus élevés pour le texte B (concret) que pour le texte a (abstrait) (F=51.95 (1-38) p<.01).

Le facteur type de paroles normales ou comprimées n'a pas d'effet significatif.

L'interaction entre les facteur P et T n'est pas significative.


VI - DISCUSSION / CONCLUSION

1-Mémorisation et compréhension

Les enregistrements écoutés par un groupe de 20 étudiants ont un débit de 135 mots/minute et les enregistrements écoutés par l'autre groupe de 20 étudiants ont subi une compression temporelle et ont un débit de 270 mots/minute. Chaque récit est écouté en continu et les sujets rédigent ensuite un compte-rendu détaillé de l'histoire; puis, ils répondent au questionnaire à choix multiple. . Les étudiants qui écoutent les récits enregistrés à un débit de 270 m/mn rappellent plus de propositions exactes que les étudiants qui écoutent les récits enregistrés à 135 m/mn (F=5.87 (1-38) p<.05). Ce résultat semble, pour le moins surprenant. Surpris par le débit de l'enregistrement comprimé et stimulés à la perspective de rédiger un compte rendu détaillé, il est possible que les étudiants aient maximisé leurs facultés d'attention et de concentration.

Pour le texte abstrait (L'île du cercle), les étudiants ont rapporté moins de propositions que pour le texte concret (Le vieux fermier), et ce dans les deux conditions d'écoute (F=115.59 (1-38) p<.01). Pour le texte abstrait, tous les étudiants ont rappelé correctement les premières et les dernières propositions du récit, mais ont omis les propositions placées au centre du texte ou ont rapporté leur contenu de façon plus synthétique et ce, d'autant plus que le débit des paroles est élevé; toutefois . avec la parole comprimée les sujets ont moins d'erreur.

Avec des récits relativement courts (quelques minutes), la compréhension et le rappel immédiat des étudiants n'est pas diminué par une "écoute rapide".

Une fois de plus, dans cette expérience les écarts-type sont importants, ce qui traduit une grande variabilité interindividuelle. Cette variabilité est plus forte pour le texte abstrait.

2-La rétention

Bien que légèrement inférieure, la performance des sujets écoutant la parole comprimée n'est pas significativement différente de celle des sujets écoutant la parole normale. Ce résultat est en accord avec les conclusions de nombreux auteurs pour la langue anglo-saxonne (Foulke et al.1969, Myers 1978, Bischoff 1979, Leroy 1982,).

EXPERIENCE 5

I-PROBLEMES THEORIQUES

De nombreux facteurs pouvant influencer l'intelligibilité et la compréhension de la parole comprimée ont été mis en évidence par les expérimentateurs. Outre le débit des mots (seuil à 275 m/mn) et le taux de compression (seuil à 50%), d'autre facteurs liés à l'auditeur sont impliqués et en particulier l'âge des sujets, leur vitesse d'articulation et de lecture. Beasley et al. (1976) ont trouvé des différences entre les performances des auditeurs en fonction de l'âge: la discrimination de mots monosyllabiques comprimés dans le temps s'améliore pour les sujets plus âgés. Freeman et Beasley (1978), Beasley Flaherty-Rintelmann 1976), puis Beasley et al. (1980) ont trouvé les mêmes résultats avec des phrases comprimées. Selon May (1984), la compression temporelle des paroles pourrait être un moyen d'étudier les caractéristiques de la perception auditive responsables des capacités de discrimination. Pour May, les capacités de discrimination de la parole comprimée dépendraient de l'âge des sujets. Dans le but de tester cette hypothèse, l'auteur a étudié quatre groupes de sujets: 14 sujets de 6 ans 6 mois en moyenne, 20 sujets de 8 ans 6 mois en moyenne, 16 sujets de 10 ans 6 mois en moyenne et 15 sujets de 21 ans 7 mois en moyenne. Ces 65 sujets ont un développement cognitif normal et une perception auditive normale. L'auteur n'a pas observé de différence significative entre les groupes des 6 ans et des 8 ans d'une part et les groupes des 10 ans et des 21 ans d'autre part. Toutefois les scores des deux groupes plus âgés (10 ans et 21 ans) sont significativement plus élevés que les scores des deux groupes plus jeunes (6 ans et 8 ans). Selon May (1984), les capacités de discrimination des paroles ayant subi une compression temporelle, augmentent avec la maturité des sujets. Les capacités optimales de traitement auditif atteindraient une asymptote vers 11 à 12 ans. L'évolution ontogénétique de l'efficacité du traitement auditif, atteint un stade optimal au début de la deuxième décade de la vie.

Le décodage de l'information parlée est régi par des mécanismes situés à différents niveaux. Au niveau périphérique, l'analyse du signal vocal dépend des propriétés physiologiques de l'oreille interne, en particulier de la sensibilité des structures de la cochlée aux différents paramètres du signal et des seuils de discrimination associés à la fréquence, la durée et l'amplitude du signal. L'intelligibilité de la parole comprimée dépend d'abord des processus d'analyse effectués à ce niveau. Au niveau central, le message parlé en cours de traitement fait appel à diverses sources de connaissances: acoustiques, phonétiques, lexicales, syntaxiques et pragmatiques. Les processus cognitifs impliquent entre autre le fonctionnement de l'attention, et de la mémoire. Le traitement d'un message parlé passerait par une étape articulatoire pour entretenir la trace mnésique: après le décodage phonétique, tandis qu'il procède au traitement syntaxique et sémantique, le sujet effectue "une verbalisation" de l'information reçue. L'auditeur se répète mentalement ce qu'il entend (Baddeley 1986). Pour Baddeley, un dispositif de boucle articulatoire alimenterait le stock phonologique: pour que les "traces" ne s'estompent pas une révision du matériel (répétition mentale) s'impose. Ce codage est central et ne dépend pas obligatoirement des mécanisme moteur du système phonatoire. En outre, la mémoire de travail "maintient en disponibilité immédiate les informations reçues de la mémoire à court terme ou retrouvées de la mémoire à long terme". Le nombre des éléments stockés en mémoire à court terme est limité:Miller (1956) a évalué la capacité de la mémoire à court terme à 7 plus ou moins 2 éléments. De plus, plusieurs auteurs ont situé la capacité temporelle de la mémoire de travail entre 1,5 et 2 secondes (Baddeley 1986, Hulme et al. 1984, Schweickert et Boruff 1986 ). Selon ces auteurs, cette durée d'environ 2 secondes serait l'intervalle de temps pendant lequel la trace mnésique peut être récupérée. Le stockage en mémoire de travail maximum pendant ces deux secondes ne dépendrait pas seulement du nombre des éléments ou "shunk" mais plutôt d'un autre facteur: la vitesse de la parole. L'empan mnésique serait fonction linéaire du taux de prononciation du sujet (Baddeley 1986, Hulme et al. 1984, Schweickert et Boruff 1986 ).

Dans la série d'expériences précédemment exposées, nous avons souligné à plusieurs reprises l'existence d'une grande variabilité interindividuelle dans les résultats après écoute des paroles comprimées. Dans la mesure où la population de ces expériences est relativement homogène en ce qui concerne la tranche d'âge et le niveau culturel, cette variabilité pourrait être expliquée par des "vitesses de traitement du langage" (parlé ou écrit) différentes selon les sujets. Les sujets capables de lire vite seraient également capables de mieux traiter la parole comprimée. C'est pour tester ce point de vue et pour comparer les capacités de traitement de la parole normale et de la parole comprimée par des collégiens en fonction de leur vitesse de lecture et de l'âge lexical de ces sujets que nous réalisons cette étude expérimentale.

En particulier, cette étude aura pour objectif d'évaluer l'influence des facteurs "vitesse de lecture" et "âge lexical" sur l'intelligibilité, la compréhension et la rétention de la parole comprimée par des élèves de sixième, cinquième, quatrième et troisième.

II-METHODOLOGIE

A-Les sujets

Les données ont été recueillies sur 80 élèves du collège Henri Durez à Estaires (Nord de la France), de langue maternelle française, au cours de l'année scolaire 1988-1989. La sélection des 80 sujets s'est opérée à partir de trois critères:

  • âge chronologique,
  • vitesse de lecture,,
  • âge lexical.

Pour sélectionner les sujets, 136 élèves (46 en sixième, 28 en cinquième, 35 en quatrième et 29 en troisième) ont passé individuellement plusieurs épreuves. Le test de "l'Alouette", test d'analyse de la lecture et de dépistage de la dyslexie a permis de définir la vitesse de lecture et l'âge lexical des sujets. Les élèves avaient pour consigne de lire le mieux possible les 265 mots du texte de "l'Alouette". Le temps de lecture est chronométré et la correction consiste à comptabiliser le nombre d'erreurs non corrigées, les mots ajoutés, les mots oubliés, les mots non lus en 5 secondes et à soustraire ce nombre au total des mots lus. Une vitesse de lecture, exprimée en nombre de mots par minute est calculée en fonction du temps de lecture et du nombre de mots correctement lus. L'âge lexical est calculé à partir de l'échelle associée au test.

Pour les quatre niveaux scolaires, ont été sélectionnés les enfants d'âge chronologique correspondant à l'âge d'un élève ayant suivi un cursus scolaire normal et ont été éliminés les élèves en retard ou en avance. Les groupes ont été constitués de telle sorte que l'âge moyen de chaque classe (pour la première phase de l'expérience) soit égal à la médiane en deçà de laquelle sont retenus les 10 lecteurs les plus lents et au-delà de laquelle sont retenus les 10 lecteurs les plus rapides. L'écart entre le plus lent des lecteurs rapides et le plus rapide des lecteurs lents est environ 10 mots/minute (8 à 15).

L'échantillon sélectionné se compose de 80 élèves (filles et garçons) répartis dans quatre groupes de 20 sujets: quatre niveaux d'âge chronologique correspondant à quatre niveaux scolaires, dans la première phase de l'expérience et à quatre groupes d'âge lexical différent dans la deuxième phase.

Une seconde épreuve a été présentée aux élèves: pour mesurer leur vitesse d'articulation. Le sujet doit répéter cinq fois le plus rapidement possible des mots et des non-mots de 4, 5 et 7 syllabes. Pour les mots, l'expérimentateur choisit les suites parmi les listes suivantes:

  • liste 1: (4 syllabes) vélo-sapin, (5 s) souris-mandarine, (7 s) hippopotame-éléphant
  • liste 2: (4 s- bureau-café, (5 s) ruban-chocolat, (7 s) automobile-écurie
  • liste 3: (4 s) valet-marin, (5 s) melon-otarie, (7 s) alligator-pissenlit.

Pour les non-mots, la liste unique est la suivante:

  • (4 s) lasapoti, (5 s) rifomulati, (7 s) piracotufacoté.

Trois listes de mots ont été établies pour éviter la communication entre les sujets et l'apprentissage de cette liste avant la passation. Une liste de mots parmi les trois est présentée au sujets et la liste de non-mots. Le temps mis pour prononcer chaque suite est chronométré, puis le temps pour prononcer une syllabes est calculé en secondes. Quand un sujet n'est pas capable de prononcer cinq fois de suite une série, il lui est attribué le temps le plus long mis par les élèves de son âge pour prononcer cette série.

B-Le matériel

Deux listes de 25 phrases équivalentes en nombre de mots (entre 7 et 9) et en nombre de syllabes (entre 7 et 12) ont été constituée en sélectionnant ces phrases parmi les 200 de la liste de Combescure (1984) qui sont phonétiquement équilibrées et dont la fréquence des phonèmes reflète celle qui existe dans la langue française.

Les 50 phrases ont été lues par une voix féminine à une vitesse de 135 mots par minute en moyenne et enregistrées sur cassette. Chaque phrase lue est terminée par un bip et séparée de la suivante par une pause de 2 secondes environ.

Un magnétophone (General Electric) permet de faire varier le taux de compression de l'enregistrement. 25 phrases seront écoutées à taux normal (135 m/mn, 0% de compression) et 25 à un débit de 270 m/mn (50% de compression)

C-Procédure

1-Les groupes de sujets:

20 sujets de chaque niveau scolaire sont rangés dans l'ordre décroissant par rapport à leur vitesse de lecture (nombre de mots par minute). En respectant le rang de chaque sujet, pour chaque niveau scolaire, les 20 sujets ont été répartis en 4 groupes de 5 sujets. Le premier groupe (les 5 premiers lecteurs rapides) écoutent d'abord 25 phrases en paroles comprimées (PC), puis 25 en paroles normales (PN). Le deuxième groupe (les 5 lecteurs rapides suivants) écoutent d'abord 25 phrases en PN, puis 25 en PC. Le troisième groupe (les 5 meilleurs lecteurs lents) écoutent d'abord 25 phrases en PC, puis 25 en PN. Le quatrième groupe (les 5 lecteurs les plus lents) écoutent d'abord 25 phrases en PN, puis 25 en PC.

Ainsi, 16 groupes de 5 sujets suivent le déroulement de l'expérience.

2-Déroulement de l'expérience

Dans une pièce isolée des autres salles de cours, 5 tables sont disposées autour de la table de l'expérimentateur et sont isolées de tel sorte que les 5 sujets voient l'expérimentateur mais ne puissent se voir, ni communiquer entre eux. Sur chaque table est posé un casque d'écoute, et les 6 casques (1 pour l'expérimentateur et 5 pour les sujets) sont reliés par l'intermédiaire d'une boite relais au magnétophone. La passation a lieu en deux temps identiques.

  • chaque sujet reçoit d'abord une feuille blanche et un crayon,
  • après avoir donné les indications pour porter confortablement les écouteurs, la consigne est ensuite énoncée:

"Ecoutez bien. Pour vous habituer vous entendrez d'abord 5 phrases que vous n'aurez pas à recopier. Puis, après deux bip sonores, vous allez entendre une série de phrases. a la fin de chaque phrase, vous entendrez un bip sonore. Immédiatement après, vous écrirez exactement ce que vous venez d'entendre. Les fautes d'orthographe ne seront pas pénalisées".

Selon le groupe présent, les 25 premières phrases ont été écoutées en PN ou en PC.

Les 5 premières phrases ont pour rôle d'éviter un effet de mise en route. Chaque sujet dispose du temps nécessaire pour recopier chaque phrase.

Quand les 20 phrases ont été écrites, les élèves rendent leur feuille.

  • chaque sujet reçoit alors une feuille sur laquelle sont écrites de façon incomplète les 20 phrases: pour chacune d'entre elles, il manque deux mots. La consigne est énoncée:

"Vous avez une feuille sur laquelle sont écrites les 20 phrases que vous venez d'entendre et de recopier. Attention, il manque 2 mots dans chacune d'elles. a vous de remplir les "blancs". Si vous ne savez pas, passez à la suivante. Vous rendrez votre feuille, quand vous estimerez avoir fini. Vous disposez du temps qui vous est nécessaire".

Le même déroulement a lieu pour les 25 phrases de la deuxième liste présentées en PN ou PC selon le mode de présentation des 25 premières. Notons que les 25 phrases écoutées en paroles normales et les 25 phrases écoutées en paroles comprimées sont les mêmes pour tous les groupes. Seul l'ordre de présentation change comme indiqué précédemment.

3-Corrections des épreuves

Les 20 phrases entendues en paroles normales et les 20 phrases entendues en paroles comprimées sont divisées en 4 groupes de 5 en gardant leur ordre respectif de présentation, ordre identique pour tous les sujets. Cette division correspond aux 4 degrés de la variable "Essai".

Pour évaluer l'intelligibilité, les sujets ont écrit exactement ce qu'ils entendaient, phrase après phrase. Pour chaque groupe de 5 phrases, a été calculé le pourcentage de mots exacts par rapport au nombre de mots total de chaque bloc de 5 phrases.

Pour évaluer la compréhension, la correction est effectuée également à partir des phrases écrites intégralement ou non par le sujet. Chaque phrase sémantiquement correcte vaut 1 point. Huit notes sont attribuées pour chaque sujet (2 fois 4 blocs de 5 phrases). En exemple de correction si un sujet à écrit "s'enfuit" au lieu de "a fui", il a faux pour le calcul du score d'intelligibilité et bon pour celui de la compréhension. Pour évaluer le score de compréhension, nous utilisons la méthode des juges: trois personnes ont à décider si le mot écrit a la même sens ou non que le mot d'origine.

Le test de rétention est le test "à trous" (en annexes). Pour chaque bloc de 5 phrases a été calculé le nombre de mots manquants correctement retrouvés: soit 8 notes pour chaque sujet pouvant varier de 0 à 10.

Pour évaluer l'équivalence des deux séries de 20 phrases du test à trous et pour mesurer l'influence de l'écoute, un groupe contrôle de 12 sujets ayant subi les prétests, mais n'ayant pas assisté à l'expérience a rempli les "blancs" du test de rétention. Pour les 20 phrases écoutées en paroles normales le score est de 1.13 sur 10 et pour les 20 phrases écoutées en paroles comprimées le score est de 1.64 sur 10.

D - Hypothèses et variables

1-Variables

  • âge chronologique (A): 4 degrés. 4 groupes de 20 sujets pour chaque classe de sixième, cinquième, quatrième et troisième correspondent respectivement aux âges de 12, 13, 14 et 15 ans en moyenne
  • vitesse de lecture (L): 2 degrés. Pour chaque tranche d'âge et donc chaque niveau scolaire, les sujets sont répartis dans deux catégories: lecteurs lents ou lecteurs rapides.
  • ordre de présentation (O): 2 degrés. Les phrases sont présentées dans l'ordre PN-PC ou PC-PN. Cette variable de contrôle permet de vérifier les effets dus à l'ordre de présentation.
  • mode de présentation (P): 2 degrés. Les phrases sont présentées selon deux débits de paroles: paroles normales ou paroles comprimées.
  • essais (E): 4 degrés. Les deux listes comportent 25 phrases dont 5 de mise en route et 20 divisées en 4 blocs de 5 phrases lors de la correction. Cette variable permet de vérifier un éventuel effet d'habituation, de fatigue, d'apprentissage ou de pratique.

2-Hypothèses

L'intelligibilité, la compréhension et la rétention seront meilleures chez les sujets plus âgés. Les performances aux tests d'intelligibilité, de compréhension et de rétention seront meilleures pour l'écoute des paroles normales que pour l'écoute des paroles comprimées.

Les lecteurs rapides mémoriseront mieux les phrases immédiatement présentées que les lecteurs lents. L'intelligibilité et la compréhension des lecteurs rapides sont meilleurs que celles des lecteurs lents.

La différence entre les performances après écoute des paroles normales et des paroles comprimées sera plus importante à un âge inférieur qu'à un âge supérieur (hypothèse d'interaction entre a et P).

Plus le lecteur est rapide, plus la différence entre les performances pour PN et PC diminue (hypothèse d'interaction entre P et L).

Définitions opérationnelles des variables dépendantes:

  • l'intelligibilité est le pourcentage des mots exacts par rapport au nombre de mots total,
  • la compréhension est définie par le nombre de phrases sémantiquement correctes,
  • la rétention est définie par le nombre de "blancs" complétés par des mots exacts (mots qui ont constitué les phrases précédemment entendues).

Première hypothèse: le pourcentage de mots exacts par rapport au nombre de mots total, le nombre de phrases sémantiquement correctes et le nombre de "blancs" correctement complétés seront d'autant plus élevés que l'élève est dans une tranche d'âge élevée (6ème, 5ème, 4ème, 3ème).

Deuxième hypothèse: le pourcentage de mots exacts par rapport au nombre de mots total, le nombre de phrases sémantiquement correctes et le nombre de blancs correctement complétés seront supérieurs pour un taux de compression temporelle de 0% (paroles normales) que pour un taux de compression de 50% (paroles comprimées).

Troisième hypothèse: le nombre de "blancs" correctement complétés, le nombre de phrase sémantiquement correctes et le pourcentage de mots exacts seront plus importants chez les lecteurs rapides que chez les lecteurs lents.

Quatrième hypothèse: la différence entre la moyenne des scores obtenus après écoute de la parole comprimée et de la parole normale sera plus importante chez les élèves de sixième que pour les élèves de troisième.

Cinquième hypothèse: la différence entre les scores obtenus après écoute des paroles normales et comprimées sera d'autant plus faible que le lecteur sera rapide.

E-Plan d'expérience

1-Age (A):

  • A1: classe de 3ème (environ 14 ans)
  • A2: classe de 4ème (environ 13 ans)
  • A3: classe de 5ème (environ 12 ans)
  • A4: classe de 6ème (environ 11 ans).

2-vitesse de lecture (L):

  • L1: lent,
  • L2: rapide.

3-ordre de présentation (O):

  • O1: comprimée-normale,
  • O2: normale-comprimée.

4-mode de présentation (P):

  • P1: normale,
  • P2: comprimée.

5-essais (E):

  • E1: 1er bloc,
  • E2: 2ème bloc,
  • E3: 3ème bloc,
  • E4: 4ème bloc.

Les résultats sont traités par le programme d'analyse de variance VAR3 pour lequel le plan d'expérience est de la forme S5<O2*L2*A4>*E4*P2 avec 3 groupes de mesure indépendants (Age, vitesse de lecture, ordre de présentation) et 2 groupes de mesure appareillées (présentation, essais).

III-RESULTATS

A-Le facteur "âge chronologique"

1-Intelligibilité:

L'effet du facteur "âge chronologique" sur la performance au test d'intelligibilité est significatif: le pourcentage de mots exacts par rapport au nombre total de mots écrits par le sujet est d'autant plus élevé que le sujet est âgé (F=4.767 (3-72) p<.01).

2-Compréhension

L'effet du facteur "âge chronologique" sur la performance au test de compréhension est significatif: le nombre de phrases sémantiquement correctes notées par les sujets augmente en fonction de l'âge (F=3.087 (3-72) p<.05).

Il n'existe pas de différence significative entre les performances des sujets en fonction des niveaux scolaires pris deux à deux (T de Newman-Keuls).

3-Rétention

L'effet du facteur "âge chronologique" sur les performances au test de rétention n'est pas significatif.

B-Le facteur "mode de présentation"

1-Intelligibilité

L'effet du facteur "mode de présentation" (en paroles normales ou en paroles comprimées) sur la performance des sujets au test d'intelligibilité est significatif: le pourcentage de mots exacts par rapport au nombre total de mots écrits par les sujets est plus élevé pour la présentation en paroles normales qu'en paroles comprimées (T=11.548 (2-37) p<.01). Les variances n'étant pas homogènes un T de Student pour groupes appareillés a été calculé pour ce facteur.

2-Compréhension

L'effet du facteur "mode de présentation" sur les performances des sujets au test de compréhension est significatif: le nombre de phrases sémantiquement correctes notées par les sujets est plus élevé pour la présentation en paroles normales qu'en paroles comprimées (F=49.39 (1-72) p<.01).

3-Rétention

L'effet du facteur "mode de présentation" sur la performance des sujets au test de rétention est significatif: le nombre de "blancs" complétés par des mots exacts est plus élevé dans la condition de présentation en paroles comprimées que dans la condition de présentation en paroles normales (F=19.157 (1-72) p<.01). Ce résultat est contradictoire avec l'hypothèse.

C-Le facteur "vitesse de lecture"

1-Intelligibilité

L'effet du facteur "vitesse de lecture" sur la performance des sujets au test d'intelligibilité est significative: le pourcentage de mots exacts par rapport au nombre total de mots est plus élevé chez les lecteurs rapides que chez les lecteurs lents (F=4.683 (1-72 p<.05).

2-Compréhension

L'effet du facteur "vitesse de lecture" sur la performance des sujets au test de compréhension est significatif: le nombre de phrases sémantiquement correctes notées par les lecteurs rapides est plus élevé que celui noté par les lecteurs lents (F=6.068 (1-72) p<.05).

3-Rétention

L'effet du facteur "vitesse de lecture" sur les performances des sujets au test de rétention est significatif: le nombre de "blancs" complétés par des mots exacts est plus élevé chez les lecteurs rapides que chez les lecteurs lents (F=11.345 (1-72) p<.01).

D-Interaction entre le facteur âge et le mode de présentation

1-Intelligibilité

L'interaction entre le facteur "âge chronologique" et le facteur "mode de présentation" est significative: la performance des sujets au test d'intelligibilité augmente en fonction de l'âge chronologique des sujets dans la condition de présentation en paroles comprimées mais ne change pratiquement pas dans la condition de présentation en paroles normales (F=4.581 (3-72) p<.01).

2-Compréhension et rétention

Les interactions entre l'âge et le mode de présentation ne sont pas significatives pour les variables dépendantes compréhension et rétention.

E-Le facteur "essais"

L'effet du facteur "essais" sur l'intelligibilité des sujets est significatif (F'=24,578 (3-192) p<.01), ainsi que sur la compréhension (F'=21.01 (3-192) p<.01) et sur la rétention (F'=5.937 (3-192) p<.01).

L'effet de l'interaction entre le facteur "essais" et le facteur "mode de présentation" sur l'intelligibilité est significatif: la différence entre les scores d'intelligibilité en faveur de la parole normale est plus élevée pour les deux premiers blocs d'essais (F'=27.634 (3-192) p<.01).

L'effet de l'interaction entre le facteur "essais" et le facteur "mode de présentation" sur la compréhension est significatif: la différence entre les scores de compréhension en faveur de la parole normale est plus élevée pour les deux premiers blocs d'essais (F'=10.233 (3-192) p<.01).

L'effet de l'interaction entre les facteurs "essais" et "mode de présentation" sur la rétention est significatif: pour la parole normale les scores de rétention sont plus élevés pour le premier et le dernier bloc (effet de primauté et de récence), pour la parole comprimée, les scores s'élèvent du premier au troisième bloc (effet de pratique) (F'=2.72 (3-192) p<.05).

L'effet de l'ordre de présentation et toutes les autres interactions ne sont pas significatifs.

F-Vitesse d'articulation

Il existe une différence significative entre la vitesse d'articulation des lecteurs lents et celles des lecteur rapides: les lecteurs rapides ont une vitesse d'articulation plus élevée que les lecteurs lents (T=5.447 (1-79) p<.01).

G-Le facteur "âge lexical"

Dans une deuxième phase de traitement des données, pour étudier le facteur "âge lexical" indépendamment du facteur âge chronologique" et du niveau scolaire, les 80 sujets ont été classés en fonction de leur "âge lexical" d'après le barème du test de "l'Alouette". Quatre niveaux d'âge lexical" ont été ainsi déterminés distribués du plus faible au plus élevé: A1 à A4. Une analyse de variance a été effectuée, prenant en compte les facteurs "âge lexical" et "mode de présentation" suivant le plan: S20<A4>*P2 pour les trois variables dépendantes: intelligibilité, compréhension et rétention.

1-Intelligibilité

TABLEAU DES MOYENNES ET ECARTS-TYPE

 

P1

P2

   

P1

P2

A1 98.43 94.30   A1 1.45 3.83
A2 98.64 95.54   A2 1.69 2.28
A3 99.27 97.26   A3 1.52 1.70
A4 99.51 96.93   A4 0.72 2.19


L'effet du facteur "âge lexical" est significatif: le pourcentage des mots exacts par rapport au nombre total de mots écrits par les collégiens est d'autant plus élevé que leur âge lexical est élevé (F=5.50 (3-76) p<.01).

L'effet du facteur "mode de présentation" est significatif: le pourcentage des mots exacts par rapport au nombre total des mots notés par les collégiens est plus élevé dans la condition de paroles normales que dans la condition de paroles comprimées (F=135.98 (1-76) p<.01). Toutefois l'intelligibilité est toujours supérieur à 90%.

L'interaction entre les deux facteurs âge lexical et mode de présentation est significative: la différence entre les scores d'intelligibilité pour la condition paroles normales et la condition paroles comprimées est d'autant plus faible que l'âge lexical des collégiens est plus élevé (F=3.17 (3-76) p<.05).


2-Compréhension

TABLEAU DES MOYENNES ET DES ECARTS-TYPE

 

 P1

P2 

   

P1

P2

A1 4.65 4.37   A1 0.33 0.46
A2 4.81 4.57   A2 0.24 0.29
A3 4.91 4.52   A3 0.15 0.31
A4 4.90 4.67   A4 0.17 0.31

L'effet du facteur âge lexical est significatif: le nombre de phrases sémantiquement correctes notées par les élèves est d'autant plus élevé que l'âge lexical est élevé (F=4.77 (3-76) p<.01).

L'effet du facteur mode de présentation est significatif: le nombre de phrases sémantiquement correctes notées par les élèves est plus élevé dans la condition paroles normales que dans la condition paroles comprimées (F=50.13 (1-76 p<.01).

Il n'existe pas d'interaction entre le facteur âge lexical et le facteur mode de présentation.


3-Rétention

TABLEAU DES MOYENNES ET DES ECARTS-TYPE

 

P1

P2

   

P1

P2

A1 6.22 7.35   A1 1.17 1.15
A2 6.05 6.87   A2 1.23 1.052
A3 7.24 7.33   A3 1.61 1.61
A4 7.56 8.28   A4 1.54 1.07

L'effet du facteur "âge lexical" est significatif: le nombre des "blancs" correctement complétés par les collégiens est plus élevé pour les tranches d'âge lexical plus élevées (F=5.99 (3-76) p<.01).

L'effet du facteur "mode de présentation" est significatif: le nombre de "blancs" correctement complétés par les collégiens est plus élevé après écoute des paroles comprimées qu'après écoute des paroles normales (F=24.08 (1-76) p<.01).

L'interaction entre les facteurs "âge lexical" et "mode de présentation" n'est pas significative.

H-Corrélations et analyse de régression hiérarchique

Des analyses complémentaires ont été effectuées dans le but d'évaluer l'influence des différents facteurs sur la performance des sujets et leurs inter-corrélations.

En particulier ont été calculées toutes les corrélations existant entre les différentes épreuves et donc les différents facteurs (voir matrice triangulaire de corrélation en annexe). Tous les résultats sont significatifs à(p<.05 et p<.01 pour certains, voir annexe).

Pour évaluer le poids des différents facteurs sur la performance des sujets a été effectué une analyse de régression hiérarchique. Cette analyse ( en annexe) montre que la variable "rétention de la parole normale" et la variable "intelligibilité de la parole comprimée" permettent d'expliquer une part relativement élevée (25%) de la variance en ce qui concerne les résultats aux épreuves de lecture (test de l'alouette) et donc de prédire la réussite en lecture des élèves.

IV-DISCUSSION-CONCLUSION

A-Intelligibilité et compréhension

L'intelligibilité et la compréhension sont meilleures chez les élèves plus âgés (âge chronologique et âge lexical). Le traitement de l'information parlée fait appel aux connaissances lexicales du sujet et aux processus de la mémoire à court terme et ce d'autant plus que le langage parlée est formé d'une suite d'éléments sonores qui évoluent dans le temps. En effet, contrairement au langage écrit qui évolue dans une dimension spatiale et pour lequel le lecteur peut à tout instant vérifier les traces incertaines d'une mémoire défaillante, le langage parlée évolue dans une dimension temporelle et l'auditeur sait qu'une fois les paroles émises, il devra compter essentiellement sur ses capacités mnésiques pour conserver l'information. Dans cette expérience l'intelligibilité et la compréhension sont testées à court terme et sont directement associées à la capacité de la mémoire à court terme des élèves. Or, il existe un effet de l'âge sur l'empan mnésique (F=4.418 (3-76) p<.01): plus les élèves sont âgés (chronologique) plus l'empan mnésique est élevé. L'augmentation de la capacité de la mémoire à court terme (nombre des éléments stockés) expliquerait en partie l'amélioration des performances aux tests d'intelligibilité et de compréhension en fonction de l'âge.

L'âge lexical des sujets calculé en fonction de la vitesse et de la qualité de la lecture, a également un effet significatif sur les variables dépendantes "intelligibilité" (F=5.50 (3-76) p<.01) et "compréhension" (F=4.77 (3-76) p<.01)dans les deux conditions de présentation.

La variable vitesse de lecture liée à l'âge lexical du sujet) a un effet significatif sur l'intelligibilité (F=4.683 (1-72 p<.05) et sur la compréhension (F=6.068 (1-72) p<.05).

En condition de paroles comprimées à 50%, de petits fragments de signal vocal de 20 millisecondes tous les 40 millisecondes sont éliminés de façon aléatoire par rapport à la distribution des phonèmes. Du fait du caractère aléatoire de l'élimination des portions sonores, il est assez peu probable qu'un silence par exemple, nécessaire à la reconnaissance d'une plosive soit éliminé en entier. Par ailleurs, l'élimination régulière d'une aussi petite portion de signal permet une bonne reconnaissance des voyelles, conserve la disposition des pauses, l'intonation, la prosodie et la fréquence fondamentale. Aussi, bien que l'intelligibilité soit plus faible en paroles comprimées qu'en paroles normales (F=135.98 (1-76) p<.01), elle reste supérieure à 94% pour la parole comprimée (>98% pour la parole normale). Mais les résultats les plus intéressants concernant cette expérience sont ceux relatifs aux effets d'interaction: de la variable "mode de présentation" avec les variables "âge" chronologique (F=4.581 (3-72) p<.01) d'une part et lexical (F=3.17 (3-76) p<.05) d'autre part. Les lecteurs rapides qui traitent mieux l'information visuelle que les lecteurs lents traiteraient également mieux l'information parlée comprimée (Pierce 1978, Johnson et al. 1963, Newman 1982, Leroy 1982, Goldstein 1940, Orr et al. 1965, Foulke 1969).

En raison du caractère séquentiel d'un message parlé, le traitement du signal fait appel à la mémoire à court terme et selon Baddeley (1986), la capacité de la mémoire à court terme ne dépend pas seulement du nombre des éléments qu'elle peut contenir, mais aussi du temps de stockage et si l'on combine ces deux paramètres du débit des paroles prononcées. Or la vitesse de lecture des sujets est liée à leur vitesse d'articulation: les lecteurs rapides ont une vitesse d'articulation plus élevée que les lecteurs lents (T=5.447 (1-79) p<.01). Tandis que les phrases sont prononcées, le lecteur rapide se répète les mots entendus plus vite que le lecteur lent Le lecteur rapide peut ainsi se répéter la phrase un plus grand nombre de fois avant de l'écrire Quand le lecteur rapide commence à noter la phrase entendue, le nombre de répétition des mots de la phrase a été plus élevé pour lui que pour le lecteur lent: ce qui expliquerait le meilleur résultat obtenu par les lecteurs rapides pour les performances au test d'intelligibilité. L'auto-répétition de maintenance permet un stockage à long terme de l'information: ce qui expliquerait les scores plus élevés des lecteurs rapides aux tests de compréhension (ils peuvent mieux interpréter) et de rétention.

Que l'on considère l'âge chronologique ou l'âge lexical, l'intelligibilité pour les paroles normales varie peu pour les différents groupes d'âge alors que l'intelligibilité pour les paroles comprimées augmente en fonction des âges chronologique et lexical.: plus les sujets lisent vite, mieux ils sont capables de percevoir la parole comprimée.

B-La rétention

Les sujets procèdent à une tâche de traitement de l'information pendant l'intervalle de rétention de l'empan mnésique (Klapp et al. 1983).

La rétention est meilleure pour les élèves dont la vitesse de lecture est plus élevée (F=11.345 (1-72) p<.01) et dont l'âge lexical est plus élevé (F=5.99 (3-76) p<.01).

Dans la mesure où les lecteurs rapides peuvent effectuer plus de répétition et procéder à un meilleur stockage de l'information à court terme, ce résultat semble tout à fait logique. En effet l'auto-répétition de maintenance permet un stockage de l'information à long terme (Baddeley 1986)et en conséquence le taux de répétition à long terme étant plus élevé chez le lecteur rapide que chez le lecteur lent, la rétention est meilleure. Le traitement du message parlé ayant été effectué de façon plus approfondie par les bons lecteurs, la trace mnésique a été renforcée. Il est à noter que la rétention a pu être favorisée pour tous les élèves par la nature des tests d'intelligibilité et de compréhension qui consistaient à écrire sur une feuille ce qui venait d'être entendu. Ainsi une perception visuelle des phrases écrites pouvait encore améliorer la trace mnésique.

Mais un autre résultat intéressant et peut-être plus inattendu concerne l'effet significatif du facteur "mode de présentation" sur la rétention: le nombre de "blancs" complétés par des mots exacts est plus élevé dans la condition de présentation en paroles comprimées que dans la condition de présentation en paroles normales (F=19.157 (1-72) p<.01). Ce résultat est d'autant plus surprenant que les scores d'intelligibilité et de compréhension en paroles comprimées sont moins élevés qu'en paroles normales. L'analyse qualitative des tests d'intelligibilité pour la parole comprimée a montré que les erreurs des collégiens concernent surtout des mots courts (articles, conjonction de coordination) et portent plus rarement sur le groupe nominal ou le groupe verbal. Si bien que ces erreurs n'empêchent pas le maintien de l'intelligibilité à un bon niveau (94%), de conserver une bonne compréhension globale et une rétention correcte des indices et éléments pertinents et essentiels pour pouvoir compléter le test. Par ailleurs, confrontés à un mode de présentation surprenant (la parole comprimée), les collégiens ont optimisé leurs capacités d'attention et d'éveil pour pouvoir détecter au mieux les paroles énoncées qu'ils devaient ensuite écrire. Cette optimisation de l'attention et de l'activation des capacités perceptives a contribué à améliorer l'encodage du message entendu et par là-même à parfaire sa rétention. Cela, d'autant plus que nous avons noté une grande curiosité et une très forte motivation chez tous les élèves. Quelques questions posées à chaque groupe de sujets après la passation ont confirmé cette observation. Or, la motivation peut avoir un effet bénéfique sur le traitement de la parole comprimée (Beatty et al. 1980, Harvey 1981, Gade et al. 1984).

Un dernier résultat est à considérer tout particulièrement: l'effet du facteur "essais". L'écoute des cinq premières phrases (non recopiées) avait pour objectif de familiariser les sujets avec le matériel de l'expérience. Puis les phrases écoutées (et recopiées) sont réparties en groupes de 5 pour tester un effet de pratique ou d'habituation éventuel. Toutefois les résultats mettent en évidence un effet significatif de la variable "essais" sur l'intelligibilité (F'=24,578 (3-192) p<.01), sur la compréhension (F'=21.01 (3-192) p<.01) et sur la rétention (F'=5.937 (3-193) p<.01). Ces résultats sont expliqués par l'effet significatif de l'interaction entre les facteurs "essais" et "mode de présentation" sur l'intelligibilité (F'=27.634 (3-192) p<.01), sur la compréhension (F'=10.233 (3-192) p<.01) et sur la rétention (F'=2.72 (3 192) p<.05). Les scores d'intelligibilité et de compréhension s'élèvent du premier au deuxième bloc d'essais et atteignent un niveau optimal. au troisième bloc pour la présentation en paroles comprimées, alors qu'ils fluctuent peu pour la présentations en paroles normales. Ce qui traduit un effet de pratique pour la parole comprimée. Plusieurs auteurs ont montré que l'intelligibilité et la compréhension de la parole comprimée s'améliorent avec l'apprentissage et l'entraînement (Leroy 1982, Lambert et al. 1980, Stitch 1970, Gade et al. 1984, ). En ce qui concerne les scores de rétention les résultats mettent en évidence un effet de primauté et de récence dans la condition de paroles normales et un effet de pratique dans la condition de paroles comprimées.

C-Conclusion

Chez des collégiens de 11 à 15 ans, l'intelligibilité, la compréhension et la rétention immédiate des paroles comprimées sont meilleures pour les lecteurs rapides que pour les lecteurs lents. Le matériel utilisé pour cette expérience est facile, Que deviendraient les scores avec un texte continu, abstrait et plus difficile? Est-ce qu'une rétention à plus long terme (quelques heures à quelques jours) ne serait pas plus faible après écoute des paroles comprimées (King 1989)? Il semblerait que l'écoute, tout comme la lecture fasse appel à un processus multi-dimensionel et que le traitement des informations écrites et parlées dépendent de facteurs inhérents aux sujets (entraînement, motivation, éveil, rapidité de discrimination et de perception...).

 
sommaire


CHAPITRE 4:

La PAROLE COMPRIMÉE ET L'ÉCOUTE RAPIDE

SECTION 3:
CONCLUSION GENERALE


I-RÉSUMÉ DU CHAPITRE

La parole comprimée permet d'entendre dans un temps donné une plus grande quantité d'information que ne le permet la parole normale. L'augmentation du débit d'un énoncé pourrait être un moyen d'accélérer l'accès à l'information auditive. Les techniques de compression temporelle de paroles permettent de faire varier le débit d'un discours enregistré sans distorsion excessive du signal vocal.

Dans une revue, nous traçons l'évolution historique des techniques de compression de paroles. Les problèmes méthodologiques et procéduraux liés à l'étude de la parole comprimée sont exposés. Les facteurs susceptibles de modifier l'intelligibilité des mots et la compréhension d'un discours comprimé sont recensés. Des applications potentielles relatives à la parole comprimée et à l'écoute rapide sont exposées.

Dans quelles limites la compression temporelle produit-elle un gain de temps sans diminuer la compréhension et la performance de l'auditeur? Les données montrent que l'intelligibilité et la compréhension des paroles comprimées restent correctes jusqu'à ce que le taux de compression temporelle ne dépasse pas 50% et jusqu'à ce que le débit de la parole ne dépasse pas 275 mots par minute. Mais la plupart des études sur la compression temporelle concerne la langue anglaise .

Les objectifs d'une première série de quatre expériences visaient à évaluer les différences entre les quantités d'information acquises par des étudiants après écoute d'enregistrement de récits en français présentés avec différents débits de paroles. Les problèmes considérés sont multiples:

  • est-ce que la compression temporelle d'un enregistrement permet de gagner un temps d'écoute appréciable sans diminuer de façon significative l'intelligibilité, la compréhension et la rétention du discours?
  • quelles sont les différences entre les performances des étudiants pour une condition de présentation continue et de présentation segmentée des enregistrements?
  • pour un même taux de compression quelles sont les différences entre les performances des sujets pour deux débits de paroles (270 m/mn et 300 m/mn)?
  • dans une condition de présentation continue, quelles sont les différences entre les performances des étudiants après écoute des paroles normales et des paroles comprimées?

Dans la premières expérience, 60 étudiants écoutent deux récits (abstrait et concret) en condition de présentation segmentée . Pour 20 d'entre eux les enregistrements sont présentés à un taux de paroles normales (135 m/mn), pour un groupe de 20 à un taux de paroles accélérées (202 m/mn) et pour le troisième groupe à un taux de paroles comprimées (270 m/mn). Les résultats montrent un effet du taux des paroles et un effet de la nature des textes: pour l'intelligibilité, les performances sont plus faibles pour la parole accélérée que pour la parole normale, mais ne sont pas différentes entre la parole normale et la parole comprimée. Pour la compréhension et la rétention immédiate, les scores ne présentent pas de différence significative pour les trois taux de paroles. Les étudiants ayant écouté les enregistrements en paroles comprimées sont capables de comprendre la même quantité d'information que les étudiants qui ont écouté les paroles normales, mais dans un temps plus court. Les performances des sujets sont plus faibles pour le texte abstrait que pour le texte concret dans les trois modes de présentation.

Dans une seconde expérience 40 étudiants sont divisés en 2 groupes de 20, dont l'un écoute les enregistrements présentés de façon continue et l'autre écoute les enregistrements présentés de façon segmentée . Les scores de compréhension et de rétention sont plus faibles pour le mode de présentation continue que pour le mode de présentation segmentée . La différence entre les scores pour les deux modes de présentation est plus faible pour le récit concret que pour le récit abstrait.

Dans une troisième expérience, deux groupes de 10 étudiants écoutent deux récits enregistrés ayant subi une compression temporelle de 50%. Pour l'un le débit des mots entendus est 270 m/mn, pour l'autre le débit est 300 m/mn. Les scores d'intelligibilité et de compréhension sont significativement plus élevés pour les enregistrements à 270 m/mn que pour ceux à 300 m/mn. Toutefois la différence entre les scores des deux groupes pour les questionnaires à choix multiples n'est pas significative.

Dans une quatrième expérience, deux groupes de 20 sujets écoutent les deux mêmes récits enregistrés et distribués sous une même condition de présentation continue, mais pour l'un des groupes le taux des paroles est normal (135 m/mn) , pour l'autre il est comprimé à 50% (270 m/mn). . Les étudiants qui écoutent les récits enregistrés à un débit de 270 m/mn rappellent plus de propositions exactes que les étudiants qui écoutent les récits enregistrés à 135 m/mn. Dans les deux conditions de présentation, les scores pour le texte abstrait sont plus faible que les scores pour le texte concret.

Selon les résultats expérimentaux, il semble que l'intelligibilité, la compréhension et la rétention immédiate de deux récits courts et relativement simples restent bonnes avec une compression temporelle de 50% et un débit de mots de 270 m/mn. Il semblerait même que la compréhension et la rétention immédiate soit meilleure dans la condition de compression temporelle à 50%. Toutefois dans cette condition de grandes variabilités inter-individuelles sont observées. Des facteurs inhérents aux sujets sont à étudier: âge, vitesse de lecture, âge lexical, motivation...

Dans une cinquième expérience, 80 collégiens sont divisés en 4 groupes en tenant compte de l'âge chronologique et la vitesse de lecture dans une première phase, de l'âge lexical dans une seconde phase. Les scores d'intelligibilité, de compréhension et de rétention immédiate de 20 phrases écoutées à taux normal et de 20 phrases écoutées à taux comprimé sont comparés. Les données montrent que chez des collégiens de 11 à 15 ans, l'intelligibilité, la compréhension et la rétention immédiate des paroles comprimées sont meilleures pour les lecteurs rapides que pour les lecteurs lents. Les scores d'intelligibilité et de compréhension sont plus élevés quand l'âge lexical est plus élevé. Dans cette expérience, il semblerait également que la rétention immédiate soit meilleure après écoute des paroles comprimées qu'après écoute des paroles normales.

Dans ces expériences, intelligibilité, compréhension et rétention immédiate font appel essentiellement aux capacités de la mémoire à court terme. La mémoire à court terme dépendrait du taux des mots émis et tant que ce taux ne dépasse pas 4,5 mots par seconde.

D'autres études utilisant différents taux de compression temporelle sont nécessaires tant sur le plan théorique que sur le plan expérimental et pratique. Sur un plan théorique pour mieux comprendre la perception du langage et les processus cognitifs du traitement de la parole comprimée. Quel serait le débit optimal des paroles pour la mémoire à court terme? quelles pourraient être les incidences de la parole comprimée sur la mémoire à long terme?

Sur un plan pratique, à partir de ces expérience exploratoires (chapitre 4) et des données sur la prise de notes (Chapitre 3), la construction de plusieurs prototypes permettraient une étude sur le terrain afin d'optimiser les caractéristiques de la parole comprimée dans le but d'une utilisation par des collégiens, lycéens et étudiants aveugles et d'évaluer plus précisément l'intérêt de cette technique et ses conditions d'utilisation, ses avantages et ses inconvénients à court terme et à long terme.

II-UNE EXPERIENCE INDIVIDUELLE PROLONGEE

L'auteur a utilisé à ses propres fins la parole accélérée de 1982 à 1986 et utilise depuis 1986 la parole comprimée. Ces deux types de paroles (accélérées et comprimées) ont été employés essentiellement dans les conditions suivantes:

  • rechercher une portion de cours enregistré sur cassette,
  • apprendre un cours écouté et compris auparavant,
  • réviser en vue d'un examen,
  • écouter pour la première fois une revue enregistrée (lecture auditive ou écoute active) et passer au débit normal pour les portions difficiles ou accrochant l'intérêt de l'auditeur en vue d'une prise de notes, une réflexion approfondie.

Différentes observations ont été notées après utilisation prolongée des enregistrements comprimés à un taux de 50% la plupart du temps. Lorsque le contenu d'un message enregistré est connu, a été compris ou déjà étudié par ailleurs, dans le cas d'apprentissage, de ré-apprentissage ou de révisions d'un cours enregistré, l'écoute en condition de compression temporelle, nous semble être un mode de travail intéressant. En effet, non seulement l'augmentation du débit des mots engendre un gain de temps appréciable (pour 45 minutes d'enregistrement, 22 minutes d'écoute), mais l'observation la plus curieuse et la plus inattendue (notée également dans les expériences précédentes) est l'amélioration de la rétention du contenu dans sa globalité. Tout se passe comme si l'écoute à vitesse rapide d'un thème connu avait un effet de rafraîchissement des traces mnésiques existantes, des schèmes, et de la configuration déjà stockée en mémoire. Cette ré-imprégnation semble plus profonde et tenace après écoute en parole comprimée qu'après écoute du même contenu en paroles normales. Dans l'état actuel des études, nous ne pouvons donner d'explication structurée à cette observation inattendue. Toutefois, quelques suppositions peuvent être émises.

Après avoir travaillé leurs notes, en vue d'un examen, certains étudiants revoient rapidement et globalement tout le contenu du cours du début à la fin comme s'ils voulaient se ré-imprégner de l'essentiel, de l'image globale. Ce survol peut être très rapide sans pour autant perdre son objectif, c'est-à-dire le rafraîchissement des traces mnésiques. Ce survol, qui n'a pas seulement un but de répétition, pourrait contribuer à mieux mémoriser l'ordre des données et la hiérarchie des idées importantes et a se construire une configuration, une image condensée du contenu. Par analogie, il semble que l'écoute rapide puisse remplir ces objectifs.

Un lecteur peut lire visuellement trois à quatre fois plus vite qu'il ne parle: le cerveau pourrait donc traiter très rapidement le langage écrit. Pourquoi ne pourrait-il pas accélérer la vitesse de traitement du langage parlé tant que celui-ci reste intelligible?

Nous avons remarqué que l'entraînement favorise et améliore très sensiblement l'intelligibilité de la parole comprimée. Le débit des mots obtenu après compression temporelle et écoutés lors des révisions a souvent dépassé 350 m/mn. Par ailleurs la compression temporelle autorise des répétitions plus nombreuses de l'écoute d'un enregistrement. Il semblerait que pour une même durée d'écoute, il soit plus rentable sur le plan mnésique, d'écouter 2fois un enregistrement à 300 m/mn qu'une seule fois un enregistrement à 150 m/mn.

Les processus cognitifs et les mécanismes physiologiques du système nerveux (influx nerveux, passage des synapses..) s'accommoderaient peut-être bien d'un rythme de distribution plus rapide du stimulus auditif et ce d'autant plus qu'il s'agit de la répétition d'une information déjà acquise. Il pourrait peut être exister un parallélisme entre leur propre rythme de fonctionnement et le rythme de la distribution de l'information (qu'elle soit de nature auditive ou visuelle).

Nous avons également utilisé la parole comprimée pour repérer plus rapidement un passage dans un enregistrement, par exemple sélectionner un article dans l'enregistrement d'une revue scientifique. Dans ce cas, même si le contenu n'est pas connu, il est aisé de repérer le thème d'un passage écouté à grande vitesse (jusqu'à 300 m/mn). Nous avons fait entendre à des néophytes un bon nombre d'enregistrements comprimés différents et mous leur avons demandé de trouver le thème du passage entendu. Après le premier moment de surprise passé et un peu plus d'attention, tous les sujets consultés ont su exprimer le thème du passage écouté: cuisine, pollution des forêts, vie des Incas...). Repérer une portion de discours dans un enregistrement avec la compression temporelle procure un gain de temps de recherche très appréciable.

Nous avons plus rarement utilisé la parole comprimée dans une condition de première écoute d'un sujet inconnu, excepté pour les récits faciles ayant uniquement un caractère informatif. Les enregistrements scientifiques ont souvent été écoutés une première fois en paroles normales, sauf ceux lus très lentement (100 à 120 m/mn). En effet, nous pensons que pour un thème difficile, très abstrait et ou complexe, littéraire ou scientifique, nouveau ou contenant des termes inhabituels, il n'est pas souhaitable d'utiliser la compression temporelle pour une première écoute.

D'autres expérimentations seraient nécessaires avec des enregistrements plus longs et des textes plus difficiles. Des expériences individuelles et prolongées pendant plusieurs mois seraient indispensables pour évaluer avec précision l'intérêt de la compression temporelle et ses conditions d'utilisation. C'est pourquoi nous proposons un cahier des charges pour la construction d'un magnétophone comportant d'une part le système d'enregistrement différé afin de pouvoir sélectionner les notes à enregistrer et d'autre part le système de compression temporelle afin de pouvoir écouter ces notes plus rapidement. Par ailleurs, un système d'indexation permettrait en outre de poser des repères entre les différentes sections d'un enregistrement.


SECTION 4: APPLICATION

PROJET D'ELABORATION D'UN MAGNETOPHONE SPECIFIQUE

a - La PRISE DE NOTES

I-ORIGINE DU PROJET

À l'origine de ce projet se situe notre recherche, concernant la possibilité pour un aveugle accidentel ne connaissant pas le braille d'une prise de notes aidée par l'enregistrement.

Entrée à l'Université en octobre 82, alors qu'elle venait de perdre la vue depuis quelques semaines, l'auteur a enregistré tous les cours de psychologie à Lille III et tous les cours de physiologie à Lille I suivis entre 1982 et 1987 (chapitre 3). Elle a constaté:

  • selon le débit du cours et la redondance du texte, le temps d'enregistrement d'un cours peut être réduit de moitié, ce qui réduit d'autant le temps d'écoute ultérieur;
  • à l'aide d'un second enregistrement, en répétant les phrases bout à bout plus rapidement, il est encore possible de réduire le temps d'écoute de 50%;
  • une écoute de l'enregistrement condensé à vitesse rapide permet enfin une "lecture auditive" des notes enregistrées aussi rapide qu'une lecture visuelle.

Une expérience avec des handicapés moteurs s'étant avérée peu concluante, en novembre 1986, l'auteur teste le principe du magnétophone à enregistrement différé. Après avoir fait modifier la capacité de la mémoire-tampon, plusieurs expériences avec des adolescents aveugles et amblyopes sont entreprises (chapitre 3).

II-BILAN DES RECHERCHES

Les études effectuées sur la prise de notes aidée par l'enregistrement, sur la compression temporelle de paroles, et l'écoute rapide (chapitre 4) permettent d'énoncer les constatations suivantes:

  • il est possible de sélectionner rapidement une information avec le magnétophone à enregistrement différé quand la mémoire-tampon est réglée à 2 secondes, plus difficile quand elle est réglée à 5 secondes et au-delà;
  • de réduire et de condenser les notes sélectionnées, ce qui réduit le temps d'écoute pendant la période d'apprentissage et de révision des étudiants;
  • d'écouter cette version condensée à vitesse rapide; de ce fait la durée d'écoute de l'étudiant aveugle pourrait être équivalente à la durée de lecture de l'étudiant voyant.
  • l'écoute rapide peut se faire soit par accélération de la vitesse de déroulement de la bande magnétique, soit par compression temporelle dont les différentes techniques ont été exposées au début de ce chapitre.
  • les études théoriques et expérimentales ont montré que l'intelligibilité et la compréhension d'un message diminuent très peu tant que le débit de paroles ne dépasse pas 275 mots par minute et tant que le taux de compression temporelle ne dépasse pas 50%.

En conséquence, ces différentes études théoriques et expérimentales, permettent de définir les caractéristiques d'un prototype (magnétophone essentiellement destiné à la prise de notes) susceptible d'être utilisé par des aveugles ou des voyants.

  • il est souhaitable de pouvoir stocker une grande quantité d'information sur une cassette pour économiser des manipulations et éviter de perdre du temps et des informations lors du retournement de la cassette.
  • il est également souhaitable de pouvoir gérer l'information stockée et de pouvoir accéder facilement à cette information par l'utilisation d'une indexation sonore.

III-CAHIER DES CHARGES

1-La fonction de sélection de l'information:

Ce magnétophone comportera une fonction de sélection de l'information à enregistrer grâce à l'insertion d'une mémoire numérique, d'un codeur et d'un décodeur à modulation delta dans la chaîne d'enregistrement du magnétophone (entre le microphone et la tête d'enregistrement). a l'aide d'une commande marche-arrêt l'utilisateur peut alors transférer sur la bande magnétique les informations contenues dans la mémoire-tampon. Ainsi, selon la capacité de la mémoire-tampon que l'on pourra faire varier de 2 à 10 secondes, les quelques mots ou les quelques phrases émis avant l'appui sur la commande marche-arrêt sont enregistrés sur la bande magnétique.

Les études expérimentales ont montré que la capacité de la mémoire-tampon doit pouvoir être réglée à 2 secondes et ne pas dépasser 3 secondes pour une prise de notes en situation de cours. L'utilisateur pourra disposer (selon la condition d'utilisation) de 2 à 10 secondes pour décider d'enregistrer ou non l'information émise durant ce laps de temps.

2-La fonction de compression temporelle:

Une technique de compression temporelle du signal sonore avant l'enregistrement a pour principe l'élimination d'une fraction du message sonore d'une durée pouvant varier de 1 à 20 millisecondes à des intervalles réguliers (pouvant également varier de 2 à 40 millisecondes).

Une compression temporelle de 50% peut être obtenue en supprimant 20 millisecondes du signal sonore toutes les 40 millisecondes ou 10 toutes les 20 etc...

Cette compression temporelle se situe entre le microphone et la tête d'enregistrement.

3-Un système d'indexation:

Le magnétophone sera équipé d'un système d'indexation sonore pour permettre l'accès direct et rapide à un paragraphe, à un point important, et faciliter ainsi toute recherche dans le discours enregistré.

Le repère sonore est un bip que l'on entend lors du déroulement rapide de la cassette et qui permet à l'utilisateur de stopper le défilement rapide à cet endroit précis et d'écouter la portion d'enregistrement souhaitée.

Ce repère sonore est complétée selon le choix de l'utilisateur par un chiffre sonore audible également lors du défilement rapide de la bande magnétique.

Il faut prévoir 4 pistes et 2 vitesses d'enregistrement afin de pouvoir entrer le maximum de données sur une seule bande magnétique: ce qui permet un gain de place et un gain de temps dans les manipulations (changement de cassettes ) .

Le repère sonore peut être distribué sur toutes les pistes.

4-Autres additifs utiles aux non-voyants:

  • l'installation d'un signal sonore à l'approche de la fin de bande permettra de prévenir l'utilisateur aveugle qui pourra agir en conséquence et éviter de perdre les information données pendant le défilement de la partie terminale de la bande magnétique (10 à 15 secondes avant l'arrêt automatique du magnétophone) . Cette perte d'information existe de même au début de la bande enregistreuse de la cassette. Le bip sonore permet d'éviter ces deux causes de pertes d'informations.
  • un signal sonore renseignera sur l'état des piles ou des accus
  • des signes, lettres braille ou symboles en relief sur les touches permettront des manipulations plus rapides;
  • un capot ajouré rendra possible un accès tactile à l'axe de rotation; celui-ci présentera en outre un repère;
  • un compte-tours accessibles sera muni de symboles en relief;
  • une fonction de lecture répétée des 4 ou 8 dernières secondes permet une réécoute immédiate du dernier passage entendu (Sony TCM-R1).

 
sommaire


 

CHAPITRE 5:

LA SYNTHÈSE VOCALE DANS LES NOUVELLES TECHNOLOGIES

Puisque notre étude concerne l'accès à l'information parlée et qu'il semble urgent d'orienter les études dans les différents domaines de la promotion, de l'intégration et de la vie autonome des déficients visuels en général et des aveugles qui utilisent peu ou pas le braille en particulier (aveugles tardifs, accidentels, diabétiques et tous ceux qui ont des problèmes de sensibilité tactile...), nous nous limiterons dans ce chapitre à formuler des interrogations, mais aussi des propositions concernant l'information et la formation des non voyants et l'utilisation des techniques nouvelles via la sortie vocale.

Dans le premier chapitre, nous avons montré que la déficience visuelle entrave et ralentit les mécanismes qui contribuent à l'acquisition des données informatives et que l'aveugle est confronté à un problème majeur: la lenteur dans l'accès à l'information. Outre la prise de notes aidée par l'enregistrement et l'utilisation de la parole comprimée, d'autres outils peuvent actuellement contribuer à améliorer grandement l'efficacité des déficients visuels: tous ceux qui peuvent être associés à un micro-ordinateur et utilisés grâce à une synthèse vocale. C'est pourquoi l'observation de Jean-Marie Pierrel (1987) dans "Dialogue oral homme-machine" semble particulièrement concerner le handicapés visuels. "Parmi les avantages de la parole, dans un système de communication homme-machine, deux me paraissent suffisamment importants pour motiver les recherches:

  • la parole est indispensable dans certaines situations pour suppléer les autres canaux de communication, lorsque ceux-ci sont soit saturés (pilote..), soit inopérants à cause de handicaps divers (aides aux handicapés);
  • la parole peut être plus efficace que d'autres modes de communication..."

Les technologies nouvelles en pleine évolution depuis 10 ans ont révolutionné le traitement de l'information et produiront probablement des applications encore insoupçonnées. Mais leurs apports effectifs et les espoirs engendrés bousculent les conceptions classiques sur l'éducation des aveugles, reculent les limites de la réadaptation et remettent en question des habitudes d'apprentissage et les idées sur l'intégration.

Dans ce chapitre, notre souhait est:

  • de fournir quelques exemples des applications associées à la sortie vocale,
  • de faire connaître la demande et les besoins des aveugles aux spécialistes de l'informatique afin qu'ils puissent mieux adapter leurs logiciels et qu'ils puissent, à travers les problèmes de l'aveugle trouver des idées nouvelles à leurs propres recherches,
  • de présenter aux utilisateurs aveugles les réalisations et les espoirs, mais aussi les limites de l'utilisation des nouvelles technologies.


I - UTILISATION DE La SORTIE VOCALE EN INFORMATIQUE PAR UN OPERATEUR AVEUGLE

A - La synthèse vocale

En france, les travaux sur la synthèse de la parole se sont particulièrement développés au CNET (Centre National d'Etude des Télécommunications) à LANNION , à l'ICP (Institut de la Communication Parlée à Grenoble et au LIMSI (Laboratoire d'Informatique et de Mécanique pour les Sciences de l'Ingénieur) à Orsay.

La synthèse vocale nécessite une carte et des logiciels d'analyse grammaticale, de transcription orthographique et phonétique, de calcul de rythme, de prosodie, un dictionnaire de diphones et un éditeur vocale. Pour pouvoir poursuivre nos travaux, nous avons utilisé trois cartes de synthèse de paroles différentes:

  • en 1985, la carte Ferma 5000 et le "WordStar parlant",
  • en 1987 la carte Télévox fabriquée à partir des recherches du CNET et qui fonctionne avec le logiciel Edivox,
  • en 1988 la carte Synthé 3 qui fonctionne avec le logiciel Sonolect.
  • en 1987, une carte américaine Synphonix 200/PT fonctionnant avec le logiciel Artic Vision.

Les trois premières cartes permettent de synthétiser toute phrase française ainsi que les nombres. Certaines sont autonomes (Ferma 5000, Synthé 3) et n'utilisent aucune ressource mémoire du micro-ordinateur, se comportant comme une imprimante. a l'heure où nous rédigeons ces travaux la carte Télévox mobilise une partie de la mémoire vive du micro-ordinateur (environ 120 KO). La quatrième carte utilisée synthétise toute phrase et chiffre de la langue anglaise.

Pour qu'un opérateur aveugle puisse se servir d'un micro-ordinateur, grâce à une sortie vocale, il doit disposer d'un compatible PC, d'une carte de synthèse vocale et d'un logiciel (éditeur vocal) associé à la carte. L'éditeur vocal d'écran (Edivox ou Sonolect par exemple) réside en mémoire et peut être appelé à tout moment selon les besoins de l'utilisateur. Les premiers utilisateurs aveugles qui ont testé ces nouveaux outils si prometteurs ont contribué via les problèmes rencontrés, à l'évolution des logiciels qui autorisent maintenant de nombreuses applications.

L'éditeur vocal gère les déplacements d'un curseur vocal et produit ainsi une sortie vocale des données affectées à l'écran: toutes les informations affichées (excepté les données graphiques) peuvent être prononcées caractère par caractère, mot par mot, ligne par ligne, phrase par phrase (lecture de tout ou partie d'écran). L'opérateur aveugle peut avoir accès aux informations de l'écran par l'intermédiaire de la synthèse de paroles en exploitant les deux possibilités offertes par l'éditeur sonore:

  1. Par une "voie interne", il entre dans l'éditeur vocal en quittant son application (traitement de textes, tableur, gestionnaire de fichiers...) et peut alors déplacer le curseur vocal faire lire ou épeler un mot, prononcer une ligne, une phrase, tout ou partie de l'écran, connaître les coordonnées d'un caractère, chercher un mot, une portion de phrase, chercher également et faire lire les parties en vidéo inverse.
  2. Par une "voie externe" il exploite les moyens donnés par les macro-commandes qu'il peut construire. Ainsi, sans quitter l'application en cours, par une seule commande, l'opérateur peut obtenir la plupart des fonctions de l'éditeur, mais il peut aussi associer plusieurs fonctions et faire l'économie de nombreuses manœuvres. Il peut ainsi faire lire un caractère, un mot, une ligne, une phrase, inscrits à un endroit donné de l'écran, connaître les coordonnées du curseur d'application, faire lire tout ou partie d'une "fenêtre"....

L'opérateur peut définir et construire des "fenêtres", c'est-à-dire des portions d'écran qu'il sélectionne selon la nécessité de l'application en cours.

B-Les besoins de l'opérateur aveugle

Une des caractéristiques principales de la population des déficients visuels est sa grande hétérogénéité, mise en évidence dans le premier chapitre. Mais un caractère commun à tous les aveugles est la lenteur dans l'accès à l'information et dans l'acquisition des connaissances. Aussi, tous les moyens actuels permettant de faciliter et de rendre plus rapide la prise d'information sont à mettre en œuvre pour améliorer l'autonomie et l'intégration du non voyant. L'initiation d'un jeune aveugle de naissance à la lecture et à l'écriture braille est nécessaire pour lui permettre d'accéder à l'enseignement scolaire, aux connaissances indispensables à son bon développement cognitif. Le jeune élève aveugle saura d'autant mieux s'intégrer dans une classe de voyant qu'il pratiquera avec plus d'aisance le braille. Toutefois pour les aveugles tardifs qui ont perdu la vue progressivement ou brusquement (accidentellement), même s'il sont "doués" ou s'ils font de gros efforts, la pratique du braille restera un moyen d'accès à l'information peu rentable. Aussi, et plus encore pour les aveugles tardifs, tous les moyens susceptibles de remplacer le plus efficacement possible le "papier-crayon" ou la "tablette-poinçon" sont des outils inestimables. Parmi eux, le micro-ordinateur, aide déjà fort appréciée de tous les utilisateurs voyants nous semble être un outil essentiel à une meilleure intégration scolaire, universitaire et professionnelle des aveugles.

Bien que les possibilités offertes par le matériel informatique pour accroître l'indépendance et l'autonomie des aveugles soient considérables, l'âge, l'histoire de la cécité, les connaissances des utilisateurs déficients visuels potentiels sont si variables, que différents niveaux de formation doivent être définis et différents types d'application proposés. a partir de nombreux entretiens entrevues avec des non voyants, et à partir de notre propre expérience, nous nous bornerons à évoquer la demande de l'étudiant aveugle. Ce qui permettra de répertorier les besoins et de mieux comprendre une demande relativement générale et pressante de tous les aveugles.

À l'université, les tâches à effectuer sont nombreuses et variées:

  • rédaction de comptes-rendus, d'exposés, d'articles, de mémoires, de rapports,
  • classement et organisation des notes,
  • constitution de fiches bibliographiques ou thématiques,
  • traitement de données statistiques, calculs...
  • stockage de données,
  • accès aux banques de données, recherches bibliographiques, recherches d'informations spécifiques...
  • gestion de dossiers...

Ce que recherche avant tout l'étudiantnon voyant, c'est pouvoir stocker, organiser, classer et retrouver facilement et rapidement l'information, pouvoir communiquer et échanger ses données avec les professeurs et étudiants voyants. Il souhaite également utiliser les mêmes outils de travail que les voyants afin de mieux échanger, discuter, critiquer, ses idées, ses méthodes de travail... Que l'étudiant aveugle utilise les mêmes outils, arrive au même but que l'étudiant voyant avec des méthodes de travail et des moyens différents n'est pas gênant , mais que les uns et les autres puissent échanger facilement leur production et discuter des méthodes, techniques et logiciels de travail pourraient contribuer à l'enrichissement des uns et des autres. Ce qui améliore l'efficacité de l'aveugle ne pourrait-il pas avoir des retombées sur la "rentabilité" du voyant et inversement.?

II-UTILISATION DU MATERIEL INFORMATIQUE PAR L'AVEUGLE

Tout matériel susceptible de pouvoir être exploité par l'aveugle et permettant d'effectuer les mêmes tâches (dactylographie, traitement de textes, traitement de données, tableur, gestion de données...) que les voyants et utilisant les mêmes logiciels semble le mieux indiqué pour faciliter l'intégration universitaire, puis professionnelle de l'opérateur déficient visuel. Outre l'allégement du travail attendu, les outils informatiques peuvent contribuer grandement à améliorer la vitesse d'exécution des nombreuses tâches à effectuer. Mais ce qui est primordial c'est que ce matériel permette à l'aveugle d'assurer des tâches jusque là inaccessibles pour lui, faute de moyens techniques et non faute de moyens intellectuels. Aussi, tout équipement susceptible d'être utilisé à la fois par des opérateurs aveugles et voyants est à étudier de façon préférentielle parce qu'il facilitera une meilleure communication entre eux, et parce qu'il sera moins coûteux que les équipements spécifiques (standardisation, vente en plus grand nombre).

A-L'équipement informatique

1-Le clavier

Contrairement à de nombreuses croyances et à de nombreux a priori, apprendre à se servir d'un clavier est relativement facile pour un non voyant. Un grand nombre de jeunes déficients visuels ont suivi des cours de dactylographie en institutions spécialisées. Le clavier d'un micro-ordinateur compatible P C peut se diviser en trois grandes parties:

  • les touches communes aux machines à écrire, pouvant être employées comme un clavier AZERTY ou QWERTY?
  • les touches de fonctions distribuées en deux colonnes de cinq touches à gauche du clavier AZERTY (pour les PC de type XT) et distribuées en ligne avec parfois un espace plus important toutes les quatre touches (3 groupes de 4) au-dessus du clavier AZERTY pour les PC de type AT;
  • le pavé numérique comportant neuf touches disposées en carré de 3 sur 3, ces touches ayant une double fonction suivant la position de la touche de blocage numérique (chiffres ou gestion de déplacement du curseur d'application).

Sur certains claviers, les touches "j", "f" du pavé AZERTY et "5" du pavé numérique sont marquées d'un indice en relief. Ce repère tactile facilite beaucoup la localisation de toutes les autres touches et permet de situer rapidement la première position des dix doigts sur le clavier. D'autres touches peuvent être mises en évidence à l'aide de caractères braille sur bandes adhésives transparentes. Bien choisis, adaptés à l'utilisateur et au type de clavier, ces repères en relief accélère la vitesse de frappe et après quelques semaines d'utilisation, le clavier ne pose généralement aucun problème à l'opérateur aveugle.

2-L'écran

Bien que la "sortie écran" ne soit pas utilisée par l'aveugle, il faut toutefois qu'il sache que les données affichées à l'écran sont distribuées sur 25 lignes et 80 colonnes et que la localisation de chaque caractère affiché à l'écran peut être défini par ses coordonnées: le numéro de la ligne et le numéro de la colonne (01,01 situent le premier caractère à gauche de l'écran, 25,80 situent le dernier caractère à droite de l'écran). La représentation de cette grille et de son contenu (son image mentale) améliore sensiblement les stratégies d'exploitation du logiciel par l'opérateur privé de vision. Il semblerait que les aveugles qui ont une bonne représentation de ce qui se passe à l'écran apprennent plus aisément à se servir d'un logiciel. Dans ce but, ils doivent exploiter toutes les possibilités de l'éditeur vocal pour étudier l'écran dans un premier temps, puis confectionner les "fenêtres" et les macro-commandes les mieux adaptées pour transmettre, via la sortie vocale, toutes les informations affichées à l'écran. La construction des "fenêtres" et l'élaboration des macro-commandes doivent utiliser au mieux toutes les commandes potentielles de l'éditeur vocal en fonction du logiciel d'application auquel elles s'adressent (traitement de texte, tableur...). On se trouve là, face à une situation de résolution de problèmes dont les solutions les plus adaptées répondront le mieux à l'objectif recherché: transmettre le plus rapidement possible, le plus précisément possible et de façon sélective et séquentielle (par voie orale) toutes les données informatives d'un écran qui elles, sont disposées spatialement dans le but d'être rapidement accessibles par la voie visuelle.

B-Utilisation des logiciels d'application par l'aveugle

Les données des logiciels graphiques, de ceux gérant de nombreux symboles, ceux dont les commandes d'application s'appuient sur des couleurs ou des effets différentiels de luminosité ne peuvent être retransmises par la sortie vocale. Toutefois de nombreux logiciels peuvent être utilisés par le non voyant. Citons à titre d'exemple:

  • les traitements de texte (Sprint, WordSar, WordPerfect, Writing Assistant...),
  • les tableurs (Multiplan, )
  • les bases de données (Dbase 3, Filing Assistant...),
  • les émulateur de Minitel (Kortex, Kx-tel2),
  • les logiciels de programmation (Turbo Pascal, Basic...).

1-Le traitement de texte

La pratique d'un traitement de texte nécessite déjà un certain "investissement intellectuel" chez le voyant. Pour l'opérateur aveugle, l'apprentissage des fonctions de l'éditeur vocal s'ajoute encore à celui du logiciel d'application (traitement de texte ou autre).

Un traitement de texte permet de saisir du texte, de le mettre en forme, de le sauvegarder, de l'imprimer. Lors de la saisie, le texte peut être frappé "au kilomètre" (sans taper un retour chariot à la fin de chaque ligne. Les fautes de frappe peuvent être corrigées, des modifications peuvent être effectuées jusqu'au dernier moment avant sa sortie à l'imprimante.

Une partie quelconque du texte peut être sélectionnée, "coupée et recollée" à un autre endroit. Une règle de tabulation permet de fixer les marges à droite et à gauche, de fixer l'interligne et l'alignement du texte. Les titres peuvent être centrés...Les enrichissements typographiques des caractères sont variés: italique, gras, souligné...Un traitement de texte peut permettre aussi la génération de table des matières, la gestion des en têtes, des bas de page, des index, des renvois en fin de texte... Une fois le texte saisi et mis en forme, il doit être sauvegardé. Une sauvegarde automatique, quand elle existe a le grand intérêt de limiter les risques de perte de document dus aux coupures de courant. Les formations à l'utilisation des traitements de textes sont souvent standardisées et très coûteuses. Elles sont essentiellement centrées sur l'apprentissage des différentes fonctions du logiciel et sont rarement orientées vers les stratégies opératoires les plus efficaces en tenant compte des tâches à effectuer. Par ailleurs, l'initiation au traitement de texte implique au moins la connaissance d'un minimum de vocabulaire informatique. L'exploitation d'un traitement de texte nécessite la mémorisation des nombreuses "fonctions" du logiciel utilisé (50 à plus de 150 selon les logiciels). D'un point de vue ergonomique, nous définissons chaque "fonction" par:

  • une commande (la ou les touches de clavier utilisées),
  • une procédure (la ou les conditions de mise en œuvre),
  • un résultat (la ou les modifications de l'état du système).

Certaines fonctions sont très utilisées, d'autres peu et d'autres pratiquement jamais: cette probabilité d'emploi dépend des tâches à effectuer et des stratégies mises en œuvre par l'opérateur. Les traitements de texte sont présentés à l'écran sous forme de menus d'aide, menus déroulants, menus en cascades, à multiples fenêtres... Ainsi les fonctions sont réalisées par des procédures s'appuyant sur des choix affichés à l'écran. Si, pour le voyant cette forme de présentation facilite la mémorisation des commandes et le guide dans l'utilisation du logiciel (au moins au début), pour le non voyant, , elle peut poser un problème. En effet, la synthèse vocale n'annonce pas la liste de ces choix. Ainsi, si une personne voyante peut, dans un premier temps, faire l'économie de mémorisation des informations contenues dans les menus, la personne non voyante doit mémoriser dès le début de l'apprentissage, ces mêmes informations (mémorisation des fonctions, commandes, procédures et représentations des résultats précis obtenus). Ce problème peut être résolu lorsque toutes les fonctions de l'éditeur vocal sont parfaitement connues.

Nous exposons le principe que nous avons expérimenté. En premier lieu, il convient d'entrer dans l'éditeur vocal et d'explorer toutes les lignes de l'écran afin de se construire une bonne représentation mentale de la configuration de l'écran. En second lieu, trouver les coordonnées des "fenêtres" à faire lire sélectivement et les construire. Enfin construire les macro-commandes adaptées qui consistent à attribuer à une touche une suite de commandes. Sorti de l'éditeur vocal, tandis qu'il a repris le cours de son application, l'opérateur aveugle peut alors, par appui sur shift puis la touche choisie (pour Edivox), CTRL puis la touche choisie (pour Sonolect), faire lire sélectivement plusieurs "fenêtres", les mots en vidéo inverse qu'elles contiennent...Cette préparation à une lecture aisée de l'écran peut demander plusieurs jours à un aveugle isolé et quelques heures s'il peut se faire aider par un voyant (même naïf) pour faire déplacer le curseur vocal et définir les coordonnées des "fenêtres" à construire. L'objectif vise à utiliser au mieux les possibilités du logiciel d'application, ici du traitement de texte, en combinant ses fonctions avec les fonctions de l'éditeur vocal. Pour le non voyant, il s'agit d'une double tâche: trouver les stratégies les plus économiques pour utiliser les possibilités de correction, de déplacement, de copie, de recherche, de coupe, d'ajout, de tri, ... du traitement de texte en consultant au bon moment et au bon endroit de l'écran l'information à faire lire par la synthèse vocale. C'est pourquoi il faut en premier lieu repérer où, quand, comment est distribuée l'information affichée à l'écran. Nous avons noté à ce propos que les voyants ont des difficultés à donner des indications précises sur la position d'un caractère, d'un mot, d'une ligne ou d'une colonne de l'écran. Pour le voyant la position d'un objet se définit par rapport à la position des autres objets situés dans l'espace ou dans le plan et non par rapport à ses coordonnées. Or pour se représenter une configuration spatiale, le non voyant a besoin non seulement de connaître la nature des objets qui la composent, mais aussi les coordonnées des objets les plus pertinents et leur position par rapport aux autres objets.

L'aide vocale permet de se représenter ce qui se passe à l'écran et dans l'application en cours mais le repérage demande parfois de nombreuses manipulations. Par ailleurs la lenteur de la restitution des données informatives par la synthèse vocale ralentit le rythme de travail de l'étudiant aveugle et rend parfois pénible l'attente de l'information recherchée.

Le déficient visuel a besoin de connaître tout comme le voyant l'état de certaines touches: Majuscules/minuscules, num lock..., les informations de la "ligne d'état" souvent regroupées dans les premières lignes ou les dernières lignes de l'écran donnant des indications sur l'unité de disque et le directory en activité, le fichier ouvert, l'heure, les coordonnées du curseur d'application... Toutes ces indications ne sont pas toujours utiles à connaître au même moment. D'où l'intérêt de construire des macro-commandes pour faire lire soit globalement, soit séparément les indications souhaitées pour économiser le temps d'écoute. En effet un autre problème crucial associé à la synthèse vocale est celui concernant la sélection des informations pertinentes inscrites à l'écran. Pour poursuivre sa tâche, nul n'est besoin de faire régulièrement l'inventaire de toutes les données de l'écran, seules certaines informations et les changements importent. Pour l'opérateur voyant, un simple coup d'œil au bon endroit suffit, pour l'opérateur aveugle, il lui faudra multiplier les commandes et macro-commandes adéquates pour faire lire sélectivement l'information pertinente.

Avec un bon traitement de texte, il est possible pour un non voyant de se fabriquer des "outils de bureau" qui lui rendent de grands services, même s'ils semblent bien rudimentaires pour un voyant. Ainsi, dès 1985, avec le "Word Star parlant", malgré ses imperfections, ses manques (seul 70% des fonctions du Word Star étaient accessibles aux non voyants à l'époque), nous avons pu confectionner:

  • un agenda, un semainier,
  • un annuaire,
  • un cahier de comptes,
  • des fichiers d'indexation,
  • des lettres-types et des en têtes de lettre,
  • les exposés, comptes rendus, mémoires, fiches bibliographiques et thématiques...

Bien que rudimentaire, avec quelques astuces et l'utilisation optimale des fonctions restantes du logiciel, cet outil informatique rendait possible l'exécution de tâches impossibles à effectuer pour une aveugle tardive ne connaissant pas le braille. Plus tard, , l'utilisation du logiciel Sprint avec la carte de synthèse vocale Télévox (1988) et la carte Synthé3 (1989), grâce aux nouvelles fonctions des logiciels et à une plus grande vitesse de fonctionnement du matériel, a nettement facilité nos travaux et amélioré notre rendement.

2-Les autres logiciels d'application

Le logiciel de traitement de texte fut le premier logiciel utilisé par les aveugles et reste celui qui est le plus fréquemment utilisé. Toutefois de plus en plus, par intérêt et peut-être par souci de se confectionner leurs propres outils de travail, et aussi en raison des nouvelles orientations pédagogiques dans les institutions spécialisées, des aveugles utilisent les autres logiciels et se dirigent vers la programmation.

Les tableurs, les logiciels de gestion de fichiers et de base de données nécessitent une analyse plus approfondie des tâches à effectuer et des possibilités du logiciel. Toutefois, persuadée que ces programmes peuvent faciliter considérablement les tâches de l'étudiant aveugle, il nous paraît urgent d'étudier leurs conditions d'utilisation.

Mais avant tout, il faut envisager plusieurs questions, y apporter des éléments de réponses ou au moins les garder à l'esprit durant une réflexion sur l'insertion professionnelle des non voyants:

  • Quels sont les logiciels pouvant rendre le plus de services aux étudiants déficients visuels?
  • quels sont les logiciels dont les données inscrites à l'écran peuvent le plus facilement être traduits oralement sans ambiguïté ni perte d'information?

En ce qui concerne la nature du logiciel, le plus utile pour l'aveugle est d'abord le traitement de texte, qui remplace le papier-crayon, qui permet de transcrire les informations d'un fichier en braille ou en caractères imprimés selon l'imprimante utilisée et qui facilite ainsi la communication entre l'étudiant non voyant et les professeurs et étudiants voyants. Les autres progiciels à employer dépendront évidemment de la nature des tâches à effectuer. Tous ceux qui aident à la gestion , à l'organisation et au stockage et à la récupération des données nous semblent être d'un grand intérêt. Comment, pour un étudiant aveugle retrouver parmi une bibliographie de plus de 500 références tous les auteurs qui, en 1986, ont écrit un article sur la parole comprimée(compressed speech)? Cette tâche est tout à fait impossible pour un étudiant aveugle sans moyen informatique. Construire des tableaux, les remplir de noms ou de chiffres, effectuer des diagrammes ou des graphes sont autant de travaux impossibles à réaliser sans l'aide d'outils informatiques bien adaptés. Pour procéder au choix d'un logiciel, de nombreux éléments doivent être pris en compte et comme dans toute résolution de problèmes, il faut opérer par étapes:

  1. définir avec le plus de précision possible le ou les objectifs à atteindre,
  2. Analyser les fonctions du logiciel afin de posséder une bonne connaissance de leur organisation et de leur structure,
  3. Vérifier si les "menus" et données affichées à l'écran peuvent être transférés sans ambiguïté via la synthèse vocale,
  4. Construire les "fenêtres" et macro-commandes permettant ce transfert,
  5. Déterminer la ou les procédures qui permettront d'effectuer la tâche,
  6. Tester le logiciel en situation de travail,
  7. Rectifier alors les macro-commandes ou en construire de mieux adaptées si besoin est.

La pratique de l'informatique est bien autre chose qu'une simple interaction homme-machine. "Cette discipline s'apparente en réalité, pour une large part à ce que la psychologie nomme résolution de problèmes appliquée au traitement de l'information" (Dufoyer 1988).

Le choix du matériel dépendant des applications envisagées, pour l'étudiant aveugle, aux contraintes imposées par la tâche s'ajoute une contrainte primordiale: la compatibilité du logiciel avec la sortie vocale.

C-Conditions d'utilisation des outils informatiques par l'opérateur aveugle

Les nombreux échanges que nous avons eus avec des opérateurs aveugles nous ont enseigné qu'il est souhaitable de souligner toute difficulté opératoire, toute imperfection d'un système en vue d'améliorer le produit et de faire évoluer les logiciels de façon optimale. Dès lors, à partir de notre propre expérience, nous nous proposons de souligner les objectifs à viser en priorité pour optimiser les conditions d'exploitation du matériel informatique par les utilisateurs aveugles.

1-Favoriser l'accès aux informations de l'écran

L'accès aux données affectées à l'écran est plus lent et plus difficile par la modalité auditive que par la modalité visuelle. Les messages distribués en ligne nécessitent moins de manipulations et sont plus facilement lus par la synthèse vocale que les messages distribués en colonnes.

2-Améliorer la sélection de l'information

Les commentaires et annonces du logiciel utilisé ainsi que la ligne d'état et toute autre indication donnée en cours d'application seront plus faciles à sélectionner si les messages sont toujours placés au même endroit de l'écran.

3-Réduire la charge mentale

Favoriser l'accès aux menus d'aide ou aux répertoires des commandes pour pouvoir retrouver aisément une commande ou une procédure oubliée. Pour cela les commandes potentielles devraient être rappelées sur une ligne et le menu d'aide accessible par une touche devrait être distribué en ligne pour ne pas mobiliser une fenêtre de lecture supplémentaire. Le non voyant devant mémoriser dès le départ, les commandes et procédures des fonctions, la charge mentale serait réduite s'il existait toujours un lien logique pour l'utilisateur entre les touches du clavier utilisées pour les commandes et les fonctions qu'elles activent: par exemple C pour copy, F pour fichier, M pour mise en forme....

Si une application nécessite une procédure longue et coûteuse en manipulations, le "chemin" emprunté pourrait être rappelé dans une ligne située toujours au même endroit.

4-Réduire le nombre des manipulations

L'aide vocale permet de se représenter ce qui se passe à l'écran et dans le système, mais le repérage nécessite parfois de nombreuses manipulations.

Le logiciel qui donne la possibilité d'effectuer des macro-commandes afin de regrouper plusieurs manipulations sous une même commande, produit une économie de temps appréciable pour l'opérateur aveugle qui peut parfaitement mémoriser quelques macro-commandes pour les fonctions les plus utilisées.

5-Economiser le temps de transfert des informations auditives

En cours d'application, les commentaires, annonces, indications doivent être courts et précis pour diminuer au maximum le temps d'écoute. Au niveau de l'éditeur vocal, la possibilité de faire varier le débit des mots prononcés permet à l'opérateur aveugle d'économiser son temps d'écoute selon l'application en cours.

6-Donner un écho sonore du fonctionnement du micro-ordinateur

Après l'activation d'une fonction, lors du déroulement d'une procédure, des mécanismes internes se mettent en route et nécessitent l'arrêt de toute manipulation du clavier pour aboutir à un bon déroulement des opérations. Pour le voyant cette période d'attente est signalée, selon les manœuvres en cours, par la diode clignotante du disque en activité ou par un indice visuel affecté à l'écran. Pour l'aveugle, ces indices pourraient être des bip, notes de musiques ou bruits particuliers signalant à l'opérateur que la machine est en train d'effectuer une opération qu'il ne doit pas interrompre sous peine de stopper le mécanisme du système.

Toutes les observations et propositions que nous avons transmises aux différents constructeurs depuis 1985 ont visé à une amélioration de la représentation du déroulement des opérations déclenchées et de la représentation du résultat de l'activation des fonctions soit par une aide vocale plus précise, soit par un écho sonore ("bip", bruit), soit par des manipulations moins nombreuses. Pour un opérateur aveugle, il importe de connaître l'effet des manipulations et des fonctions activées pour pouvoir poursuivre l'objectif associé à l'application en cours. Une aide vocale centrée sur le résultat de l'activation des fonctions faciliterait la construction et la mobilisation des représentations qui sous-tendent l'activité de l'opérateur privé des informations de l'écran.


III-LES SOURCES D'INFORMATIONS ACCESSIBLES GRACE À L SORTIE VOCALE

Tous les nouveaux modes de documentation et de communication susceptibles d'être accessibles à l'étudiant aveugle via une sortie vocale sont d'un intérêt capital pour faciliter l'acquisition de ses connaissances. Nous relatons à ce propos les appréciations d'un intellectuel aveugle: "la plupart des nouveaux moyens de communication ont beaucoup plus d'importance pour les aveugles que pour les personnes voyantes. Pour ces dernières, en effet, il ne s'agit en général que d'un procédé supplémentaire pour obtenir plus aisément ou plus rapidement un résultat auquel elles pouvaient déjà parvenir normalement. En revanche, pour les aveugles, c'est parfois une révolution..." (Jaquin 1989). Parmi les nouveaux supports de l'information le Pinitel, les scanners associés aux logiciels de reconnaissances de caractères, les CD ROM sont des outils révolutionnaires pour les déficients visuels parce qu'ils leur permettront l'accès à des informations auxquelles ils ne pouvaient prétendre jusque là sans l'aide d'une tierce personne.

A-Accessibilité aux informations du Minitel

Nous avons testé l'accès aux informations du Minitel et profité de ses services en utilisant la configuration et les adaptations suivantes:

  • un micro-ordinateur compatible PC de type AT,
  • une carte de communication (Kortex) et son logiciel associé
  • une carte de synthèse vocale et son logiciel d'édition vocale.

La carte Kortex permet les appels automatiques des serveurs et la sauvegarde de l'information dans des fichiers du disque dur du micro-ordinateur. Ainsi les données enregistrées peuvent être traitées par d'autres programmes tel qu'un traitement de texte. L'étudiant aveugle peut alors, à son rythme, consulter à l'aide de la synthèse vocale toutes les informations enregistrées.

Pour utiliser le logiciel d'émulation Minitel, il est relativement aisé de construire les "fenêtres" et macro-commandes adaptés. Les problèmes ici sont liés à la nature des caractères affichés et à la variété de la disposition de l'information. Les caractères disposés sur l'écran sont des lettres majuscules non accentuées. De ce fait, la lecture par la synthèse vocale est parfois peu compréhensible: l'éditeur vocal n'étant pas "intelligent", il prononce strictement ce qui est affiché. Par ailleurs selon les serveurs interrogés, la disposition des données varie et il n'est pas possible de prévoir la localisation des informations pertinentes. L'opérateur aveugle est forcé de faire lire tout l'écran. Il en résulte une perte de temps évidente et une interrogation parfois coûteuse !

B-Accessibilité aux informations scannées

Un logiciel de reconnaissance de caractères associé à un scanner fournit un moyen automatique de rentrer dans la mémoire d'un micro-ordinateur des textes à partir de documents déjà dactylographiés ou imprimés sans avoir à les saisir manuellement au clavier. Associé à une synthèse vocale, c'est un système permettant de faire de la lecture assistée par ordinateur. En effet, grâce à ce dispositif, il est possible de récupérer des textes imprimés déjà existants pour les ré-exploiter. L'étudiant aveugle peut se constituer ainsi une base de données ou saisir du texte pour le faire lire.Pour cela,la configuration nécessaire est la suivante:

  • un scanner (caméra linéaire électronique),
  • un micro-ordinateur compatible de type AT de préférence,
  • un logiciel de saisie d'images et de reconnaissance de caractères,
  • une carte de synthèse vocale et son logiciel associé.

Le scanner numérise ligne par ligne la page d'un document et la transmet au micro-ordinateur qui doit posséder une mémoire vive importante compte tenu de la masse d'informations à traiter.

Lors de la saisie, les caractères non reconnus sont remplacés par une étoile. Nous avons testé ce type de matériel avec le logiciel de reconnaissance de caractères ReadStar. Malheureusement, les cartes de synthèse vocale n'ont pu fonctionner simultanément: l'une d'elles occupant une trop grande place dans la mémoire vive de l'ordinateur, l'autre associée à un logiciel nécessitant un "dongle" (clé de protection) incompatible avec le "dongle" du ReadStar. a l'heure où nous rédigeons notre texte, une personne aveugle ne peut utiliser seule ce dispositif, mais ayant signalé nos observations aux différents constructeurs concernés, un espoir est permis.

Nous avons constaté qu'un système de reconnaissance ne peut tout lire: la qualité du document doit être bonne (frappe, photocopie, impression). Les caractères de petite taille ou très proches les uns des autres sont difficiles à reconnaître. Un texte contenant de nombreuses polices de caractères, des images ou une mise en page complexe est plus long à "saisir".

Toutefois, une personne voyante a pu saisir des documents imprimés, photocopiés, ou dactylographiés qui ont été lus dans un deuxième temps, par les synthèses vocales françaises pour les textes en français et la synthèse américaine pour les articles en langue anglaise. Lorsqu'un tel système de reconnaissance pourra fonctionner sous les commandes d'un seul opérateur aveugle, une étape importante sera franchie dans le domaine de l'accès à l'information chez l'aveugle. Signalons que des "machines à lire", (Kurwail Reading machine) provenant des Etats-Unis commencent à être commercialisées en France. Constituées d'un logiciel de reconnaissance automatique des caractères par contraste entre l'image de la lettre et le fond du papier, informations qui sont ensuite traitées pour être lues par une synthèse vocale, ce matériel ultra perfectionné est extrêmement coûteux. Une découverte spectaculaire n'a pas toujours des retombées immédiates sur les déficients visuels et elle ne modifiera que lentement leur vie quotidienne si elle ne peut leur être directement accessible.

C-Les informations stockées sur C D ROM

Cette étude est le résultat d'une longue réflexion à partir des problèmes rencontrés par les aveugles pour accéder à l'information et à partir de ce qui a été perçu des potentialités du C D ROM.

1-Caractéristiques du CD ROM

C D ROM signifie Compact Disk Read Only Memory. Les informations stockées sur C D ROM peuvent être lues, sélectionnées et copiées sur disque dur ou disquette, mais ,ne peuvent être modifiées ou effacées sur leur support original par l'utilisateur.

Le CD ROM est un support d'informations très dense, pouvant contenir 20 à 25 fois plus d'informations qu'un disque dur de 20 mégaoctets. C'est un disque de 12 centimètres de diamètre qui a en moyenne une capacité de 550 mégaoctets. Un lecteur de CD ROM peut donc être intégré dans un micro-ordinateur.C'est un support très maniable et peu fragile qui a une structure auto-protégée le mettant à l'abri des poussières, micro-rayures et empreintes digitales. Le C D ROM est un support relativement résistant ayant une stabilité physico-chimique permettant une bonne conservation des données pendant quelques dizaines d'années. Le C D ROM est relativement peu coûteux compte tenu du volume d'informations enregistrées. Enfin ce produit professionnel s'appuie sur un standard grand public diffusé mondialement. En 1985, plus de 60 sociétés importantes avaient déjà acheté la licence du C D ROM".

En résumé, un C D ROM est un support d'informations de très grande capacité, pouvant contenir plus de 200 000 pages de format A4, peu fragile, très maniable et amovible (Grumelin et Prost 1987).

2-Matériel nécessaire à son utilisation

La lecture d'un C D ROM nécessite un micro-ordinateur, un lecteur de C D ROM et des logiciels adaptés. Le micro-ordinateur peut être de type Macintoch ou de type compatible PC, XT ou AT. Il doit posséder une mémoire vive de 640 KO et un disque dur de 20 ou 40 MO et un lecteur de disquette de 5 pouces un quart ou 3 pouces et demi. Sur MAC le système d'exploitation utilisé est le dossier système et sur les compatibles le système MS DOS à partir de la version 3.10. Certains C D ROM nécessitent la manipulation d'une souris.

Il existe deux types de lecteur de C D ROM: le lecteur externe qui a une alimentation propre et autonome et le lecteur intégré à l'ordinateur qui utilise une alimentation du micro-ordinateur. Le C D est facilement introduit dans le lecteur à l'aide d'une cartouche.

Les logiciels sont de deux types: le logiciel qui assure le dialogue entre le micro-ordinateur et le lecteur de C D (qui dépend du type de micro-ordinateur, de son système d'exploitation et du type de lecteur) et le logiciel qui assure le dialogue entre l'usager et l'application sur C D ROM. Ce dernier logiciel est un logiciel d'application écrit pour un type de micro-ordinateur et dédié à un type d'application (exemple le Navigator de Zyzomys). Le logiciel d'installation est fourni avec le lecteur et s'ajoute au système d'exploitation du micro-ordinateur, tandis que le logiciel d'application s'installe sur le disque dur du micro-ordinateur dans un directory et est appelé par l'usager au moment de la consultation du C D. Il peut y avoir plusieurs directory et plusieurs logiciels peuvent ainsi être installés sur le disque dur pour différents C D.

3-Les types de CD ROM

Une assez grande variété de C D ROM commence à être commercialisée. Etant donné le développement intensif des nouveaux produits la classification ne peut être exhaustive. a titre indicatif citons:

  • les catalogues de bibliothèques,
  • les banques de données dans les domaines de l'éducation, des sciences humaines, de la jurisprudence, des finances, de la médecine, de la technique, du commerce ,
  • la documentation,
  • les encyclopédies,
  • les dictionnaires.


IV-UTILISATION PAR L'AVEUGLE DES INFORMATIONS STOCKEES SUR CD ROM

A-Les difficultés d'accès à l'information pour l'étudiant aveugle

Pour l'étudiant aveugle, deux modes d'accès à l'information sont possibles: "la lecture tactile et la lecture auditive" c'est-à-dire la lecture braille et l'écoute. Mais dans les bibliothèques universitaires françaises en général (en dehors de quelques exceptions), il n'existe ni informations en braille, ni informations sur cassettes. L'étudiant aveugle doit faire appel aux bonnes volontés pour faire photocopier les articles et informations qui l'intéresse, puis faire appel à des organismes, associations et aux bénévoles pour les retranscrire en braille ou les lire sur cassettes. Il devra parfois patienter plusieurs mois avant de récupérer l'information souhaitée et que dire quand les articles et livres sont en anglais ou en allemand. Les lecteurs sont alors moins nombreux.

Le problème est d'autant plus crucial que le niveau des études atteint est élevé. En effet lors des premières années d'étude, les cours magistraux et les travaux pratiques constituent la base du savoir. Une présence régulière et une prise de notes efficaces, aidée d'un magnétophone le cas échéant, permettent d'accéder à la majeure partie des informations. Par la suite, cette pratique est insuffisante et le travail personnel beaucoup plus lourd impose à l'étudiant de nombreuses investigations dans les différentes sources de données de la bibliothèque universitaire. L'étudiant aveugle doit donc se faire aider pour trouver la référence d'un livre, d'un article, d'une revue et la présenter ensuite à l'employé de la bibliothèque, puis muni de la photocopie ou du livre, il doit alors faire les démarches nécessaires pour faire transcrire les informations en braille ou les faire enregistrer sur cassettes. Ce qui nécessite parfois l'obtention de dérogations spéciales pour les prêts et parfois l'achat d'un livre quand les lecteurs ou la retranscription nécessitent plus d'un mois pour achever le travail.

Un autre problème pour l'étudiant aveugle est la place occupée par l'écriture braille. Une page de caractères imprimés occupe selon sa densité trois à quatre pages de caractères braille. Le volume d'un dictionnaire retranscrit en braille est multiplié par dix. Aussi, l'étudiant ou le lycéen aveugle ne peuvent se charger d'un dictionnaire et que dire d'une encyclopédie !

Il convient de noter également les difficultés que peut avoir un étudiant aveugle à rechercher une phrase ou un mot dans un texte écrit en braille ou enregistré.

Plus que quiconque, les aveugles aspirent à un support de l'information efficace. Le C D ROM pourrait leur permettre un accès à l'information rapide, facile et surtout direct, sans devoir attendre des semaines, voire des mois pour récupérer les données.

B-Les promesses d'avenir du CD ROM

Les qualités du C D ROM: transportabilité, haute densité des informations et accès direct par l'utilisateur permettent d'envisager des applications nouvelles dans des domaines très variés. En particulier dans le domaine de l'éducation et de l'apprentissage des jeunes aveugles, le C D ROM semble pouvoir combler l'espoir de tous les non voyants: celui d'avoir un accès direct à une vaste quantité d'informations. Or, l'association d'un C D ROM et d'un micro-ordinateur avec sortie vocale ou sortie braille pourrait fournir à l'aveugle un "média potentiellement beaucoup plus interactif" que les autres supports actuels. Ces possibilités d'interaction offertes par le C D ROM permettront un accès direct à une telle quantité d'informations que les étudiants aveugles auront désormais des moyens pratiquement analogues à ceux des voyants.

En premier lieu, le dictionnaire sur C D ROM permettra aux jeunes aveugles d'obtenir rapidement et directement la définition d'un mot, un synonyme, une conjugaison, une règle grammaticale. L'étudiant aveugle pourra également avoir un accès direct aux encyclopédies, aux références et aux catalogues des bibliothèques.

Ainsi ce nouveau support de l'information pourrait apporter aux déficients visuels un gain de temps considérable, une autonomie toujours souhaitée et une plus grande indépendance dans son travail. En permettant le stockage d'une quantité imposante d'informations et la consultation de dictionnaires, encyclopédies, banques de données, livres scolaires, le C D ROM peut prétendre à une application assez fascinante: un des meilleurs moyens d'accéder directement à l'information pour le voyant et surtout pour le non voyant.

C-Les adaptations

Mais pour que le C D ROM puisse être utilisé par les non voyants, il sera nécessaire de prévoir des adaptations au niveau des logiciels et du matériel informatique.

Le matériel informatique susceptible d'être adapté aux activités des aveugles, est actuellement bien distribué par un grand nombre d'associations et d'entreprises spécialisées. Depuis les années 85 en France, un certain nombre d'aveugle utilisent ce type de matériel très prometteur. Trois formes d'adaptations à la déficience visuelle sont à distinguer:

  • l'adaptation au niveau des entrées,
  • l'adaptation des logiciels,
  • l'adaptation au niveau des sorties.

1-L'adaptation des entrées:

L'apprentissage et la pratique de machines à écrire sur clavier AZERTY sont proposés aux aveugles de naissance dans la plupart des écoles spécialisées. Ce qui permet une communication et des échanges plus aisés avec les voyants. De plus, pratiquement tous les aveugles scolarisés ont utilisé régulièrement et couramment le clavier "braille" sur machine à écrire le braille. Certains sont plus rapides et efficaces avec ce dernier type de clavier ne comportant que 6 touches et la barre d'espacement. Pour faciliter l'utilisation des micro-ordinateurs par les aveugles, des constructeurs d'aides techniques pour handicapés ont adapté le clavier des micro-ordinateurs soit directement, soit par l'utilisation de logiciels permettant de transformer le clavier classique en clavier braille par l'utilisation sélective de 6 touches. Pour les aveugles qui utilisent couramment le clavier AZERTY ou QWERTY classique, des repères en relief sont placées sur certaines touches dans le but d'accéder rapidement aux touches stratégiques: J et F, touches de fonction, retour et commandes spécifiques.

2-L'adaptation des sorties:

Pour remplacer l'écran visuel inaccessible aux aveugles, les adaptations proposées au niveau des sorties sont de deux formes: soit une sortie vocale, soit une sortie tactile. Les deux peuvent être utilisées ensembles ou séparément. La sortie vocale fait appel à un synthétiseur de voix et nécessite l'adjonction d'une carte et d'un logiciel spécifique. La sortie vocale est plus ou moins fidèle par rapport aux inscriptions de l'écran et son efficacité dépend beaucoup du logiciel adapté utilisé. En général, il est possible d'avoir un écho "écran" ou un écho "clavier", c'est-à-dire de faire lire caractère par caractère, mot par mot ou phrase par phrase tout ce qui est inscrit à l'écran ou entré par le clavier. La position du curseur peut être connu à la demande ainsi que les fonctions utilisées ou les commandes effectuées. Depuis quelques années, les progrès effectués dans ce domaine sont considérables et les sorties vocales proposées ont de bonnes qualités sonore et sont également très efficaces. La sortie vocale est avantageuse pour les personnes qui ne connaissent pas le braille ou qui sont trop lentes pour le lire. (aveugles tardifs, aveugles accidentels, personnes plus âgées).

La sortie tactile fait appel à une plage tactile éphémère qui peut contenir de 12 à 80 caractéres selon le matériel considéré. C'est une véritable fenêtre tactile ouverte sur une portion de l'écran. Elle a pour avantage de donner une représentation fidèle de ce qui est inscrit sur l'écran. La plage tactile est utilisée avec plus d'efficacité par les bons lecteurs de braille.

Il est à noter que ces deux modes de sorties, vocal et tactile, ne permettent pas actuellement une représentation des graphiques. Mais grâce à ces adaptations, le non voyant peut utiliser l'informatique comme le voyant et bénéficier des logiciels de traitement de texte, de gestionnaire de fichier, de tableur, de base de données....

D-Etude de faisabilité

En 1987, nous avons pris contact avec les éditions Robert pour proposer de mettre à la disposition des étudiants aveugles un dictionnaire sur disquettes pouvant être consulté grâce à la sortie vocale d'un micro-ordinateur. Le directeur général a émis l'idée d'utiliser le CD ROM comme support. Nous avons alors suggérer les caractéristiques de présentation à adopter pour que ce produit puisse être accessible à la fois à des étudiants aveugles et voyants (majuscules accentuées, nombre de fenêtres limité, touches rapides...). En décembre 1989, nous avons reçu le "Grand Robert Electronique". Nos premières investigations ont montré que, couplé à une sortie vocale, il peut être considéré comme étant le premier "dictionnaire parlant" accessible aux aveugles.

En mars 1989, nous avons testé quelques CD ROM et recensé les modifications nécessaires à apporter aux logiciels ou à la disposition des messages pour que les informations stockées puissent être directement accessibles à l'utilisateur aveugle grâce à une sortie vocale.

La gamme de matériel C D proposé actuellement étant déjà assez variée, nous avons sélectionné ce qui semble être le plus urgent pour l'étudiant aveugle: un dictionnaire (Zyzomys), des données littéraires (CDLitt), des références de bibliothèque (Myriade).

Une étude exploratoire avec des collégiens voyants fut entreprise afin d'évaluer l'intérêt pédagogique du dictionnaire sur CD ROM d'une part et les modifications à envisager pour que les collégiens aveugles puissent l'employer. En outre une expérience effectuée par un sujet aveugle et un sujet voyant a montré que l'utilisateur aveugle avec le clavier est plus rapide que l'utilisateur voyant avec la souris (Voir annexe).

Pour les C D ROM Zyzomys et Cdlitt, toutes les commandes pouvant être entrées par le clavier sont accessibles à l'aveugle. Toutefois, les commandes de sélection qui nécessitent impérativement l'utilisation d'une "souris" ne permettent pas aux déficients visuels de sélectionner les données.

En ce qui concerne le CD ROM "Myriades", la première version était assez difficile à utiliser les nombreuses fenêtres et la disposition de certaines données en colonnes entraînaient une grande perte de temps dans les manipulations pour obtenir l'écho vocal de la zone sélectionnée. Une seconde version rend ces manipulations moins nombreuses et de fait ce matériel est désormais accessible à l'étudiant aveugle.

E-Les propositions

Pour que le C D ROM puisse être accessible à l'utilisateur aveugle, deux types d'adaptation sont à envisager:

  • les adaptations du logiciel qui assure le dialogue entre l'utilisateur et l'application sur C D ROM,
  • les adaptations concernant la lecture des informations du C D ROM.

1-Les adaptations des logiciels d'application:

Il est impératif pour le non voyant, que toutes les commandes soient accessibles à partir des touches du clavier. Les voyants pourraient éventuellement manipuler ces commandes à l'aide du clavier ou d'une souris.

Il serait souhaitable que les "fenêtres disponibles" soient peu nombreuses ou disposées une par une toujours au même endroit. Une ligne de rappel des commandes successives utilisées pourrait être visualisée et sonorisée.

Il est également nécessaire de pouvoir utiliser les flèches de direction et les fonctions pour sélectionner un bloc de texte.

2-Les adaptations concernant la lecture du texte à l'écran:

Tous les lignes et mots en vidéo inversée sur l'écran doivent pouvoir être accessibles par un écho sonore repérable. Toutes les abréviations, les symboles et les icônes pourront être verbalisés, c'est-à-dire être facilement compréhensibles quand ils sont reçus par "l'écho sonore". Les modifications du style (italique, gras, souligné) seront également traduit par un écho sonore.

L'objectif de ces différentes adaptations est de traduire de façon sonore toute modification affichée à l'écran. Grâce à ces aménagements, les utilisateurs déficients visuels pourront manipuler le matériel d'informations comme les utilisateurs voyants et pourront bénéficier des mêmes potentialités. Pour que l'étudiant aveugle dont le système principal d'accès à l'information est déficient, puisse bénéficier d'un support d'information aussi extraordinaire et aussi précieux, il est urgent de définir ses besoins parce que "nos besoins doivent être connus très tôt dans le processus de conception".

V-CONCLUSION

Le handicap quel qu'il soit peut à tout moment concerner n'importe qui d'entre nous et le savoir ne peut conduire qu'à une amélioration de l'intégration sociale.

Cette intégration sociale sera d'ailleurs facilitée par une bonne utilisation des techniques nouvelles.

Les aveugles ne disposent d'aucune source d'information sur les techniques et matériels modernes susceptibles de les aider. Ils ne connaissent ni les possibilités techniques, ni les apports potentiels de ces nouveaux outils, ni les moyens de se procurer un matériel qui leur serait très utile, mais dont l'achat ne peut être envisagé parce que trop coûteux.

Le magnétophone, l'ordinateur, et les nombreuses adaptations et innovations qui existent aujourd'hui pourront apporter aux aveugles une aide considérable. Il est essentiel que ces outils soient faciles d'emploi, efficaces et qu'ils permettent une économie de temps substantielle. Pour obtenir ce résultat, il importera de faire des enquêtes auprès des aveugles et d'essayer de comprendre comment ils peuvent se représenter l'information globale d'un schéma, d'un écran d'ordinateur, à partir de données ponctuelles, séquentielles et successives. Les morceaux de phrases ou les quelques mots énoncés par une sortie vocale ou affichés par une plage tactile d'ordinateur par exemple devront nécessairement être cumulés avant d'obtenir la globalité de l'information présentée à l'écran. Aussi, les recherches dont le but sera d'étudier les possibilités de rendre les déficients visuels plus rapides et plus efficaces aboutiront forcément à une amélioration de la technologie pour tous. En ce qui concerne les matériaux déjà existants, il serait souhaitable que les notices explicatives des fabricants soient présentées en imprimé, en braille et enregistrées sur cassette pour pouvoir être accessible à tous les cas de cécité.

Nous proposons quelques questions posées par des étudiants et des parents d'élèves: quels sont les mini-calculateurs scientifiques parlant français ou anglais?

Quelles sont toutes les adaptations techniques destinées aux ordinateurs pouvant être utiles aux aveugles? Quelles sont les formations proposées pour pouvoir utiliser rapidement et facilement ce matériel? Il serait primordial de tester le matériel pour handicapé afin de déterminer quel "type" de matériel , pour quel "type" d'utilisateur, et à quel prix.

L'évolution de la technologie et des nouvelles techniques rend désormais accessibles aux aveugles des tâches qu'ils ne pouvaient accomplir auparavant. Des nouvelles possibilités d'orientation vont désormais s'offrir à eux. Ils pourront choisir leur métier et ne seront plus forcés de se limiter à un domaine bien trop restreint et qui n'était pas toujours en accord avec leurs aptitudes réelles et leur goût.

Le besoin d'une éducation adaptée à ces nouveaux domaines d'orientation est aujourd'hui pressant.

Pour permettre aux aveugles de s'adapter aux nouvelles techniques et à la technologie de demain, une pédagogie nouvelle doit s'installer. Dans la formation des aveugles, il ne s'agit pas simplement d'enseigner les technologies nouvelles, mais d'assurer une formation afin que le jeune aveugle puisse être capable de s'adapter aux innovations, développer son sens de la créativité et ses capacités d'adaptation pour le rendre compétitif dans le monde du travail. Pour cela, il importe de définir les besoins nécessaires à l'apprentissage et à la formation . Puisque l'enfant aveugle est privé de l'information visuelle, il s'agira de lui apprendre à se servir au mieux des informations auditives et tactiles.

Dans les institutions et écoles spécialisées, des hommes et des femmes remarquables cherchent inlassablement à faire évoluer et à adapter leur enseignement et leurs méthodes pédagogiques. Aujourd'hui, les jeunes aveugles sont plus nombreux dans les lycées et certains d'entre eux abordent l'Université. L'apprentissage et l'utilisation de la lecture et de l'écriture braille sont à la base de l'acquisition des connaissances chez les jeunes aveugles et amblyopes profonds. Un grand mérite revient aux professeurs de braille qui apprennent aux écoliers à améliorer leurs stratégies de palpation pour accélérer leur vitesse de lecture. Mais pour être compétitifs et pour pouvoir aborder une grande quantité d'information, les non voyants doivent aussi améliorer leurs stratégies d'écoute.

Apprendre à écouter est essentiel pour l'aveugle. Ecouter le professeur, écouter un enregistrement, c'est pouvoir accéder à un maximum d'informations par unité de temps. L'utilisation du magnétophone peut être un outil précieux tant pour la prise de notes que pour l'apprentissage des leçons. Il ne s'agit pas, bien entendu, d'une écoute passive, au même titre que l'écoute des nouvelles à la radio en prenant son petit déjeuner ou l'écoute du dernier bon livre enregistré. L'écoute dans le but d'une "lecture auditive" est une écoute active et intentionnelle. Elle nécessite une attention soutenue et une concentration intense pour repérer les grandes idées d'un énoncé, sa structure et les données essentielles afin de pouvoir les intégrer en faire une synthèse, s'en representer correctement le contenu.

Pour que l'audition devienne efficace et puisse conduire à "une lecture auditive", et même à un "apprentissage auditif", et remplacer ainsi la lecture visuelle, l'audition doit être éduquée. Cette éducation doit tenir compte du développement cognitif de l'aveugle et du rôle de la mémoire pour gérer des événements séquentiels.

Aussi, l'entraînement s'adressera surtout à l'attention, l'écoute active, la mémoire et visera à acquérir les meilleures stratégies d'adaptation en vue d'utiliser le plus efficacement possible les nouvelles techniques qui pourront être mises à leur disposition.

À l'université, par exemple, l'étudiant aveugle doit soit faire transcrire ses cours en braille, soit les enregistrer sur cassette et la quantité de matériel à transcrire ou à enregistrer est considérable. Aussi, il faut trouver tous les moyens pour gagner du temps. En collaboration avec l'I N S E R M de Lille, nous avons étudié deux moyens d'accéder rapidement à l'information: l'utilisation d'un magnétophone à enregistrement différé pour la prise de notes et l'utilisation de la parole comprimée pour pouvoir gagner du temps dans l'écoute et l'apprentissage des cours.

C'est en lui donnant les moyens non seulement techniques, mais aussi les stratégies et les cours adéquats que le lycéen aveugle pourra accéder le plus aisément à de plus longues études.

Nous avons pu observer que les jeunes possèdent des capacités, mais ils ne savent pas qu'ils les possèdent; ils savent toutefois bien évaluer la nature de leurs difficultés. Comme il faut définir avec précision la nature des problèmes pour trouver les solutions les plus acceptables, il est essentiel de donner en priorité la parole aux déficients visuels.

En conclusion, nous pouvons assurer que l'intégration scolaire, sociale et professionnelle des aveugles et amblyopes progressera dans la mesure où il sera donné une moins grande part au côté négatif du handicap , où la valeur du déficient visuel sera plus appréciée, et où ses capacités effectives et potentielles seront plus et mieux exploitées. Lui donner l'information et les moyens, savoir utiliser ses compétences et ses acquis, développer sa motivation, son dynamisme, lui apprendre à apprendre pour s'adapter aux changements de situation, c'est la demande parfois directe, trop souvent secrète de tous les jeunes aveugles pour qu'il puissent vivre plus libres, se sentir plus utiles, mieux communiquer et pour qu'ils puissent ouvrir les portes des emplois jusque là infranchissables.

"Lorsque l'on considère un sujet nouveau, on a fréquemment tendance à tout d'abord surestimer ce qui paraît déjà intéressant ou remarquable et ensuite par une sorte de réaction naturelle, à sous estimer l'état réel de la situation quand nous découvrons que nos idées ont dépassé celles qui étaient réellement réalisables."

 

ϟ


Anita Richaume-Crinquette

présentation d'une Thèse de Doctorat soutenue le 8 juin 1990

Fonte: http://typhlophile.com/aipa/index.shtml

Δ

7-Jul-09
publicado por MJA