
-
sommaire
-
-
-
-
-
Quand la cécité survient à 10, 20 ou 40 ans, la personne qui en est atteinte
est un "aveugle tardif" par opposition à "l'aveugle précoce", aveugle congénital
ou aveugle-né. L'aveugle tardif a peut-être eu l'avantage de pouvoir organiser
ses connaissances à partir des perceptions visuelles, mais il est brusquement
face à un problème crucial: celui de la perte de la lecture et de l'écriture.
Confrontée en 82 à cette situation difficile, nous avons résolu les difficultés
au coup par coup en nous appuyant essentiellement sur la sélection, la gestion
et le stockage des informations auditives. A partir de 1986, de multiples
rencontres avec des intellectuels aveugles de nationalité différentes nous ont
confirmé la place importante que tient l'accès à l'information parlée dans
l'acquisition des connaissances chez l'aveugle. Par ailleurs de nombreuses
entrevues avec des responsables d'instituts spécialisés pour déficients visuels,
ont mis l'accent sur un problème lié en tout état de cause aux progrès en
médecine péri-natale et en ophtalmologie. Les plus anciens d'entre eux nous ont
confié: "il y a 20 ans dans notre établissement, l'effectif de nos élèves se
partageait entre 70 à 75% d'enfants aveugles et 25 à 30% d'enfants amblyopes,
actuellement ces proportions sont inversées. La plupart des enfants amblyopes
qui peuvent lire et écrire en noire, délaissent les cours de braille. Or ces
enfants pour un bon nombre d'entre eux risquent plus que quiconque à plus ou
moins long terme la cécité. Quand on sait le nombre d'années d'étude et de
pratique régulière du braille pour aboutir à une lecture encore relativement
lente par rapport à celle des voyants, on peut alors deviner aisément les
problèmes d'intégration scolaire et sociale que peut engendrer une telle
situation. Pourtant ces enfants ou ces adultes privés brusquement de la vision
conservent leurs potentialités intellectuelles et leurs capacités de
raisonnement, de mémorisation, aussi, en attendant l'acquisition de la lecture
et de l'écriture braille et surtout la rentabilité de ce nouveau moyen
d'appréhender l'information, nous pensons que celle-ci pourrait être transmise
via le canal auditif, tout au moins dans un premier temps. C'est pourquoi, notre
étude, qui est une approche essentiellement exploratoire, aborde le thème de
l'acquisition des connaissance chez l'aveugle à partir de l'information parlée.
Selon notre point de vue, la déficience visuelle entrave et ralentit les
mécanismes qui contribuent à l'acquisition des données informatives, mécanismes
relatifs à l'accès à l'information, à la communication et à la locomotion. Nous
accordons une priorité à l'accès à l'information qui conditionne les deux autres
domaines et interagit avec eux. Notre démarche a suivi deux voies de recherche:
l'une a un caractère fondamental et théorique, l'autre appliqué et pratique.
Le premier chapitre rend compte de faits d'observations et de constatations
obtenues à partir des entretiens et rencontres avec de jeunes aveugles et leurs
enseignants spécialisés. Il relate également des faits théoriques et
expérimentaux décrits par des chercheurs dont l'objectif principal est d'évaluer
l'influence de la perception visuelle dans le développement cognitif et
d'apporter leur contribution à un programme d'éducation et de réadaptation des
handicapés visuels. a travers ces différentes sources de faits, il est montré
que la privation de la vue entraîne un retard dans le développement cognitif lié
essentiellement au déficit de l'accès à l'information sur l'environnement.
L'exploration visuelle présente un caractère holistique, spatial et global,
alors que les explorations tactiles et auditives ont un caractère analytique,
séquentiel et nécessitent l'assemblage de nombreux éléments ponctuels et
successifs pour construire l'événement dans sa globalité; ce qui sollicite
d'autant plus les mécanismes de la mémoire. Nous avons montré dans cette partie
que l'aveugle est confronté à un problème majeur qui est la lenteur dans l'accès
à l'information et nous avons souligné que la population des handicapés visuels
est très hétérogène en raison de divers facteurs: la nature, l'âge et
l'histoire de la déficience visuelle, l'environnement familial et social etc..
Pour accélérer et faciliter l'accès à l'information et l'acquisition des
connaissances, nous nous sommes proposés d'étudier:
-
la prise de notes aidée par l'enregistrement,
-
l'utilisation de la parole comprimée,
-
l'utilisation du micro-ordinateur et des technologies nouvelles grâce à
la synthèse vocale.
Dans un second chapitre, nous avons exposé quelques rappels sur la perception
auditive dans le but d'introduire les étude sur la prise de notes orale, les
expérience avec la parole comprimée et les observations sur la sortie vocale.
Nous avons également montré que l'écoute est un mode d'accès à l'information
appréciable pour l'aveugle de naissance et primordial pour l'aveugle tardif.
Dans le troisième chapitre, nous avons évalué un moyen susceptible de
faciliter la prise de notes des élèves et étudiants déficients visuels:
l'enregistrement. Les caractéristiques de ce mode un peu particulier de
sélection de l'information sont alors considérées et deux types de matériel sont
comparés: le magnétophone classique et le magnétophone à enregistrement
différé. Conçu par une équipe de l'INSERM de Lille, le magnétophone à
enregistrement différé possède une "mémoire-tampon" dans laquelle peut stagné
une portion du discours en cours d'enregistrement pendant quelques secondes, ce
qui laisse le temps à l'utilisateur de décider si les quelques mots ou les
quelques phrases émis par le locuteur sont à conserver ou non et donc à
enregistrer ou non sur la bande magnétique. Nous avons montré que des
collégiens, des lycéens aveugles ou amblyopes sont capables de sélectionner
l'information avec ce type de matériel et qu'il peut être une aide très efficace
pour l'étudiant déficient visuel et tous ceux voyants ou non, désireux de
procéder à un enregistrement sélectif du discours émis. Nous avons aussi
souligné qu'une prise de notes aidée par l'enregistrement ne consiste pas à
mettre en marche un magnétophone et à attendre passivement que le cours ou le
discours soit terminé, mais consiste plutôt, comme tout autre forme de prise de
notes à une sélection active de l'information et à une mise en valeur de la
structure et de l'organisation de son contenu. Ainsi, le découpage en chapitre
et en sections doit être rendu par des indices sonores. Il est souvent
nécessaire de remanier les notes enregistrées afin de les restructurer avec
adjonction de pauses, de bip, de repères sonores, d'explications supplémentaires
dans le but de les rendre plus compréhensible oralement. L'écoute devient alors
une démarche intellectuelle relativement complexe où interviennent les
compétences langagières, les capacités de compréhension, les facultés d'analyse
, de synthèse et de mémorisation de l'auditeur dont les stratégies dépendent
évidemment de ses objectifs et de ses acquis. Pour qu'elle puisse être efficace
la prise de notes aidée par l'enregistrement nécessite une formation, un
apprentissage et un entraînement.
Mais parce que tous les mots sont prononcés et que le débit de la parole
humaine ne dépasse pas 180 mots par minute, l'écoute d'un texte demande plus de
temps que sa lecture visuelle. Pour économiser le temps d'écoute des notes ou
des texte enregistrés et être ainsi plus proche du temps de lecture visuel, nous
nous sommes proposer d'utiliser et d'étudier la compression temporelle de la
parole. L'augmentation du débit d'un énoncé pourrait être un moyen d'accélérer
l'accès à l'information auditive. Les techniques de compression temporelle de
parole permettent de faire varier le débit d'un discours enregistré sans
distorsion excessive du signal vocal. Après avoir tracé l'évolution historique
de ces techniques, exposé les problèmes méthodologiques et procéduraux liés à
l'étude de la parole comprimée, recensé les facteurs susceptibles de modifier
l'intelligibilité et la compréhension des discours comprimés et les applications
potentielles relatives à la parole comprimée et à l'écoute rapide, nous nous
sommes demandés dans quelles limites la compression temporelle produit une
économie d'écoute sans diminuer la compréhension et la performance de
l'auditeur. Les données des publications montrent que l'intelligibilité et la
compréhension de la parole comprimée restent correctes tant que le taux de
compression ne dépasse pas 50% et tant que le débit de la parole n'excède pas
275 mots par minute.
Une première série de quatre expériences a eu pour objectif
l'évaluation des différences entre les quantités d'information acquises
par des étudiants après écoute d'enregistrement de récits en français
présentés avec différents débit de parole. Les problèmes considérés sont
multiples:
-
est-ce que la compression temporelle d'un enregistrement permet
de gagner un temps d'écoute appréciable sans diminuer de façon
significative l'intelligibilité, la compréhension et la rétention de
son contenu?
-
quelles sont les différences entre les performances des
étudiants pour une condition de présentation continue et une
condition de présentation segmentée des enregistrements?
-
pour un même taux de compression quelles sont les différences entre les
sujets pour deux débits de parole (270 m/mn et 300 m/mn)?
-
dans une condition de présentation continue quelles sont les
différences entre les performances des étudiants après écoute de
paroles normales et de paroles comprimées?
Dans la première expérience, 60 étudiants écoutent deux récits, l'un
abstrait, l'autre concret, en condition de présentation segmentée, pour 20
d'entre eux à un taux de paroles normales (135 m/mn),
pour un second groupe de 20 à un taux de paroles accélérée (202
m/mn) et pour un troisième groupe de 20 à un
taux de paroles comprimées (270 m/mn). Les
résultats montrent un effet du taux des paroles et un effet de la nature des
textes. Pour l'intelligibilité, les performances sont plus faibles pour la
parole accélérée que pour la parole normale, mais ne sont pas significativement
différentes entre la parole normale et la parole comprimée. En ce qui concerne
la compréhension et la rétention immédiate, les scores ne présentent pas de
différence significative pour les trois taux de parole. Les étudiants qui ont
écouté les enregistrements en paroles comprimées sont capables de comprendre la
même quantité d'information que les étudiants qui ont écouté la parole normale,
mais dans un temps plus court. Les performances des sujets sont plus faibles
pour le texte abstrait que pour le texte concret dans les trois modes de
présentation.
Dans une seconde expérience, 40 étudiants sont divisés en deux groupes de 20
dont l'un écoute les enregistrements comprimés présentés de façon continue et
l'autre les enregistrements comprimés présentés de façon segmentée. Les scores
de compréhension et de rétention sont plus faibles pour le mode de présentation
continue que pour le mode de présentation segmentée. la différence entre les
scores pour les deux modes de présentation est plus faible pour le récit concret
que pour le récit abstrait.
Dans une troisième expérience, deux groupes de 10 étudiants écoutent deux
récits enregistrés ayant subi une compression temporelle de 50% (pour l'un le
débit des mots est 270 m/mn et pour l'autre 300
m/mn). les scores d'intelligibilité et de
compréhension sont significativement plus élevés pour les enregistrement à 270
m/mn que pour ceux à 300
m/mn. Toutefois la différence entre les scores
des deux groupes pour les épreuves aux questionnaires à chois multiples n'est
pas significative.
Dans une quatrième expérience, deux groupes de 20 sujets écoutent les deux
mêmes récits enregistrés et distribués sous une même condition de présentation
continue. Pour l'un des groupe, le taux de paroles est normale (135
m/mn) pour l'autre comprimé à 50% (270
m/mn). Les étudiants qui écoutent les récits à
un débit de 270 m/mn rappellent plus de
propositions exactes que les étudiants qui écoutent les récits enregistrés à 135
m/mn. Dans les deux conditions de présentation
les scores pour le texte abstrait sont plus faibles que pour le texte concret.
Selon les résultats expérimentaux, il semble que l'intelligibilité, la
compréhension et la rétention immédiate de deux récits courts et relativement
simples restent bonnes avec une compression temporelle de 50% et un débit de
mots de 270 m/mn. Il semblerait même que la
compréhension et la rétention immédiate soient meilleures dans une condition de
compression temporelle à 50%. Toutefois dans cette condition de grandes
variabilités interindividuelles ont été observées. Aussi, nous pensons que des
facteurs inhérents aux sujets sont à étudier: âge, vitesse de lecture, âge
lexical, motivation...
Dans une cinquième expérience, 80 collégiens sont divisés en quatre groupes
en tenant compte de l'âge chronologique et de la vitesse de lecture dans une
première phase et de l'âge lexical dans une seconde phase. Les scores
d'intelligibilités, de compréhension et de rétention immédiate de 20 phrases
écoutées à taux normal et de 20 phrases comprimées sont comparés. Les résultats
montrent que chez des collégiens de 11 à 15 ans en moyenne, l'intelligibilité,
la compréhension et la rétention immédiate des paroles comprimées sont
meilleures pour les lecteurs rapides que pour les lecteurs lents. Les scores
d'intelligibilités et de compréhension sont plus élevés quand l'âge lexical est
plus élevé. Dans cette expérience, il semblerait également que la rétention
immédiate soit meilleure après écoute des paroles comprimées qu'après écoute des
paroles normales. Dans toutes ces expériences intelligibilité, compréhension et
rétention immédiate font essentiellement appel aux compétences langagières et
aux capacités de la mémoire à court terme des sujets. Nous pensons que le
stockage de la mémoire à court terme dépendrait du débit des mots émis. Nous
pensons que d'autres études utilisant différents taux de compression temporelle
sont nécessaires tant sur un plan théorique que sur un plan pratique. D'autre
facteurs pourraient être étudiés: le style cognitif des sujets, leur
motivation, l'attention, les temps de réaction...
Sur un plan théorique ces études pourraient apporter des éléments nouveaux
dans la compréhension de la perception du langage et les processus cognitif liés
au traitement de la parole comprimée. Quel serait le débit optimal des paroles
pour un fonctionnement optimal de la mémoire à court terme? Quelles pourraient
être les incidences de la parole comprimée sur la mémoire à long terme?
Sur un plan pratique, à partir de ces expériences exploratoire et des données
sur la prise de notes, la construction de plusieurs prototypes devrait permettre
une étude sur le terrain afin d'optimiser les caractéristiques de la parole
comprimée dans le but d'une utilisation par des collégiens, lycéens et étudiants
aveugles et d'évaluer avec précision l'intérêt de cette technique, ses
conditions d'utilisation, ses avantages et ses inconvénients à court terme et à
long terme.
Notre expérience personnelle avec la parole accélérée entre 82 et 86 et la
parole comprimée depuis 86, nous a conduit à différentes observations. Lorsque
le contenu d'un message est connu, a été compris ou déjà étudié par ailleurs,
dans le cas d'apprentissage, de ré-apprentissage ou de révision d'un cours
enregistré, l'écoute en condition de compression temporelle nous semble être un
mode de travail intéressant. En effet, non seulement l'augmentation du débit des
mots engendre une économie de temps d'écoute appréciable (pour 45 mn d'enregistrement, 22
mn
d'écoute). Mais l'observation la plus curieuse, notée également dans les
expériences précédentes, est l'amélioration de la rétention du contenu dans sa
globalité. Dans l'état actuel des études nous ne pouvons donner d'explications
structurées à cette observation plutôt inattendue. Nous avons noté également que
l'entraînement améliore et favorise très sensiblement l'intelligibilité et la
compréhension de la parole comprimée. Nous avons aussi utilisé la parole
comprimée pour repérer plus rapidement un passage dans un enregistrement. Nous
avons plus rarement employé la parole comprimée dans une condition de première
écoute d'un thème inconnu, sauf pour les récits faciles ayant uniquement un
caractère informatif. Nous pensons que pour un thème difficile, abstrait ou
complexe, qu'il soit littéraire ou scientifique, nouveau et contenant des termes
inhabituel, il n'est pas souhaitable d'utiliser la compression temporelle pour
une première écoute. Des expériences individuelles et prolongées pendant
plusieurs mois seraient indispensables pour évaluer avec précision l'intérêt de
la compression temporelle et ses conditions d'utilisation. C'est pourquoi, nous
travaillons en collaboration avec l'INSERM de Lille pour la construction d'un
magnétophone comportant d'une part le système d'enregistrement différé afin de
pouvoir sélectionner les notes à enregistrer et d'autre part un système de
compression temporelle afin de pouvoir écouter ces notes plus rapidement. Par
ailleurs un système d'indexation sonore permettrait en plus de poser des repères
entre les différentes section d'un enregistrement.
Outre la prise de notes aidée par l'enregistrement et l'utilisation de la
parole comprimée, d'autres outils peuvent actuellement contribuer à améliorer
grandement l'efficacité et la compétitivité des étudiants déficients visuels.
Nous pensons en particulier à tous les outils qui peuvent être associés à un
micro-ordinateur et utilisables grâce à une synthèse vocale. Des technologies
nouvelles en pleine évolution depuis 10 ans ont révolutionné le traitement et le
stockage de l'information et fourniront probablement des applications encore
insoupçonnées. Leur apport effectif et les espoirs engendrés bousculent les
conceptions classiques sur l'éducation des aveugles, reculent les limites de la
réadaptation et remettent en question des habitudes d'apprentissage et les idées
sur l'intégration. Dans le dernier chapitre, nous avons fourni quelques exemples
d'application associés à la synthèse vocale. Nous avons essayé de faire
connaître les besoins des non voyants aux spécialistes de l'informatique afin
qu'ils puissent mieux adapter leurs logiciels et qu'ils puissent à travers les
problèmes rencontrés par les déficients visuels trouver des idées nouvelles pour
leur propre recherche. Enfin, nous avons présenté à l'utilisateur aveugle les
réalisations et les espoirs mais aussi les limites de l'utilisation des
nouvelles technologies. Un opérateur aveugle peut avoir accès aux informations
affichées à l'écran par l'intermédiaire d'une sortie vocale.
Nous avions montrer qu'un caractère commun à tous les non voyants est la
lenteur dans l'accès à l'information et l'acquisition des connaissances. Aussi,
tous les moyens actuels permettant de faciliter et de rendre plus rapide la
prise d'information, son stockage et sa récupération sont à mettre en œuvre pour
faciliter l'intégration et l'autonomie du non voyant. En particulier, dans ce
chapitre l'idée principale est que pour poursuivre sa tâche nul n'est besoin
pour un opérateur de faire régulièrement l'inventaire de tout ce qui est affiché
à l'écran. Seuls certaines informations et certains changements importent. Si,
pour un opérateur voyant un simple coup d'oeil au bon moment et au bon endroit
suffit, pour l'opérateur aveugle, il lui faudra choisir judicieusement les
macro-commandes adéquates pour faire lire sélectivement l'information
pertinente.
Toute la question est de trouver les artifices et les bons indices pour
transformer un message écrit distribué de façon spatiale en un message oral
distribué de façon séquentielle et le transmettre le plus rapidement possible et
le plus précisément possible via le canal auditif sans qu'il y ait perte
d'information.
LENTEUR DANS L'ACQUISITION DES CONNAISSANCES CHEZ L'AVEUGLE
De nombreux ouvrages ont apporté leur contribution à la connaissance des
aveugles. Parmi ces publications, des auteurs ont évalué le retentissement de la
déficience visuelle sur le développement cognitif de l'individu, sur ses
capacités de communication et ses facultés d'intégration dans le milieu social.
Ce qui est frappant dans ces différentes approches, historiques,
philosophiques, scientifiques ou anecdotiques, c'est l'expression de l'extrême
variabilité qui réside dans les possibilités d'adaptation des sujets aveugles.
Si bien que la cécité peut être un état invalidant pour un individu et ne semble
être qu'un fâcheux contre-temps pour un autre.
Pourtant, à travers ces grandes fluctuations individuelles, qui font dire aux
enseignants spécialisés que "tout cas est un cas particulier", la perte de la
vision entraîne des difficultés communes à tous les aveugles. Une difficulté qui
nous semble essentielle est que l'aveugle vit dans un monde sonore et tactile,
géré surtout par une dimension temporelle et séquentielle et qu'il doit
affronter l'inconnu, le monde visuel, le monde de l'espace et du simultané. Le
plus dur sera de reconstruire l'un à partir de l'autre.
Dans cette première partie, les principaux facteurs de variabilité
inter-individuelle sont d'abord examinés. Puis, les caractéristiques des
modalités visuelles et tactiles sont comparées dans le but de mieux comprendre
le développement de la fonction représentative, la conceptualisation de
l'aveugle et son retard dans l'acquisition des connaissances.
I - LES PRINCIPAUX FACTEURS DE LA VARIABILITE INTER INDIVIDUELLE
Les organes des sens sont des "fenêtres ouvertes sur le monde extérieur". La
perception du monde environnant se construit à partir du traitement et de
l'intégration des données, tactiles, auditives, olfactives, gustatives,
kinesthésiques, ... Ces données ne peuvent pas être classées sur le même plan
informatif dans leur contribution au développement cognitif et à l'acquisition
des connaissances du jeune enfant. En 1966, dans "Privation
Sensorielle et Intelligence", Yvette Hatwell souligne l'impor tance de la
perception visuelle sur le développement cognitif de l'enfant et démontre que la
perte de la vision précoce engendre un retard du développement des processus
cognitifs plus important que la perte de la vision tardive.
a - L'âge de la cécité:
Dans les études relatives à l'influence de la cécité sur l'évolution des
processus cognitifs et l'acquisition des connaissances, la plupart des auteurs
insistent sur la nécessité de distinguer les aveugles-nés et les aveugles
tardifs. Les aveugles-nés ou aveugles congénitaux présentent une perte de vision
totale ou un reste de vision non utile (légère perception lumineuse) depuis la
naissance ou ont été atteint de cécité dans les quelques mois qui ont suivi la
naissance. Les aveugles tardifs sont ceux dont la déficience est acquise après
une période de plusieurs années de vision normale. Lorsque la cécité apparaît
après 4 ou 5 ans, peu de différences sont observées entre aveugles et voyants.
Les aveugles tardifs se situent à mi-chemin entre les aveugles nés et les
voyants: ils procèdent "systématiquement à une traduction de leurs
représentations tactiles en représenta tions visuelles imagées" (Hatwell 1966.
Il sera donc nécessaire de s'assurer que les sujets aveugles n'ont pas eu
d'expériences visuelles depuis la naissance, avant d'effectuer toute
investigation dans le domaine de la "représentation" de l'enfant aveugle.
b - L'histoire de la cécité:
D'autres facteurs liés à la cécité doivent être considérés ou contrôlés dans
l'analyse des performances des sujets, sous peine d'introduction de biais
expérimentaux.
En effet, d'autres handicaps physiques et neuro-moteurs peuvent s'associer à
la déficience visuelle et retentir ainsi plus ou moins sur le développement des
capacités de l'enfant.
Dans ce cas, la déficience visuelle n'est pas seule respon sable du retard
observé.
De plus l'histoire de la cécité, même si elle n'est pas associée à d'autres
déficiences sensorielles, physiques ou mentales peut, à elle seule, être la
cause de différences inter-individuelles.
Des hospitalisations plus ou moins fréquentes et plus ou moins nombreuses
peuvent perturber la petite enfance et la scolarité de l'enfant.
c - L'environnement familial et social:
Un autre problème à considérer est celui de l'interaction du sujet aveugle
avec son milieu environnant.
Il importe de souligner les difficultés de communication que rencontrent les
enfants aveugles. Ce problème de communication est une source d'extrême
variabilité dans les performances des sujets aveugles.
Les parents comprennent plus ou moins bien les réactions de leur enfant
handicapé; ils ont des difficultés à comprendre les indices que l'enfant
utilise pour exprimer ses besoins. En général ces enfants sont sous-évalués et
les parents apprécient mal la nature des progrès de leur enfant (Burlingham
1979). Les réactions des parents ou de l'entourage accentuent plus ou moins les
problèmes du petit aveugle, c'est-à-dire la diminution de ses possibi lités de
déplacement, la diminution de son autonomie, la limitation des contacts avec les
objets et les personnes et la création éventuelle de perturbations affectives.
La perte de la vision nécessite, dès le plus jeune âge, une compensation par
de nombreuses stimulations supplémentaires et cet apport est très variable selon
l'intervention des parents et de l'entourage. Il importe donc de considérer
l'environnement de l'enfant déficient. Il convient aussi de distinguer les
aveugles qui vivent en institution des aveugles qui vivent parmi les voyants.
Les aveugles qui "vivent" parmi les voyants ont tendance à utiliser le
répertoire linguistique des personnes voyantes, à s'approprier leurs "référents
visuels" et à imiter leurs expressions descriptives. Les aveugles en
institution, essentiellement entourés d'autres déficients visuels, ont un
langage plus spécifique, particulièrement influencé par la perception haptique
(tactilo-kinesthésique). Les sujets aveugles ont tendance à représenter la
signification de certains items en utilisant des attributs provenant d'autres
modalités sensorielles que la modalité visuelle ou en utili sant la
signification d'items associés. Ils peuvent ainsi dire "chaleur" pour soleil.
d - La nature de la déficience visuelle:
Nous citerons une définition de la cécité employée avec bon sens par les
enfants des instituts spécialisés pour se situer par rapport à leur camarade:
"est aveugle celui qui doit appprendre le braille et se servir d'une canne pour
ses déplacements".
Selon la définition légale de la déficience visuelle, l'éducation
d'un enfant nécessite une prise en charge en institution spécialisée, si
l'acuité visuelle de l'enfant pour le meilleur œil corrigé ne dépasse
pas 20/200 ou si le diamètre du champ visuel ne soutient pas un angle de
plus de 20 degrés (Willis 1979). Cette définition est retrouvée dans de
nombreux pays à peu de variantes près. Les américains distinguent neuf
catégories de déficience visuelle:
-
catégorie 1: 20/200 à18/200;
-
catégorie 2: 17/200 à13/200;
-
catégorie 3: 12/200 à8/200;
-
catégorie 4: 7/200 à3/200;
-
catégorie 5: 2,5/200 à 1/200;
-
catégorie 6: compte les doigts;
-
catégorie 7: mouvements de la main, formes des objets;
-
catégorie 8: perception de la lumière et des ombres - catégorie 9:
cécité totale.
Pour l'O M S (Organisation Mondiale pour la Santé):
-
Catégorie 1: acuité visuelle entre 3/10 et 1/10
-
Catégorie 2: acuité visuelle entre 1/10 et 1/20
-
Catégorie 3: acuité visuelle entre 1/20 et 1/50
-
Catégorie 4: acuité visuelle entre 1/50 et perceptions lumineuses
-
Catégorie 5: pas de perception lumineuse
Outre la notion d'acuité visuelle, il faut considérer la notion de champ
visuel: si l'amplitude du champ visuel est compris entre 5 et 10 degré, le
sujet appartient à la catégorie 3 et si le champ visuel est inférieur à 5 degré,
il appartient à la catégorie 4.
Les trois premières catégories classent les sujets appartenant à l'une
d'entre elles parmi les amblyopes, les deux autres les classent parmi les
aveugles.
Mais, si cette classification définit un taux de vision,l'utilisation
fonctionnelle de ce taux de vision est très variable d'une personne à l'autre.
Elle dépend en effet de l'apprentissage perceptif de l'enfant. Quel que soit le
degré d'atteinte visuelle, une éducation bien appropriée peut amener l'enfant à
utiliser au mieux ces capacités perceptives. Cette rééducation visuelle devrait
être mise en œuvre dès le diagnostic de déficience et surtout dès que possible
chez le jeune enfant. La perception visuelle normale est le résultat d'une
longue période d'apprentissage (Hebb 1958 cité par Reuchlin 1977), apprentissage
dans laquelle l'activité du sujet et ses déplacements joueraient un rôle
essentiel. Pour Reuchlin, l'apprentissage de la perception ne se ramènerait pas
à une association répétée, mais serait plutôt une perception des "invariants",
c'est-à-dire "des aspects du tableau perceptif dont les variations sont
entièrement prévisibles à partir des informations dont dispose l'organisme sur
ses propres déplacements... Ces détecteurs d'invariants pourraient être
alimentés par des informations visuelles aussi bien que par des informations
tactiles. ou auditives". Ces détecteurs de caractéristiques seraient présents
dès la naissance mais ne deviendraient fonctionnel que grâce à l'activité du
sujet.
Ainsi, sur le plan fonctionnel et en conséquence sur le plan expérimental, la
manière dont est utilisée "un reste" de vision peut être une source de
variabilité importante. C'est pourquoi une étude expérimentale avec des sujets
déficients visuels doit être entreprise avec beaucoup de précaution. Il est très
difficile de constituer des groupes de sujets. Une passation individuelle
s'impose dans la plupart des cas.
L'étendue de la classification des déficiences visuelles est le
résultat d'étiologies très variées: fibroplasie rétro-lentale, glaucome chronique,
décollement de rétine, tumeurs de la rétine...
Ces différentes pathologies aboutissent à des perceptions visuelles de
qualités très diverses, que ne révèle pas la mesure de l'acuité.
e - Les facteurs non spécifiques:
Si des techniques efficaces et des méthodes d'apprentissage peuvent
contribuer grandement à une bonne intégration du jeune aveugle dans le
milieu scolaire, universitaire et dans le monde professionnel, il
importe de ne pas minimiser et de favoriser les facteurs qui influencent
la réussite professionnelle et l'adaptation de tous, voyants et non
voyants. Parmi ces facteurs non spécifiques, citons les principaux:
-
les capacités intellectuelles,
-
l'aptitude à la relation et à la communication avec les autres,
-
la motivation personnelle,
-
les capacités et la volonté d'autonomie,
-
les capacités d'adaptation.
Tous ces facteurs spécifiques ou non spécifiques aux non voyants, peuvent
interagir entre eux et contribuer à accentuer les différences
inter-individuelles.
II - INFLUENCE DE L'ORGANISATION DU CHAMP PERCEPTIF DE L'AVEUGLE SUR L'ACCES
À L'INFORMATION ET L'ACQUISITION DES CONNAISSANCES
A - Caractéristiques du champ perceptif de l'aveugle
La vision joue un rôle considérable dans la prise d'information sur le monde
environnant. L'œil est un télérécepteur: il "capte" les informations à
distance. C'est le plus complexe des organes sensoriels et celui qui apporte la
plus grande quantité d'information à un moment donné.
Le champ perceptif visuel est très étendu. Il permet une perception
simultanée des objets. L'œil est l'organe des sens qui possède le plus grand
nombre de récepteurs au millimètre carré, soit par exemple 165000 récepteurs au
millimètre carré pour la région fovéale. L'organisation de ces récepteurs au
centre de la rétine permet une discrimination très fine et une appréciation
simultanée des multiples détails d'un objet. De par sa simultanéité, l'approche
visuelle facilite l'anticipation, la préparation à l'action et assure ainsi la
rapidité et la précision du mouvement.
Contrairement au champ visuel, le champ perceptif tactile est réduit. La
perception tactile s'élabore à partir d'informations successives et fragmentées.
Le nombre de récepteurs au millimètre carré de la pulpe du doigt est de 370.
Pour explorer l'espace avec les mains, l'aveugle utilise des stratégies de
palpation, mais la perception tactile qui en découle est une réorganisation des
sensations fragmentées dans l'espace et successives dans le temps. Aussi, il est
nécessaire, pour l'aveugle, d'adapter et d'affiner ce système perceptif et
d'améliorer ses stratégies de palpation.
Si la vision donne une perception globale d'un objet, la perception
tactilo-kinesthésique ne permet pas toujours d'aboutir à une perception globale,
même après avoir rassemblé toutes les sensations tactiles. Il en est ainsi pour
les objets très volumineux ou hors de portée, pour les paysages...
Gibson (1962, cité par Bailes 1986) fait remarquer que la perception visuelle
est aussi un processus séquentiel qui aboutit à la construction de la "gestalt"
à partir d'une série de fixations oculaires. Pour Gibson, les deux perceptions,
visuelle et tactilo-kinesthésique, sont des constructions dont la différence
majeure se situe sur le plan temporel. En effet cette "construction" est
beaucoup plus rapide pour la vision, si bien que le processus d'assemblage
semble être simultané, alors qu'il est par opposition séquentiel et très ralenti
dans la perception haptique (tactilo-kinesthésique). Aussi cette forme de
perception nécessite-t-elle un effort de traitement plus élaboré et plus soutenu
et est-elle moins efficace dans le traitement de l'information spatiale et dans
les tâches impliquant une reconnaissance de configuration.
Par rapport aux stimulations visuelles, les stimulations auditives et
kinesthésiques sont en général instables. Les sons rarement continus et les
sensations cutanées et proprioceptives cessent dès que le contact physique prend
fin (Markovitz 1982,p. 435). De plus, la perception de la conti nuité du
mouvement est plus facile en modalité visuelle qu'au moyen des autres sens. La
vision facilite aussi la mise en relation des actions.
B - Retentissement de la déficience visuelle sur l'accès à l'information
1 - Les informations visuelles inaccessibles:
Pour un nouveau-né aveugle, la plus grande partie du monde qui l'entoure est
inaccessible. Seules les stimulations auditives (voix et bruit), les
stimulations tactiles immédiatement proches, les stimulations olfactives et
gustatives pourront être expérimentées. Le jeune enfant voyant peut observer une
mouche, un oiseau qui vole, le feu qui crépite dans la cheminée, le ciel, la
lune, les paysages, les maisons... L'enfant aveugle ne pourra, ni voir, ni
toucher tout cela. Pour le non voyant, les très grand objets, les objets
dangereux, les objets en mouvement, les scènes, les paysages et les dessins sont
inaccessibles. Ce défaut d'accès à l'information visuelle peut aboutir à des
déficits plus ou moins graves dans la fonction de représentation et à un retard
du développement cognitif de l'enfant (Hatwell 1966).
2 - Difficultés dans la communication:
Le petit aveugle ignore tout des expressions faciales, des mimiques, des
attitudes, des gestes des gens qui l'entourent. Il ne pourra pas se référer à ce
genre d'indices pour imiter les grands ou modifier sa conduite. Il ne pourra
savoir si son comportement est accueilli par un sourire ou un froncement de
sourcils. Seuls, une parole apaisante, , un soupir, un grognement, une
intonation plus marquée, une main qui le repousse ou l'attire pourront orienter
son comportement.
Pour l'adolescent et l'adulte aveugle, l'inaccessibilité de la gestualité des
autres, aboutit assez souvent à des malentendus et parfois à des difficultés
dans la communication. Ces problèmes sont accentués quand le non voyant est
confronté à un groupe de personnes. Si les jeunes aveugles ne sont pas préparés
à de telles situations, s'ils ne savent pas comment ils "fonctionnent " et
comment "fonctionnent" les autres, ils peuvent être confrontés à de réels
problèmes de communication qui pourraient secondairement retentir sur leur
personnalité.
3 - Les informations spatiales et environnementales
Avant la marche, l'espace du jeune enfant aveugle se réduit à ce qu'il peut
atteindre avec les mains, les pieds la tête et à ce qu'il peut entendre. Quand
il commence à se déplacer, ses relations avec l'espace environnant dépendent du
comportement de son entourage. Des parents inquiets, ne sachant que faire ou
craignant un accident, maintiennent l'enfant aveugle attaché sur un siège ou
couché dans son lit jusqu'à un âge avancé. Ce maintien de l'enfant dans un
environnement spatial déjà trop limité, ne peut avoir que des conséquences
fâcheuses sur son développement psychomoteur, sa musculature et plus tard sur
ses capacités de déplacement autonome. La locomotion de l'enfant aveugle
(possibilité de se déplacer de façon autonome) nécessite la plupart du temps un
apprentissage.
À défaut d'informations visuelles, l'aveugle doit s'appuyer sur des indices
sonores, tactiles, musculaires, proprioceptifs, parfois olfactifs pour pouvoir
se déplacer librement. Ces déplacements nécessitent le plus souvent beaucoup
d'attention et de concentration et font appel aux capacités mnésiques du sujet
et à sa "conscience" de l'espace (Hatwell 1986). Des chercheurs se sont
intéressés plus particulièrement à ces problèmes et ont expérimenté des
techniques nouvelles (Sampaïo ).
C - Retentissement de la déficience visuelle sur l'acquisition des
connaissances et le développement cognitif
1 - La représentation
Les images mentales, le langage, sont des formes de représentation
construites à partir des informations , des événements et des
expériences que le sujet tire du monde environnant. Les différentes
modalités sensorielles sont engagées dans la formation et la production
des concepts. Que se passe-t-il lorsque la modalité visuelle est
déficiente, voire absente?
L'analyse différentielle des caractéristiques des perceptions visuelle et
tactile permet de comprendre l'avantage des aveugles tardifs sur les
aveugles-nés dans la reconnaissance des formes. Cette reconnaissance est
facilitée par une expérience visuelle précoce et contribue à améliorer les
capacités d'organisation spatiale (Hatwell 1966, Bailes 1986, Hatwell 1986).Pour
Bailes (1986), les aveugles tardifs ont acquis la capacité d'encoder les
informations successives obtenues de façon tactilo- kinesthésique, sous forme de
"représentation visuelle globale" tandis que les aveugles congénitaux
utiliseraient un système de codage basé sur le traitement "d'inputs successifs".
En 1966, Hatwell, dans "Privation sensorielle et Intelligence", souligne
l'influence d'une modalité sensorielle aussi primordiale que la vision sur le
développement cognitif de l'enfant. Pour cet auteur,la composante figurative de
ce développement est surtout perturbée, du fait essentiellement de la déficience
perceptive qui retentit secondairement sur les activités locomotrices et sur les
expériences de l'enfant.
Plusieurs études ont mis en évidence un retard dans le développement cognitif
de l'enfant aveugle, en particulier dans les stades de développement définis par
Piaget: dans la conservation, sériation, classification (Hatwell 1966, Miller
1969, Friedman et Pasnak 1973), dans la sériation et la classification de
certains concepts (Swallow et Poulsen 1972), dans la conservation (Gottesman
1971, 1973, 1976) et dans la résolution de problèmes spatiaux topologiques,
projectifs et euclidiens (Tobin 1973).
Dans ces différentes études, les auteurs concluent que le développement
cognitif de l'enfant aveugle est plus lent que celui de l'enfant voyant. Ce
retard semble être attribué essentiellement au déficit, tant quantitatif que
qualitatif, des informations qui peuvent être appréhendées par l'enfant aveugle.
Toutefois, les auteurs s'accordent à reconnaître que les enfants aveugles ne
sont pas handicapés dans leurs capacités de raisonnement. En particulier, pour
Higgins (1973), le retard de développement de l'enfant aveugle n'est pas lié à
des déficiences dans les structures intellectuelles, mais est dû à un déficit
perceptif.
Le déficit visuel impose à l'enfant une interaction directe avec l'objet, une
prise d'information séquentielle, des stratégies de palpation et une
reconstruction plus élaborée et plus complexe de l'information perçue. En effet
la comparaison entre la perception tactile et la perception visuelle explique la
lenteur dans la prise d'information du sujet aveugle.
Les enfants aveugles nés présentent un développement cognitif comportant les
mêmes stades que les enfants voyants, mais ce développement est plus lent
(Gottesman 1973, 1976, Stephens et Simpkins 1974). Le défaut d'apprentissage
incident, l'expérimentation limitée, l'exploration active limitée, expliquent ce
retard du jeune enfant aveugle qui s'exprime davantage sur un plan figuratif que
sur un plan opératif. Privés d'une grande partie de l'information utili sable
par les voyants, les jeunes enfants aveugles possèdent "des concepts fragmentés
d'informations déficitaires" et font une utilisation limitée des informations
différentielles (Kephart et Schwartz 1974).
L'échelle de Kephart est une mesure de "la prise de conscience conceptuelle"
liée aux concepts qui se rapportent à l'image corporelle de soi-même et de
l'environnement. Cette échelle permet d'établir l'ordre de l'information que
l'enfant a accumulée par ses propres moyens sur son environnement physique: son corps,la rue, le quartier, la ville.
Avant de pouvoir verbaliser l'information, les enfants voyants ont déjà
établi des concepts, (le toit, les murs, le plancher...), parce qu'ils ont
exploré eux-mêmes, le pré-verbal chez les enfants voyants est "perdu" pour
l'enfant aveugle (Kephart et Schwartz 1974). Ces deux auteurs ont appliqué
l'échelle de Kephart à 49 aveugles et 47 voyants de 5 à 7 ans. Ils ont effectué
une étude différentielle de l'ordre d'acquisition des concepts familiers chez
l'enfant voyant et aveugle. Les différents concepts et attributs étudiés sont
ceux du corps,de la maison, du jardin, de la rue, de la ville.
Cette expérience souligne tout particulièrement la lenteur de l'acquisition
chez l'enfant aveugle. La façon dont l'enfant aveugle traite les informations
par rapport à son propre corps et à son environnement semble résulter d'une
compréhension fragmentée et déformée des concepts de base. Les expériences
effectuées à travers les modalités sensorielles autres que la vision ne peuvent
remplacer celles effectuées à l'aide de la modalité visuelle.
Dès les premières années, l'enfant aveugle reçoit les informations à partir
du cadre de référence construit par les personnes voyantes qui l'entourent.
L'enfant aveugle manque d'expériences qui lui sont propres. Pour Kephart, il est
nécessaire de placer l'enfant déficient visuel face à une très grande variété
d'expériences, pour qu'il puisse "s'équiper d'un cadre de référence qui lui soit
propre". L'expérience étayée de toutes les modalités sensorielles est nécessaire
à une bonne conceptualisation. Aussi il est important que l'enfant ait des
explications pour tout ce qu'il entend et pour tout ce qu'il sent tactilement
(Kehpart et Schwartz 1974).
D'autres auteurs insistent sur l'importance de l'expérience de
l'apprentissage dans l'évolution du développement cognitif du jeune enfant
aveugle. Pour Simpkins (1979), les enfants aveugles pourraient apprendre à
utiliser des stratégies d'exploration dans le but de "se construire une image
mentale" et donner ainsi plus de poids et plus de richesse aux concepts qu'ils
acquièrent et en particulier aux concepts spatiaux.
"L'espace mental est une construction édifiée par une activité individuelle
ou fondée par la construction et la coordination des actions qui conduisent à
objectiver l'espace". L'élaboration de la représentation spatiale dépend plus
des processus cognitifs que des processus perceptifs (Piaget et Inhelder 1965,
Hatwell 1966, Simpkins 1978).
Simpkins (1978) note aussi l'importance de la manipulation et des stratégies
de palpation chez l'enfant aveugle. Dans son étude, l'auteur remarque que les
enfants de 6-7 ans sont plus exacts pour les reconnaissances de formes que les
enfants de 4-5 ans. Les enfants plus âgés palpent l'objet avec la main entière,
avec tous les doigts de la main, isolant des traits particuliers de la forme
tout en les comparant avec d'autres traits. Cette exploration globale et
simultanée est un aspect particulier de "la manipulation active" qui conduit à
un jugement plus exact et plus précis de la forme. Ces activités d'exploration
peuvent être modifiées par l'expérience et l'apprentissage. Pour Simpkins
l'apprentissage est nécessaire pour pouvoir explorer les formes et les arêtes de
façon efficace et l'auteur se demande comment "sentir" et évaluer la surface
entière dans le but de se construire une image mentale. Il importe de ne pas
négliger l'apprentissage et les exercices précoces de manipulation, des
techniques d'exploration pour isoler des composantes d'une forme, discriminer
des différences et des ressemblances, et définir ainsi une signification pour
effectuer une reconstruction mentale du stimulus.
S'appuyant sur la conception de Piaget de l'organisation spatiale, les
conclusions de Simpkins dérivent des résultats de deux expériences dans
lesquelles l'auteur tente d'identifier certains concepts spatiaux utilisés dans
la reconnaissance tactile de forme et dans lesquelles l'auteur compare les
relations topologiques utilisées par les enfants voyants et les enfants
aveugles. Les formes utilisées sont celles de Laurendeau et Pinard (1970).
La représentation spatiale chez l'enfant aveugle a été également étudiée par
Millar (1976):72 enfants aveugles et voyants aux yeux bandés sont testés entre
l'âge de 6 et 11 ans dans des tâches de rotations mentales de lignes dans
différentes directions. Dans la reconnaissance tactile, le score est similaire
pour les enfants aveugles et voyants, mais dans la tâche de rappel, les
résultats mettent en évidence une supériorité des enfants voyants. De plus, tous
les enfants aveugles qui avaient eu une expérience visuelle avant 6 ans sont
supérieurs aux aveugles-nés. Le problème étudié consiste à déterminer comment
les enfants aveugles se représentent l'information tactilo-kinesthésique en
mémoire.
La représentation spatiale a essentiellement un caractère visuel. Toutefois,
en accord avec Piaget, Millar parle de "perception spatiale" plutôt que d'image
mentale parce que la représentation spatiale ne dériverait pas uniquement
d'images visuelles.
Dans une tâche de rotation mentale, le temps de réaction des aveugles croît
en fonction de l'augmentation du déplacement angulaire comme celui des voyants
Toutefois, selon ses résultats, Millar (1976) conclut que:
-
l'expérience haptique (tactilo-kinesthésique) apporte moins
d'informations sur les directions complexes
-
la mémoire du mouvement (rotation) est organisée de façon séquentielle
-
la mémoire de la perception haptique de l'espace est moins bonne que la
mémoire visuelle qui peut être organisée plus facilement de façon spatiale.
En conclusion la comparaison entre la perception visuelle et la perception
haptique (tactilo-kinesthésique) permet de comprendre le retard du développement
cognitif des enfants aveugles. Ce retard n'est pas permanent et les déficiences
observées sont plus nettes sur le plan figuratif que sur le plan opératif des
capacités cognitives. Ce qui explique leur retentissement sur la représentation
et la conceptualisation de l'enfant aveugle.
2 - La conceptualisation de l'enfant aveugle:
Pour mieux comprendre la représentation et la conceptualisation de l'enfant
aveugle des auteurs ont essaye d'évaluer sa capacité à générer une image
mentale. Ils ont tenté de comprendre comment l'enfant aveugle construit cette
image mentale et ont fait une analyse des concepts que l'enfant aveugle associe
aux objets (Richaume 1988).
La formation de concepts et la catégorisation sont fondés essentiellement sur
la perception et l'expérience. La cécité prive l'enfant aveugle-né d'une très
grande quantité d'informations, limite sa motricité, ses déplacements et
l'interaction avec l'environnement et les objets qui l'entourent. Cette
limitation s'étend aussi dans la communication avec les personnes. Dès les
premiers mois de la vie, le bébé, né aveugle, ne peut voir les expressions du
visage de sa mère, ses mouvements, ses gestes, ses allées et venues. L'enfant se
trouve ainsi face à des problèmes de communication et à des difficultés pour
construire des références extérieures (Rowland 1984, Rogow 1980).
Burlingham (1979) a procédé à de nombreuses observations de jeunes enfants
aveugles d'âge pré-scolaire, dans le but d'apporter des éléments de réponses à
trois questions principales:
-
l'absence de vision influence-t-elle le développement des autres
sens?
-
Comment l'aveugle construit-il une image du monde et celle ci
diverge-t-elle de celle des voyants?
-
Comment l'aveugle agit-il pour s'adapter à l'environnement du
voyant?
Burlingham note une déficience dans la prise d'information des jeunes enfants
aveugles par rapport aux enfants voyants. Elle constate que les enfants aveugles
essaient de compenser cette déficience par une utilisation accrue du toucher (à
l'aide des mains et des doigts, des pieds et surtout de la bouche) et par une
utilisation accrue de l'ouïe. Elle remarque aussi que l'enfant aveugle emploie
les mêmes mots que les voyants, mais la représentation des choses peut avoir une
signification tout à fait différente pour l'enfant aveugle.Ainsi le mot
"regarder" est employé au lieu de "toucher", "voir" au lieu de "entendre". Des
comparaisons inattendues pour les voyants et assez originales sont utilisées:
elles se rapportent souvent à l'expérience sensorielle propre de l'enfant
aveugle. En effet, l'utilisation des impressions engendrées par les stimulations
externes et élaborées à partir des sens, donne des significations sensiblement
différentes aux choses et aux événements chez l'aveugle si on les compare à
celles des voyants.
Des auteurs ont étudié de façon comparative les capacités perceptives
tactiles et auditives des aveugles et des voyants. Dans deux expériences de Cobb
(1979) des aveugles et voyants adultes sont mis en présence de 150 objets
courants et écoutent 194 sons naturels. Les résultats montrent que les aveugles
et les voyants ont une même capacité à distinguer et à reconnaître des objets
communs et des sons naturels.
Dans une étude comparative de temps de réaction auditifs simples de sujets
âgés de 11 à 15 ans, Bernard (1979) n'observe pas de différence significative
entre les sujets aveugles et voyants.
Toutefois Lucas (1984) observe que les enfants aveugles discriminent mieux
que les enfants voyants le son et la parole.
Les observations et les expériences montrent en général que les jeunes
enfants aveugles ont les mêmes capacités "d'écouter" et de "sentir" que les
enfants voyants, mais qu'ils essaient d'utiliser avec une plus grande efficacité
ces deux perceptions tactiles et auditives afin de compenser le défaut de
perception visuelle.
Un facteur non négligeable dans la formation d'image mentale est la capacité
de création. Johnson (1979) a étudié la pensée créative et l'originalité verbale
chez 95 adolescents voyants et 95 aveugles. Il a fait entendre des sons et a
demandé d'imaginer les images correspondantes, de même pour des onomatopées. Les
adolescents aveugles présentent des scores significativement plus élevés que les
adolescents voyants sur les deux tests d'originalité verbale: son-image et
onomatopée-image. De plus, l'auteur note un effet de l'intelligence: les
adolescents aveugles ou voyants d'intelligence moyenne ou élevée produisent plus
de réponses verbales originales que les adolescents d'intelligence faible pour
les deux tests. Ce résultat est en accord avec la conclusion de Halpin et al
(1973), selon laquelle les enfants aveugles sont des "penseurs plus créatifs"
que les enfants voyants.
Il est à noter que la capacité verbale des adolescents aveugles mentionnée
ici, n'est pas le "verbalisme" parfois décrit chez l'aveugle. Le verbalisme est
une dissociation entre les mots, le vocabulaire utilisé et l'expérience
sensorielle (De Mott 1972).
Les multiples travaux de Kennedy (1983, 1982, 1986) et les études citées
auparavant mettent en évidence la capacité de l'aveugle à générer une image
mentale. Kennedy (1982, 1983), tout comme Millar (1983) rapportent que les
aveugles sont capables de comprendre les graphiques en relief des objets. Des
aveugles qui n'avaient pas souvenir d'avoir vu des dessins ou des images et à
qui on n'avait jamais expliqué ce qu'était un dessin, reconnaissaient des
graphiques en relief et dès les premiers essais, ils effectuaient des dessins en
relief.
Il est donc très probable que l'aveugle ait acquis la notion d'imagerie.
Mais, comme le pense Cornoldi et al. (1979), la conceptualisation de l'aveugle
présenterait des composantes imagées particulières, propre à ses mécanismes de
perception.
D - Nature de l'image mentale chez l'aveugle
Dans le but d'étendre la connaissance de l'imagerie et des processus
mnésiques des aveugles congénitaux, Cornoldi (1979) place en situation
d'apprentissage incident deux groupes de jeunes adultes (aveugles
congénitaux et voyants). Les sujets doivent donner une valeur d'imagerie
à trois séries de mots. Ils sont ensuite soumis à une tâche inattendue
de rappel libre. Les mots évalués et rappelés appartiennent à trois
catégories:
-
les items à haute "capacité d'imagerie" dont les référents peuvent être
directement sentis et évalués par l'aveugle (exemple: balle, pierre);
-
les items à haute "capacité" d'imagerie (ou pouvoir évocateur d'images,
traduit de imageability), dont les référents ne sont pas directement
accessibles aux aveugles (exemple: tigre, tour);
-
les items à faible capacité d'imagerie ou à faible pouvoir
évocateur d'images;
Les sujet voyants ont donné un taux d'évaluation élevé à la fois aux mots
dont les référents sont directement accessibles et à ceux dont les référents ne
le sont pas;alors que chez les sujets aveugles, la note d'évaluation est
particulièrement basse pour les mots non directement accessibles.
Ainsi, les sujets aveugles congénitaux sont capables de faire "l'évaluation
iconique" d'un mot et de différencier cette valeur d'imagerie selon des critères
déterminés.
Toutefois, les mots qui se réfèrent à des objets concrets, mais non
directement accessibles, de façon sensorielle, à l'aveugle ont reçu des notes
très basses, alors que les sujets voyants leur ont donné des notes élevées.
Les mots à faible capacité d'imagerie, ont obtenu des notes élevées de la
part des aveugles par rapport aux mots à référents inaccessibles à l'aveugle, et
par rapport aux notes données par les voyants.
Les mots à référents inaccessibles représentent des objets avec lesquels
l'aveugle n'a pu avoir une expérience sensorielle.
En situation de rappel incident, la meilleure performance des aveugles est
obtenue pour les mots dont les référents sont inaccessibles. En rappel
intentionnel, la meilleure performance des aveugles est obtenue pour les mots à
faible capacité d'imagerie. Le rappel des sujets aveugles ne correspond ni aux
normes en valeur d'imagerie obtenues avec des sujets voyants, ni aux notes en
imagerie données par les sujets aveugles.
Bien que les sujets aveugles soient capables de différencier la valeur en
imagerie des mots, ils n'utilisent pas cette valeur d'imagerie dans les tâches
de rappel.
Pour Cornoldi, la capacité d'imagerie d'un mot semble plutôt décrire, comme
Paivio le suppose, la susceptibilité qu'a un item d'être codé de façon
spécifique (visuo-imagée). Ce type de codage est peut être plus disponible pour
le voyant que pour l'aveugle.
La perception peut être considérée comme un système à double encodage dans la
mémoire de travail comprenant une composante de stockage mnésique iconique
initiale, qui est soit haptique, soit visuelle, et une deuxième composante qui
est un stockage mnésique de nature acoustique ou articulatoire (Bailes 1986).
Pour Bailes, les aveugles traitent les images spatiales de la même façon que les
voyants, mais plus lentement. L'application d'un code verbal est un événement
plus tardif dans la séquence du traitement. Pour les sujets aveugles,
l'intégration de tous les segments d'un objet n'est pas terminée avant
l'intégration du segment suivant. Dans l'expérience de Bailes (1986), les sujets
aveugles n'appliquent pas d'étiquettes verbales à des stimulus non familiers
comme le font les sujets voyants. Pour Bailes, la perception visuelle
permettrait de donner plus facilement une étiquette représentative à une
information spatiale abstraite.
Pour essayer de comprendre la nature de l'image mentale de l'aveugle, Hans
(1974) a répliqué l'expérience de Paivio et Occovita (1971). L'auteur présente
aux sujets 12 paires de noms communs. Chaque paire est composée d'un nom
stimulus et d'un nom réponse. Ces 12 paires sont divisées en 4 groupes: 3
paires comportent des noms de haute valeur d'imagerie visuelle pour les termes
stimulus et réponse; 3 paires des noms de haute valeur d'imagerie auditive pour
les deux termes; 3 paires avec des noms à haute valeur d'imagerie visuelle pour
le terme stimulus et haute valeur d'imagerie auditive pour le terme réponse et
inversement pour les trois dernières paires.
Les résultats de l'expérience de Hans suggèrent que les sujets aveugles
n'utilisent pas une image auditive pour faciliter le rappel, mais ils traitent
moins bien les mots avec des référents auditifs que les mots avec des référents
visuels. Etant donné que la confirmation de l'hypothèse d'une "cheville
conceptuelle" dépend de l'utilisation d'une imagerie de modalité spécifique ,
cette hypothèse n'est pas validée dans cette expérience. Il semble que les
aveugles n'utilisent pas une imagerie de modalité spécifique dans
l'apprentissage de paires de mots associés.
Toutefois Jonidès et al. (1975) ont montré qu'une "instruction d'imagerie"
améliore non seulement la mémoire des sujets voyants, mais aussi la mémoire des
sujets aveugles congénitaux. Ainsi l'effet de l'image mentale sur la mémoire ne
peut pas être expliqué uniquement par un mécanisme dépendant de la vision.
L'effet de l'instruction d'imagerie pourrait former un lien sémantique entre
les deux mots. Ce qui produirait une meilleure rétention mnésique. Pour Jonidès
et al., l'effet d'imagerie n'est pas essentiellement visuel.
Les aveugles congénitaux possèdent des connaissances sur le monde environnant: ils possèdent en particulier des connaissances sur "le monde visuel" qui
dérive de leur prospection et de leur expérience tactilo-kinesthésique (Kennedy
1980). Toutefois certaines propriétés des objets ne sont pas "tangibles" pour
l'aveugle: la couleur,la taille par exemple,et parfois les objets ne sont pas
accessibles de façon tactile: un paysage, une vue d'ensemble, un
toit...L'aveugle apprend l'existence des objets et phénomènes non tangibles à
partir des descriptions verbales de son entourage, des lectures en braille, de
l'écoute d'émissions radiophoniques...
Si les voyants peuvent utiliser une image visuelle pour se représenter les
objets tangibles et non tangibles,
Page 35 l'aveugle doit se référer à une autre modalité d'imagerie ou utiliser
une représentation sémantique (Zimler 1983). Zimler propose plusieurs
expériences dans le but d'évaluer la limitation dans la représentation sur
l'information du "monde visuel" chez l'aveugle congénital. Pour apprécier
l'évolution des connaissances de l'aveugle, l'auteur teste des enfants aveugles
et voyants, puis des adultes aveugles et voyants.
Les deux premières expériences examinent les hypothèses de Paivio sur "la
modalité spécifique" de l'imagerie. L'expérience 1 utilise une tâche de rappel
de paires associées dont les référents des mots ont une valeur d'imagerie
visuelle et auditive élevée. Les aveugles, tout comme les voyants rappellent
plus de paires présentant une haute valeur d'imagerie visuelle.
L'expérience 2 utilise une tâche de trois rappels pour des mots dont
les attributs sont en rapport avec une modalité spécifique:
-
un groupe "rouge" (sang, cerise)
-
un groupe bruit intense (sirène, tonnerre);
-
un groupe "rond" (bouton, balle).
Les résultats montrent que les adultes rappellent plus de mots que les
enfants. Les aveugles rappellent plus de mots "bruits forts" que les voyants,
mais il n'est pas observé de différence significative pour le rappel des mots
"rond" et "rouge" entre les voyants et les aveugles.
Les auteurs ont demandé aux sujets "l'étiquetage des catégories". Ils notent
une différence significative entre aveugles et voyants dans la capacité
d'étiqueter la catégorie "rouge": 17 pour cent des enfants aveugles ont reconnu
la catégorie "rouge" pour 56 pour cent des enfants voyants. En comparaison cette
catégorie a été identifiée par 72 pour cent des adultes aveugles et 89 pour cent
des adultes voyants.
Selon les résultats de cette expérience, les aveugles ne présentent pas de
déficit dans le rappel de mots organisés suivant des attributs visuels.
Nous reprendrons au dernier paragraphe la discussion sur la classification et
l'étiquetage des mots.
Pour Paivio (1971), les voyants utilisent une imagerie visuelle pour
faciliter la rétention mnésique plutôt que la représentation sémantique
abstraite. Les données des expériences de Zimler ne confortent pas cette
conception et Zimler (1983) conclut suivant cette alternative:
-
ou bien que l'imagerie visuelle n'est pas plus facilitatrice de
la rétention mnésique que la représentation sémantique abstraite;
-
ou bien que les voyants n'utilisent pas l'imagerie visuelle.
L'auteur note que le seul déficit observé dans les deux expériences se situe
chez les voyants dans le rappel des mots dont le référent est lié à la modalité
auditive. Ce résultat étant confirmé par d'autres auteurs, Zimler suppose que
l'expérience visuelle du voyant le rend moins sensible aux stimulus auditifs et
que le voyant a moins de connaissance ou moins "d'images" sur les stimulus
auditifs que les aveugles.
L'expérience 3 de Zimler reprend la tâche de Neisser et Kerr (1973),
dans laquelle il est demandé aux sujets de former des images de trois
types différents d'après une description verbale des objets qui les
composent:
-
une image comportant une relation d'interaction "visible" (un
oiseau assis sur la torche de la statue de la Liberté);
-
une image comportant une relation d'interaction "invisible"
(l'oiseau est à "l'intérieur" de la torche de la statue de la
Liberté);
-
une image ne présentant pas de relation entre les objets (la statue de
la Liberté et plus loin, dans le ciel, l'oiseau).
Une tâche de rappel incident suit la tâche d'imagination.
Il n'y a aucune différence entre aveugles et voyants en ce qui concerne les
temps de production d'images. Pour les voyants et les aveugles, quand une image
est construite pour cacher ou dissimuler un objet, cet objet est moins
accessible en mémoire que lorsque cette image est "visible". Ainsi les aveugles
peuvent comprendre et se représenter la distinction entre les objets "visibles"
et "invisibles". Zimler propose que les aveugles utilisent des images
tactilo-kinesthésiques et que ces images préservent la distinction entre les
objets cachés et non cachés de la même façon que les images visuelles supposées
être utilisées par les voyants. Ce point de vue est en accord avec celui de
Kennedy (1980).
Les études de Kennedy sur la production graphique des aveugles congénitaux
mettent en évidence leur capacité à se représenter une perspective. Kennedy
affirme que les aveugles ont la même forme de perception que les voyants pour
appréhender tous les traits d'un dessin. De plus, la perspective doit être un
facteur important de la perception tactilo-kinesthésique. L'auteur remarque en
effet que les sujets aveugles commentent souvent la localisation à partir de
laquelle l'objet est décrit et lorsqu'il dessine un objet ils donnent d'abord
l'angle à partir duquel l'objet est "vu". Enfin les aveugles sont capable
d'apprécier la notion de profondeur et d'occlusion.
En conclusion, un grand nombre d'expériences soulignent que les aveugles
congénitaux ont une aussi bonne performance que les voyants pour les tâches qui
impliquent des informations sur des phénomènes visuels et la formation d'images
sur des configurations spatiales. Il semblerait que l'image mentale de l'aveugle
congénital soit essentiellement de nature haptique (tactilo-kinesthésique).
L'expérience de Hollins (1985) essaie de déterminer la nature de l'image mentale
de l'aveugle selon l'âge de la cécité (congénitale ou acquise). Deux tests
d'imagerie sont présentés à 6 adultes aveugles et 4 voyants. Pour l'un d'entre
eux les sujets doivent imaginer un damier sur lequel certains carrés spécifiés
par l'expérimentateur, sont occupés. Selon la position des cases "occupées", le
sujet peut identifier mentalement un dessin. Ce test vise à évaluer le "style
visuel" de l'imagerie. Dans l'autre test, les sujets doivent imaginer un
assemblage de cubes en trois dimensions pour évaluer le "style haptique" de
l'imagerie.Dans les deux tests, la tâche consiste à nommer l'objet qui ressemble
au "pattern" imaginé.
Selon les données, chez les sujets aveugles, le taux d'imagerie graphique
varie en fonction de "l'histoire visuelle" des sujets. Plus la durée de la
cécité est longue, plus le score est faible. La performance dépend aussi de
l'âge à laquelle La cécité s'est installée. Ainsi, l'image mentale de l'aveugle
est influencée par la nature de son expérience perceptive. Il semblerait que les
caractéristiques de la représentation mentale fondées sur l'expérience visuelle
et celles fondées sur l'expérience haptique diffèrent.
Il convient cependant, de signaler l'étude de Johnson (1980) sur 91 aveugles
et 91 voyants âgés de 10 à 21 ans. Leurs réponses à une forme du questionnaire
de Bates sur les images mentales classées en 7 catégories sensorielles
(visuelle, auditive,tactile, kinesthésique, gustative, olfactive,symbolique et
organique) lui ont permis de conclure que les adolescents aveugles ne sont pas
déficients dans la formation d'images mentales. Mais quand un adolescent aveugle
dit je "vois", il caractérise peut-être une sensation qui lui est propre plutôt
qu'une image visuelle.
E - Nature de la catégorisation et des attributs chez l'enfant aveugle
Les aveugles doivent acquérir leurs connaissances à partir de nombreuses
informations qui ne sont pas toujours "tangibles" pour eux. Ils sont forcés de
se référer à ce qui leur est décrit verbalement par leur entourage. Ils peuvent
donc présenter un retard dans l'acquisition de ces connais sances par rapport
aux voyants. Toutefois comme l'a montré Zimler (voir précédemment) l'évolution
des capacités d'exploration tactile du jeune enfant, des capacités de loco
motion et l'apprentissage atténuent ce retard et à l'âge adulte le groupe de mot
"rouge" par exemple est catégorisé par un grand nombre d'adultes aveugles.
En raison d'une perception limitée et d'une expérience particulière,
les enfants aveugles sont-ils déficients dans leurs modes de
conceptualisation?
La mesure de la conscience conceptuelle personnelle et de l'environnement
appliquée à 49 aveugles et 47 voyants de 5 à 7 ans par l'échelle de Kephart
(Kephart et Schwartz 1974) a montré que les enfants aveugles présentent des
concepts fragmentés de l'information déficitaire et une utilisation limitée de
cette information restreinte.
À travers une analyse statistique et qualitative du nombre et du type des
attributs que les enfants associent aux objets, des auteurs ont pu comparer les
différences entre la conceptualisation des enfants aveugles fondée
essentiellement sur le sens tactile et la conceptualisation des enfants voyants
fondée sur le sens visuel (Anderson 1984).
Dans l'expérience d'Anderson (1984), 10 enfants aveugles congénitaux et 10
enfants voyants (âgés de 3 à 9 ans) doivent décrire d'abord de mémoire, puis
après exploration tactile, des objets communs sélectionnés pour cette tâche.
Est-ce que le langage de l'enfant aveugle reflète le développement
des connaissances qu'il a du monde environnant ou la connaissance qu'il
a du langage de son entourage?
Le but de l'étude d'Anderson est de déterminer l'effet de l'absence de la
vision sur la formation des concepts relatifs aux objets chez les enfants
aveugles et de révéler les attributs utilisés par ces enfants pour décrire ces
objets.
Les attributs donnés par les enfants sont répertoriés en trois
catégories:
-
égocentrique: pour les réponses liées à une expérience
personnelle de l'enfant;
-
fonctionnelle: pour les réponses donnant la fonction de l'objet
ou son but et les actions qui peuvent être effectuées avec cet
objet;
-
perceptive: pour les réponses qui incluent les références de couleur,
forme, taille, nombre et caractéristiques physiques de l'objet.
Les résultats, qu'il est prudent de ne pas généraliser trop rapidement du
fait du petit nombre de sujets testés, mettent l'accent sur les expériences
propres aux sujets. Les expériences des enfants aveugles sont particulières.
Chez l'enfant aveugle, les informations provenant de l'environnement leur sont
données par le toucher et l'audition. Ce qui est révélé par la nature des
attributs proposés par les enfants aveugles.
Les données suggèrent que les enfants aveugles construisent leurs images
mentales et forment leurs concepts à partir de leur propre expérience avec le
monde. Le langage qu'ils utilisent reflète cette expérience et leur propres
représentations mentales plutôt que leur connaissance du langage des voyants.
L'auteur propose d'encourager l'exploration tactile de l'enfant aveugle et de
lui apprendre toutes les utilisations possibles des objets pour multiplier les
informations nouvelles et favoriser sa conceptualisation.
Pour approfondir la compréhension du langage et du développement cognitif des
aveugles congénitaux, Anderson et Fischer (1986) effectuent une expérience en
reprenant la conception de Piaget sur le "réalisme nominal". Ce qui est réel
pour les jeunes enfants doit exister dans les mots: les mots ne sont pas
considérés par les jeunes enfants comme ayant une origine sociale arbitraire et
conventionnelle: le réalisme nominal est la confusion entre le mot et la chose
qu'il désigne. Pour le jeune enfant, le nom est "dans" l'objet et non comme une
étiquette attachée à cet objet.
Pour tester le réalisme nominal et l'animisme chez des enfants aveugles et
voyants, les auteurs posent une série de questions sur l'origine des noms et la
modification possible de ces noms.
L'analyse des résultats met en évidence un développement cognitif normal chez
les enfants voyants (au sens de la théorie piagétienne), mais souligne le retard
du développe ment cognitif des enfants aveugles. Le réalisme nominal
caractéristique de la pensée pré-opératoire est mis en évidence à un âge plus
tardif chez l'enfant aveugle que chez l'enfant voyant.
F - Conclusion
En conclusion, le défaut d'expérience visuelle de l'enfant aveugle entraîne
un retard dans son développement cognitif. Cependant ce retard n'est pas
permanent parce qu'il est lié essentiellement à la lenteur de l'acquisition des
connaissances. Les études (peu nombreuses) sur la conceptualisation et le
langage chez l'enfant aveugle-né montrent que les images mentales et les
concepts des enfants aveugles sont construits à partir d'une expérience qui leur
est propre et à partir d'une information tactile complétée par les informations
provenant des autres modalités sensorielles qui se sont développées par
compensation.
Du fait d'une perception limitée et d'une expérience particulière, les
attributs des concepts donnés par les enfants aveugles, sont plus concrets que
les attributs donnés par les voyants. De plus les attributs des enfants aveugles
se rapportent davantage à des sensations tactiles et auditives. Toutefois la
présence d'attributs "visuels" et les capacités des aveugles à comprendre les
dessins et la perspective nous amènent à penser que leurs représentations
imagées sont assez proches de celles des voyants.
Sur un plan théorique, il serait utile de poursuivre les recherches sur la
conceptualisation de l'enfant aveugle pour mieux comprendre le retentissement de
la représentation sur la généralisation des concepts, la catégorisation et la
formation de prototypes.
Sur un plan pratique, il serait souhaitable d'examiner les caractéristiques
de la perception tactile et de la perception auditive, dans le but d'utiliser au
maximum ces deux modes sensoriels et de fournir à l'aveugle davantage
d'informations par l'intermédiaire de ces deux voies perceptives.
Ainsi, des expériences comme celle de Berla (1972, 1985) permettraient de
définir les caractéristiques les mieux appropriées d'un schéma ou d'un dessin en
relief pour qu'il soit le plus facilement et le plus rapidement "compris" par
l'aveugle.
En ce qui concerne l'accès à l'information, nous nous proposons de poursuivre
notre étude dans le domaine de l'audition et de l'écoute, afin de savoir s'il
est possible d'acquérir une plus grande quantité d'informations en un temps
donné, tout en maintenant une grande efficacité dans la compréhension.
III - LES PROBLÈMES ASSOCIÉS À La CÉCITÉ
A - Problèmes associés à la motricité de l'aveugle
1 - Mimiques et gestualité:
Parce qu'il souffre des yeux ou pour provoquer des réactions lumineuses
(phosphènes), le bébé aveugle se frotte souvent les yeux et enfonce
épisodiquement les doigts dans les orbites. Ces gestes épisodiques au début
peuvent ensuite se transformer en grimaces et en "tic".
Pour le jeune non voyant, le champ des stimulations externes est
considérablement réduit, les stimulations tactiles étant limitées au berceau ou
à ce qui lui est directement accessible tant qu'il ne marche pas. D'autre part
les stimulations auditives sont peu intéressantes tant qu'une relation entre le
son entendu et sa cause ne peut être établie. D'une part, l'enfant, "frustré"
par ce manque de stimulation, se balance, se cogne et effectue des explorations
tactiles désordonnées. D'autre part l'enfant aveugle n'a pas de "modèle gestuel": il ne peut imiter les mimiques, les attitudes et les gestes de ses parents, de
ses frères et sœurs. Il peut alors s'installer peu à peu une gestualité
particulière. Pour qualifier cette gestualité spécifique à certains aveugles,
les anglo-saxons ont introduit le terme de "blindisme". La prudence s'impose
dans
l'utilisation de ce terme qui trop souvent se généralise à toutes les
attitudes de protection qu'utilisent les non voyants pour éviter les obstacles
(bras en avant, tête en arrière, pieds écartés) ou aux mouvements visant à
dépenser l'énergie que la sédentarité laisse inemployée.
Regard figé, mobilité inexistante ou anormale des yeux rendent le visage de
l'aveugle moins expressif. Ce défaut d'expression peut être accentué chez
l'aveugle de naissance par suite de la pauvreté des mimiques et de l'inexistence
quasi totale du sourire.
2 - Posture et locomotion
La station debout et la marche sont acquises entre 10 et 18 mois chez le
petit voyant et favorisent à la fois son développement musculaire,son sens de
l'espace et la confrontation à des expériences nouvelles. L'acquisition de la
marche est plus tardive chez l'enfant né aveugle qui n'a pas été soumis à des
stimulations suffisantes. Le bébé aveugle adopte de préférence la position
couchée sur le dos qui lui permet un champ d'exploration tactile plus vaste. En
outre, n'étant pas attiré par les stimulations visuelles,il ne bouge ni ne
relève la tête comme le bébé voyant. Par contre le bébé aveugle est plus
attentif au bruit: il dirige l'oreille vers la source sonore et s'immobilise
pour mieux écouter. Ces différentes postures provoquent une hypotonie axiale et
secondairement une hypotonie musculaire générale (Martinez 1984). Pour qu'il
s'effectue dans les meilleures conditions, le développement psychomoteur du
jeune enfant aveugle a besoin d'apports provenant de son entourage. Très tôt, il
aura besoin d'être guidé et éduqué pour l'acquisition du sens de l'orientation,
pour l'acquisition de la notion d'espace, pour favoriser son développement
musculaire et une bonne gestualité. Ainsi, il pourra plus rapidement se déplacer
de façon autonome, sans craindre les chocs et les chutes.
B - Les problèmes de développement du langage
Une grande partie de ce qu'un aveugle peut apprendre sur le monde
environnant, est fournie par la voix humaine: celle de l'entourage, de la
télévision, de la radio, des disques, des enregistrements sur cassettes...Le
langage est un mode d'acquisition des connaissances primordial pour une personne
privée de la vue puisqu'il supplée aux informations visuelles inexistantes.
Outre un moyen de communication irremplaçable, le langage est un moyen
d'apprentissage inestimable pour le non voyant. Nous pensons que le langage doit
jouer un rôle primordial dans le développement des enfants atteints de cécité.
Pourtant le développement des fonctions langagières de l'enfant aveugle risquent
d'être perturbé par le défaut de stimulation visuelle. "Les problèmes associés à
la compréhension des termes ayant des référents visuels diminuent dans la mesure
où une expérience antérieure peut suppléer à une déficience visuelle acquise"
(Markovits 1982 in Troubles du langage. Diagnostic et Rééducation). Un jeune
enfant atteint de cécité à 5 ans aura bénéficié d'une expérience visuelle non
négligeable pour l'acquisition du langage par rapport à un enfant aveugle de
naissance.
Nous avons montré précédemment que la sous stimulation visuelle des enfants
aveugles de naissance provoque un retard de leur développement cognitif. Selon
Gesell, la vision mène le développement pendant le premier mois et fournit à
l'enfant la plupart des indices nécessaires à "la conquête de son environnement
physique". Outre l'apport informatif de la vision sur tous les objets de son
environnement, elle facilite aussi la mise en relation des actions de l'enfant
avec le milieu extérieur et donc retentit sur le développement sensori-moteur.
Chez des enfants aveugles de naissance, il a été noté un retard dans le
développement des fonctions langagières: période prolongée de vocalisations
imitatives , difficultés pour atteindre le stade de babillage. Ces enfants se
contentent de répéter des sons. Une sous stimulation associée à une carence
affective peut conduire à des problèmes linguistiques sérieux. Il semblerait que
le développement linguistique d'un enfant aveugle soit plus sensible aux
conditions affectives et environnementales que celui des enfants voyants.
En ce qui concerne le développement lexical, le rythme d'acquisition des
premiers mots chez les enfants aveugles semble nettement ralenti par rapport à
celui des enfants voyants. Mais là aussi, le retard n'est pas permanent; il est
ensuite compensé. L'enfant aveugle a des difficultés à associer des mots à ses
expériences sensorielles de type tactile ou auditif. Les parents ou l'entourage
s'appuient essentiellement sur des qualificatifs visuels et utilisent un langage
souvent incompréhensible pour le petit déficient visuel. Ces jeunes enfants
concentrent surtout leur attention sur les aspects des choses qui leur sont
directement perceptibles et fonctionnels. Ce qui explique leur difficulté à
acquérir un vocabulaire de base, puisque le langage nécessaire à la description
des perceptions d'un aveugle est peu fréquent dans les discours des personnes de
son entourage !
En ce qui concerne "l'imitation vocale", étudiée par Fraiberg (1977), elle
serait un des seuls moyens de communication entre l'enfant aveugle et ses
parents qui ne soit pas touché par la déficience visuelle. L'imitation ayant
avant tout un but de communication sociale, elle peut engendrer le "verbalisme": l'enfant peut avoir un vocabulaire mais l'employer à mauvais escient parce
qu'il n'en possède pas toute la signification.
Ainsi les enfants aveugles semblent rencontrer plus de difficultés que les
enfants voyants dans la production des premiers mots et des premières phrases.
Ce retard serait ensuite rattrapé. L'acquisition de la marche et de la
Page 47 locomotion étant plus lente chez les enfants aveugles que chez les
enfants voyants, ils ont moins d'expérience et de contacts avec les objets. Un
bon nombre d'auteurs ayant étudié les problèmes linguistiques chez l'enfant
aveugle, (dont Fraiberg 1977) attribuent les difficultés linguistiques des
enfants aveugles à ce défaut d'expériences associé aux carences visuelles. La
vision faciliterait la tâche de dénomination des objets ainsi que les premières
combinaisons de mots dans les phrases en fournissant à l'enfant un cadre de
référence plus stable que celui fourni par les autres sens. La notion de
"permanence de l'objet" qui est installée vers 2 ans pour le voyant n'est
acquise qu'entre 3 et 5 ans chez l'enfant aveugle.
En ce qui concerne le développement phonologique, les résultats des
recherches sont contradictoires. L'interprétation des résultats attestant des
difficultés d'articulation et de production de langage chez les enfants aveugles
est rendue difficile par l'existence de facteurs souvent associés à la cécité
(atteintes neuro-motrices et sensorielles autres que la vision).
En ce qui concerne l'organisation sémantique, la déficience visuelle limite
la quantité d'informations disponibles sur le milieu environnant et dans la
mesure où cette information est indispensable pour la compréhension de mots ou
d'expression linguistique, la compréhension du langage peut être retardée chez
l'aveugle (problèmes par rapport aux référents inaccessibles paysages, couleur).
.Les jeunes aveugles utilisent le plus souvent un vocabulaire "visuel" au lieu
de se servir des mots qui ont des référents plus directement compréhensibles
pour eux. Aussi le discours est peut être acceptable sur le plan formel, mais
trop éloigné des expériences propres des personnes aveugles (verbalisme). La
tendance à s'exprimer en termes visuels pourrait avoir des conséquences néfastes
sur l'organisation intellectuelle des personnes aveugles, qui s'appuieraient sur
des référents incompréhensibles pour eux.Ce qui conduirait ainsi à une pensée
moins bien structurée. Toutefois pour certains auteurs le langage visuel
pourrait être utile même si sa signification ne correspond pas nécessairement et
directement à celle des sujets voyants. Les données issues des études sur le
"verbalisme" montrent que l'utilisation d'un langage qui n'a pas de support
visuel mène à la constitution d'un réseau linguistique similaire à celui observé
chez les voyants. L'utilisation d'un langage visuel pourrait aider à
l'acquisition d'une capacité de compréhension symbolique qui dépasse la simple
imitation sociale.
En conclusion sur le problème du langage chez l'aveugle, l'enfant aveugle de
naissance a plus de difficultés à acquérir le langage. Cette acquisition est
plus lente. Toutefois, l'organisation de la fonction langagière installée, elle
permet l'accès à des connaissances aussi complètes que possible. Au niveau de
l'articulation et de la syntaxe, le développement du langage chez l'aveugle
semble évoluer plus ou moins normalement quand les conditions physiques et
affectives sont optimales. Le jeune enfant aveugle est plus sensible à des
perturbations du milieu que l'enfant voyant. Une fois le langage acquis,
l'interaction entre la compréhension du monde extérieur directement accessible à
l'enfant aveugle et son utilisation du langage est d'une importance capitale
pour faciliter la connaissance de l'un et améliorer l'organisation de l'autre.
En effet au début , les contacts limités avec le monde extérieur peuvent poser
des problèmes en ce qui concerne l'acquisition du langage et ce d'autant plus
que le langage utilisé par les personnes de son entourage fait référence à des
expériences visuelles, mais une fois l'acquisition du langage bien établie,
celle ci peut aider à la compréhension au moins partielle des relations
existantes dans le monde non perceptible aux personnes aveugles.
L'enfant aveugle utilise le "je" non syncrétique au sens de Zazo, beaucoup
plus tard que l'enfant voyant. (Zazo distingue le "je" syncrétique qui se
rapporte aux désirs ou aux besoins de l'enfant: "je veux", et le "je" non
syncrétique qui désigne la personne qui parle et implique l'utilisation du "tu"
ou du "il"). Les enfants aveugles auraient des difficultés à se dissocier des
autres personnes et même des objets. La vision facilite les capacités de
représentation de soi par rapport aux autres. Cette difficulté à se dissocier
des autres peut entraîner pour l'enfant aveugle des malentendus et des problèmes
de communication.
C - Les problèmes associés à la communication
Deux points sont à considérer dans les problèmes de communication de
l'aveugle:
-
le langage de l'aveugle s'appuie sur une expérience qui lui est
propre et surtout sur des perceptions tactiles et auditives;
-
l'aveugle ne peut accéder aux mimiques faciales, à la gestualité et aux
attitudes de ses interlocuteurs.
Le "verbalisme", c'est-à-dire la dissociation entre le vocabulaire utilisé et
l'expérience sensorielle, peut parfois engendrer des malentendus dans la
communication avec les voyants. Dès la naissance, le bébé aveugle est isolé des
personnes qui l'entoure, les échanges par le regard étant impossibles. Les
parents, non informés sur les problèmes liés à la cécité, peuvent agir avec
maladresse: pour la mère il est parfois difficile de comprendre son bébé
aveugle, ses besoins et plus tard son langage. La plupart du temps l'enfant
aveugle est forcé de s'initier lui-même pour essayer de comprendre le monde
extérieur. Pour cela l'enfant aveugle utilise avant tout le toucher et
l'audition, mais l'écoute nécessite une certaine concentration et surtout une
certaine immobilité: le premier malentendu s'installe alors. La mère peut
associer cette immobilité à "une certaine incapacité mentale", à une
"anormalité". Plus tard, le jeune enfant aura conscience de sa cécité et de ses
problèmes par rapport aux voyants. Mais ce qui est assez contradictoire, c'est
que l'enfant a à la fois besoin d'indépendance et en même temps il a besoin de
l'aide des voyants. Aussi, son besoin d'autonomie et d'indépendance conduit
l'enfant et plus tard l'adulte à utiliser le voyant comme "un outil". Les
enfants aveugles considèrent les voyants comme des prolongements d'eux-mêmes et
les utilisent comme des outils pour arriver au but qu'ils se proposent. Ils les
utilisent comme des "outils" temporairement placés sous leur commande: ce que
les adultes voyants ressentent parfois assez mal parce qu'ils ne comprennent pas
que c'est pour l'aveugle le seul moyen d'entrer dans une relation vraie
(Burlingham 1979).
Le jeune enfant aveugle a des difficultés à converser avec plus d'une
personne à la fois. L'enfant ne peut pas diviser son attention entre deux
personnes: il ne peut pas en même temps réfléchir, converser et percevoir une
tierce personne. C'est là un problème de charge mentale.
Dans une conversation, , "la sémantique du discours verbal dépend beaucoup de
la mimique faciale et de la gestualité du locuteur". Des gestes illustratifs
sont souvent indispensables à la compréhension du discours: "asseyez-vous là,
posez vos affaires ici". Dans ces cas l'énoncé verbal prévoit dans sa structure
la présence d'un énoncé gestuel complémentaire sans lequel bien que
grammaticalement correct, il resterait sémantiquement incomplet". Les gestes et
les mimiques faciales interviennent également dans les processus connotatifs.
Les mimiques complètent l'énoncé verbal ou donnent des informations
supplémentaires. Dans une conversation, les échanges entre deux personnes sont
réglés et nuancés par ces mimiques: sourire, hochement de tête, froncement de
sourcils, regard moqueur ou agressif...Les gestes ont également un rôle dans la
prise de paroles, le changement de tour, d'autant plus que les personnes qui
composent un groupe sont nombreuses. L'aveugle perd toutes ces informations
gestuelles et il est forcé de réclamer des informations complémentaires ou des
précisions sur les intentions des locuteurs.
D - La personnalité de l'aveugle
Nous ne pouvons ici résumer la psychologie de l'aveugle. C'est un
domaine très complexe et d'autant plus que cette population est
extrêmement hétérogène. Aussi, nous citerons simplement quelques
observations relatant des pathologies pouvant être liées à la cécité.
Nous signalons que des à priori et des idées erronées ont été propagées
par méconnaissance de ce qu'est réellement la cécité. Nous pensons que
c'est un sujet qu'il faut traiter avec prudence et qu'il importe de ne
pas généraliser des observations à partir d'un cas de cécité. Si le
point commun est la perte de la vision, chaque cas de cécité est
pratiquement un cas unique de par son histoire et son évolution. ainsi,
il faut déjà distinguer:
-
ceux qui ne voient rien du tout et n'ont jamais rien vu;
-
ceux qui ont toujours eu des perceptions lumineuses faibles;
-
ceux qui recouvrent une parcelle de vision après une
intervention chirurgicale;
-
ceux qui après avoir eu une vision normale, sont devenus
aveugles;
-
ceux qui, après avoir été amblyopes, deviennent aveugles.
Dans ces dernières catégories, l'âge auquel survient la cécité nécessiterait
encore plusieurs subdivisions.
Revenons aux observations: un certains nombre d'auteurs ont noté que l'état
de sous-stimulation dans lequel peut évoluer l'enfant né aveugle peut avoir des
effets sévères. Fraiberg (1977) a remarqué des symptômes autistiques chez les
enfants handicapés de la vue: "ce qui pourrait être dû à une histoire de
stimulations affectives inadéquates durant les premiers mois de la vie". Le
comportement de certains enfants aveugles a été modifié par un programme
d'éducation favorisant l'enrichissement et l'élargissement des interactions
parents-enfants.
En ce qui concerne l'adolescent et l'adulte aveugle, il est évident que l'on
peut rencontrer plus fréquemment chez eux des distorsions de la personnalité, ne
serait-ce que parce que la société est composée essentiellement de voyants et
"organisée par ces derniers et pour ces derniers". Un jeune aveugle inadapté a
deux solutions: ou il fait des efforts pour s'intégrer ou il se replie sur
lui-même. Dans ce dernier cas, on peut rencontrer des aveugles égocentriques,
introvertis, exposés aux rêveries éveillées, aux verbalismes, aux blindismes,
... qui ne sont rien d'autres que des réactions d'ajustement à un milieu
défavorable !
IV - CONCLUSION ET RESUME DU CHAPITRE 1 La LENTEUR DANS L'ACCES à
L'INFORMATION CHEZ L'AVEUGLE
À partir des observations recueillies dans de multiples écoles spécialisées,
nous avons essayé de comprendre pourquoi les différences entre les sujets
aveugles sont plus frappantes que les différences inter-individuelles des sujets
voyants.
Si le point commun à tous les aveugles est la perte de toutes les
informations visuelles, il existe une grande variabilité entre les
sujets dans leurs possibilités d'adaptation et de réadaptation. En
effet, les facultés d'apprentissage et d'adaptation de l'aveugle
dépendent des mêmes facteurs que chez les voyants mais dépendent avant
tout des facteurs liés à la déficience:
-
l'âge de la cécité
-
l'histoire de la cécité
-
l'environnement familial et social
-
la nature de la déficience visuelle
Ce qui explique les difficultés de toute expérimentation associée à un groupe
de sujets aveugles.
Dans un second point, à travers les études relatées dans un certain nombre
d'articles, nous avons essayé d'évaluer l'influence de l'organisation du champ
perceptif de l'aveugle sur ses fonctions de représentation et de comprendre le
retentissement de la cécité sur son développement cognitif.
Tandis que la perception visuelle présente des caractéristiques de
simultanéité, de globalité et donc de rapidité, la perception tactile s'effectue
à partir de l'intégration de multiples sensations fragmentées dans le temps et
dispersée dans l'espace.
Toutes les activités symboliques d'un sujet et par conséquent toutes les
formes de représentation sont construites, tout comme le langage, à partir des
informations, des événements, des expériences que le sujet tire du monde
environnant et participent à la formation des concepts.
Les différentes modalités sensorielles sont donc engagées dans la
formation et la production du langage et dans le développement cognitif
de tout individu. Que se passe-t-il lorsque la modalité visuelle est
déficiente ou même absente?
-
L'absence de la vision influence-t-elle le développement des
autres sens?
-
Comment l'enfant aveugle se construit-il une image du monde?
-
Cette image diverge-t-elle de celle des voyants?
-
Quelle est la représentation mentale que les enfants aveugles
congénitaux peuvent avoir des objets?
À travers une analyse statistique et qualitative du nombre et du type des
attributs que les enfants associent aux objets, des auteurs ont pu comparer les
différences entre la conceptualisation des enfants aveugles fondée
essentiellement sur le sens tactile et la conceptualisation des enfants voyants
fondée sur le sens visuel.
Les expériences de certains auteurs montrent que les images mentales et les
concepts des objets des enfants aveugles sont construits à partir d'une
expérience qui leur est propre et à partir d'une information tactile complétée
par les informations provenant des autres modalités sensorielles qui se sont
développées.
Du fait d'une perception limitée et d'une expérience particulière, les
attributs des concepts donnés par les enfants aveugles, sont plus concrets que
les attributs donnés par les voyants. Ce qui pourrait retentir sur la
généralisation de ces concepts et sur la catégorisation et la formation de
prototypes.
Toutefois la plupart des auteurs s'accordent sur plusieurs points qui
nous semble essentiels:
-
le retard observé dans le développement cognitif de l'enfant
déficient visuel est en général temporaire;
-
la stimulation des autres sens doit être aussi variée et aussi riche que
possible pour alimenter la capacité de raisonnement de l'aveugle qui est
restée intacte.
-
l'information parlée est une source primordiale de prise de connaissance
pour le jeune enfant aveugle et nous ajoutons qu'elle reste la principale
pour l'aveugle accidentel qui connaît mal le braille et n'est pas bien
adapté aux explorations tactiles.
Dans une troisième partie, nous avons présenté sur un plan plus concret les
problèmes associés à la cécité, afin de montrer combien une éducation précoce
est essentielle pour le déficient visuel et combien un programme d'adaptation et
de réadaptation fondé sur toute les potentialités restantes de l'aveugle est
indispensable à son intégration sociale et professionnelle.
L'ÉCOUTE ET LE TRAITEMENT DE L'INFORMATION PARLÉE
L'œil, l'oreille, la peau, le nez et la langue sont des organes sensoriels
qui apportent au cerveau les informations sur le monde environnant. Ces
informations sont détectées, triées, classées, organisées et intégrées parmi les
premières acquisitions. Les fonctions perceptives et l'expérience alimentent
ainsi le champ des connaissances et contribuent au développement cognitif d'un
individu.
Nous avons vu dans un premier chapitre que la privation de la perception
visuelle ralentit considérablement la prise d'informations et aboutit chez le
jeune enfant à un retard du développement cognitif, chez l'adulte, à des
problèmes de locomotion, de communication et d'intégration sociale. Toutefois,
chez l'enfant le retard n'est pas permanent et chez l'adulte, les difficultés
dépendent beaucoup des capacités d'adaptation ou de réadaptation du sujet.
Un programme d'éducation ou de rééducation prévoyant des stimulations riches,
variées, adéquates, bien distribuées dès le plus jeune âge, accélèrent le
développement cognitif du jeune enfant aveugle et favorise l'adaptation de
l'adulte. Un des buts primordiaux de ce programme sera de favoriser la relation
entre perception auditive et perception tactile pour viser à une parfaite
coordination oreille-main. L'éducation de l'écoute et du toucher prend une part
privilégiée dans ce programme.
L'oreille est l'organe sensoriel le plus complexe après l'œil. Elle permet de
détecter, de discriminer des variations de signal sonore très faibles. L'oreille
exercée d'un musicien est capable d'apprécier les nuances les plus fines.
Nous pensons que l'écoute occupe la part la plus importante du temps
d'apprentissage des enfants scolarisés qu'ils soient aveugles ou
voyants. D'autre part, C'est le seul mode d'accès à l'information pour
l'aveugle accidentel qui ne connaît pas la lecture braille. C'est
pourquoi nous nous proposons d'étudier tout particulièrement l'écoute et
l'accès à l'information parlée dans ce chapitre. Notre ambition est de
pouvoir fournir des modes d'apprentissage et des outils de travail
efficaces à tous les aveugles. Cette recherche a un double objectif:
-
d'une part sur un plan théorique, essayer de comprendre et de
définir les différents niveaux d'analyse dans le traitement de la
parole;
-
d'autre part sur un plan pratique, étudier un mode d'apprentissage,
l'écoute, et des applications directes , la prise de notes aidée par
l'enregistrement, "l'écoute rapide" et la parole comprimée et enfin la
sortie vocale dans les nouvelles technologies.
I - QUELQUES RAPPELS SUR LA PERCEPTION AUDITIVE
A - Le son
Le son est le stimulus qui active le système auditif. C'est une onde
mécanique de pression qui se propage dans le milieu environnant. La
représentation des variations de pression sonore en fonction du temps fournit
une description complète du son (Buser et al 1988). Dans cette description, deux
types de son peuvent être distingués: les sons purs et les sons complexes.
En ce qui concerne les sons purs, la description de l'onde vibratoire
est strictement sinusoïdale et peut être définie par différents
paramètres:
-
la phase,
-
la fréquence,
-
l'amplitude.
La phase correspond au temps de départ de l'onde.
La fréquence est le nombre d'oscillations recueillies en une seconde. Elle
est définie en cycles par seconde ou en Hertz (Hz) ou en période par seconde. La
période T est l'inverse de la fréquence F (F=1/T). Par rapport aux mécanismes de
perception, la fréquence correspond a la hauteur du son: un son aigu a une
fréquence élevée, un son grave a une fréquence basse.
L'amplitude de la sinusoïde est liée à l'intensité du son. Lorsque
l'intensité du son est exprimée par rapport à la pression sonore, l'unité
utilisée est le Dyn par centimètre carré. Elle peut aussi être exprimée en Watts
par centimètre carré. Mais le plus souvent l'intensité du son est associé au
mécanisme perceptif, c'est-à-dire à la sensation à laquelle est associée la
hauteur et l'intensité du son. Cette sensation progresse proportionnellement au
logarithme de l'excitation et est exprimée en unité relative: le décibel (dB).
Le décibel correspond au logarithme du rapport de deux intensités:
nombre de dB=10Log(I/Ir),
Ir est l'intensité de référence standard internationale (0,0002 Dyn/cm2). Ce
standard correspond à une pression sonore très faible. Il correspond à une
intensité sonore minimale perçue par l'être humain pour un son de 1000 Hz.. Par
exemple, une différence de 20 dB dans les intensités de deux sons, signifie
qu'un son est de 10 puissance 2 000 000 fois plus intense que l'autre. Les sons
harmoniques sont ceux qui, compris dans la zone audible se disposent dans la
progression F, 2F, 3F, 4F, 5F, 6F, 8F, 9F, 10F, 11F. L'intensité d'un son est
plus faible dans l'eau que dans l'air.
Les sons complexes peuvent être décomposables grâce à l'analyse de Fourier:
une longueur d'onde complexe peut être représentée par une combinaison d'ondes
sinusoïdales, de fréquence, d'intensité et de temps de départ spécifique. La
décomposition d'une forme ondulatoire en fréquences et composantes simples est
l'analyse de Fourier. La représentation des ondes complexes par leurs
composantes sinusoïdales semble s'approcher le plus de la façon qu'à l'oreille
de traiter le son (Lindsay et Norman 1981). Le timbre d'un signal sonore est la
qualité spécifique individuelle du son complexe donné par les différents
composants.
B - La transmission du son
Les récepteurs de l'oreille qui détectent les sons sont des phonorécepteurs
qui ont la capacité de transformer les ondes sonores qui les excitent en un flux
nerveux. Le son peut être transmis par deux voies: la conduction osseuse grâce
à laquelle chacun entend sa propre voix et la voie aérienne grâce à laquelle
nous entendons les autres. Au cours de la transmission, le son passe dans l'air,
traverse successivement les trois parties de l'oreille: externe, moyenne et
interne.
1 - L'oreille externe et l'oreille moyenne:
Les sons sont captés grâce au pavillon de l'oreille qui est destiné à
concentrer l'onde sonore dans le canal auditif ou conduit auditif. Ce conduit a
la particularité de transformer les ondes sonores "sphériques" (qui se
dispersent dans toutes les directions) en ondes planes. L'onde se propage dans
une seule direction le long du canal auditif. Celui-ci a une résonance proche de
3000 Hz. Un corps entre en "résonance" lorsque sa fréquence de vibration
optimale correspond à la fréquence de l'onde qui le fait vibrer: il y a alors
parfaite concordance entre l'onde mécanique qui arrive et les capacités de
vibration de ce corps. Les sons qui ont une fréquence de 3000 Hz sont les mieux
adaptés à l'oreille humaine.
L'onde sonore aboutit a une membrane: la membrane tympanique. Le tympan
oscille et les fréquences de résonance du tympan pour lesquelles il oscille le
mieux sont située entre 1000 et 4000 Hz.
2 - De l'oreille moyenne à l'oreille interne
La transmission des sons est réalisée dans l'oreille interne en milieu
aqueux. L'onde sonore passe d'un milieu aérien à un milieu aqueux. La
propagation des sons est différente selon que les ondes chemine dans l'un ou
l'autre milieu. En effet la résistance de l'air n'est pas la même que celle de
l'eau. Ainsi l'énergie sonore véhiculée dans l'air n'est pas transmise en
totalité dans l'oreille interne.
L'oreille moyenne comprend la chaîne des osselets: le marteau, l'enclume et
l'étrier qui relie le tympan à la fenêtre ovale. L'oreille interne comprend la
cochlée et également le sacule, l'utricule et les canaux semi-circulaires qui
interviennent dans l'équilibration. Pour que la transmission se passe dans les
meilleures conditions, c'est-à-dire pour que le maximum de puissance sonore soit
transmise à la cochlée, deux types d'adaptation sont possibles. Premièrement la
chaîne d'osselets entre le tympan et la fenêtre ovale agit comme un levier:
elle diminue l'amplitude des mouvements pour ne pas léser les membranes fragiles
et augmente la pression sonore. La deuxième adaptation est le rapport entre la
surface du tympan et la surface de la fenêtre ovale. Le tympan a une surface de
55 millimètres carré et la surface de la fenêtre ovale sur laquelle s'appuie
l'étrier ne mesure que 2 à 3 millimètres carré. Ainsi, toute la pression qui
s'exerce sur 55 mm2 se concentre ensuite sur 3 mm2: c'est un système
d'amplification. Une adaptation protège aussi le tympan. L'étrier s'appuie sur
la fenêtre ovale et selon l'intensité du son, il ne vibre pas dans le même plan.
La fenêtre ovale possède un grand rayon horizontal et un petit rayon vertical.
En oscillant autour de son axe vertical, l'étrier enfonce le grand rayon
horizontal dans la fenêtre et exerce une pression plus importante que s'il
oscillait dans l'autre sens. Pour les faibles intensités l'étrier oscille autour
de son axe vertical et amplifie ainsi la pression. Pour les fortes intensités
l'étrier oscille suivant l'axe horizontal. C'est le petit rayon qui s'enfonce
dans la fenêtre ovale atténuant les effets néfastes d'une trop forte intensité.
La cochlée est une structure membraneuse située à l'intérieur d'une structure
osseuse en forme de limaçon. La cochlée est composée de trois canaux enroulés en
spirale (2 tours et demi en moyenne). Ces trois canaux sont séparés par deux
membranes: l'une très fine, la membrane de Reisner et l'autre au-dessous, la
membrane basilaire sur laquelle repose la structure (l'organe de Corti) qui
réalise la transduction entre l'onde sonore et les activités électriques dans
les cellules nerveuses. Entre les deux membranes de Reisner et basilaire se
situent trois canaux. Dans la partie supérieure, la rampe vestibulaire, dans la
partie inférieure, la rampe tympanique dans lesquelles circule la périlymphe.
Les deux membranes se rejoignent à l'extrémité apicale de la cochlée en laissant
un orifice permettant la communication de la périlymphe entre les deux rampes.
Dans la partie moyenne de la cochlée, limité en haut par la membrane de Reisner
et en bas par la membrane basilaire se situe le canal cochléaire où circule
l'endolymphe.La cochlée est en communication avec l'oreille moyenne par la
fenêtre ovale et la fenêtre ronde. la fenêtre ovale, sur laquelle s'appuie
l'étrier, est en communication avec la rampe vestibulaire et la fenêtre ronde
est en communication avec la rampe tympanique.
3 - Le cheminement du son
Après un signal sonore, l'étrier s'enfonce dans la fenêtre ovale, qui enfonce
et déplace la périlymphe transmettant la pression à la fenêtre ronde qui bombe
légèrement. Les mouvements des liquides de l'oreille interne sont différents
selon la fréquence des sons émis. Pour des fréquences faibles jusqu'à 20 HZ,
toute la masse de liquide fait X fois le va et vient ( X est égale à la
fréquence du son) au travers de l'hélicotrène. Au-delà de 20 Hz, la résistance
de cet orifice est telle que le liquide ne peut plus suivre la cadence.
Au-dessus de 20 Hz, la pression exercée sur la fenêtre ovale va modifier une
zone privilégiée du canal cochléaire: de 20 Hz à 20000 Hz, une portion du canal
cochléaire se déforme d'une façon privilégiée. Cela est lié aux caractéristiques
de la membrane basilaire.
4 - La membrane basilaire
La membrane basilaire est constituée de tissu conjonctif et d'élastine. Elle
s'insère sur la partie osseuse de l'oreille moyenne (la base) l'autre extrémité
étant l'apex. a la base, près des fenêtres, la membrane basilaire est plus
étroite (0,05 mm) qu'à l'apex (0,5mm). De plus, son élasticité augmente de la
base vers l'apex. Lorsqu'un son de basse fréquence est émis, il fait vibrer la
portion de la membrane dont la structure est adaptée, c'est-à-dire qui entre en
résonance avec cette basse fréquence. Les sons graves sont perçus par la partie
apicale, tandis que les sons aigus entrent en résonance avec la partie basale de
la membrane basilaire et les sons de fréquences moyennes avec la partie médiane.
a chaque point de la membrane basilaire correspond une fréquence donnée qui fera
vibrer au maximum ce point privilégié. Grâce à ces points de vibration
sélectifs, la membrane basilaire fait une véritable "analyse de Fourier" de
l'onde sonore. La transduction de l'onde mécanique en activité électrique dans
les cellules nerveuses se situe au niveau de l'organe de Corti.
5 - L'organe de Corti
L'organe de Corti est une structure complexe composée de cellules ciliées qui
longent la membrane basilaire. Ces cellules sont situées en repli le long de la
membrane. Il existe 3 rangées de cellules ciliées externes (soit au total
environ 20000) et une rangée de cellules ciliées internes (environ 3500). Des
fibres nerveuses (environ 30000) relient ces cellules ciliées au cerveau. Tout
mouvement de la membrane basilaire, même infime, entraîne des fléchissements des
cellules ciliées. Ces fléchissements déclenchent une activité nerveuse dans les
fibres du nerf auditif. Pour un neurone donné cette activité dépend de la
fréquence et de l'amplitude du son qui l'a produite. Les neurones reliés aux
cellules ciliées de la partie basale de la membrane basilaire, sont activés par
les hautes fréquences, ceux qui sont reliés aux cellules ciliées de la partie
apicales, sont excités par les basses fréquences...
Les impulsions nerveuses sont synchrones de la fréquence du signal sonore qui
les a déclenchées. Par exemple un son de 200 Hertz provoque une réponse de 200
impulsions par seconde du neurone sensible à cette fréquence.
En physiologie, grâce à des électrodes placées sur un nerf auditif, des
expérimentateurs ont recuilli les "potentiels microphoniques cochléaires" au
niveau des cellules réceptrices de la cochlée. Le potentiel microphonique
cochléaire ressemble à une onde sinusoïdale. Comparée avec l'onde sonore qui lui
a donné naissance, la forme de ce potentiel a le même aspect: même forme
sinusoïdale, même fréquence. Un délai acoustique est observé: il correspond au
temps de parcours de l'onde sonore dans les milieux de propagation de l'oreille
jusqu'aux cellules réceptrices. L'amplitude du potentiel microphonique
cochléaire augmente lorsque l'énergie sonore augmente (intensité du son).
Jusqu'à 80 dB, cette amplitude est proportionnelle à l'augmentation de
l'intensité sonore. Au-dela de 80 dB, le potentiel microphonique cochléaire
n'est plus représentatif de l'intensité sonore.
La transmision de l'influx nerveux, qui a pris naissance au niveau des
cellules réceptrices (cellules ciliées), s'effectue à travers 3 neurones: la
voie cochléo-bulbaire (de la cochlée au bulbe), la voie bulbo-thalamique (du
bulbe au thalamus) et la voie thalamo-corticale (du thalamus à l'aire
sensorielle auditive c'est-à-dire l'aire 42).
C - La perception auditive
La fréquence et l'intensité d'un son sont des caractéristiques physiques qui
peuvent être mesurées avec précision par des instruments adéquats tandis que les
sensations qu'ils provoquent sont plus difficiles à évaluer.
La force d'un son (caractéristique psychologique) est liée à l'intensité de
ce son (caractéristique physique), mais aussi à sa fréquence. Pour une fréquence
constante, les sons de forte intensité sont plus forts que ceux de faible
intensité. Pour une intensité constante, ce sont les sons de basse ou haute
fréquence qui semblent plus faibles que ceux de fréquence moyenne. La hauteur
tonale d'un son dépend d'abord de sa fréquence, mais aussi de son intensité. Le
timbre d'un son (qualité du son) dépend de la complexité de l'onde sonore.
Deux théories ont essayé d'expliquer la perception auditive: la théorie de
la localisation et la théorie de la périodicité. Pour la théorie de la
localisation, la hauteur d'un son est déterminée par l'endroit où l'onde atteint
son amplitude maximale sur la membrane basilaire. Dans la théorie de la
périodicité, les réponses des neurones entrent en synchronisme avec les
variations de pression dans l'onde acoustique. Les cellules nerveuses réagissant
à une onde sonore déchargent en synchronisme avec la fréquence de l'onde. Cette
synchronisation des réponses nerveuses permet ainsi de percevoir la hauteur d'un
son. Selon Linsay et Norman, les théories de la localisation et de la
périodicité expliqueraient en partie les mécanismes de la perception auditive.
Mais, "peut-être faudrait-il songer à une théorie dualiste qui puisse les
combiner". Les théories modernes mettent l'accent sur l'existence d'un système
d'analyse spectrale centralisé pour la fréquence et un système temporel de
forme. Ces analyses se situeraient au niveau du cerveau. Ainsi, au niveau
cochléaire, la théorie de la localisation et la théorie de la périodicité
détermineraient la hauteur tonale, mais d'autres analyses seraient effectuées à
d'autres niveaux.
L'écoute binaurale c'est-à-dire les informations captées par les deux
oreilles permettent de localiser le son dans l'espace. Quand la source d'un son
est située à égale distance des deux oreilles, le son arrive aux oreilles en
même temps. Si la source est décalée par rapport au plan sagittal c'est-à-dire
situé à droite ou à gauche, il existe alors un délai entre l'arrivée de l'onde
sonore à l'oreille droite et l'arrivée à l'oreille gauche. Ce délai permet de
localiser le son dans l'espace. Toutefois ce délai ne peut servir d'indice à une
bonne localisation que pour des fréquences inférieures à 1300 Hz. La
localisation du son s'effectuerait grâce à un double mécanisme: écart de temps
pour les basses fréquences et différence d'intensité pour les hautes fréquences.
La forme du pavillon de l'oreille avec ses aspérités particulières facilite
également la localisation du son. L'écoute binaurale ajoute une dimension
spatiale à la perception auditive et rend les sons plus "clairs".
II - TRAITEMENT DE L'INFORMATION PARLÉE
La parole est le support de la communication humaine. C'est aussi une source
d'information importante et un médiateur non négligeable dans l'apprentissage.
Toutefois le traitement de la parole ou signal vocal peut être abordé sous
différents angles selon le contexte dans lequel il s'inscrit: domaine de
l'acoustique, de la perception, de la cognition, de la linguistique, de la
production... La connaissance de la parole intéresse de nombreuses disciplines
qui, de plus en plus, interagissent entre elles et ce d'autant plus que
l'objectif est lié à l'évolution des nouvelles technologies: reconnaissance de
la parole, codage, synthèse de la parole. Le traitement de la parole concerne
donc des domaines multidisciplinaires qui se sont tous plus ou moins appliqués à
évaluer les capacités humaines de perception, de cognition et de production de
la parole.
A - L'appareil phonatoire
La structure de la parole est liée directement avec les organes de production
de la parole. Sur le plan physique, la parole est produite par une source d'air
provenant des poumons et un ensemble de muscles dont le rôle est de faire
cheminer l'air de la trachée vers les cordes vocales et la bouche. Un locuteur
peut parler pendant 40 secondes entre deux inspirations. Les muscles abdominaux,
les muscles respiratoires entrent en jeu dans la production de paroles. Les
muscles articulatoires modèlent ensuite cette production.
1 - Le larynx
La fonction phonatoire du larynx dépend de la pression de l'air provenant des
poumons, de l'ajustement du larynx déterminé par les commandes nerveuses
permettant de tendre et d'écarter plus ou moins les cordes vocales et enfin de
l'association entre le larynx et les cavités sus-jacentes et sous-jacentes de la
glotte.
Le signal vocal (voir paragraphe suivant) peut être caractérisé par sa
fréquence, et son amplitude. La fréquence est surtout liée aux caractéristiques
mécaniques des cordes vocales et l'intensité à la pression de l'air
subglottique. Mais tous ces facteurs interagissent entre eux. Le débit de l'air
est fonction des caractéristiques des cordes vocales, mais aussi de la forme des
poumons, de la trachée et du conduit vocal dans sa globalité. Ce qui explique la
variablilité des émissions vocales individuelles et interindividuelles.
Le larynx permet de faire une première classification des sons émis.
En effet, les voyelles sont des sons pendant lesquels la position des
organes phonatoires restent constante et pour lesquels il n'existe pas
de rétrécissement important du conduit vocal qui pourrait provoquer un
bruit de friction par exemple. Les sons pour lesquels les cordes vocales
vibrent sont:
-
les voyelles pour lesquelles il n'existe pas de rétrécissement du
conduit vocal,
-
les consonnes liquides (me, de, le et re), ,
-
les consonnes pour lesquels il existe un léger rétrécissment du conduit
vocal permettant l'apparition d'un bruit ( fe, che et se),
-
les occlusives, sons pour lesquels il existe une fermeture du conduit
vocal à un moment donné (ba, da, ga).
Pour les "silences", les cordes vocales ne vibrent pas et il n'existe pas de
bruit. Ils sont indispensables pour l'intelligibilité de mots comme "papa "par
exemple.
2 - La langue
Elle est formée de 17 muscles. La variété des sons est due à la
richesse de la structure musculaire de la langue. Les sons vocaux
peuvent aussi être classés selon la position de la langue:
-
la langue très relevée en avant produit le "i",
-
la langue relevée en arrière produit le "ou",
-
la langue abaissée au centre produit un "a",
-
d'autres positions intermédiaires donnent le "é", "o", "u"...
Le "i", le "o" et le "a" déterminent les 3 positions extrêmes de la langue
dans son espace articulatoire.
3 - La mâchoire
Elle peut s'abaisser, se relever, s'avancer ou se reculer. "chou" et "chu"
avancent la mâchoire au maximum tout en la fermant. "pa" ouvre la mâchoire.
4 - La bouche
Les lèvres sont les organes essentiels pour la production des consonnes et le
français. Selon l'espace intérolabial, l'étirement des lèvres et leur point de
contact les sons produits sont différents.
B - Structure de la parole
1 - Le signal vocal
La parole est un signal acoustique produit par l'homme dans le but d'énoncer
un message d'information ou de communication. C'est pourquoi les "émissions
sonores" de l'homme peuvent prendre des formes très variées: parler rapidement,
lentement, à voix haute, à voix basse, chuchoter, murmurer, chanter, crier...
D'autre part chaque personne à une voix particulière: voix grave ou aigüe,
forte ou faible, timbre et intonation spécifique.
Sur un plan physique, la parole fait partie des ondes sonores complexes.
C'est un signal vocal continu dont "la structure est complexe et variable dans
le temps, tantôt périodique pour les sons voisés, tantôt aléatoire pour les sons
fricatifs, tantôt inmpulsionnel dans les phases explosives des sons occlusifs".
L'information parlée peut être considérée comme une suite de séquences
"consonne-voyelle". Les voyelles sont les parties stables (formants) et les
consonnes sont les parties transitoires.
Le spectre acoustique est la représentation de la variation de l'amplitude
des composants du signal vocal en fonction de la fréquence de ces composants.
Les trois premières fréquences de résonance sont par exemple caractéristiques
d'une voyelle: ce sont les trois premiers formants.
2 - Structure propre à la parole
Les connaissances propes au langage parlé concernent la phonétique, la
phonologie et la prosodie. La phonétique est l'étude des sons utilisées dans les
langues naturelles. Le terme de phonétique est apparu au XIX ème siècle et
jusqu'au début du XX ème siècle la phonétique était surtout une science
descriptive. Chaque changement de son était étudié isolément. Ferdinand de
Saussure (1857-1913) fit évoluer les connaissances en linguistique en
considérant la langue comme "un système de signes indépendants relevant d'une
convention sociale entre les membres d'une communauté linguistique, l'emploi de
chaque signe étant délimité par l'emploi des autres". Selon Saussure, la
relation entre le "signifiant" (phase phonique) et le "signifié" (phase
sémantique) d'un signal est arbitraire. La phonétique était considérée comme une
science expérimentale étudiant les sons du langage selon deux points de vue: la
manière dont on les produit (phonétique articulatoire) et le phénomène physique
qu'ils représentent lié à leur perception (phonétique acoustique). La phonologie
qui étudie les relations entre les sons du langage est venue complétée les
connaissances linguistiques. La phonétique, science des sons de la langue
indépendamment du contexte, est ainsi très liée à la phonologie qui étudie
l'organisation des sons. La phonétique étudie la nature physique et
physiologique des distinctions entre les sons tandis que la phonologie établit
les oppositions entre les sons utilisés à des fins linguistiques dans une
langue. Le phonème est un "segment de parole" (Content 19 ). C'est la plus
petite unité de parole distincte par rapport à ses caractéristiques physiques.
On en dénombre 36 pour la langue française.
La phonétique acoustique mesure les caractéristiques de l'onde sonore
produite par le signal vocal: fréquence, intensité et durée. Les sons du
langage sont complexes, composés de plusieurs fréquences qui peuvent être
déterminées grâce à l'analyse de Fourier. Le spectrographe est un appareil qui
analyse les fréquences composant l'onde sonore en fonction du temps. Il donne
ainsi une image visuelle des composants physiques des sons (spectrogrammes). Le
spectrographe peut être utilisé en filtrage large (300 Hz) ou en filtrage étroit
(45 Hz). En filtrage large, le spectrogramme met bien en évidence les ondes
périodiques (voyelles) et les transitions (consonnes) qui peuvent être
considérées comme des ondes périodiques de période infinie. Ce filtrage permet
d'étudier les phonèmes d'une langue. En filtrage étroit, le spectrographe
enregistre chaque harmonique séparément et permet d'établir la courbe de la
fréquence fondamentale qui caractérise la mélodie de la phrase. Ce filtrage est
utilisé pour l'étude de la prosodie. Les différences d'intensités des sons
vocaux sont traduites par des différences dans le noircissement du
spectrogramme. On peut mesurer, grâce au spectrographe la durée, la fréquence
fondamentale et l'intensité des sons vocaux et connaitre leurs fréquences
caractéristiques (formants).
La prosodie est un terme qui vient du grec "prosodia". Il signifie accent,
quantité dans la manière d'énoncer des propos. Il était autrefois réservé au
domaine de la versification. Actuellement l'emploi du terme prosodie concerne le
langage parlé et regroupe l'intonation et certains phénomènes physiques associés
à la parole: l'effet de hauteur, l'effet d'intensité et la durée des segments
phonémiques, syllabiques... L'intonation concerne la variation de la ligne mélodique.L 'intonation pourrait être un indicateur de la segmentation et de la
hiérarchie syntaxique (Noizet 1980, Wingfield 1975).
La voix humaine peut être plus ou moins grave. Cet effet de hauteur dépend de
la fréquence de l'onde sonore: les voix masculines peuvent varier entre 80 Hz
et 160 Hz, les voix féminines entre 150 Hz et 300Hz, et les voix des enfants
peuvent atteindre 500 Hz. L'intensité de la voix est aussi très variable: pour
le langage parlé, l'intensité varie généralement entre 40 et 60 dB. La durée des
segments phonémiques, syllabiques est mesurée en millisecondes: le débit des
paroles fait varier la durée de ces segments. La durée d'un phonème peut
s'étendre de 30 millisecondes à plusieurs centaines de millisecondes. La durée
des pauses et des silences est un paramètre important dans l'intelligibilité
d'un mot ou d'une phrase. Les trois paramètres (hauteur, intensité et durée)
sont plus ou moins dépendants lors de la phonation. L'intensité dépend de la
pression sous glottique et la fréquence laryngienne est le produit de la
pression sous glottique et de la tension des cordes vocales. L'accent inclut les
paramètres de durée, d'intensité et de hauteur. Le rythme, l'intonation
dépendent du locuteur et de ses intentions par rapport au message qu'il souhaite
transmettre. L'intonation peut être analysée au niveau des phonèmes ou au niveau
de la phrase ou même au niveau du discours. Au niveau de la phrase, l'intonation
est différente selon la modalité: assertive, interrogative, injonctive ou
exclamative.
3 - Structure commune à la parole et à l'écrit
Les connaissances communes au langage parlé et écrit concernent le lexique,
la syntaxe, la sémantique et la pragmatique.
Le lexique comprend l'ensemble des informations acoustiques, phonologiques,
syntaxiques et sémantiques concernant le mot.
La syntaxe peut être définie comme l'ensemble des règles permettant de gérer
l'ordre des mots et la construction des phrases et des énoncés.
Le Ny (1979) définit la sémantique comme étant"la relation entre la forme des
signes linguistiques ou signifiants et ce qui est signifié ou "signifié". La
sémantique comprend l'ensemble des informations liées au sens, à la
signification des mots.
La pragmatique est l'étude des relations entre "signifié" et
l'interprétation. Elle recouvre l'ensemble des relations entre le langage et le
contexte d'énonciation.
C - Niveaux de traitement
La parole est un support d'information et de communication. Elle est émise et
perçue. Dans l'émission de la parole, le locuteur transmet une idée en mettant
en œuvre ses capacités de production de paroles pour aboutir à la commande des
nerfs moteurs des organes phonatoires. Dans la perception, l'auditeur reçoit le
signal vocal, analyse et organise ses différents constituants jusqu'à la
compréhension du message et son intégration parmi ses idées. Dans la production
et la perception de la parole, peuvent ainsi être mis en évidence différents
niveaux de traitement: un niveau périphérique correspondant aux mécanismes du
système de phonation et d'audition, et un niveau central correspondant à la
formation ou à la compréhension du message linguistique.
Dans cette étude, l'objectif est d'essayer d'analyser les mécanismes associés
à la perception, l'intelligibilité, et la compréhension du langage parlé afin de
pouvoir définir les conditions d'une écoute efficace sur un plan pratique et sur
un plan théorique, de mieux comprendre les processus cognitifs associés à la
perception de la parole.
1 - Le niveau perceptif
Une phrase parlée est un signal sonore continu qui évolue dans le temps. Une
phrase écrite est une suite de symboles (lettres) groupées en mots séparés par
des espaces. L'analyse et le codage d'une phrase parlée fait appel au système de
perception auditive qui utilise des mécanismes d'analyse séquentiels.
Dans la perception de la parole, l'oreille analyse d'abord les paramètres
définissant cette onde sonore complexe: amplitude, fréquence et durée des
segments. a ce stade, le traitement du signal a pour but de quantifier ces
différentes grandeurs pour faire correspondre à l'onde sonore (temporelle), une
description multidimensionnelle afin de réaliser l'analyse phonétique de la
phrase. La parole a une structure complexe et très variable dans le temps,
tantôt périodique, tantôt apériodique, impulsionnelle ou bruitée... Ainsi le
"timbre" peut avoir plusieurs significations: le timbre des voyelles, le timbre
du locuteur.. L'une qualifie la structure physique du son des voyelles,l'autre
l'aspect global de la voix de l'individu. Les caractéristiques propres aux
phonèmes se mêlent aux caractéristiques propres au locuteur. Les voyelles et les
consonnes ont des caractéristiques acoustiques différentes. L'émission des
voyelles produit des sons complexes ayant des composants de différentes
fréquences (les formants) qui sont tous des harmoniques de la fréquence
fondamentale (note sur laquelle une voyelle est prononcée). L'oreille humaine
peut percevoir une différence de fréquence inférieure à 25 Hz. Les différences
entre les phonèmes sont supérieures. Les deux ou trois premiers formants des
voyelles sont suffisants pour les caractériser. Les voyelles "i" et "u" sont
aiguës et les voyelles "ou", "o" sont graves les autres voyelles sont
intermédiaires. Les caractéristiques acoustiques des consonnes sont plus
complexes: elles comportent toujours un bruit (friction ou explosion)
accompagné ou non d'un son pur selon que les cordes vocales vibrent ou non.
Parmi les consonnes on distingue par exemple les occlusives, les fricatives, les
nasales selon leur mode de production et leurs caractéristiques spectrales. Dans
l'émission des paroles, le phénomène de coarticulation complique encore
l'analyse: lorsqu'une personne parle, elle anticipe le son suivant dans le son
précédent. Ainsi il y a une relation entre la voyelle et la consonne suivante si
bien qu'un "a" suivi de "p" n'est pas un "a" suivi de "r". Sur le spectre, les
transitions sont les portions de voyelles influencées par les consonnes. Les
recherches sur la synthèse et la reconnaissance de la parole ont montré que les
paramètres acoustiques (intensité, fréquence, durée), des transitions, des
silences, des pauses sont des traits pertinents utilisés par les mécanismes
d'analyse perceptive de la parole.
À ce stade, des indices prosodiques peuvent être également utilisés pour
affiner l'analyse perceptive, mais aussi pour la quantification de segments de
paroles et peuvent fournir des informations sur la structure syntaxique voire
sémantique de l'énoncé. Pour les mots plurisyllabiques une "nuance mélodique"
différente peut être perçue entre la syllabe initiale, intermédiaire et finale.
Pour la phrase, la fréquence et l'intensité sont plus élevées au début, plus
basses à la fin. au début d'un discours, la fréquence est toujours plus élevée
et ce d'autant plus que le locuteur est émotif. Puis le locuteur "pose sa voix".
a la fin du discours, le débit est plus lent et la note mélodique est la plus
grave de tout l'énoncé.
Nous avons vu dans la première partie de ce chapitre que la physiologie du
système auditif permet de comprendre quelles sont les informations que le
système nerveux extrait des signaux sonores qui arrivent aux cellules
sensorielles de l'oreille. Ces mécanismes physiologiques expliquent la première
phase d'intelligibilité et de reconnaissance de l'information parlée. Toutes les
caractéristiques d'un signal sonore n'ont pas la même importance: les cellules
sensorielles vont sélectionner les caractéristiques pertinentes dans certaines
conditions de limite (intensité, fréquence, durée). Des fréquences et des
intensités sont mieux perçues que d'autres. L'existence d'un silence avant
certaines consonnes est indispensable à leur intelligibilité...., Au niveau de
la cochlée, des cellules ciliées spécifiques sélectionnent les caractéristiques
pour lesquelles elles sont sensibles. Les effets consécutifs, de contraste,
d'inhibition affinent cette sélection et permettent de comprendre le
fonctionnement du système auditif.
Selon un modèle hiérarchique de la perception humaine de la parole
(Lieberman 1979) trois niveaux peuvent être distingués dans la
compréhension de l'information parlée:
-
la reconnaissance acoustico-phonétique analyse le signal vocal et le
traduit en une suite de sons élémentaires (phonèmes),
-
la reconnaissance de phrase aboutit à une représentation
syntaxico-sémantique à partir des phonèmes,
-
la phase d'interprétation complète, valide ou modifie les résultats de
la reconnaissance de phrase.
Au fur et à mesure du déroulement de l'énoncé, des interactions constantes
s'établissent entre ces trois niveaux et il est impossible de les séparer sans
aboutir à une schématisation restrictive des mécanismes du traitement de la
parole.
2 - Niveau cognitif
En psychologie cognitive, plusieurs modèles ont été proposés pour expliquer
le traitement de l'information perceptive, du langage parlé et écrit.
"Lorsque nous écoutons quelqu'un parler, nous percevons des entités
significatives, des mots, et non pas une suite confuse de sons qui doivent être
traduits d'une façon ou d'une autre afin d'avoir un sens" (Lindsay et Norman
1981). Ces auteurs ont décrit deux systèmes de traitement, l'un "dirigé par
données", l'autre "par concepts". Dans un système de traitement dirigé par
données, le traitement commence avec l'arrivée des données. Chaque étape de
l'analyse effectue son travail recevant des données d'entrée de l'étape
précédente. Les données de sortie sont les données d'entrée qui déclenchent
l'étape suivante. Mais il est plus facile d'entendre, quand on sait ce qu'il
faut entendre. Quand il y a connaissance d'une interprétation possible ou
conceptualisation d'un stimulus pour aider à sa perception, le traitement est
dirigé par concept. Les mécanismes de ces deux systèmes de traitement
s'effectueraient presque toujours simultanément, chaque mode contribuant à
l'analyse globale.
Le rôle de la sémantique et de la conceptualisation dans l'étape de
reconnaissance de phrases a fait l'objet de plusieurs études (Le Ny 1980). Nous
citons ici quelques modèles:
-
un modèle de grammaire sémantique (Burton1976),
-
un modèle de réseau sémantique (Quillian 1968, Anderson 1976, Anderson
1984) composé d'un ensemble de nœuds (concepts) et d'arcs (relation entre
les concepts),
-
un modèle hiérarchisé de traits sémantiques dans le lexique qui donne
une représentation arborescente du vocabulaire.
-
un modèle de comparaison et de mémoire sémantique (Smith, Schoben et
Rips 1973, 1974).
Dans la plupart de ces modèles, les auteurs montrent l'interaction entre les
données informatives qui arrivent au sujet et les données acquises qu'il a
classées et organisées dans sa propre base de connaissance. Mais dans toute
acquisition, les processus cognitifs liés à l'attention et à la mémoire sont
présents.
En effet lorsqu'un auditeur écoute un locuteur, il perçoit et décode les
derniers éléments d'une phrase alors qu'il a déjà intégré en mémoire et compris
les premiers éléments. Pour Spérandio (1986) , la mémoire à court terme permet
de gérer les interprétations partielles d'une phrase élémentaire de dialogue et
contient les résultats de l'analyse du dernier énoncé du locuteur au niveau
acoustique, phonétique, lexical, sémantique. Dans la mesure où le débit moyen
d'un locuteur varie entre 120 et 180 mots par minute, la vitesse de traitement
de l'information parlée de l'auditeur doit suivre ce rythme.
En conclusion, la compréhension de phrases parlées nécessitent
plusieurs approches:
-
une approche ascendante (traitement dirigé par données) dans
laquelle l'auditeur émet des hypothèses à partir des
caractéristiques de l'onde sonore pour trouver la phrase en suivant
les diverses étapes de décodage (phonétique, lexical, syntaxique,
sémantique) jusqu'à l'interprétation de la phrase;
-
une approche descendante (traitement dirigé par concept) dans laquelle
l'auditeur part du concept, de ses connaissances linguistiques (sémantique,
syntaxe), du contexte, de ses attentes, pour prédire les éléments de la
phrase (mots, syllabes, phonèmes),
-
une approche horizontale dans laquelle l'auditeur utilise ses
connaissances pour sélectionner ou indicer les éléments pertinents dans le
but de parfaire les interprétations immédiates ou à venir.
"Le problème de la compréhension de phrases peut être considéré comme un
problème de recherche de la solution optimale dans un espace de réalisations
partielles correspondant à l'ensemble des phrases ou des sous-phrases possibles
compte tenu de trois contraintes: la structure du langage, le lexique, la
chaîne ou le treillis phonétique d'entrée. On appelle alors "stratégie de
recherche" l'ensemble des règles régissant le parcours qui conduit à la solution
retenue. Cette notion de stratégie de recherche d'une solution dans un espace
d'états correspond à une des méthodes les plus classiques de résolution de
problèmes en intelligence artificielle" (Pierrel 1987).
III - L'ÉCOUTE
L'importance de l'écoute dans la communication humaine est évidente. Mais si
la parole est un moyen de communication primordial, elle peut être un moyen
d'apprentissage essentiel et même indispensable dans certaines situations:
enseignement, de tous ceux qui ne peuvent avoir accès à la lecture. L'écoute
nécessite l'intervention de l'attention et de l'éveil et peut être enseigner
(Frazier 1966). .
A - Importance de l'écoute
Des auteurs ont essayé d'évaluer la place occupée par l'écoute au cours d'une
journée de travail d'un enfant scolarisé et d'un adulte. Les premières études,
en 1928 au Etats-Unis ont montré que les adultes passent 42% de leur temps à
écouter, 32% à parler, 15% à lire et 11% à écrire. En 1940, toujours au
Etats-Unis, ils passent 47% de leur temps à écouter, 28% à parler, 17% à lire et
7% à écrire. Parler occupe 3 fois plus de temps qu'écrire. Ecouter occupe 3 fois
plus de temps que lire (toutes ces études ont été citées par Bischoff 1979).
Pour cet auteur, les activités d'écoute et de compréhension des informations
parlées occupent 50% du temps des enfants scolarisés. Il semblerait pourtant que
les enseignants donnent moins d'importance aux facultés d'écoute qu'aux facultés
de lecture.
À partir des études qui ont exploré les relations entre les capacités
d'écoute et les capacités de lecture, il semblerait que ces capacités soient
bien corrélées (Bischoff 1979).
L'écoute pourrait être un mode d'apprentissage avantageux pour les handicapés
visuels. En effet, les aveugles sont en général très lents dans la lecture
braille. Les amblyopes peuvent également perdre beaucoup de temps à essayer de
déchiffrer les grands caractères imprimés. Les collégiens aveugles ont un débit
de lecture approximatif de 50 mots/minute et les lycéens de 90 m/mn (mots par
minute). si bien que ces enfants passent 2 à 3 fois plus de temps que les
enfants voyants pour avoir accès a la même quantité d'information (Myers et al.
1966, Myers 1978, Foulke 1969) Magadur (1987) est plus optimiste pour les bons
lecteurs braille:
-
après 1 an d'apprentissage, 40 m/mn,
-
après 2 ans, 60 m/mn,
-
après 3 ans, 80 m/mn,
-
après 4 ans, 90 m/mn,
-
après 5 ans, 100 m/mn,
-
après 6 ans, 110 m/mn,
-
après 7 ans 120 m/mn,
-
après 8 ans, 130 m/mn,
-
après 9 ans, 140 m/mn,
-
après 10 ans, 150 m/mn.
Cet auteur relate une expérience relative à la vitesse de lecture d'un enfant
aveugle: "la lecture d'un texte jamais lu de 52 mots a été faite en 5 minutes 6
secondes par un aveugle de 9 ans du cours élémentaire; la lecture du même texte
(sans préparation) par un clairvoyant de même niveau scolaire a été faite en 38
secondes. Le jeune aveugle a mis 8 fois plus de temps que le
clairvoyant"...."Les élèves aveugles sont plus longtemps au stade de déchiffrage
que les élèves clairvoyants. La lecture reste lente plus longtemps et cette
lenteur perturbe le déroulement des études primaires, du premier cycle et même
au lycée". Magadur expose ensuite les causes de cette lenteur:
-
l'éducation du toucher,
-
l'apprentissage tardif,
-
la possibilités tactiles de chaque enfant,
-
le refus d'apprentissage lié à un résidu visuel ou à la non acceptation
du handicap,
-
le manque d'entraînement,
-
la méthode braille appliquée,
-
le système braille lui-même,
-
le toucher qui est un moyen de connaissance lent. L'élève prend ainsi du
retard parce qu'il est lent.
Par comparaison avec la lecture visuelle, citons quelques observations et
quelques chiffres classiquement admis. La vitesse de lecture à voix haute ou de
paroles est environ 9000 mots à l'heure (soit 150 m/mn). La vitesse de la
lecture "chuchotée" est environ de 13000 mots à l'heure (soit 215 à 220 m/mn).
La lecture silencieuse est plus rapide et sa vitesse dépend des capacités et
surtout de l'entraînement du lecteur: 20000 m/h (330 m/mn) pour un lecteur
lent, 28000 m/h (470 m/mn) pour un lecteur moyen et 60000 m/h (1000 m/mn) pour
un lecteur rapide (Richaudeau 1976). Les observations de Zielke (1970) ont
conduit aux résultats suivants:
-
moyenne de vitesse des adultes (lecteurs non exercés) 90 à 160 m/mn,
-
moyenne d'un lecteur normal exercée avec une technique personnelle, 200
à 250 m/mn,
-
moyenne de lecteurs exercés participant à des cours de lecture, 500 à
700 m/mn,
-
moyenne de lecteurs très exercés, 900 m/mn et plus.
Nous sommes convaincu qu'il est nécessaire de favoriser la lecture braille
chez l'enfant aveugle et le rendre plus efficace dans sa pratique. Pour
l'encourager et le familiariser avec ce mode de lecture tactile, le contact avec
des livres braille bien avant la classe préparatoire serait favorable.
L'apprentissage de l'écoute "active" (voir paragraphe suivant), l'entraînement à
l'écoute, l'analyse et la synthèse de livres enregistrés pourraient pallier les
problèmes associés à la lenteur dans l'accès à l'information et compléter les
connaissances acquises avec la lecture braille.
Les livres enregistrés peuvent aider considérablement les lycéens aveugle
intégrés dans des classes de voyants (Field 1974, Bischoff 1976).
B - Apprendre à écouter
L'apprentissage dépend de l'efficacité de l'écoute qui dépend
elle-même de plusieurs facteurs:
-
l'intelligence,
-
la compréhension dans les activités de lecture,
-
l'acquisition d'un vocabulaire riche,
-
les capacités d'adaptation au locuteur,
-
l'expérience et l'entraînement de l'écoute.
L'écoute efficace nécessite un effort de concentration. Elle doit être
"active": comme dans une prise de notes, l'auditeur doit analyser, sélectionner
et synthétiser les informations perçues.
Bishoff signale le défaut d'étude et de recherche dans le domaine de
l'écoute et propose un programme d'entraînement:
-
des leçons d'écoute distribuées à raison de trois par semaine,d'une
durée de 15 minutes au début,
-
chaque leçon comporterait trois phases. Une phase de présentation de
l'énoncé, un test de compréhension avec un questionnaire à choix multiples,
un test de performance (réponse à des questions).
-
tester à chaque leçon la compréhension des idées, la connaissance du
vocabulaire, l'interprétation de l'énoncé
-
découvrir l'idée principale de l'énoncé en lui donnant un titre,
-
les leçons devraient être échelonnées en longueur et en difficulté,
-
développer les capacités sélectives par la détection d'indices, de
mots-clés, d'idée principale ou pertinente,
-
développer les capacités d'attention et de concentration,
-
les énoncés sont enregistrés par une voix masculine avec un débit de 120
m/mn.
La plupart des éducateurs des déficients visuels ont estimé nécessaire
d'enseigner l'écoute. Un grand nombre d'auteurs (Bischoff 1967, Bixler 1963,
Cobb 1977, Daughtery 1974, Gore 1969, Hatlen 1976, Morris 1966 et Nolan 1973,
cités par Bischoff 1979) jugent que la présentation auditive des énoncés à
apprendre est la seule voie d'apprentissage possible pour que les handicapés
visuels puissent être intégrés aisément dans un enseignement scolaire.
C - Applications
Le champ d'application de l'écoute est vaste et varié: accueil,
communication, échanges, informations radiophoniques et télévisées, cours et
enseignement, conférence, renseignements, narrations, témoignage, documentation,
publicité... Toutes les informations véhiculées par la parole sont plus ou moins
importantes, plus ou moins intéressantes, plus ou moins utiles, plus ou moins
utilisables.
Nous nous limiterons à étudier l'utilisation d'un mode de présentation
auditive et de l'écoute chez l'aveugle et en particulier chez le collégien, le
lycéen, l'étudiant. Il semble en effet primordial d'essayer d'améliorer l'accès
à l'information chez les déficients visuels et ce d'autant plus qu'ils ne
peuvent avoir un accès aisé à la lecture braille (aveugles tardifs, diabétiques,
sensibilité tactile déficiente).
1 - La prise de notes:
Si l'acquisition de la lecture braille est relativement lente pour un jeune
aveugle, la maîtrise de l'écriture braille est tout aussi difficile et peut être
plus pour les très jeunes. La vitesse reste longtemps faible et il faut de
nombreuses années de pratique pour être efficace. D'autre part la tablette et le
poinçon ou la machine à écrire le braille sont assez bruyants et peuvent être
gênants quand plusieurs aveugles sont intégrés dans une classe de voyants. Un
grand nombre d'éducateurs anglo-saxons et quelques éducateurs français estiment
que le magnétophone serait un outil précieux dans certaines conditions
d'utilisation. Le chapitre suivant est consacré à l'étude de la prise de notes
aidée par l'enregistrement. Il n'est évidemment pas pensable d'enregistrer
l'intégralité d'un cours, de rester passif devant le matériel en marche, et de
réécouter les 30 heures de cours enregistrés dans la semaine ! Comment rendre ce
mode de prise de notes efficace? Comment utiliser ce matériel pour sélectionner
les informations pertinentes? Sur un plan cognitif, quels sont les mécanismes
les plus sollicités? Quel est le rôle de la mémoire et celui de l'attention?
Une longue expérience et les problèmes à résoudre au "coup par coup" ont abouti
a quelques solutions rentables et à une proposition de fabrication d'un
magnétophone spécifique à la prise de notes et à la réécoute rapide.
2 - La parole comprimée et l'écoute rapide
Des techniques nouvelles mises en place dans les années 60 aux Etats-Unis ont
permis de réaliser une compression temporelle de la parole enregistrée sans
distorsion excessive du signal vocal. L'augmentation du débit de
l'enregistrement permet l'écoute d'une plus grande quantité d'information dans
un temps plus court. Quel est l'influence de la parole comprimée sur
l'intelligibilité des mots, la compréhension du discours, la mémorisation des
informations et l'efficacité de l'apprentissage? a partir de quel âge peut-on
utiliser ce mode de présentation? Quelles seraient les applications de l'écoute
rapide?
Ces questions sont abordées dans le chapitre 4 dans lequel une revue de
questions et une étude expérimentale sont exposées.
3 - La synthèse vocale
La synthèse vocale associée à un ordinateur, des logiciels adaptés, des
nouveaux supports pour le stockage des informations (CD ROM, DON, ...) offrent
des possibilités considérables aux jeunes aveugles.
Quels sont les problèmes posés par une sortie vocale? Un opérateur aveugle
peut-il utiliser le matériel informatique utilisé par les voyants sans avoir
accès à l'écran? Les mécanismes de la perception auditive et les processus
mnésiques pourraient-ils pallier l'inexistence de la perception visuelle?
Quelles sont les conséquences de l'utilisation de ces nouvelles techniques sur
l'intégration scolaire, sociale et professionnelle des jeunes déficients visuels? Notre expérience et nos investigations dans ce domaine sont relatées dans le
chapitre 5.
IV - CONCLUSION ET RÉSUMÉ
La parole est un signal vocal complexe, continu et redondant (formants)
composé de segments périodiques et apériodiques, variable pour un même locuteur
à des instants différents, et très variable selon les locuteurs (variabilité
inter-individuelle). Contrairement à l'écrit, la parole est une suite de
segments continue (phonèmes) dont le débit varie entre 120 et 150 mots par
minute environ selon les conditions d'émission et les objectifs recherchés.
L'expérimentation en physiologie et en psycho-physiologie a permis de décrire
l'information qui circule sur le nerf auditif à partir de l'émission d'un signal
vocal.Au niveau périphérique, les mécanisme de la perception auditive ont pu
être étudiés: l'onde vocale peut être définie par sa fréquence, son amplitude,
sa durée. Dans l'oreille, elle subit des phénomènes de décomposition spectrale
capables de discriminer la fréquence fondamentale et les harmoniques d'une
voyelle par exemple. La hauteur perçue est liée à la fréquence fondamentale,
l'intensité à la notion d'énergie (amplitude, pression acoustique). Une unité de
puissance acoustique a été définie permettant de déterminer une unité relative
de niveau d'intensité sonore en décibels. L'oreille perçoit des sons dont la
fréquence varie entre 20 et 20000 Hertz (jusqu'à 10000 HZ dans la pratique). Des
seuils d'audibilité et de douleur sont déterminés pour différentes fréquences
(courbes d'audibilité et de douleur) La sensibilité de l'oreille est maximum
pour les sons de 1000 Hertz. L'oreille est peu sensible à la variation
d'intensité d'un son (supérieur à 10%), mais elle est très sensible à sa
variation de fréquence (entre 0,1 et 0,3% en moyenne). L'oreille interne
transforme le signal acoustique en un signal nerveux et le codage à ce niveau
est tel qu'il produit déjà une bonne analyse acoustique du signal d'entrée. Deux
type de codage sont effectués au niveau périphérique: un codage temporel pour
une fibre nerveuse et un codage spatial et synchronisé de plusieurs fibres
nerveuses suivant la localisation des cellules réceptrices: définissant une
sorte de cartographie fonctionnelle au niveau de la cochlée (oreille interne).
Au niveau central, l'énoncé en cours de traitement fait appel à diverses
sources de connaissances: acoustiques, phonétiques, lexicales, syntaxiques et
pragmatiques. Plusieurs modèles rendent compte des mécanismes centraux.
Plusieurs types de modèles ont essayé de décrire le déroulement des processus
cognitifs dans le traitement de l'information parlée. Des phénomènes
d'interaction multiples compliquent beaucoup cette tâche: phénomènes de
coarticulation au niveau des segments (phonèmes) et multiples interactions dans
les différentes étapes de l'analyse. Les recherches des acousticiens (Vicard
1987, Wang 1987) et des informaticiens (Pierrel 1987) qui ont pour objectif la
synthèse et la reconnaissance de la parole, utilisent les résultats des
phonéticiens, des phonologistes, des linguistes, des psychologues, mais
en contre partie vérifient ces résultats:
-
la parole est redondante et reste intelligible après élimination de
petits segments du signal vocal,
-
la durée d'un phonème varie de 30 millisecondes à quelques centaines de
millisecondes,
-
des "silences" sont indispensables pour la reconnaissance de certaines
consonnes et l'intelligibilité de la parole,
-
les pauses et la prosodie jouent un rôle important dans la compréhension
des informations parlées,
-
la coarticulation et les interactions entre les différentes étapes du
traitement rendent ces études très complexes,
-
la schématisation des mécanismes et des processus mis en jeu est
toujours réductionniste, même si elle permet d'affiner les résultats et
d'améliorer la qualité des synthèses vocales, des progrès sont encore
attendus dans la reconnaissance de la parole,
-
l'attention et la mémoire sont importantes dans l'analyse, la
compréhension et l'interprétation d'un message parlé.
La parole occupe une place essentielle dans la communication humaine et c'est
aussi un support de l'information non négligeable dans l'enseignement. Compte
tenu des difficultés et des problèmes de lenteur avec le mode d'accès à
l'information tactile, de nombreux éducateurs anglo-saxons jugent le mode de
présentation auditif très favorable pour l'accès à l'information et
l'apprentissage des jeunes aveugles. D'autre part le développement des nouvelles
technologies: machines à lire (scanner), calculatrices parlantes, synthèses
vocales permettant la sortie vocale des données d'un micro-ordinateur et
l'utilisation de nombreux logiciels rendent nécessaire l'éducation de l'écoute.
Comment peut-on transmettre une information visuelle distribuée de façon
spatiale sur une feuille ou un écran par la voie orale impliquant des
caractéristiques temporelles et séquentielles? La mémoire à court terme, la
mémoire de travail, l'attention n'imposent-elles pas leurs lois de
fonctionnement? Et comment distribuer l'information parlée pour favoriser la
compréhension et réduire la charge mentale? Nous nous proposons d'étudier ces
différentes questions dans les chapitres suivants.
LA PRISE DE NOTES
SECTION 1: ÉTUDE THÉORIQUE
I - LENTEUR DE L'ACQUISITION DE L'INFORMATION
Même si les étudiants aveugles ont pu acquérir une base de connaissances
suffisamment solide et riche pour pouvoir prolonger leurs études, ils sont
confrontés à un problème majeur qui est celui de l'accès à l'information. .
Cette lenteur dans l'acquisition des informations et donc des connaissances a
été soulignée et expliquée à maintes reprises dans la première partie de notre
travail.
Les différences dans l'efficacité et la rapidité de perception des deux
fonctions visuelle, et tactile, expliquent les résultats des recherches sur la
lecture des caractères brailles et des caractères imprimés.
En effet, pour un temps de lecture donné, un lecteur aveugle qui lit le
braille, couvre trois fois moins de texte qu'un lecteur voyant qui lit des
caractères imprimés (Myers 1978, Drueger 1982). Un lecteur expérimenté lit avec
les yeux environ 300 mots par minute alors qu'un lecteur aveugle lit avec les
doigts environ 100 mots par minute (Foulke et Stitch 1969, Foulke 1982). Les
explications qui rendent compte de cette différence de rapidité reposent
sur des différences de structures physiologiques:
-
la lecture haptique (tactilo-kinesthésique) implique le
mouvement des mains, tandis que la lecture visuelle implique le
mouvement des yeux;
-
l'acuité tactile est plus faible que l'acuité visuelle (l'acuité
est le pouvoir de discrimination entre deux points rapprochés);
-
le champ perceptif tactile est plus petit que le champ perceptif
visuel;
-
la lenteur de la lecture tactile est renforcée par son caractère
essentiellement analytique qui dérive des caractéristiques de la perception haptique définie précédemment.
L'écriture braille avec poinçon présente également cette caractéristique de
lenteur par rapport à l'écriture avec crayon. De plus, la tablette et le poinçon
sont assez bruyants lorsqu'ils sont utilisés par plusieurs élèves dans une même
salle de cours. En outre l'écriture braille permet plus difficilement la
correction, la rectification, l'annulation ou l'adjonction d'une note dans le
texte écrit (Postel 1972). Or la prise de notes est une phase importante voire
primordiale dans l'acquisition des connaissances de l'élève, du lycéen et de
l'étudiant.
II - La TECHNIQUE DE PRISE DE NOTE
Plus le niveau est élevé dans le cursus scolaire et universitaire, plus la
quantité d'informations à acquérir s'accroît. Aussi au fur et à mesure de
l'évolution des études, la technique de prise de notes occupe une place de plus
en plus importante.
Dans les petites classes et suivant les établissements jusqu'à la troisième,
c'est l'enseignant qui gère et organise cette activité de prise de notes. Peu à
peu, le professeur est moins directif et les lycéens, puis les étudiants doivent
accroître leur autonomie dans ce domaine (Ledru et Sizaire 1985). Ils devront
sélectionner l'information et choisir dans le discours du professeur les
éléments essentiels et pertinents qui se rapportent à un thème donné et qui leur
seront utiles pour pouvoir apprendre et restituer cette information (Ledru,
Sizaire 1984).
Les notes stockées par les élèves et les étudiants constituent une base de
données importante sur laquelle peut s'effectuer le travail de révision en vue
d'examens ultérieurs. De la quantité et surtout de la qualité des notes prises,
dépendra la réussite aux examens.
Confrontés à un sujet inconnu ou peu familier, les étudiants utilisent une
stratégie qui consiste à prendre un maximum de notes en vue de procéder à un tri
ultérieur de l'information. C'est une technique classique durant les premières
années d'étude à l'université.
Pour que l'élève ou l'étudiant aveugle, intégré dans une classe de voyants,
puisse suivre le rythme imposé par le débit du cours, une solution avantageuse
est l'utilisation d'un magnétophone.
III - La PRISE DE NOTE AIDÉE PAR L'ENREGISTREMENT
Nous avons enregistré tous les cours de psychologie suivis entre 1982 et 1987
à l'Université de Lille III.
Les premiers cours ont été enregistrés intégralement, soit par exemple 2
heures d'enregistrement pour 2 heures de cours. Puis les enregistrements étaient
retranscrits à la machine à écrire, et enfin lus et ré-enregistrés au
magnétophone. Ce travail de retranscription et de ré-enregistrement avait pour
but principal de condenser toutes les informations, d'éliminer les bruits de
fond et les informations inutiles ou redondantes.
Toutefois, un travail de synthèse n'était pas éffectué durant ces premières
opérations: toutes les phrases apportant une idée nouvelle étaient retenues.
Ces différentes manœuvres avaient pour seul objectif de réduire le temps
d'écoute du cours au maximum en vue d'un apprentissage ou d'un travail de
révision ultérieur.
Au cours des six premières semaines d'enregistrement, suivant la nature et la
densité des cours, nous avons pu constater qu'un cours de 2 heures pouvait être
réduit à 20 ou 40 minutes d'écoute en moyenne.
Cependant, le temps passé dans la retranscription des enregistrements était
considérable. Par exemple, pour un cours de deux heures, il s'agissait
d'additionner les deux heures d'écoute de l'enregistrement d'origine, puis le
temps passé à la dactylographie de 5 à 10 pages (environ 3 heures) et enfin le
temps de relecture, soit au total 6 à 8 heures de travail !...
Étant donné l'inexistence quasi-totale de cours polycopiés, de livres braille
ou de cours enregistrés, l'étudiant aveugle est placé devant deux possibilités:
prendre des notes plus ou moins complètes en braille ou enregistrer le cours et
passer de longues heures de réécoute.
Le choix des solutions est encore plus réduit pour l'étudiant aveugle
accidentel ou pour le mal voyant qui perd (peu à peu ou brusquement ) la vue et
qui avait délaissé la tablette braille pour les gros caractères ! Ces cas sont
relativement courants.
De multiples entrevues avec des élèves aveugles de naissance ou aveugles
accidentels qui avaient une bonne pratique de la tablette braille ont mis
l'accent sur les difficultés rencontrées lors de la prise de notes, surtout chez
les élèves intégrés avec les voyants.
Après ces six semaines d'observation sur la prise de notes à l'aide
du magnétophone, il semblait primordial de réduire:
-
- le temps d'enregistrement du cours;
-
- le temps de la retranscription;
-
- diminuer encore le temps d'écoute.
IV - RÉDUCTION DU TEMPS D'ENREGISTREMENT
La quantité et la qualité des notes prises par un élève ou un
étudiant lors d'un cours dépendent de nombreux facteurs relatifs aux
sujets:
-
niveau scolaire et universitaire;
-
connaissances antérieures du sujet;
-
utilisation ou non utilisation ultérieure des notes;
-
intérêt et motivation du sujet;
-
attention et éveil du sujet;
-
stratégies utilisées par le sujet...
-
capacité mnésique de l'auditeur,
-
intégrité sensorielle et motrice du sujet...
La quantité et la qualité des notes prises peut dépendre aussi de facteurs
relatifs à la nature du cours et relatifs au locuteur. En outre ces différents
facteurs pourraient être interactifs.
Lorsque le thème d'un cours est peu familier ou très complexe, les élèves et
les étudiants ont tendance à prendre le maximum de détails afin de pouvoir faire
un tri ultérieur de l'information et éventuellement une synthèse et un résumé de
ce qui a été compris.
Lorsque l'accès à d'autres informations complémentaires est difficile voire
impossible, parce que le cours est très spécialisé, que les livres et
publications sont inexistants (livres en braille pour les aveugles par exemple),
l'étudiant doit se résoudre à cumuler un maximum de données lors du cours.
Nous nous sommes placés dans ces conditions (thème nouveau, accès aux
informations complémentaires difficiles) durant "la prise de notes" de la
majeure partie des cours suivis pendant les premières années (1982 à 1985) avec
pour objectif essentiel: réduire la durée d'écoute et de retranscription du
cours enregistré.
Pour réduire le temps d'enregistrement d'un cours, une première solution est
d'éliminer tous les "temps sans information", c'est-à-dire de ne pas enregistrer
chaque fois que le locuteur cesse de parler et de redémarrer l'enregistrement
dès les premières paroles. Pour ce faire, il suffit de placer le magnétophone
sur "enregistrement" et un seul appui sur la touche "pause" permet alors l'arrêt
immédiat ou la mise en route de l'appareil. Deux stratégies sont alors
possibles. La première consiste à appuyer le plus vite possible sur la touche
marche-arrêt respectivement dès les premières et dernières paroles. Compte tenu
du temps de réaction à un signal auditif (qui peut varier de 150 à 200
millisecondes), la perte de l'information peut être minimale (moins d'un mot) si
le temps de réaction est très court et si le débit de la parole du locuteur
n'est pas trop élevé.
Toutefois ce procédé présente quelques inconvénients. En effet, même après un
certain temps de pratique et l'acquisition d'une grande dextérité, la perte du
premier ou des deux premiers mots d'une phrase est parfois inévitable et peut,
selon la valeur de ces mots, modifier le sens de la phrase ou rendre celle-ci
incompréhensible. De plus, assez souvent, en situation de cours le professeur
répète une phrase ou une portion de phrase, soit pour insister sur une idée
émise, soit pour aider les élèves à suivre le rythme dans la prise de notes.
Aussi, si l'enregistrement est déclenché dès la perception de la première parole
émise, les phrases et les séquences répétées seront également enregistrées.
En conséquence, cette redondance allongera inutilement le temps d'écoute.
Cette façon de procéder est donc très simple, l'appui automatique sur une touche
au début et à la fin d'un signal s'acquiert rapidement. Cette pratique permet de
réduire le temps d'écoute de 20 à 30 pour cent en moyenne (cours suivis en
première année de psychologie). Toutefois le temps de retranscription sera
encore long en raison de la redondance du discours et d'un temps
d'enregistrement encore trop long.
Une seconde façon de procéder permet d'éviter ces désavantages. Il s'agit
d'attendre 1 à 2 secondes soit l'émission de 2 à 5 mots avant de décider de
déclencher ou non l'enregistrement. Ce laps de temps est suffisant pour
apprécier si l'idée est à enregistrer ou si elle est une simple répétition d'une
phrase ou d'un segment de phrase énoncé et enregistré antérieurement.
Dans le cas ou l'enregistrement est décidé, il est alors nécessaire de
superposer à l'enregistrement en cours,les premiers mots de la phrase dont
l'absence risquerait de rendre l'idée incompréhensible. Cette pratique a
l'avantage de pouvoir éliminer les portions de discours inutiles ou redondantes.
Ainsi l'enregistrement étant plus sélectif, la durée d'écoute en sera d'autant
plus réduite. Dans ce cas, la durée d'enregistrement représente en moyenne 50
pour cent de la durée d'un cours. Ce pourcentage peut être variable en fonction
de la nature du cours. Il peut encore être plus faible pour un cours
d'informatique ou de mathématiques. Il peut être plus élevé si le cours est très
dense (préparation à un concours).
V - REDUCTION DU TEMPS DE RETRANSCRIPTION
Pour de nombreuses raisons, dont certaines peuvent être déduites des
remarques précédentes sur l'enregistrement, la retranscription d'un cours
enregistré au magnétophone est pratiquement toujours une nécessité. En effet, la
retranscription a pour but d'éliminer les bruits de fond, les portions de
discours inutiles et d'augmenter le débit de l'énoncé. Ce qui a pour conséquence
de rendre le discours plus clair et surtout considérablement moins long que le
discours d'origine. Le temps d'écoute est en moyenne de 10 à 25 pour cent de la
durée d'un cours.
La retranscription orale est plus rapide que la retranscription écrite et
plus encore que la retranscription braille. Aussi, le mode oral a été choisi ici
pour la transcription. Deux magnétophones sont nécessaires: l'un pour écouter
l'enregistrement du cours l'autre pour enregistrer la version condensée de cet
enregistrement (retranscription orale).
La retranscription consiste à écouter l'enregistrement et à répéter plus
rapidement phrase par phrase dans un second magnétophone tout en éliminant
éventuellement les segments inutiles. L'écoute d'une portion du discours,
l'arrêt du premier magnétophone, l'enregistrement sur le second, puis l'arrêt du
second pour revenir au premier, peut faire perdre beaucoup de temps dans les
manipulations. Par exemple un cours de deux heures dont la durée
d'enregistrement a pu être réduite à 50 pour 100 (voir précédemment) nécessitera
une heure d'écoute à laquelle il faut ajouter le temps d'enregistrement de la
retranscription (10 à 20 minutes) et la durée des manipulations.Ce qui conduit à
un temps de retranscription variant de une heure et demie à deux heures et quart
environ. Il convient donc de réduire au maximum la durée de la retranscription.
La durée minimale de la retranscription ne pourra pas être inférieure à la
durée de l'enregistrement à moins d'écouter celui-ci à vitesse plus rapide. Il
existe en effet des magnétophones qui permettent de faire varier la vitesse de
déroulement de la bande magnétique et permettent ainsi de réduire de 20 à 30
pour cent la durée d'écoute. Toutefois les bruits de fond enregistrés en même
temps que le cours, la superposition de la voix de l'élève et du professeur pour
le début des phrases et la nécessité d'avoir une bonne intelligibilité de
l'énoncé en vue d'une retranscription fidèle et claire,contraignent à une écoute
de la bande enregistrée à vitesse normale.
Pour réduire la durée de la retranscription, la seule solution est de
procéder à l'enregistrement de la version condensée et aux manipulations qu'elle
nécessite pendant le temps d'écoute du cours enregistré. Avec un peu
d'entraînement cela est tout à fait possible et a été effectué pour tous les
cours enregistrés entre 1982 et 1987 (psychologie, mathématique, informatique,
physiologie).
En effet pendant un cours le débit de la parole (même s'il varie beaucoup
selon les locuteurs) est en général très lent. Il est donc possible de suivre le
cours enregistré à l'aide d'un écouteur et dans le même temps, il est possible
d'énoncer plus rapidement dans un second magnétophone les portions de discours
qu'il est souhaitable de conserver. Un doigt posé sur la touche marche-arrêt de
ce second magnétophone, permet de stopper l'enregistrement chaque fois qu'il est
nécessaire d'attendre la phrase suivante.
En conséquence la durée de la retranscription sera réduite à la durée
d'écoute du cours enregistré, réduit lui- même de 50 pour 100 et parfois plus
par rapport à la durée du cours d'origine. Seuls, des retours en arrière, lors
de l'écoute du cours enregistré par suite d'une mauvaise intelligibilité,
pourraient allonger ce temps de retranscription.
Pour favoriser un bon enregistrement du cours et minimiser les bruits de
fond, il convient de se placer le plus près possible du locuteur et de faire
ainsi écran entre les "murmures des bavards" et le discours du professeur.
Dans certaines situations de cours, nous avons pu faire une retranscription
orale immédiate pendant le cours et ainsi économiser de longues heures de
retranscription. Les cours propices à une telle pratique se déroulent en général
en amphithéâtre où la dictée orale, c'est-à-dire la répétition dans le
microphone des portions de discours sélectionnés, ne peut gêner les autres
auditeurs. Cette condition est en fait comparable à celle d'un journaliste en
situation de transcription directe de ses commentaires dans son microphone.
Cette prise de note orale au magnétophone est très avantageuse quand
elle est possible. Elle permet en effet:
-
d'économiser le temps de la retranscription;
-
de procéder à l'analyse et à la synthèse immédiate de l'énoncé;
-
de sélectionner directement l'information et d'enregistrer
immédiatement (pendant le déroulement du cours) l'information
condensée;
-
d'ajouter à cette information des points de repères, des indices (des
commentaires de graphes par exemple), l'épellation de mots complexes ou de
noms propres etc...
-
de mettre en valeur les points essentiels et le plan du cours.
Cette forme de retranscription orale directe en situation de cours est tout à
fait comparable à la transcription écrite que pratique tout étudiant ou élève en
situation de prise de notes. Toutefois, par rapport à la prise de notes (écrite)
classique de l'élève, elle présente des avantages, mais aussi quelques
inconvénients.
La transcription orale est plus rapide que la transcription écrite et permet
donc de prendre des notes complètes et précises. Elle favorise aussi
l'adjonction de quelques brefs commentaires personnels. Cependant elle implique
une "lecture auditive" et un apprentissage auditif qui pourraient ne pas
convenir à tous les étudiants. D'autre part, ce mode de prise de notes ne
pourrait pas être utilisé par plusieurs étudiants dans une même salle de cours,
à moins de posséder des cabines d'écoute individuelles.
VI - RÉDUCTION DU TEMPS D'ÉCOUTE
L'un des buts essentiels de la prise de notes est de rassembler un maximum
d'informations dans un minimum de place, ou de temps selon le mode de
transcription afin de réduire le temps de lecture et d'écoute et donc de rendre
l'apprentis sage plus efficace.
La sélection et l'organisation des notes dépendent de nombreux facteurs liés
au récepteur (l'élève), au locuteur (le professeur), à la nature du texte émis.
Pour un thème peu familier ou inconnu de l'élève, la sélection et l'organisation
des idées à retenir seront plus difficiles que pour un thème familier. Aussi la
nécessité d'une retranscription et d'une réorganisation des notes prises
s'impose-t-elle dans de telles conditions. Une relecture ou une réécoute d'un
texte complexe en facilite grandement la synthèse. Un bon nombre d'étudiants en
première année de psychologie réorganisent leurs notes dans le but de rendre le
texte plus compréhensible, plus synthétique et donc d'un accès plus facile lors
d'une utilisation ultérieure (Sizaire et Ledru 1985).
Pour l'étudiant voyant, le plan d'un cours et les idées principales sont mis
en valeur par de nombreux artifices: soulignements, adjonction de couleurs, de
symboles, utilisation de tableau, marge, tabulation ... Pour l'étudiant aveugle,
l'écriture braille rend plus difficile le positionnement de ces indices, voire
impossible lorsqu'une adjonction doit s'effectuer après coup. Il en est de même
lors de l'écoute d'un cours enregistré.
Aussi, pour faciliter l'accès rapide à une vue d'ensemble d'un cours, il
importe d'en énoncer d'abord le plan , puis de mettre en évidence ce plan par
des indices sonores: élévation de l'intensité de la voix, modification du
débit, pause, adjonction d'un bref commentaire ...
L'expérience nous a montré qu'une relecture visuelle et "auditive" d'un cours
dont le plan est connu, peut être très rapide. Aussi lorsqu'une retranscription
est bien organisée, elle peut être lue ou écoutée à vitesse rapide.
Au magnétophone, le temps d'écoute peut être réduit en augmentant le débit de
la parole lors de l'enregistrement de la retranscription, mais aussi en
accélérant la vitesse de défilement de la bande magnétique ou en utilisant une
technique de compression de la parole. Ces méthodes et techniques seront
brièvement expliquées à la fin de ce chapitre.
Il convient de remarquer que la lecture visuelle s'adresse à une organisation
spatiale des éléments lus,alors que la lecture "tactile" et la lecture
"auditive" font appel à une organisation temporelle de ces éléments. Ces deux
derniers modes pourraient donc nécessiter un travail de mémorisation
supplémentaire ou peut être une organisation mnésique différente.
VII - CARACTÉRISTIQUES DE LA PRISE DE NOTES AU MAGNÉTOPHONE
Dans l'activité de prise de notes effectuée de façon manuelle (en noir ou en
braille), l'élève ou l'étudiant procède à une transcription plus ou moins fidèle
de ce qui est émis par le locuteur. Selon le débit du cours, les connaissances
de l'élève, la vitesse de transcription et de nombreux autres facteurs, les
notes ont un caractère plus ou moins analytique ou synthétique. Le caractère
plus ou moins synthétique des notes qui provient d'un remaniement du discours
original par transformation, adjonction, élimination de certains termes, ne peut
être de même nature dans la prise de notes au magnétophone.
En effet, lors d'un enregistrement, qu'il soit plus ou moins sélectif, ne
prenant pas en compte les phrases superflues, incomplètes ou redondantes, les
bruits, les pauses, les séquences enregistrées sont des copies fidèles des
séquences émises. C'est seulement au moment de la retranscription des notes
enregistrées (retranscription écrite ou orale à l'aide d'un second
magnétophone), que le processus de remaniement aura lieu.
D'autre part, les notes écrites ont essentiellement un caractère spatial et
visuel. L'indexation des paragraphes, sous-paragraphes, points importants
s'effectue à l'aide d'une lettre majuscule ou minuscule, d'un chiffre ou de tout
autre symbole sélectionné à cet effet. Le plan peut également être mis en valeur
par l'utilisation de marges, de soulignements, d'encadrements, de couleurs.
L'accentuation des mots ou des idées importantes utilise des procédés analogues.
Les notes enregistrées ont un caractère temporel et séquentiel. Aussi, la mise
en valeur du plan,des mots et des idées importantes, ne peut faire appel aux
mêmes processus que les notes écrites.
Toutefois par analogie, il est possible de souligner le plan et les
différents paragraphes par un commentaire oral: "premièrement",
"deuxièmement"...ou "grand A", "grand B" ou par un silence de une à deux
secondes entre les paragraphes.
Les changements de rythme, de ton ou d'intensité peuvent également être des
artifices de mise en valeur d'un enregistrement. Des étudiants aveugles adeptes
de la "lecture auditive" superposent des petits sons aigus ou des bruits divers
pour "souligner" un mot ou groupe de mots dans un enregistrement.
Dans la prise de notes à l'aide d'un magnétophone, il importe de ne pas
négliger l'orthographe et de ne pas omettre d'enregistrer l'épellation des mots
inconnus ou non familiers, des noms propres, des mots complexes afin de pouvoir
procéder à leur utilisation ultérieure de façon correcte.
Dans la mesure où le langage se développe dans le temps et implique deux
données essentielles: la durée et la succession (Postel et al. 1972), la prise
de notes au magnétophone (et écrite) nécessite une perception correcte d'une
succession dans le temps.
SECTION 2: ÉTUDE EXPÉRIMENTALE
Pour que l'élève ou l'étudiant aveugle, intégré dans une classe de voyants,
puisse suivre le rythme imposé par le débit du cours, une solution avantageuse
pourrait être l'utilisation d'une technique d'enregistrement.
Toutefois, le magnétophone classique entraîne quelques inconvénients, en
particulier la perte des premiers mots du discours enregistré. Nous avons testé
un prototype, le magnétophone à enregistrement différé qui ne présente pas ce
désavantage.
Les différentes expériences ont été réalisées avec l'aide du Centre de
Technologie Biomédicale de l'Institut National de la Santé et de la Recherche
Médicale de Lille: (C T B I N S E R M), dirigé par Y. Moschetto.
I - UNE TECHNIQUE D'AIDE À LA PRISE DE NOTES: LE MAGNÉTOPHONE
A - ENREGISTREMENT DIFFÉRÉ
Le magnétophone à enregistrement différé a été conçu par F. Steenkeste et
D.D. N'Guyen, respectivement ingénieur C N a M et chargé de recherche à l'INSERM
de Lille.
Ce système d'enregistrement permet de sélectionner des fragments de discours,
sans perdre le début de la séquence estimée intéressante.
Le principe du magnétophone à enregistrement différé repose sur l'insertion
d'un codeur, d'une mémoire digitale et d'un décodeur à modulation delta dans la
chaîne d'enregistre ment, c'est-à-dire entre le microphone et la tête enregis
treuse, (voir la vue synoptique, fig. 1).
Suivant le principe de ce matériel, avant d'être stockée sur la bande
magnétique, l'information émise par le locuteur transite dans une mémoire
dynamique, dont la capacité, réglable, peut varier de 2 à 20 secondes.
Quand l'utilisateur déclenche l'enregistrement par un simple appui sur la
touche marche-arrêt, il envoie sur la bande magnétique l'information contenue
dans la mémoire- tampon. Ainsi, selon le réglage de la capacité de la mémoire-
tampon, les quelques mots ou les quelques phrases émis avant l'appui sur le
bouton "marche" sont enregistrés. L'utilisateur a, suivant le réglage, de 2 à 20
secondes, pour décider s'il enregistre ou non, l'information émise pendant ce
laps de temps.
Cette technique permet de procéder directement à une sélection rapide de
l'information en situation de cours ou dans d'autres conditions de prise de
notes: conférence, travail de secrétariat ...
II - ÉVALUATION DU MAGNÉTOPHONE À ENREGISTREMENT DIFFÉRÉ
1 - Les expériences antérieures:
Les premières expériences furent effectuées avec des élèves de troisième,
handicapés physiques, atteints d'infirmité motrice cérébrale (I M C) qui
présentaient quelques difficultés à prendre des notes écrites (Ledru et Sizaire
1985).
À ce niveau scolaire, le professeur organisait l'activité de prise de notes
des élèves et indiquait les éléments importants à noter. La capacité de la
mémoire-tampon était réglée à 5 secondes, ne pouvant varier à cette époque
qu'entre 5 et 30 secondes.
Selon les auteurs, les élèves étaient assez capables de faire une sélection
de l'information, mais présentaient avant tout des difficultés à évaluer ce qui
pouvait être énoncé en 5 secondes.
Après apprentissage de la technique et expérimentation en situation de cours,
les auteurs avaient conclu que le magnétophone à enregistrement différé pouvait
permettre une sélection et un stockage de l'information essentielle
satisfaisants; mais les élèves devaient procéder à une retranscription du cours
pour éliminer les informations superflues et les phrases incomplètes.
2 - Évaluation du matériel à l'Université
Pendant l'année universitaire 1986-1987, nous avons expérimenté le
magnétophone à enregistrement différé en situation de cours, dans différentes
disciplines (informatique, psychologie, physiologie), afin de pouvoir tester le
matériel avec une grande variété d'énoncés.
La technique de prise de notes utilisée est celle précédemment décrite et
consiste à déclencher l'enregistre ment de façon sélective. Avec un magnétophone
classique, cette sélectivité repose sur une prédiction plus ou moins probable,
de la phrase suivante, compte tenu du contexte et de la familiarité avec le
thème et le locuteur. Avec le magnétophone à enregistrement différé, cette
sélectivité est plus objective: elle repose sur une prise de décision à partir
de ce qui a réellement été entendu entre 5 et 30 secondes, puisque l'élève ou
l'étudiant possède entre 5 et 30 secondes (selon le réglage de la mémoire
tampon) pour décider s'il enregistre ou non les paroles émises pendant ce laps
de temps.
Le débit des paroles émises lors d'un cours est souvent proche du débit des
paroles conversationnelles, qui est de l'ordre de 120 mots par minutes (Foulke
1969). Durant nos propres investigations, nous avons constaté que le débit de la
parole varie entre 100 et 180 mots par minutes selon les locuteurs et la nature
du cours. En outre, pour une même personne ce débit fluctue très sensiblement
d'un moment à l'autre de l'émission. Ainsi, rapide en début de phrase, le
professeur peut ralentir son énoncé pour suivre le rythme des étudiants.
Selon le taux de mots émis, une phrase de 10 à 15 mots peut être énoncée en 5
secondes et 4 à 6 mots peuvent être émis en deux secondes.
Lors de nos investigations, nous avons constaté combien il est difficile
d'évaluer ce qui a été "dit" en 5 secondes. Ainsi avec un réglage de la
mémoire-tampon à 5 secondes, quand l'étudiant décide d'enregistrer une phrase en
cours d'émission ou en fin d'émission, les derniers mots de la phrase précédente
sont également enregistrés. Des portions de phrases sans signification ou des
silences inutiles surchargent l'enregistrement. Elles allongent le temps
d'écoute, rendent la compréhension plus difficile et nécessitent une
retranscription du cours. Cette difficulté avait déjà été signalée dans les
études précédentes (Ledru et Sizaire 1985).
Toutefois, quand le débit du locuteur est régulier l'étudiant bien entraîné
est plus sélectif et peut tirer profit d'un temps de réflexion de 5 secondes. Il
faut cependant noter que le débit de la parole du professeur fluctue très
largement pendant le déroulement d'un cours.
En conséquence, l'utilisation de la mémoire-tampon de 5 secondes nécessite un
entraînement long et une bonne adaptation aux fluctuations du débit du
locuteur.
3 - Hypothèse théorique
Dans l'activité de prise de notes, le traitement des paroles émises par le
locuteur (le professeur) doit s'accomplir le mieux possible, il doit être précis
et rigoureux à toutes les "étapes" pour aboutir à une bonne sélection des
fragments d'énoncé à conserver ou construire rapidement une phrase synthétique
intégrant plusieurs idées informatives. Cette activité sollicite donc au maximum
la mémoire de travail.
La mémoire de travail "maintient en disponibilité immédiate les informations
reçues de la mémoire à court terme ou retrouvées de la mémoire à long terme". Le
nombre des éléments stockés en mémoire à court terme est limité. Il est
classique de citer Miller (1956) qui évalue la capacité de la mémoire à court
terme à 7 plus ou moins 2 éléments. Par ailleurs, il semblerait que sa
limitation temporelle soit environ 2 secondes (Reuchlin 1981).
Dans le traitement de l'information écrite et parlée, outre l'approche
ascendante (traitement dirigé par données) et descendante (traitement dirigé par
concepts), exposée au chapitre précédent, "l'exécutif central" serait alimenté
par deux "systèmes esclaves": l'agenda visuo-spatial (système de stockage
d'informations de type visuo-spatial) et la boucle articulatoire (Baddeley
1986). Le traitement d'un message parlé, séquentiel, code et envoie
l'information auditive dans le stock phonologique et fait appel essentiellement
à la mémoire à court terme. Pour mémoriser cette information séquentielle, après
le décodage phonétique, , tandis qu'il procède au traitement syntaxique et
sémantique, le sujet effectue "une verbalisation" de l'information reçue.
L'auditeur se répète mentalement ce qu'il entend. Ainsi pour Baddeley, ce
dispositif de boucle articulatoire entretiendrait la trace phonologique et pour
que celle-ci ne s'estompe pas une révision du matériel (répétition mentale)
s'impose. Ce codage est central et ne dépend pas obligatoirement des mécanismes
moteurs du système phonatoire.
Plusieurs auteurs ont situé la capacité temporelle de la mémoire à court
terme entre 1,5 et 2 secondes (Baddeley 1986, Hulme et al. 1984, Schweickert et
Boruff 1986 )
Dans la prise de notes, lorsqu'un auditeur écoute un locuteur, il perçoit et
décode les derniers éléments d'une phrase alors qu'il a déjà intégré en mémoire
et compris les premiers éléments. Si la capacité temporelle de la mémoire à
court terme est limitée à environ 2 secondes, et si, par conséquent, l'auditeur
est capable de gérer et mémoriser correctement environ 2 secondes d'information
parlée, nous posons l'hypothèse qu'un auditeur utiliserait avec plus de facilité
le magnétophone à enregistrement différé si la capacité de la mémoire-tampon
était réglée à 2 secondes.
À la suite de ces observations, une modification du prototype fut envisagée.
Nous avons proposé de déplacer la limite de la capacité de la mémoire-tampon
vers des valeurs plus petites (2 secondes) et d'éliminer les valeurs les plus
élevées (20 et 30 secondes).
Avec la collaboration de l'I N S E R M, les modifications du prototype
permettaient désormais de régler sélectivement la capacité de la mémoire-tampon
selon quatre degrés de variation: 2, 5, 10 ou 15 secondes.
Dès lors, nous avons sélectionné alternativement un réglage de 2 ou de 5
secondes pour la suite de notre étude expérimentale.
4 - Résultats expérimentaux en situation de cours
Nous avons procédé à une prise de notes en situation de cours dans trois
disciplines différentes: informatique, physiologie, psychologie. Nous avons
utilisé un magnétophone classique (Sony, type TCM-6DX) et le magnétophone à
enregistrement différé (prototype) avec une capacité de la mémoire-tampon réglée
à 2 secondes.
Dans notre étude à visée essentiellement exploratoire, la prise de notes
aidée par l'enregistrement classique ou différé, a pour objectif principal la
sélection de toutes les phrases susceptibles de contenir un élément descriptif
ou explicatif nouveau, associé au thème du cours. La prise de notes aidée par
l'enregistrement étant de nature séquentielle, analytique, l'unité
d'enregistrement considérée est la phrase: l'appareil démarre dès le début
d'une phrase, pour le magnétophone classique, après 2 secondes d'écoute et de
réflexion pour le magnétophone à enregistrement différé. La fin de la phrase
coïncide avec l'arrêt des appareils.
La durée de l'enregistrement de chaque cours, le temps passé à sa
retranscription et le temps d'écoute du ré-enregistrement sont chronométrés en
minutes (voir tableaux 1, 2 et 3).
L'économie (E) moyenne de la durée d'écoute, après enre gistrement sélectif
et "retranscription" enregistrée a été calculée pour chaque discipline:
E=((T-t):T)*100 T représente la durée totale du cours et t, la durée totale de
la retranscription enregistrée.
La durée d'écoute de la retranscription enregistrée est calculée également en
pourcentage par rapport à la durée totale du cours pour chaque discipline: d
=100-E
Dans les tableaux 1, 2, 3, les * signalent que ces cours ont été enregistrés
avec le magnétophone à enregistrement différé.
Note des tableaux:
(1): durée de l'enregistrement du cours en minutes
(2): durée de la prise de note enregistrée en minutes
(3): durée de la retranscription du cours en minutes
(4): durée de la retranscription enregistrée en minutes
TABLEAU 1: cours d'informatique
|
1
|
2
|
3
|
4
|
cours 1
|
180
|
78
|
110
|
17
|
*cours 2
|
180
|
75
|
100
|
15
|
cours 3
|
180
|
|
|
14
|
*cours 4
|
240
|
90
|
125
|
27
|
Total
|
780
|
|
|
73
|
* Réduction du temps d'écoute (E) = 90,64 %; (d) =9,26 %.
TABLEAU 2: cours de physiologie
|
1
|
2
|
3
|
4
|
cours 1
|
130
|
74
|
115
|
28
|
*cours 2
|
180
|
105
|
120
|
45
|
cours 3
|
180
|
90
|
135
|
34
|
*cours 4
|
180
|
115
|
120
|
52
|
Total mn
|
670
|
384
|
490
|
159
|
* Réduction du temps d'écoute (E) = 76,27 %; (d) = 23,73 %.
TABLEAU 3: cours de psychologie expérimentale
|
1
|
2
|
3
|
4
|
cours 1
|
120
|
72
|
115
|
22
|
*cours 2
|
120
|
82
|
85
|
28
|
cours 3
|
120
|
62
|
65
|
19
|
*cours 4
|
120
|
50
|
60
|
15
|
Total
|
480
|
266
|
325
|
84
|
* Réduction du temps d'écoute (E) 82,5%; (d) = 17,5%.
Les résultats sont distingués en trois catégories:
-
les résultats relatifs à la réduction du temps d'écoute de la
retranscription enregistrée (E et d);
-
ceux relatifs à la charge de travail supplémentaire occasionnée
par la retranscription;
-
ceux relatifs à la comparaison des enregistrements avec les deux
magnétophones (classique et prototype).
Les deux premières catégories de résultats sont princi palement de nature
quantitative et s'expriment en unité de temps (minutes pour T, t ) et en
pourcentage (E, d).
La troisième est à la fois de nature quantitative et qualitative.
A - PREMIÈRE CATÉGORIE DE RÉSULTATS: voir tableau 4
TABLEAU 4
(Récapitulation des tableaux 1, 2 et 3)
Discipline
|
T
|
t
|
E
|
d
|
|
|
|
|
|
Informatique
|
780
|
73
|
90,64
|
9,26
|
Physiologie
|
660
|
159
|
76,27
|
23,73
|
Psychologie
|
480
|
84
|
82,50
|
17,50
|
Ces résultats montrent que le temps d'écoute de la retranscription
enregistrée représente 10 à 25 pour cent de la durée totale du cours.
Cette réduction du temps d'écoute de la retranscription peut dépendre de
plusieurs facteurs:
-
la nature du cours; certaines matières nécessitent plus de
démonstrations et de graphiques, de tableaux que d'autres et dans ce
cas le temps de paroles est réduit;
-
la méthode du professeur; si le professeur écrit un maximum de
données au tableau, le temps de paroles est plus faible;
-
la densité du cours;
-
la vitesse d'élocution du professeur;
-
la sélectivité de l'étudiant...
b - DEUXIÈME CATÉGORIE DE RÉSULTATS: voir tableau 5
TABLEAU 5
(durée du travail de retranscription)
Discipline
|
T (mn)
|
1 (mn)
|
2 (mn)
|
3 (%)
|
4 (%)
|
|
|
|
|
|
|
Informatique
|
600
|
243
|
335
|
40,50
|
55,83
|
Physiologie
|
670
|
384
|
490
|
57,31
|
73,13
|
Psychologie
|
480
|
266
|
325
|
55,41
|
67,70
|
|
|
|
|
|
|
Dans le tableau 5, les colonnes T, 1 et 2 exprimées en minutes représentent
le total des colonnes 1, 2 et 3 des tableaux 1, 2 et 3, respectivement pour
chaque discipline.
Les colonnes 3 et 4 exprimées en pourcentage, représentent les pourcentages
des colonnes 1 et 2 par rapport à la durée totale T des différents cours.
Ces résultats montrent que la durée d'écoute de l'enregistrement sélectif
d'un cours représente en moyenne 50 pour 100 de la durée totale du cours
(colonne 3). En conséquence, la durée de la retranscription (temps d'écoute de
l'enregistrement auquel s'ajoute la durée des manipulations de
ré-enregistrement) représente en moyenne 65 pour 100 de la durée totale d'un
cours.
c - TROISIÈME CATÉGORIE DE RÉSULTATS: voir tableau 6
TABLEAU 6
|
Magnétophone classique
|
|
Prototype
|
Discipline
|
1
|
2
|
3
|
|
1
|
2
|
3
|
|
|
|
|
|
|
|
|
Informatique
|
43,3
|
61,1
|
8,6
|
|
39,3
|
53,6
|
10,0
|
Physiologie
|
52,9
|
80,6
|
20,0
|
|
61,1
|
66,7
|
26,9
|
Psychologie
|
50,8
|
72,9
|
15,4
|
|
60,0
|
62,5
|
19,6
|
Le tableau 6 rassemble les résultats des tableaux 1, 2 et 3 calculés en
pourcentage par rapport à la durée totale des différents cours, en séparant les
résultats obtenus avec le magnétophone classique et le magnétophone à
enregistrement différé.
Les colonnes 1 du tableau 6 indiquent la durée moyenne de l'enregistrement
(en pourcentage) par rapport à la durée du cours pour chaque discipline. La
durée de l'enregistrement est en général plus longue avec le prototype qu'avec
le magnétophone classique. Après analyse du contenu des enregistrements, cette
différence correspond au fait que les phrases sont entières avec le prototype,
tandis qu'elles sont incomplètes avec le magnétophone classique.
Les colonnes 2 indiquent le temps nécessaire pour effectuer le
ré-enregistrement du cours en pourcentage par rapport à la durée totale du cours
pour chaque discipline. Le temps mis pour le travail de ré-enregistrement est
inférieur avec le prototype qu'avec le magnétophone classique.En effet, les
phrases complètes, sans superposition de données, enregistrées avec le
prototype, ne nécessitent pas des retours en arrière et des réécoutes répétées
comme l'exige l'enregistrement avec le magnétophone classique.
Les colonnes 3 indiquent la durée d'écoute des ré-enregistrements (en
pourcentage par rapport à la durée totale du cours) obtenus à partir des
enregistrements avec le magnétophone classique ou le prototype. Ces durées sont
en général légèrement supérieures pour les retranscriptions effectuées avec les
enregistrements du prototype.
Une analyse qualitative des enregistrements a été effectuée afin de préciser
les avantages ou inconvénients des deux types de matériel (voir discussion).
Considérant la phrase comme unité de base, cette analyse qualitative évalue
l'intégrité des phrases enregistrées, la cohérence et la coordination des idées
successives et enfin relève les segments de phrases ou de mots inutiles
susceptibles de gêner la cohérence ou la compréhension de l'enregistrement.
4 - Discussion et caractéristiques de la prise de notes avec le
magnétophone à enregistrement différé:
Les résultats quantitatifs de cette première étude exploratoire ont souligné
quelques différences entre les deux techniques de prise de notes utilisant le
magnétophone classique et le magnétophone à enregistrement différé. Une analyse
qualitative des enregistrements a permis d'expliquer et de compléter ces
résultats.
Avec le magnétophone à enregistrement différé, dont la mémoire-tampon
est réglée à 2 secondes, trois avantages notables ont été remarqués:
-
la possibilité de sélectionner des phrases complètes dans un
discours;
-
la possibilité de "recopier" plus rapidement (tableau 5 et 6) un
enregistrement plus "propre", sans sur-ajout de données
complémentaires;
-
la possibilité d'obtenir un enregistrement et un ré-enregistrement
condensé légèrement plus long (tableau 4 et 6) mais plus complet qu'avec le
magnétophone classique.
En outre, nous avons constaté que 2 secondes de délai (réglage de la
mémoire-tampon) permettent de s'adapter plus facilement à la fluctuation du
débit du locuteur qu'un délai de 5 secondes.
C'est probablement parce que ce délai de 2 secondes est mieux adapté à la
capacité de la mémoire de travail de l'utilisateur (environ 2 secondes) que son
emploi est plus aisé (voir les expériences suivantes).
Des entrevues avec des étudiants voyants ont permis de souligner qu'un
décalage de 2 secondes environ par rapport à l'émission du professeur leur
permet de s'adapter avec souplesse au rythme du discours. Si le délai entre ce
qui est entendu et ce qui est écrit dépasse 2 secondes l'étudiant prend le
risque d'oublier et d'omettre des informations. Si le délai est trop court,
l'étudiant prend le risque de noter une information redondante ou inutile.
Pour prolonger l'analogie entre la prise de notes écrites et enregistrées,
quelques remarques supplémentaires s'imposent .
En situation de prise de notes écrites ou enregistrées, les étudiants sont
confrontés à deux tâches majeures qui font appel à la fois à l'attention, la
perception et la mémoire. L'attention est indispensable à une bonne perception
et une rétention efficace des informations à noter ou à enregistrer. La décision
de noter ou de ne pas noter doit être prise le plus rapidement possible, sous
peine de ne pouvoir conserver en mémoire à court terme, les éléments que
l'étudiant souhaite écrire ou enregistrer(au moment où il déclenche
l'enregistrement).
Cette phase est occupée par une répétition immédiate écrite ou verbale
impliquant l'intelligibilité des mots. Cette première tâche, avant tout motrice
et automatique, demande une certaine attention, mais ne nécessite pas de gros
efforts de réflexion.
La seconde tâche accompagne la première: elle implique les mécanismes de
l'attention, de la mémoire à court terme et à long terme et des processus
cognitifs. Il importe en effet de comprendre le discours et d'effectuer un
travail de réflexion afin d'évaluer la portée des idées énoncées pour les
intégrer aux connaissances antérieures.
"Il y a conflit entre les efforts à faire pour se souvenir des informations
arrivées il y a quelques instants et les processus impliqués dans la
compréhension des données sensorielles qui nous parviennent à l'instant
même...Dans un cours magistral, le fait de réfléchir à ce qui vient tout juste
d'être dit, empêche d'être entièrement attentif à ce qui se dit au moment même.
Ce conflit est attribuable aux limites de de la capacité humaine pour le
traitement de l'information." (Lindsay et Norman 1980)
Dans la prise de notes aidée par l'enregistrement, une partie de l'attention
peut être libérée au profit d'un effort accru dans la compréhension de l'énoncé
à condition de maintenir une écoute active.
III - ÉTUDE EXPÉRIMENTALE AVEC DES ÉLÈVES DE QUATRIÈME
1 - Objectif et problématique:
Pendant le dernier trimestre de l'année scolaire 1986-1987, une étude
exploratoire fut entreprise avec des élèves de quatrième de l'Ecole pour la
Réadaptation des Déficients Visuels (E R D V ) de Loos.
L'objectif, essentiellement exploratoire de cette expérience, est d'évaluer
la capacité des collégiens aveugles ou amblyopes, à utiliser le magnétophone à
enregistrement différé pour la prise de notes en situation de cours.
Dans cette perspective, et compte tenu des études antérieures
effectuées dans ce domaine (Ledru et Sizaire, 1985), trois questions
principales sont à considérer:
-
les collégiens et les lycéens aveugles et amblyopes sont-ils
capables d'effectuer une sélection de l'information avec ce système
de prise de notes?
-
quelle sera la qualité des notes enregistrées avec ce matériel?
L'enregistrement ne comportera-t-il pas trop de fragments de phrases
qui pourraient nuire à la cohérence du discours et empêcher une
bonne compréhension des notes enregistrées?
-
le temps d'écoute de l'enregistrement sera-t-il suffisamment
réduit pour permettre une économie de temps appréciable aux
réécoutes ultérieures?
Si les réponses à ces trois interrogations sont affirmatives, est-il
alors possible, pour les élèves déficients visuels, d'utiliser
directement, sans retranscription les notes enregistrées pour un
apprentissage ou des révisions ultérieures?
Dans les classes de quatrième, en général, c'est le professeur qui gère
l'activité de prise de notes. L'enseignant donne le plan à suivre; il signale
les idées importantes à noter et les détails superflus à ne pas noter. Des
observations dans des Collèges d'Enseignement Général ont montré que la quantité
minimale d'information que le professeur souhaite voir dans les notes des
élèves, à la fin d'une heure de cours, peut être consignée sur 4 à 6 minutes
d'enregistrement (Ledru et Sizaire, 1985).
Ainsi, quand les élèves sont suffisamment sélectifs, il est possible de
réduire de façon considérable le temps d'écoute de l'enregistrement des
informations essentielles du cours.
Pour une capacité de la mémoire-tampon de 2 secondes, les élèves de quatrième
aveugles et amblyopes seront-ils capables de sélectionner et d'enregistrer les
phrases principales d'un cours? Ces phrases seront-elles complètes et intégrées
dans l'enregistrement d'un discours global cohérent?
2 - Entrevues avec les élèves et le professeur principal:
Deux entrevues (d'une durée de trois heures au total), avec 6 élèves de
quatrième aveugles et amblyopes et leur professeur principal, ont permis de
souligner les difficultés auxquelles les enfants déficients visuels doivent
faire face dans l'activité de prises de notes.
Selon les professeurs, tous les élèves déficients visuels sont confrontés de
façon plus ou moins cruciale, à des problèmes pendant cette activité.
Le plan, les idées essentielles et le résumé sont dictés par le professeur.
Les amblyopes, capables de se relire utilisent un crayon; les autres et les non
voyants utilisent la tablette et le poinçon. Le professeur attend les élèves les
plus lents: en général ceux qui ne sont pas encore bien familiarisés avec le
braille abrégé. En effet l'écriture braille intégrale nécessite plus de temps
que l'écriture avec le stylo. L'enseignant souligne aussi la difficulté pour
corriger ou ajouter un mot en braille et la lenteur pour retrouver un mot dans
une page écrite.Il note également le problème pour représenter des détails dans
un schéma en relief.
Cette lenteur dans l'activité de prise de notes est d'autant plus gênante que
la matière étudiée nécessite la notation d'un plus grand nombre d'informations:
français, sciences humaines, sciences naturelles par exemple.
Les 6 collégiens sont volontaires pour participer à l'expérience.
Les trois prototypes sont mis à la disposition de trois collégiens; le
quatrième reçoit un magnétophone classique et effectue en tant que sujet
contrôle les mêmes séances d'entraînement que les sujets expérimentaux. Les deux
autres élèves,l'une amblyope, écrivant en noir, l'autre aveugle très habile en
écriture braille assistent en spectateurs à la première séance d'apprentissage
de leurs camarades.
La moyenne d'âge des quatre élèves: 3 sujets expérimentaux (2 filles, l'une
aveugle, l'autre amblyope et 1 garçon aveugle), 1 sujet contrôle (fille), est de
14 ans 6 mois, avec une variation s'échelonnant entre 12 ans 9 mois et 15 ans 9
mois.
L'histoire de la déficience visuelle varie beaucoup d'un sujet à l'autre. Les
résultats scolaires de ces élèves sont très différents et selon l'appréciation
des professeurs cet ensemble comprend à peu prés tous les niveaux de réussite:
bon, assez bon, moyen et faible.
3 - Les deux séances d'apprentissage:
Deux séances d'apprentissages et d'entraînement sont organisées dans le but
de faire comprendre le principe du matériel d'une part, et la manière d'utiliser
l'enregistrement différé en situation de prise de notes, d'autre part.
Chaque séance, d'une durée d'une heure comporte plusieurs séries d'exercices
destinés à apprendre à segmenter le discours en séquences pré-déterminées et à
sélectionner les segments à enregistrer.
Quelques exemples d'exercices:
-
dans une suite de chiffres de 1 à 50, enregistrer les chiffres entre
20 et 30 et la portion entre 35 et 45.
-
dans la suite de chiffres et de lettres suivante: a B C D E 1 2 3 4 5
F G H I J 6 7 8 9 10 K L M N O 11 12 13 14 15 P Q R S T 16 17 18 19 20 U V W
X Y 21 22 23 24 25, enregistrer uniquement les chiffres.
-
dans la suite précédemment décrite, enregistrer
-
uniquement les lettres.
-
dans la suite de chiffres et de lettres suivantes: 1 2 3 a B C D E F
G 4 5 6 H I J 7 8 9 K L M N 10 11 12 13 O P Q 14 15 16 17 R S T U V 18 19 20
W X Y Z, enregistrer toutes les lettres, puis tous les chiffres.
-
dans une comptine dans laquelle un vers est répété plusieurs fois,
enregistrer uniquement ce vers: dans notre exemple, "La biche brame au
clair de lune".
Ces exercices sont distribués dans un ordre de difficulté croissante. Dans la
première séance, la capacité de la mémoire-tampon est réglée sur 2 secondes.
Dans la deuxième séance, cette capacité est réglée sur 5 secondes.
Les observations effectuées durant ces deux séances d'entraînement, ont
permis de déterminer les conditions de l'expérimentation en situation de cours.
En effet, l'apprentissage est nettement plus facile lorsque la mémoire-tampon
est réglée à 2 secondes que lorsqu'elle est réglée à 5 secondes. a 2 secondes,
les trois sujets expérimentaux réussissent dés les premiers essais, à
enregistrer les séquences sélectionnées, avec parfois un mot superflu; mais
très rapidement, et souvent dés le deuxième ou troisième essai, l'enregistrement
demandé est parfait.
En ce qui concerne le sujet-contrôle, les résultats sont éloquents. Sauf pour
les séquences pour lesquelles l'élève peut s'attendre à ce qui suit (suite
croissante de chiffres, séquences alternées et régulières de chiffres et de
lettres), pour lesquelles le sujet-contrôle peut anticiper la suite du discours
et obtenir un enregistrement convenable, pour les exercices plus difficiles,
(portions non prévisibles, phrase), les segments enregistrés sont incomplets. Il
manque, dans ce cas un ou deux mots selon la vitesse de l'enregistrement.
Avec une mémoire-tampon de 5 secondes, l'apprentissage est plus difficile. Il
semblerait que les collégiens aient des difficultés à évaluer ce qui peut être
énoncé en 5 secondes et surtout à situer à postériori la portion du discours par
rapport à la séquence temporelle de 5 secondes. Si bien, qu'en général, les
sujets déclenchent trop tôt le système et les quelques mots (2 à 5) qui
précédent le début de la phrase sélectionnée sont enregistrés. a la réécoute ces
fragments de phrases rendent l'énoncé moins cohérent et surtout moins
compréhensible et cela d'autant plus que le thème de l'enregistrement est peu
familier à l'auditeur.
Afin que les notes enregistrées puissent être réutilisées directement par
l'élève, il est souhaitable d'éviter l'adjonction de ces portions de discours
inutiles . Pour cela, un entraînement plus long serait nécessaire.
En raison des conditions de déroulement des cours dans lesquelles le
professeur signale aux élèves les informations à noter, la capacité de la
mémoire-tampon est réglée à 2 secondes pour la suite de l'expérimentation.
4 - Expérimentation en situation de cours:
En accord avec le directeur de l'établissement, pour éviter toute
perturbation des élèves dont l'emploi du temps est extrêmement chargé, l'étude
expérimentale s'est déroulée pendant les deux derniers cours de géographie de
l'année scolaire.
Après avoir introduit le sujet du cours, (Le tourisme sur la côte
méditerranéenne), l'enseignante expose de façon détaillée la première partie du
cours; elle donne des explications complètes des mots difficiles, aide les
élèves à trouver les points de repères sur des cartes grand format pour les
amblyopes, en relief pour les aveugles. Le cours est divisé en plusieurs grands
points, à la fin des explications données pour chacun d'entre eux, le professeur
dicte les idées principales à retenir. Elle lit une phrase complète, puis
reprend cette phrase par bribes et à plusieurs reprises jusqu'à ce que les
élèves les plus lents aient fini de noter.
Le professeur dicte ensuite la phrase suivante selon le même procédé.
Plusieurs idées, titres et sous-titres sont ainsi énoncés, parfois épelés pour
les mots difficiles et les noms propres. Le paragraphe suivant est alors
expliqué et le résumé dicté. Pour l'élève, le déroulement du cours comporte donc
des phases d'écoute alternant avec des phases de prise de notes (dictées).
Les collégiens participant à l'expérience ont pour consigne d'enregistrer
uniquement ce qu'ils noteraient et ce que doivent noter leur camarades (en noir
ou en braille) pour apprendre le cours. Il leur est conseillé de ne pas prendre
de mots superflus qui allongeraient le temps d'écoute inutilement.rappelons que
la durée d'un cours est de 1 heure.
5 - Les résultats:
Pour cette étude exploratoire, ne comportant que deux séances de cours,
seules, la mesure de la durée de l'enregistrement pour chacun des élèves et
l'analyse qualitative du contenu de chaque enregistrement, sont effectuées.
Le tableau 7 présente la durée d'écoute des notes enregistrées par les trois
sujets expérimentaux avec les magnétophones à enregistrement différé et par le
sujet contrôle avec le magnétophone classique.
TABLEAU 7
|
cours 1
|
cours 2
|
|
en minutes et secondes
|
*sujet 1
|
3 mn 40 s
|
3 mn 00 s
|
*sujet 2
|
4 mn 20 s
|
3 mn 02 s
|
*sujet 3
|
4 mn 00 s
|
3 mn 05 s
|
*sujet 4
controle
|
3 mn 30 s
|
2 mn 47 s
|
Le tableau 7 montre que la durée de d'écoute des notes enregistrées par les
élèves varie légèrement pour les trois sujets utilisant un prototype (noté par
*), mais cette durée est nettement inférieure pour les notes enregistrées par
l'élève contrôle avec le magnétophone classique (sujet 4).
L'analyse qualitative du contenu des enregistrements explique cette
variation.
En effet, les sujets expérimentaux ont tous enregistré des phrases complètes.
Ces sujets ont été sélectifs et ont essayé de réduire le temps d'enregistrement
au minimum. Toutefois, le sujet 1 a omis d'enregistrer le plan du premier cours: titre des paragraphes, les a, b, c, des sous-titres. Ce sujet n'a pas
enregistré volontairement l'épellation de certains mots (qu'elle connaissait
pour certains d'entre eux). Ces omissions volontaires ou non expliquent la durée
plus faible de l'enregistrement par rapport à la durée des enregistrement des
sujet 2 et 3.
Malgré ces quelques omissions,les notes enregistrées par les trois sujets
expérimentaux (enregistrement parfait pour le second cours), peuvent être
utilisées directement et ne nécessitent pas de retranscription, les points
essentiels de l'énoncé étant enregistrés intégralement et le discours étant
parfaitement cohérent.
En ce qui concerne le sujet contrôle,qui déclenche l'enregistrement dès les
premières paroles, un à deux mots sont souvent perdus en début de phrase.
Citons quelques exemples de mots "perdu": des articles (un, le, des ...), le
mot "après" dans la phrase "Après la seconde guerre mondiale", le mot "soixante"
dans "soixante dix millions d'européens.."; "mille neuf cent trente" dans "mille
neuf cent trente six: les congés payés.."
Pour réutiliser ces notes, une retranscription avec corrections et
compléments d'information s'impose.
6 - Discussion et conclusion:
Pendant le premier cours, les sujets se sont attachés à sélectionner
l'information qu'ils enregistrent, considérant comme unité de base la phrase.
Les trois collégiens qui ont à leur disposition un magnétophone à enregistrement
différé, réussissent parfaitement cette tâche, tandis que l'élève qui possède un
magnétophone classique doit procéder à une retranscription pour corriger et
compléter les notes enregistrées.
En effet, les pertes répertoriées dans le contenu de l'enregistrement de
l'élève-contrôle ne sont pas négligeables.
Quand les mots "perdus" sont des articles, des mots d'introduction, de
coordination ou de liaison, la signification de la phrase n'est pas trop
perturbée du moins dans les cas rencontrés et la perte d'information est
minimale. Mais quand les mots placés en début de phrase expriment une
information importante (date, lieu, nombre, complément de temps...) ou modifient
le sens d'une phrase, leur élimination ne peut être sans conséquence sur la
compréhension et la cohérence de la suite du discours.
Avant le déroulement de la deuxième séance de cours, nous avons donné une
appréciation sur le premier enregistrement à chacun des sujets. Nous avons
également insisté sur l'importance des indices de plan dans l'organisation et la
classification des idées de tout énoncé. Deux des sujets avaient en effet
volontairement omis d'enregistrer les indices du plan et parfois même les titres
(sujet 1 et sujet contrôle 4).
Pendant le second cours, l'attention de tous les élèves s'est portée à la
fois sur l'énoncé des phrases et du plan.
Cette mise au point explique l'excellente qualité de l'enregistrement obtenu
par les sujets expérimentaux pour le deuxième cours.
L'élève contrôle, a également bénéficié de ces nouvelles indications et
l'effet de l'exercice a modifié ses stratégies d'enregistrement et diminué son
temps de réaction (temps entre le début d'une phrase à enregistrer et le
déclenchement de l'enregistrement). Toutefois, pour être utilisables, les notes
enregistrées nécessitent encore quelques compléments d'information (nom de
villes, par exemple). Ces quelques pertes d'information expliquent la différence
de 18 à 23 secondes entre la durée des notes enregistrées par ce sujet contrôle
et la durée d'écoute des enregistrements des sujets expérimentaux.
Les résultats de cette expérience présentent un intérêt pour l'étude des
possibilités d'aide à la prise de notes chez les déficients visuels.
Dans cette classe de quatrième, où les informations essentielles sont dictées
aux élèves, la prise de notes au magnétophone est relativement facile dans la
mesure où le professeur prévient "maintenant vous pouvez notez". Ainsi avec un
élève bien exercé et quelques compléments d'informations, le magnétophone
classique pourrait être une aide à ne pas négliger pour l'enfant aveugle
accidentel qui ne peut maîtriser le braille avant une longue période
d'adaptation ou pour tout enfant déficient visuel ayant des difficultés dans la
pratique de l'écriture braille.
La supériorité du magnétophone à enregistrement différé sur le magnétophone
classique réside dans sa capacité à mémoriser l'information pendant 2 secondes,
lui attribuant ainsi une véritable "capacité d'anticipation" dont est dépourvu
le magnétophone classique.
IV - EXPÉRIENCE AVEC DES LYCÉENS
1 - Objectif et problématique:
Si, dans les petites classes, c'est l'enseignant qui dirige l'activité de
prise de notes, peu à peu les élèves doivent accroître leur autonomie dans ce
domaine. Ainsi, dès la seconde, et parfois plus tôt (selon les établissements),
les lycéens doivent sélectionner l'information, c'est-à-dire choisir dans le
discours du professeur, les éléments essentiels et pertinents qui se rapportent
à un thème donné et qui leur seront utiles pour pouvoir apprendre et restituer
cette information.
En outre la quantité d'information à prendre en compte, ne se réduit plus à 4
ou 5 minutes de notes par heure de cours et le débit du professeur est plus
rapide.
À partir de la seconde, un bon nombre d'adolescents aveugles et amblyopes
sont intégrés dans des classes de voyants et sont forcés de s'adapter au mieux
au rythme imposé par le professeur lui-même guidé par le niveau moyen de
l'ensemble de la classe.
Compte tenu de ces contraintes supplémentaires: quantité et qualité
de l'information à respecter, rythme plus rapide à suivre, le lycéen
aveugle intégré dans une classe de voyants pourrait-il bénéficier de
l'aide de l'enregistrement dans l'activité de prise de notes?
Pour évaluer cette possibilité, nous nous sommes placés dans des conditions
expérimentales plus difficiles qu'en situation de cours.
En effet, dans notre situation expérimentale, le débit de la parole du
locuteur est plus élevé que le débit moyen de parole d'un professeur, et pour
les deux premières séances les thèmes proposés sont totalement inconnus des
adolescents.
Dans de telles conditions, le magnétophone à enregistrement différé
permet-il d'effectuer une sélection correcte de l'information?
-
les phrases enregistrées par les lycéens sont-elles complètes et
contiennent-elles l'information principale?
-
les fragments de phrases et les informations superflues sont-ils
réduits au minimum?
-
les notes enregistrées mènent-elles à un discours cohérent et
compréhensible permettant une utilisation directe de l'enregistrement pour
une réécoute ou un apprentissage ultérieur.
2 - Entrevues avec les lycéens et le conseiller d'éducation
Des rencontres avec des lycéens aveugles et amblyopes du lycée polyvalent de
Beaupré à Haubourdin, sont organisées dans le but de mettre en évidence les
difficultés éventuelles des déficients visuels pour s'adapter au rythme des
voyants.
Plusieurs entretiens avec 6 lycéens , deux filles et trois garçons en classe
de seconde, un garçon en terminale, ont rapidement orienté les investigations
dans le domaine de l'acquisition de l'information.
En effet, les adolescents apprennent rapidement à s'orienter dans
l'établissement seuls et à acquérir une autonomie totale de déplacement. La
communication avec les professeurs et leurs camarades voyants est relativement
aisée et dépend avant tout de la personnalité des uns et des autres. Les
principales difficultés des lycéens non voyants résident donc dans l'accès à
l'information.
En raison de la lenteur de l'écriture braille pour certains aveugles et des
difficultés à se relire, rencontrées par quelques lycéens amblyopes, les lycéens
déficients visuels sont tous plus ou moins confrontés aux problèmes posés par la
prise de notes. En général, ils sont amenés à compléter leurs informations, le
soir, dans le collège spécialisé qui les héberge. En outre, ce collège met à
leur disposition les aides techniques et matérielles nécessaires à la
transcription en braille de textes imprimés (énoncés de devoirs, sujets de
contrôle...). Des séances de soutien et d'aide sont dispensées par une
éducatrice spécialisée.
Des professeurs signalent que la prise de notes avec la tablette braille est
assez bruyante quand plusieurs élèves aveugles sont placés dans une même salle
de cours.
Les lycéens soulignent que les matières présentant le plus de difficultés
concernant la prise de notes sont le français, les sciences humaines et les
sciences naturelles.
3 - Les séances d'apprentissage:
À la suite des entretiens, 6 lycéens ont accepté d'expérimenter le
magnétophone à enregistrement différé. Ces adolescents n'avaient pas eu de
problèmes d'audition, mais n'avaient jamais utilisé le magnétophone pour
travailler: prendre des notes ou apprendre un texte. Certains avaient utilisé
l'enregistrement pour écouter des romans.
Pendant la première séance d'apprentissage, nous suggérons aux lycéens la
possibilité de prendre des notes à l'aide d'un magnétophone . Les réactions sont
assez variées.
Pour certains, cette idée leur semble totalement dépourvue de vraissemblance
et au mieux assez difficile à réaliser; pour d'autres c'est une idée originale
qu'ils aimeraient tenter, mais ils craignent que les enseignants ne soient pas
d'accord pour être enregistrés; pour d'autres enfin l'enregistrement pourrait
être d'une grande utilité et faire gagner beaucoup de temps, mais ils se
demandent s'il est aussi facile d'apprendre en écoutant les notes enregistrées
qu'en lisant (tactilement ou visuellement) les notes écrites.
Malgré des avis partagés, les six adolescents volontaires sont très
intéressés par l'expérience. L'histoire du handicap, les difficultés rencontrées
et le niveau de réussite scolaire sont très variables selon les sujets.
Pendant la première séance d'apprentissage, le principe du magnétophone à
enregistrement différé est expliqué et les exercices décrits antérieurement sont
effectués, la mémoire- tampon étant d'abord réglée à 2 secondes, puis à 5
secondes.
Pendant la seconde séance, l'entraînement est complété pour le réglage de la
mémoire-tampon à 5 secondes. En effet si la maîtrise du matériel est acquise
très rapidement avec la mémoire-tampon réglée à 2 secondes, cette acquisition
nécessite un apprentissage plus long avec 5 secondes.
Les différentes étapes de l'expérimentation sont décrites en partie et les
tâches qui seront à effectuer sont expliquées en détail dès cette seconde
séance.
4 - Expérimentation en laboratoire:
a - Les sujets:
Les trois sujets expérimentaux, deux garçons aveugles et un garçon amblyope
et le sujet contrôle (une fille amblyope) ont une moyenne d'âge de 17 ans,
s'échelonnant entre 16 ans et 18 ans 3 mois.
Ces quatre adolescents fréquentent deux classes de secondes avec des lycéens
voyants. Pour l'un d'entre eux (aveugle) les résultats scolaires sont bons, pour
les trois autres moyens (appréciation donnée par le conseiller d'éducation).
b - Le matériel:
Les trois sujets expérimentaux ont chacun à leur disposition un magnétophone
à enregistrement différé et le sujet contrôle utilise un magnétophone classique
dont les facilités d'accès et de manipulation sont équivalentes à celles des
prototypes.
Quatre textes sont enregistrés sur cassette à l'aide d'un
magnétophone Sony:
-
les deux textes a et B sont lus par une même voix masculine dont le
débit de la parole est en moyenne de 110 mots par minutes.
-
les deux textes C et D sont lus par une autre voix masculine dont le
débit de la parole est en moyenne de 120 mots par minute (débit de la parole
conversationnelle).
Les enregistrements a (Les bonzai) et B (Le chant des oiseaux) sont obtenus à
partir d'articles de la revue"ça m'intéresse" (respectivement numéros 50 d'Avril
1985 et 65 de Juillet 1986). La revue et les informations contenues dans ces
articles ne sont pas connues par les adolescents.
Les enregistrements C (Les mégalithes: dolmen et menhir) et D (La terre)
sont des séquences d'une "revue parlante", envoyée par la Ligue Braille de
Bruxelles aux jeunes aveugles qui en font la demande. Ces articles ne sont pas
connus par les sujets de notre expérience, mais contrairement aux articles a et
B dont les thèmes sont totalement ignorés des sujets, les thèmes des articles C
et D sont bien connus des élèves de seconde.
Dans ces quatre articles, les phrases principales (information essentielle
opposée à l'information superflue) ont été sélectionnées par la "méthode des
juges". Trois personnes (les juges) ont trié séparément les phrases essentielles
des phrases superflues, puis se sont consultées pour décider du choix à retenir
en cas de litige.
c - La tâche et la consigne:
La tâche consiste à sélectionner et à enregistrer les phrases essentielles
d'un discours parlé ( a B C ou D).
La consigne est exposée de la façon suivante:
""Vous allez entendre un texte dont le titre est le suivant (est alors énoncé
le titre de l'article enregistré a B C ou D correspondant à la séance en cours).
Vous aurez à enregistrer toutes les phrases que vous estimerez être
principales dans ce texte. Pour guider votre choix, vous pouvez considérer comme
"principales" toutes les phrases qui apportent une information nouvelle et
importante en rapport avec le thème du texte, c'est-à-dire toutes les phrases à
partir desquelles vous pourriez obtenir l'information nécessaire à l'élaboration
d'un résumé.
Vous ne devez pas enregistrer les idées qui se répètent ou qui contiennent
des détails que vous n'estimeriez pas importants à retenir lors d'un
apprentissage.
Essayez de n'enregistrer que des phrases complètes. Evitez d'enregistrer des
fragments de phrases afin que toutes les portions enregistrées puissent former
un énoncé cohérent, c'est-à-dire de telle sorte qu'une personne naïve, ne
connaissant pas cet article, puisse comprendre les idées essentielles du texte
en écoutant votre enregistrement.""
Pour chaque enregistrement de chaque sujet, le nombre de phrases principales
et le nombre de phrases superflues sont répertoriés et comparés aux nombres de
phrases principales et superflues du texte d'origine.
d - La passation:
L'expérimentation s'est déroulée en quatre séances. Chaque séance
comporte les étape suivantes:
-
une période de mise en route durant laquelle les sujets doivent
sélectionner et enregistrer des portions de discours bien déterminées.
-
une phase de questionnaire pendant laquelle le titre du texte est
d'abord énoncé; puis quelques questions sont posées à chaque sujet:
"Avez-vous déjà entendu parler de cela? Si oui, que pouvez-vous en dire?
Si non, avez-vous une idée de ce que cela peut être, ou de ce qui
peut être dit sur ce thème?
-
une phase pendant laquelle la consigne est exposée. Si les sujets le
souhaitent quelques explications supplémentaires sont données.
-
la phase d'expérimentation proprement dite, dont la durée varie selon
le temps d'écoute des différents textes, commence alors.
La prise de notes est d'abord effectuée avec une capacité de la
mémoire-tampon réglée à 2 secondes, puis à 5 secondes.
Chaque séance expérimentale dure en moyenne une heure. Les quatre séances se
sont déroulées sur une période de un mois, à raison d'une séance par semaine.
5 - Les résultats:
Les résultats, (les nombres de phrases principales et superflues pour chaque
enregistrement) ont été recueillis uniquement pour les sujets expérimentaux
ayant utilisé la mémoire-tampon de 2 secondes. En effet en raison de leurs
obligations scolaires, tous les sujets n'ont pu enregistrer tous les textes avec
la capacité de la mémoire-tampon de 5 secondes. Toutefois l'analyse qualitative
est effectuée pour tous les enregistrements que nous possédons.
Les résultats quantitatifs n'ont pu être exprimés pour le sujet contrôle; la
majorité des phrases enregistrées étant incomplètes, le tri correct entre les
phrases principales et superflues est pratiquement impossible.
TABLEAUX DE RÉSULTATS
Élèves aveugles et amblyopes en seconde. Les thèmes des texte A et B sont
inconnus pour les élèves. Ils enregistrent des informations tout-à-fait
nouvelles pour eux.
Première séance: TABLEAU 8
|
Texte A
|
Sujet 1
|
Sujet 2
|
Sujet 3
|
Durée d'écoute en secondes
|
625
|
195
|
105
|
292
|
nombre phrases essentielles
|
24
|
19
|
14
|
24
|
nombre phrases superflues
|
37
|
6
|
2
|
13
|
nombre total de phrases
|
61
|
25
|
16
|
37
|
Deuxième séance: TABLEAU 9
|
Texte B
|
Sujet 1
|
Sujet 2
|
Sujet 3
|
Durée d'écoute en secondes
|
780
|
285
|
250
|
390
|
nombre phrases essentielles
|
29
|
29
|
23
|
29
|
nombre phrases superflues
|
63
|
11
|
3
|
25
|
nombre total de phrases
|
92
|
40
|
26
|
54
|
Les thèmes des textes C et D sont connus des élèves. Ils enregistrent des
informations qui leur sont familières.
Troisième séance: TABLEAU 10
|
Texte C
|
Sujet 1
|
Sujet 2
|
Sujet 3
|
Durée d'écoute en secondes
|
540
|
130
|
168
|
245
|
nombre phrases essentielles
|
21
|
12
|
14
|
21
|
nombre phrases superflues
|
42
|
2
|
0
|
8
|
nombre total de phrases
|
63
|
14
|
14
|
29
|
Quatrième séance: TABLEAU 11
|
Texte D
|
Sujet 1
|
Sujet 2
|
Sujet 3
|
Durée d'écoute en secondes
|
300
|
102
|
83
|
115
|
nombre phrases essentielles
|
15
|
14
|
11
|
15
|
nombre phrases superflues
|
28
|
1
|
0
|
1
|
nombre total de phrases
|
43
|
15
|
11
|
16
|
Données des 3 sujets transformées en pourcentages par rapport aux paramètres
des textes A, B, C et D
1- Pourcentages par rapport au texte A
TABLEAU 12
|
|
Sujet 1
|
Sujet 2
|
Sujet 3
|
Durée d'écoute
|
|
31,2
|
16,8
|
46,72
|
phrases essentielles
|
|
79,16
|
58,33
|
100
|
phrases superflues
|
|
16,22
|
5,4
|
35,13
|
phrases totales
|
|
40,98
|
26,23
|
60,65
|
2-Pourcentages par rapport au texte B
TABLEAU 13
|
|
Sujet 1
|
Sujet 2
|
Sujet 3
|
Durée d'écoute
|
|
36,54
|
32,05
|
50
|
phrases essentielles
|
|
100
|
79,31
|
100
|
phrases superflues
|
|
17,46
|
4,76
|
39,68
|
phrases totales
|
|
43,48
|
28,26
|
58,7
|
3-Pourcentages par rapport au texte C
TABLEAU 14
|
|
Sujet 1
|
Sujet 2
|
Sujet 3
|
Durée d'écoute
|
|
24,07
|
31,11
|
45,37
|
phrases essentielles
|
|
57,14
|
66,66
|
100
|
phrases superflues
|
|
4,76
|
0
|
19,05
|
phrases totales
|
|
22,22
|
22,22
|
46,03
|
4-Pourcentages par rapport au texte D
TABLEAU 15
|
|
Sujet 1
|
Sujet 2
|
Sujet 3
|
Durée d'écoute
|
|
34
|
27,66
|
38,33
|
phrases essentielles
|
|
93,33
|
78,57
|
100
|
phrases superflues
|
|
3,57
|
0
|
3,57
|
phrases totales
|
|
34,88
|
15,58
|
37,21
|
TABLEAU 16
Temps d'enregistrement: pourcentage du temps d'enregistrement des notes
enregistrées par les sujets par rapport à la durée d'écoute des textes A et B.
Indice T: Taux moyen (pour les textes A et B) du nombre de phrases
essentielles enregistrées par les sujets par rapport au nombre total des phrases
essentielles.
Indice S: Taux moyen (pour les textes a et B) de phrases essentielles
enregistrées par chaque sujet par rapport au total des phrases enregistrées.
Données pour texte A + texte B:
|
|
Sujet 1
|
Sujet 2
|
Sujet 3
|
Temps ( en mn) d'enregistrement
|
|
33,87
|
24,40
|
48,36
|
Indice T (A,B)
|
|
89,58
|
68,82
|
100,00
|
Indice S (A,B)
|
|
73,85
|
88,10
|
58,24
|
TABLEAU 17
Données pour Texte C + Texte D:
|
|
Sujet 1
|
Sujet 2
|
Sujet 3
|
Temps ( en mn) d'enregistrement
|
|
29,04
|
29,39
|
41,85
|
Indice T (A, B)
|
|
75,23
|
72,26
|
100,00
|
Indice S (A, B)
|
|
89,66
|
100,00
|
80,00
|
Fig. 2: diagrammes (texte A)
Fig. 3: diagrammes (texte B)
Le thème des textes A et B est inconnu des lycéens. Chaque figure comporte 3
groupes de 4 colonnes pour les sujets 1, 2 et 3.
LEGENDE:
Colonne 1 (en hachures): Pourcentage du temps d'écoutes des notes
enregistrées par rapport au temps d'écoute du texte entier.
Colonne 2 (en pointillés): Pourcentage du nombre total de phrases
enregistrées par rapport au nombre total de phrases dans le texte.
Colonne 3 (en blanc): Pourcentage du nombre de phrases essentielles
enregistrées par rapport au nombre de phrases essentielles du texte.
Colonne 4 (en noir): Pourcentage du nombre de phrases superflues
enregistrées par rapport au nombre de phrases superflues du texte.
Fig. 4: diagrammes (texte C)
Fig. 5: diagrammes (texte D)
Les thèmes des textes C et D sont bien connus des lycéens.
Chaque figure comporte 3 groupes de 4 colonnes pour chacun des 3 sujets
expérimentaux (1, 2 et 3).
LEGENDE: La légende est la même que celle des figures 2 et 3.
Fig. 6: diagrammes (textes a et B)
Fig. 7: diagrammes (textes C ET D)
Chaque figure comporte 3 groupes de 3 colonnes pour chacun des sujets 1, 2 et
3.
LEGENDE:
Colonne 1 (en noir): Pourcentage du temps d'écoute des notes enregistrées
par rapport au temps d'écoute des 2 textes (a et B pour la figure 6 , C et D
pour la figure 7).
Colonne 2 INDICE T (en pointillés): Pourcentage des phrases essentielles
enregistrées par chaque sujet par rapport aux phrases essentielles des textes a
et B (Fig. 6), C et D (Fig. 7).
Colonne 3 INDICE S (en blanc): Pourcentage des phrases essentielles
enregistrées par chaque sujet par rapport au nombre total de phrases
enregistrées des textes a et B (Fig 6) , C et D (Fig. 7).
La quantité de fragments de discours ou de phrases incomplètes enregistrés
par chaque sujet quand la capacité de la mémoire-tampon est 2 secondes, est
inférieure à 2 pour cent par rapport à l'ensemble des phrases enregistrées. Ce
nombre, considéré comme négligeable, est additionné au nombre de phrases
superflues.
Les tableaux 8 et 9 et les tableaux 10 et 11 , dans lesquels sont
exprimés pour le texte d'origine et pour les notes enregistrées de
chaque sujet, la durée d'écoute de l'enregistrement, le nombre de
phrases essentielles, de phrases superflues et de phrases totales, met
en évidence trois points essentiels:
-
la durée d'écoute des notes enregistrées est inférieure à la
durée d'écoute des textes originaux;
-
le nombre de phrases essentielles semble être relativement
important par rapport au nombre de phrases enregistrées et au nombre
de phrases essentielles des textes originaux;
-
le nombre de phrases superflues est relativement faible par rapport au
nombre de phrases essentielles enregistrées et au nombre de toutes les
phrases enregistrées.
Pour objectiver ces données, le nombre de phrases essentielles, superflues et
totales est respectivement exprimé en pourcentage par rapport au nombre de
phrases essentielles, superflues et totales des textes originaux. De plus, les
données pour les textes a et B d'une part, les textes C et D d'autre part, sont
rassemblées.
Les diagrammes fig 2 et 3 illustrent les données des tableaux 12, 13 et 14 et
15 . Ils différencient les tendances des lycéens par rapport à la sélection de
l'information.
Les diagrammes fig 6 et 7 illustrent les données des tableaux 16 et 17 . Ils
mettent en évidence la sélectivité des sujets expérimentaux.
6 - Discussion et conclusion:
Cette expérience, réalisée en laboratoire avec quatre lycéens aveugles et
amblyopes, s'est déroulée en 6 séances.
Dans les deux premières séances d'apprentissage, il est noté que les lycéens
réussissent la sélection et l'enregistrement des séquences, dès les premiers
essais, quand la capacité de la mémoire-tampon est de 2 secondes, mais nécessite
un apprentissage plus long pour une capacité de la mémoire-tampon de 5 secondes.
Ainsi, bien que plus âgés, les lycéens semblent avoir également des
difficultés à évaluer ce qui peut être dit en 5 secondes ou encore à apprécier
la durée d'une séquence temporelle de 5 secondes.
L'analyse qualitative des notes enregistrées à partir du texte A, quand la
mémoire-tampon est réglée à 5 secondes, souligne aussi cette difficulté. En
effet, les notes enregistrées par les sujets expérimentaux pour une seconde
écoute du texte a avec une mémoire-tampon de 5 secondes, contiennent beaucoup
plus de phrases incomplètes (plus de 5 pour cent) que les notes enregistrées
avec la mémoire-tampon de 2 secondes.
Les réponses aux questions posées sur les impressions et les stratégies des
sujets traduisent que les élèves ont des difficultés à "localiser" une portion
de discours dans une séquence temporelle, si cette séquence temporelle est
supérieure à 2 secondes.
La prise de notes enregistrées ou écrites implique les mécanismes de
l'attention,de la perception et de la mémoire. Elle nécessite à la fois
la compréhension du discours et une prise de décision concernant les
derniers mots énoncés:
-
apportent-ils des éléments importants?
-
constituent-ils une information essentielle et pertinente par
rapport à l'ensemble de l'énoncé précédemment émis, par rapport au
thème du cours et aux connaissances antérieures de l'élève?
Les mots prononcés par le professeur sont retenus par l'élève en mémoire à
court terme dont la capacité est limitée. Cette limitation concerne d'une part
le nombre des éléments stockés (5 à 6) et d'autre part la durée de la rétention: "l'oubli en mémoire à court terme tient autant d'une dégradation due au temps,
que d'une interférence produite par la présentation de matériel nouveau"
(Lindsay et Norman 1980, p. 315 à 318.
Nous rappelons que la mémoire à court terme se rapporte à l'étape où sont
conservées pendant un temps relativement bref les informations dont le sujet a
besoin temporairement ou qu'il essaie d'organiser pour être stockées de façon
permanente.
Or, la trace mnésique de la mémoire à court terme se dégrade rapidement
(qualitativement et quantitativement) après 2 secondes de rétention.
Dans notre expérience, il semble que la capacité réglée à 2 secondes de la
mémoire-tampon du magnétophone à enregistrement différé est particulièrement
bien adaptée à la capacité de rétention de la mémoire de travail des sujets
expérimentaux. Ce qui expliquerait pourquoi les sujets ont des difficultés dans
la prise de notes quand la mémoire- tampon du prototype est réglée à 5 secondes.
Etant donné le débit de la parole du locuteur (en moyenne de 120 mots par
minutes) pour les textes présentés aux sujets de l'expérience, 4 à 5 mots sont
émis pendant ce laps de temps de 2 secondes. Ainsi, la facilité avec laquelle
tous les élèves ont pu utiliser le magnétophone à enregistrement différé quand
la mémoire-tampon est réglée à 2 secondes, semble être expliquée par la
limitation (dans le temps et dans le nombre d'éléments retenus) de la capacité
de la mémoire de travail.
Les 5 premiers mots d'une phrase sont-ils suffisants pour juger la valeur de
cette phrase? Compte tenu des résultats obtenus avec les trois sujets
expérimentaux, il semblerait que le magnétophone à enregistrement différé ait
permis une sélection convenable de l'information. En effet, pour les textes a et
B dont les thèmes sont totalement inconnus des lycéens, l'indice T, représentant
le taux de phrases essentielles enregistrées par rapport au nombre de phrases
essentielles du texte est en moyenne de 86 pour 100 (variant de 69 à 100 pour
100 selon les sujets); l'indice S représentant le taux de phrases essentielles
enregistrées par rapport au nombre de phrases totales enregistrées par les
sujets est en moyenne de 73 pour 100 (variant de 58 à 88 pour 100 selon les
sujets). Ces données prouvent que les sujets ont procédé à une sélection de
l'information. La comparaison des deux indices met en évidence une plus grande
sélectivité chez le sujet 2 et une moindre sélectivité chez le sujet 3. De plus
la comparaison des indices T et S pour les textes a et B d'une part et les
textes C et D d'autre part montrent que ces indices sont plus élevés pour les
textes dont les thèmes sont bien connus des lycéens: la sélection des notes
enregistrées est meilleure quand le thème du discours est familier pour l'élève.
D'un point de vue qualitatif, pour les trois sujets expérimentaux qui
utilisent le magnétophone à enregistrement différé, toutes les phrases
enregistrées sont complètes à quelques exceptions près. L'analyse des portions
de phrases et le questionnaire des sujets ont montré qu'en fait les fragments
sont des propositions entières ayant une signification et contenant des éléments
informatifs que le sujet souhaite conserver. En outre présentés à des sujets
"naïfs", ne connaissant pas les textes originaux, les différents enregistrements
condensés sont jugés cohérents et compréhensibles (présentant une suite d'idées
logiques);
En ce qui concerne les enregistrements du sujet contrôle, utilisant un
magnétophone classique, la plupart des phrases sont incomplètes: un à trois
mots sont absents en début de phrase, donnant à celle-ci une signification
différente ou la rendant peu compréhensible. De plus,la succession de ces
portions de phrase produisent un enregistrement hâché et incohérent, rendant la
majorité du discours enregistré incompréhensible. En outre cette succession de
fragments de phrases a rendu impossible l'analyse quantitative des
enregistrements.
Après quelques minutes de pratique, les sujets expérimentaux disaient "se
sentir plus détendus pour réfléchir à la phrase à enregistrer".
V - CONCLUSION
Nos investigations et les expériences en situation de cours et de laboratoire
effectuées avec des collégiens et des lycéens aveugles et amblyopes, ont validé
notre hypothèse sur la mémoire à court terme d'une part et ont prouvé d'autre
part que l'enregistrement pourrait être un moyen de prendre des notes.
En ce qui concerne la mémoire à court terme, deux explications semblent
justifier nos résultats. La première est le choix de la capacité de la
mémoire-tampon du magnétophone à enregistrement différé qui a été guidé par les
résultats des recherches sur la mémoire de travail: la plupart des auteurs
situent la limite temporelle de la mémoire à court terme entre 1,5 et 2
secondes. La deuxième est associée au nombre de mots émis par le locuteur en 2
secondes. Le locuteur, ici le professeur en situation de cours, émet au maximum
6 mots en 2 secondes, ce qui est en accord avec le chiffre 7 plus ou moins 2 de
Miller. La combinaison de ces deux facteurs, c'est-à-dire le respect des
conditions de limitation temporelle et de limitation du nombre des éléments de
la mémoire à court terme, justifie la facilité avec laquelle les sujets ont
utilisé le magnétophone à enregistrement différé dans une condition de prise de
notes. Par ailleurs, l'existence d'une boucle articulatoire associé au niveau
cognitif du traitement de la parole introduirait un autre facteur: la vitesse
de la parole ( Baddeley, Thompson et Buchanan 1975, Baddeley 1986). L'empan
mnésique serait fonction linéaire du taux de prononciation du sujet (Baddeley
1986, Hulme et al. 1984, Schweickert et Boruff 1986 ). Nous étudierons plus
particulièrement ce facteur dans le quatrième chapitre.
En ce qui concerne l'application de notre étude, bien qu'elle ait un
caractère essentiellement exploratoire, elle met en évidence les avantages du
magnétophone à enregistrement différé.
Ce matériel permet en effet de sélectionner de façon plus précise et plus
sûre, sans perdre d'informations les phrases que l'étudiant souhaite conserver.
Cette technique a de plus l'avantage de pouvoir suivre aisément le rythme du
locuteur.
Il est à noter que les notes enregistrées par les collégiens et les lycéens
peuvent être utilisées directement pour un apprentissage ultérieur ou une
révision. En ce qui concerne le magnétophone classique, quelques manipulations
supplémentaires (définies précédemment) sont nécessaires pour permettre
l'utilisation des notes enregistrées.
Le magnétophone à enregistrement différé nous semble être un matériel d'un
grand intérêt pour tous ceux qui ont besoin de sélectionner rapidement une
information orale.
D'un point de vue théorique, des recherches sur la lecture et l'apprentissage
par "l'écoute" pourrait intéresser les domaines de la psychologie cognitive et
la psycho-pédagogie.
Sur un plan pratique, il serait très profitable d'étudier la possibilité
d'utiliser ce mode d'apprentissage. Bien que l'utilisation de l'enregistrement
ne nous semble pas être une panacée pour l'enseignement de tous les déficients
visuels, le magnétophone pourrait être une aide précieuse pour tous les aveugles
accidentels et les amblyopes confrontés à des difficultés insurmontables dans
l'utilisation du braille.
Dans le chapitre suivant, , nous nous proposons d'étudier " la parole
comprimée et l'écoute rapide" qui pourrait être un mode d'apprentissage efficace
pour l'aveugle (Foulke et Stitch, 1969).
VI - RÉSUMÉ
Même si les étudiants aveugles ont pu acquérir une base de connaissances
suffisamment solide et riche, pour pouvoir prolonger leurs études, ils sont
confrontés à un problème majeur qui est celui de la lenteur de l'acquisition de
l'information.
L'œil est l'organe sensoriel qui apporte la plus grande quantité
d'informations à un moment donné. Le champ perceptif visuel très étendu permet
une perception simultanée des objets. De par sa simultanéité, l'approche
visuelle facilite l'anticipation, la préparation à l'action et assure ainsi la
rapidité et la précision d'une action ou d'un comportement. En revanche, la
perception tactile qui est une réorganisation des sensations fragmentées dans
l'espace et successives dans le temps est considérablement plus lente.
Pour un temps de lecture donné, un lecteur aveugle qui lit le braille couvre
trois fois moins de texte qu'un lecteur voyant qui lit les caractères imprimés
(Myers 1978, Krueger 1982). Un lecteur expérimenté lit avec les yeux environ 300
mots par minutes, alors qu'un lecteur aveugle lit avec les doigts environ 100
mots par minutes (Foulke 1982, Nollan et Késéris).
L'écriture braille avec poinçon présente également cette caractéristique de
lenteur par rapport à l'écriture avec crayon. De plus la tablette et le poinçon
sont assez bruyants lorsqu'ils sont utilisés par plusieurs étudiants dans une
même salle de cours. En outre l'écriture braille permet plus difficilement la
correction, la rectification, l'annulation ou l'adjonction d'une note dans le
texte écrit(Postel 1972).
LA TECHNIQUE DE PRISE DE NOTES
Plus le niveau est élevé dans le cursus scolaire et universitaire, plus la
quantité d'information à acquérir s'accroît. C'est pourquoi, au fur et à mesure
de l'évolution des études, la technique de prise de notes occupe une place de
plus en plus importante.
Dans les petites classes, c'est l'enseignant qui gère et organise cette
activité de prise de note. Peu à peu le professeur devient moins directif et les
lycéens, puis les étudiants doivent accroître leur autonomie dans ce domaine. Il
leur faut sélectionner l'information et choisir dans le discours du professeur
les éléments essentiels et pertinents qui se rapportent à un thème donné et qui
leur seront utiles pour pouvoir apprendre et restituer cette information.
De la quantité, et surtout de la qualité des notes prises, dépendra
essentiellement la réussite aux examens.
LE MAGNÉTOPHONE À ENREGISTREMENT DIFFÉRÉ
Pour que l'élève ou l'étudiant aveugle, intégré dans une classe de voyants
puisse suivre le rythme imposé par le débit du cours, une solution avantageuse
est l'utilisation d'un magnétophone.
Une étudiante aveugle a expérimenté en psychologie le magnétophone à
"enregistrement différé". Ce système permet de n'enregistrer que les parties
importantes du cours, c'est-à-dire d'enregistrer des notes. L'intérêt d'une
phrase ou d'une idée n'est perçu par l'auditeur qu'à postériori, et donc
seulement après son émission par le locuteur. Dans ces conditions, l'auditeur ne
peut l'enregistrer sur bande magnétique que s'il en dispose dans une mémoire,
car il a besoin d'un temps de réflexion et de décision.
L'insertion d'une mémoire numérique, d'un codeur et d'un décodeur à
modulation delta dans la chaîne d'enregistrement d'un magnétophone, c'est-à-dire
entre le microphone et la tête d'enregistrement, permet d'obtenir un
magnétophone à enregistrement différé. Grâce à une commande marche-arrêt,
l'utilisateur transfère sur la bande magnétique les informations contenues dans
la mémoire-tampon. Ainsi, selon la capacité de la mémoire-tampon, variable de 2
à 20 secondes, les quelques mots ou les quelques phrases émises avant l'appui
sur la commande marche-arrêt sont enregistrés sur la bande magnétique.
L'utilisateur dispose, suivant le réglage, de 2 à 20 secondes, pour décider
d'enregistrer ou non l'information émise durant ce laps de temps.
Cette technique permet de procéder directement à une sélection de
l'information rapide en situation de cours.
LES EXPÉRIENCES AVEC LE MAGNÉTOPHONE À ENREGISTREMENT DIFFÉRÉ
1- Les premières expériences furent effectuées en 1985 avec des élèves de
quatrième, handicapés physiques. La capacité de la mémoire-tampon était réglée à
5 secondes. Selon les auteurs, les élèves étaient peu sélectifs et avaient des
difficultés à évaluer ce qui pouvait être dit en 5 secondes. Après apprentissage
et expérience en situation de cours, les auteurs avaient conclu que le
magnétophone à enregistrement différé pouvait permettre une sélection et un
stockage de l'information essentielle satisfaisant . Mais les élèves devaient
procéder à une retranscription du cours, pour éliminer les informations
superflues et les phrases incomplètes (Capelain et al.1985, Canivet et al. 1984,
Ledru et Sizaire 1985, Steenkeste et al. 1985).
2- Une étudiante aveugle a enregistré, avec un magnétophone
classique, tous les cours de psychologie suivis à l'Université de Lille
III entre 1982 et 1987. Elle a constaté:
-
Selon le débit de la parole et la redondance du texte, le temps
d'enregistrement d'un cours peut être réduit environ de moitié. Ce qui
réduit d'autant le temps d'écoute ultérieur.
-
À l'aide d'un second enregistrement en répétant les phrases bout à
bout plus rapidement, il est encore possible de réduire le temps d'écoute de
50 pour cent.
-
Toutefois, pour chaque déclenchement de l'enregistre ment, les
premiers mots d'une phrase sont perdus. Ce qui peut modifier ou rendre
inaccessible la signification de la phrase.
-
Il est possible de pallier cet inconvénient en superposant à
l'enregistrement en cours le début de la phrase. Cela représente une charge
mentale supplémentaire pendant l'écoute du cours et lors de son ré-enregistrement ultérieur.
-
Avec le magnétophone à enregistrement différé utilisé en 1986,
1987, ces problèmes trouvent une solution:
-
En réduisant la capacité de la mémoire-tampon à 2 secondes, il est
possible d'enregistrer des phrases complètes de sélectionner les phrases à
enregistrer sans perte d'information.
-
Avec une bonne sélection et des énoncés rapides, les notes
(enregistrement condensé) peuvent être conservées pour une utilisation
ultérieure. Ce qui permet d'éviter la retranscription.
3- Une expérience avec des élèves de quatrième aveugles et amblyopes est réalisée en situation de cours. L'apprentissage du système
avec une capacité de la mémoire-tampon réglée à 2 secondes est plus facile
qu'avec une mémoire-tampon réglée à 5 secondes. Pour un cours de géographie d'une
heure le temps d'écoute de l'enregistrement sélectionné est de 5 minutes en
moyenne. Pour 2 des élèves, l'enregistrement très correct ne nécessite pas de
retranscription. Pour la troisième, l'enregistrement des phrases est correct,
mais elle a omis de prendre le plan du cours. L'élève contrôle, qui utilise un
magnétophone classique a perdu le début de certaines phrases. Ce qui se traduit
par des pertes d'information importantes: dates, chiffres, noms propres. Il est
nécessaire d'apporter un complément d'informations pour pouvoir utiliser cet
enregistrement.
4- Une expérience avec quatre élèves aveugles et amblyopes d'une classe de
seconde est réalisée en laboratoire. Cette expérience s'est déroulée pendant 6
séances. Les deux premières sont des séances d'apprentissage avec une capacité de
la mémoire-tampon de 2 et 5 secondes. Dans les deux suivantes, les élèves
doivent enregistrer les idées principales de deux textes dont le thème leur est
inconnu. Dans les deux dernières séances, les sujets doivent enregistrer les
phrases principales de deux textes dont le thème leur est familier. Les résultats
montrent que tous les élèves sont capables de sélectionner les idées
essentielles d'un texte. Cette sélection est d'autant plus satisfaisante que le
thème de l'énoncé est plus familier. Pour les trois sujets qui utilisent le
magnétophone à enregistrement différé, les phrases de l'enregistrement
"condensé" sont complètes et peuvent être utilisées pour un apprentissage
ultérieur. Pour l'enregistrement du sujet contrôle, les phrases sont incomplètes.
De ce fait, la signification est modifiée et l'énoncé devient incompréhensible
et n'est pas utilisable pour un apprentissage ultérieur.
La technique de l'enregistrement sélectif, rendue plus confortable et
plus efficace grâce à l'utilisation du magnétophone à enregistrement
différé, permet:
1- de sélectionner rapidement l'information et d'être ainsi compétitif par
rapport à l'étudiant voyant dans une condition de prise de notes,
2- d'effectuer ultérieurement un travail d'analyse et de synthèse sur les
notes enregistrées; ce qui peut améliorer la compréhension et l'apprentissage
du cours.
3- de réduire et de condenser un texte enregistré; ce qui réduit le temps
d'écoute pendant la période de révision.
4- d'écouter éventuellement la version condensée à vitesse rapide; de ce fait
la durée d'écoute de l'étudiant aveugle sera équivalente à la durée de lecture
de l'étudiant voyant (voir chapitre 4).
Ces expériences ont mis en évidence l'influence de la capacité de la mémoire
de travail dans l'activité de prise de notes. En effet, l'utilisation du
magnétophone à enregistrement différé est rendue plus difficile pour un réglage
de la mémoire-tampon supérieur à 2 secondes. Ce résultat peut être expliqué par
la limitation de la capacité de la mémoire de travail qui se situe
approximativement à 2 secondes.
LA PAROLE COMPRIMÉE ET L'ÉCOUTE RAPIDE
SECTION 1: ÉTUDE THÉORIQUE
Le matériel verbal sous sa forme écrite fut une source d'étude
particulièrement riche pour les psychologues s'intéressant à la perception du
langage. Avant l'avènement de nouvelles technologies de production et
d'enregistrement de la parole, le caractère séquentiel et éphémère du matériel
verbal sous sa forme parlée présentait des difficultés de manipulation et
d'analyse qui en limitaient l'étude. Aussi les travaux sur la parole comprimée
sont-ils relativement récents. Ils coïncident d'ailleurs avec l'apparition des
nouvelles technologies liées à la synthèse et au traitement de la parole.
La parole comprimée permet d'entendre dans un temps donné une plus grande
quantité d'informations que ne le permet la parole normale. Les premières études
ont commencé aux États-Unis dans les années 50: il est classique de citer à ce
propos le premier système de compression de Fairbanks et al. (1954). Le
développement de nouvelles techniques de compression de la parole dans les
années 60 et 70 a contribué à améliorer la qualité de la parole comprimée. Les
chercheurs ont alors pu tester avec une plus grande précision un mode d'accès à
l'information prometteur: "l'écoute rapide" (par analogie avec la lecture
rapide.
Pour prolonger la comparaison entre un texte écrit et parlé, les phrases
écrites peuvent être lues à une vitesse choisie par le lecteur en fonction de
ses intérêts ou de ses objectifs. La variation du taux de lecture peut occuper
une marge importante: de quelques mots à 600 mots par minute pour les plus
doués. Dans l'écoute, la modalité auditive n'autorise pas une telle variation de
débit de paroles. De plus, l'auditeur a peu ou pas de contrôle sur le débit de
la parole du locuteur qui peut varier approximativement entre 125 et 175 mots
par minute. Aussi l'accès à l'information par l'écoute est-il peu efficace
comparé à l'accès par la lecture visuelle et cela d'autant plus que le sujet ne
peut utiliser ce dernier mode d'apprentissage: personne aveugle ou ne pouvant
lire des caractères imprimés.
L'homme peut traiter l'information à un débit plus élevé que celui du langage
parlé (Nichols 1955, cité par Leroy 1982). L'augmentation du débit d'un énoncé
pourrait être un moyen d'accélérer l'accès à l'information par la modalité
auditive. Les techniques de compression de la parole et la mise au point d'un
nouveau système appelé compresseur de paroles (speech compressor) permettent de
faire varier le débit d'un discours enregistré, sans distorsion excessive du
message. L'évolution des recherches tant sur un plan pratique que théorique a
donné naissance à un nouveau concept: "speed listening" que nous avons traduit
par "l'écoute rapide". Il s'agit d'une technique utilisée par un auditeur pour
déterminer de façon volontaire le taux d'écoute d'un discours enregistré, en
accord avec ses objectifs plutôt qu'avec ceux du locuteur dont la voix est
enregistrée (Leroy 1982).
Dans cette revue, nous proposons:
-
de rappeler l'évolution historique des techniques de compression de la
parole,
-
d'exposer les problèmes méthodologiques et procéduraux liés à l'étude de
la parole comprimée,
-
de recenser les facteurs susceptibles de modifier l'intelligibilité des
mots et la compréhension d'un discours comprimé,
-
de résumer les applications relatives à la parole comprimée et à
l'écoute rapide.
I - PAROLE NORMALE ET PAROLE COMPRIMEE
1-Le signal vocal
La parole est un signal vocal complexe, continu et redondant, composé de
segments périodiques (formant des voyelles) et apériodiques, variable pour un
même locuteur à des instants différents, et très variable selon les locuteurs.
Contrairement à l'écrit, la parole est une suite de segments continue (phonèmes)
dont le débit varie entre 120 et 150 mots par minute environ selon les
conditions d'émission et les objectifs recherchés.
2-Le niveau périphérique du traitement de la parole
L'expérimentation en physiologie et en psycho-physiologie a permis de décrire
l'information qui circule sur le nerf auditif à partir de l'émission d'un signal
vocal.Au niveau périphérique, les mécanismes de la perception auditive ont pu
être étudiés: l'onde vocale peut être définie par sa fréquence, son amplitude,
sa durée. Dans l'oreille, elle subit des phénomènes de décomposition spectrale
permettant de discriminer la fréquence fondamentale et les harmoniques d'une
voyelle par exemple. La hauteur perçue est liée à la fréquence fondamentale,
l'intensité à la notion d'énergie (amplitude, pression acoustique). Une unité de
puissance acoustique a été définie permettant de déterminer une unité relative
de niveau d'intensité sonore en décibels. L'oreille perçoit des sons dont la
fréquence varie entre 20 et 20000 Hertz (jusqu'à 10000 HZ dans la pratique). Des
seuils d'audibilité et de douleur sont déterminés pour différentes fréquences
(courbes d'audibilité et de douleur) La sensibilité de l'oreille est maximum
pour les sons de 1000 Hertz. L'oreille est peu sensible à la variation
d'intensité d'un son (supérieur à 10%), mais elle est très sensible à sa
variation de fréquence (entre 0,1 et 0,3% en moyenne). L'oreille interne
transforme le signal acoustique en un signal nerveux et le codage à ce niveau
est tel qu'il produit déjà une bonne analyse acoustique du signal d'entrée.
L'amplitude de l'onde sonore est codée par l'amplitude de la réponse nerveuse.
Pour l'analyse de la fréquence du son, deux types de codage sont effectués au
niveau périphérique: un codage temporel pour une fibre nerveuse et un codage
spatial et synchronisé de plusieurs fibres nerveuses suivant la localisation des
cellules réceptrices: définissant une sorte de cartographie fonctionnelle au
niveau de la cochlée (oreille interne).
3-Le niveau central du traitement de la parole
Au niveau central, l'énoncé en cours de traitement fait appel à diverses
sources de connaissances: phonologiques, morphologiques, lexicales, syntaxiques
et pragmatiques. Plusieurs modèles rendent compte des mécanismes centraux.
Plusieurs types de modèles ont essayé de décrire le déroulement des processus
cognitifs dans le traitement de l'information parlée. Des phénomènes
d'interaction multiples compliquent beaucoup cette tâche: phénomènes de
coarticulation au niveau des segments et multiples interactions dans les
différentes étapes de l'analyse.
En psychologie cognitive, plusieurs modèles ont été proposés pour expliquer
le traitement de l'information perceptive, du langage parlé et écrit.
"Lorsque nous écoutons quelqu'un parler, nous percevons des entités
significatives, des mots, et non pas une suite confuse de sons qui doivent être
traduits d'une façon ou d'une autre afin d'avoir un sens" (Lindsay et Norman
1981). Ces auteurs ont décrit deux systèmes de traitement, l'un "dirigé par
données", l'autre "par concepts". Dans un système de traitement dirigé par
données, le traitement commence avec l'arrivée des données. Chaque étape de
l'analyse effectue son travail recevant des données d'entrée de l'étape
précédente. Les données de sortie sont les données d'entrée qui déclenchent
l'étape suivante. Mais il est plus facile d'entendre, quand on sait ce qu'il
faut entendre. Quand il y a connaissance d'une interprétation possible ou
conceptualisation d'un stimulus pour aider à sa perception, le traitement est
dirigé par concept. Les mécanismes de ces deux systèmes de traitement
s'effectueraient presque toujours simultanément, chaque mode contribuant à
l'analyse globale.
Les auteurs montrent l'interaction entre les données informatives qui
arrivent au sujet et les données acquises qu'il a classées et organisées dans sa
propre base de connaissance. Mais dans toute acquisition, les processus
cognitifs liés à l'attention et à la mémoire sont présents.
En effet lorsqu'un auditeur écoute un locuteur, il perçoit et décode les
derniers éléments d'une phrase alors qu'il a déjà intègré en mémoire et compris
les premiers éléments. Pour Spérandio (1986) , la mémoire à court terme permet
de gérer les interprétations partielles d'une phrase élémentaire de dialogue et
contient les résultats de l'analyse du dernier énoncé du locuteur au niveau
acoustique, phonétique, lexical, sémantique. Dans la mesure où le débit moyen
d'un locuteur varie entre 120 et 180 mots par minute, la vitesse de traitement
de l'information parlée de l'auditeur doit suivre ce rythme.
4-La parole comprimée
Dans un discours, le locuteur qui accélère la parole augmente le débit des
mots prononcés. L'augmentation du taux des mots émis réduit le temps de
communication d'un message donné. Aussi la parole accélérée se réfère souvent à
la parole comprimée dans le temps que nous nommerons plus simplement: la parole
comprimée.
Les méthodes et techniques utilisées pour modifier le taux d'émission
des mots d'un discours parlé (paroles d'entrée ou input) influencent la
nature du vocabulaire employé pour caractériser le discours final
(paroles de sortie ou output). Les articles abordant ce thème de
recherche contiennent une grande variété d'expressions. Citons quelques
exemples:
-
rapide speech (parole rapide),
-
accelerated speech (parole accélérée),
-
rate controled recording (enregistrement à taux contrôlé),
-
compressed speech (parole comprimée).
Ces termes relevant en général de la technique employée pour modifier le
débit de paroles seront expliqués en même temps que nous exposerons l'évolution
des méthodes de compression temporelle.
5-Implications théoriques
Le décodage de l'information auditive est régi par des mécanismes de
reconnaissance de formes et de perception. Ces mécanismes effectuent l'analyse
des caractéristiques sensorielles du signal vocal et font intervenir les indices
contextuels et les attentes du sujet. L'analyse des caractéristiques est limitée
par des seuils de discrimination (intensité, fréquence et de durée). Les
processus cognitifs impliquent le fonctionnement de l'attention, de la boucle
articulatoire, de la mémoire. Le traitement d'un message parlé passerait par une
étape articulatoire: après le décodage phonétique par feed-back articulatoire,
tandis qu'il procède au traitement syntaxique et sémantique, le sujet effectue
"une verbalisation" de l'information reçue. L'auditeur se répète mentalement ce
qu'il entend (Baddeley 1986). Ainsi pour Baddeley, le dispositif de boucle
articulatoire alimenterait le stock phonologique et pour que les "traces" ne
s'estompent pas une révision du matériel (répétition mentale) s'impose. Ce
codage est central et ne dépend pas obligatoirement des mécanisme moteur du
système phonatoire. D'autre part, la mémoire de travail "maintient en
disponibilité immédiate les informations reçues de la mémoire à court terme ou
retrouvées de la mémoire à long terme". Le nombre des éléments stockés en
mémoire à court terme est limité. Il est classique de citer Miller (1956) qui
évalue la capacité de la mémoire à court terme à 7 plus ou moins 2 éléments. Par
ailleurs, il semblerait que sa limitation temporelle soit environ 2 secondes
(Reuchlin 1981). Plusieurs auteurs ont situé la capacité temporelle de la
mémoire de travail entre 1,5 et 2 secondes (Baddeley 1986, Hulme et al. 1984,
Schweickert et Boruff 1986 ). Selon ces auteurs, cette durée d'environ 2
secondes serait l'intervalle de temps pendant lequel la trace mnésique peut être
récupérée. Le stockage en mémoire de travail maximum pendant ces deux secondes
ne dépendrait pas seulement du nombre des éléments ou "shunk" mais plutôt d'un
autre facteur: la vitesse de la parole. L'empan mnésique serait fonction
linéaire du taux de prononciation du sujet (Baddeley 1986, Hulme et al. 1984,
Schweickert et Boruff 1986 ).
La parole comprimée pourrait être un matériel d'étude intéressant pour
contrôler et affiner ces résultats. Par exemple pour un débit normal de paroles
(120 mots par minute), les 4 premiers mots d'une phrase seront parfaitement
répétés dès la fin de leur émission (après 2 secondes), mais qu'en est-il des 8
premiers mots pour un débit de 240 mots/minute ou des 10 premiers mots pour un
débit de 300 mots/minute? Le sujet qui articule vite traiterait-il mieux la
parole rapide? Existe-t-il un seuil d'intelligibilité de la parole associé à son
débit?
6-Applications
La parole occupe une place essentielle dans la communication humaine et c'est
aussi un support de l'information non négligeable dans l'enseignement. Compte
tenu des difficultés et de la lenteur de l'accès à l'information tactile, de
nombreux éducateurs anglo-saxons jugent le mode de présentation auditif très
favorable pour l'accès à l'information et l'apprentissage des jeunes aveugles.
D'autre part le développement des nouvelles technologies: machines à lire
(scanner), calculatrices parlantes, synthèses vocales permettant la sortie
vocale des données d'un micro-ordinateur et l'utilisation de nombreux logiciels
rendent nécessaire l'éducation de l'écoute. Comment peut-on transmettre une
information visuelle distribuée de façon spatiale sur une feuille ou un écran
via une modalité sonore impliquant des caractéristiques temporelles et
séquentielles? La mémoire à court terme, la mémoire de travail, l'attention
n'imposent-elles pas leurs lois de fonctionnement? Et comment distribuer
l'information parlée pour favoriser la compréhension et réduire la charge
mentale
II-ETUDE HISTORIQUE DES TECHNIQUES DE COMPRESSION DE La PAROLE
1-Un critère de référence: la parole normale
Le débit des mots parlés varie sensiblement d'un locuteur à un autre,
mais aussi pour une même personne d'un moment à l'autre de son énoncé(Richaume
1988). Les variations inter-sujets peuvent être influencées par des
facteurs d'ordre constitutionnel, physiologique, des facteurs de
personnalité, de niveau social et culturel. Les différences intra-sujets
peuvent être influencées par des variables liées:
-
aux conditions d'émission des paroles (conversation libre, lecture d'un
texte);
-
aux objectifs du locuteur (ordre, explication, démonstration...).
Les variations les plus importantes sont observées dans les comparaisons
entre le taux des mots émis lors d'une conversation spontanée et le taux des
mots prononcés lors d'une lecture orale. Nichols et Stevens (1957) ont trouvé
que le débit des paroles conversationnelles était de 125 mots par minute en
moyenne. Johnson et al. (1963, p.220) ont trouvé un taux moyen de lecture orale
de 176,5 mots par minute. Foulke (1967) a observé un taux moyen de lecture orale
de 174 mots par minute.
Lors des enregistrements des cours de psychologie, des échantillons de
différents professeurs et différents cours ont montré des variations de taux de
mots s'échelonnant entre 90 et 150 mots par minute avec des moyennes
approximatives de 110-120 mots par minute.
Par conséquent, afin de pouvoir situer le taux des mots d'un discours
"accéléré" et d'un discours "comprimé" par rapport au taux des paroles normales,
deux taux sont à retenir: 125 mots par minute pour la parole conversationnelle
et 175 mots par minute pour la lecture orale.
Dans un discours, le locuteur qui accélère la parole augmente le débit des
mots prononcés. L'augmentation du taux des mots émis réduit le temps de
communication d'un message donné. Aussi la parole accélérée se réfère souvent à
la parole comprimée dans le temps que nous nommerons plus simplement: la parole
comprimée.
Les méthodes et techniques utilisées pour modifier le taux d'émission des
mots d'un discours parlé (paroles d'entrée ou input) influencent la nature du
vocabulaire employé pour caractériser le discours final (paroles de sortie ou
output). Les articles abordant ce thème de recherche contiennent une grande
variété d'expressions.
2-La parole rapide:
En l'absence de technique et de matériel approprié,les premières recherches
ont fait appel aux seules capacités du locuteur à pouvoir faire varier son débit
de paroles. Toutefois même bien entraînés, les sujets se heurtent rapidement à
des limites insurmontables. En effet, les premières études (Goldstein 1940,
Nelson 1948, Hardwood 1955, cités par Foulke 1969 et Leroy 1982) ont fait appel
à des locuteurs bien entraînés à qui il était demandé d'essayer d'accroître leur
débit de paroles jusqu'à 300 mots/minute. Ce score est très difficile à
atteindre et son approche provoque des distorsions dans l'inflexion et
l'intensité vocale, la durée relative des voyelles, consonnes et pauses. Outre
ces modifications, des difficultés d'articulation rendaient le plus souvent ces
énoncés rapides peu compréhensibles (Calearo et Lazzaroni, 1957).
Dequiros (1964), Miron et Brown (1968) ont ainsi observé que des locuteurs
entraînés ne peuvent soutenir un taux d'élocution supérieur à 225 mots par
minute pendant une longue période lors d'un énoncé continu. Le taux de la parole
"rapide" ne peut donc excéder de beaucoup celui de la parole normale approchant
175 mots/minutes dans les meilleures conditions de lecture à voix haute.
Bien que peu concluants, les premiers travaux sur la parole rapide ont eu le
mérite d'encourager la mise au point de techniques ou de systèmes capables de
produire une parole accélérée de meilleure qualité (Leroy 1982).
3-Parole accélérée ou à taux modifié
Avec l'introduction des techniques d'enregistrement et l'utilisation du
magnétophone, les expérimentateurs étaient désormais capables d'accélérer la
vitesse de déroulement de la bande magnétique. La vitesse d'écoute d'un
enregistrement pouvait alors être supérieure et même être double de celle du
discours d'origine enregistré. Toutefois, l'augmentation de la vitesse de
déroulement de la bande magnétique entraînait des modifications des
caractéristiques du signal sonore non négligeables. Ainsi, par exemple, dans le
cas d'une vitesse double, la fréquence de tous les composants du signal vocal
étant doublée, le ton de la voix enregistrée est nettement modifié et s'élève
d'une octave (voix plus aiguë). Ces distorsions sont considérées comme
insupportables par une majorité d'auditeurs. Seul un accroissement de vitesse de
l'enregistrement de 25 pour cent est tolérable (Latz 1967). Actuellement de
nombreux modèles de magnétophone à cassettes ou à bandes magnétiques possèdent
ce système d'accroissement de vitesse de déroulement et permettent de réduire de
25 à 30 pour cent le temps d'écoute. Il est à noter que les voix masculines sont
transformées en voix féminines avec ce système. Les voix les plus graves restent
les plus audibles après augmentation de la vitesse de déroulement.
4-Méthode d'échantillonnage et appareil de Fairbanks (cut and spliced
speech)
En 1950, Miller et Licklider de l'université de Harvard, ont mis en évidence
la redondance du signal vocal. Ils ont effacé de très petites portions
d'enregistrement (quelques millisecondes, 10 fois par seconde). Bien qu'amputés
de nombreux fragments, les mots restent intelligibles. L'intelligibilité des
mots monosyllabiques ne descend pas en dessous de 90% jusqu'à 50%
d'interruption. Il semblerait donc qu'une bonne portion d'un énoncé puisse être
éliminée sans modification sensible d'intelligibilité. Mais il n'est pas encore
possible de parler de compression: le temps d'écoute de ce discours parsemé de
multiples petits effacements, reste toujours le même.Garvey(1953) a eu l'idée de
rapprocher les portions de paroles restantes après ces brefs effacements
d'enregistrement, le résultat fut alors une parole comprimée dans le temps,
intelligible, sans modification de ton, sans distorsion excessive de la parole.
Fairbanks, Everitt et Jaeger (1954) ont mis au point un appareil
électro-mécanique capable d'effectuer la fonction d'échantillonnage proposée par
Miller et Licklider.
Le système de Fairbanks et al. produisait de façon aléatoire des coupures de
très faibles durées dans l'enregistrement, de sorte que la portion éliminée ne
puisse contenir un son entier.
a partir de la technique de Fairbanks et al. (1954) deux compresseurs de
paroles furent commercialisés aux Etats-Unis: le "Eltro Information Rate
Changer" et le "Whirling Dervish". Ces compresseurs étaient relativement chers à
l'achat (3 à 5000 dollars).
5-Methode d'échantillonnage et informatique
Le système de Fairbanks ne permet pas de sélectionner les portions à éliminer
de l'enregistrement . Avec l'évolution des techniques informatiques, cette
sélection est désormais possible. En effet, un programme informatique peut
permettre un échantillonnage sélectif des portions à éliminer d'un signal
redondant (Ball 1961, Scott 1965, Qureshi 1974, Seo 1974). Cette sélection peut
s'appliquer également à des pauses trop longues ou aux voyelles (Miron et Brown
1968). Les techniques de compression faisant appel à l'informatique sont les
plus satisfaisantes, mais elles sont complexes et trop coûteuses pour justifier
leur emploi dans toutes les recherches (Leroy 1982).
6-Méthode d'échantillonnage et synthèse vocale
L'utilisation d'un synthétiseur de voix permet de générer une compression de
qualité (Canpanella 1967, Canpanella et Coldberg 1973). Avec cette technique, le
signal d'entrée est analysé en termes de "caractéristiques standardisées de
paroles" et digitalisé. Après échantillonnage, le signal de sortie est
synthétisé pour ressembler au mieux à la voix d'origine, mais sous forme
comprimée.
Breuel et Levens (1974) ont montré que la parole peut être comprimée au moyen
d'un compresseur harmonique: un diviseur de fréquence permet d'obtenir un débit
de parole deux fois supérieur au taux d'origine. Toutefois, le compresseur
harmonique ne peut effectuer qu'une seule compression: deux fois le taux
d'origine; aussi, a-t-il peu de valeur pratique.
Les différentes techniques décrites précédemment sont à l'origine de
l'élaboration d'un bon nombre de prototypes, puis à la commercialisation
de compresseurs:
-
le "Varispeech I" et le "Varispeech II" produits par Lexicon Inc.
-
variable speech control copycorder model CC-103 produit par Magnetic
Video Corporation.
-
Vocom-I et Vocom-II produit par PKM Corporation, et plus tard le modèle
A7 commercialisé par la Variable Speech Control Company (VSCC) .
III-LES PROBLEMES METHODOLOGIQUES ET PROCEDURAUX
1-La compression de la parole
Selon le système utilisé, l'accélération et la compression de la parole
peuvent être obtenues par différentes méthodes. La parole accélérée est produite
le plus souvent par accélération de la vitesse de déroulement de la bande
magnétique sur laquelle est enregistré le texte parlé. La parole comprimée peut
être produite par de nombreuses techniques, mais la méthode la plus couramment
utilisée est la méthode dite d'échantillonnage. Selon son principe, des petits
segments d'enregistrement, de très courtes durée (10 à 80 millisecondes) sont
supprimés à des intervalles réguliers. Les portions restantes sont ensuite mises
bout à bout.
Le résultat obtenu, est une parole dite comprimée qui réduit le temps
d'écoute, de la version d'origine, mais sans les distorsions de qualité et de
hauteur produites par l'augmentation de la vitesse de déroulement d'un
enregistrement (parole accélérée).
Ainsi, avec la technique de compression temporelle, la réduction d'un
discours s'effectue de la manière suivante:
-
des interruptions temporelles périodiques sont effectuées sur le message
enregistré par extinction et allumage instantanés du signal. Les périodes
"off" peuvent être variables: 20 ou 30 millisecondes par exemple, parfois
davantage.
-
les périodes "on" restantes sont rapprochées pour former un signal ou
message continu.
-
le taux de compression est déterminé par la longueur et la fréquence des
périodes "off".
-
le débit de la parole du message comprimé qui peut être défini
par le nombre de mots émis par minute, dépend:
-
de la longueur et de la fréquence des périodes "off";
-
du débit de la parole du message initial.
Exemple: un message comprimé de 250 mots par minute peut être produit par 50
pour 100 de compression d'un message enregistré à 125 mots par minute ou par une
compression de 33 pour 100 d'un message enregistré à 188 mots par minute.
L'intelligibilité et la compréhension d'un message comprimé pourront
donc dépendre:
-
du nombre de mots par minute émis lors de l'enregistrement du message
d'origine.
-
de la longueur des interruptions (périodes "off"); -
de la fréquence des périodes "off";
-
de l'intensité en décibels des sons émis.
2-Le degré de compression
La diversité des méthodes de production de la parole comprimée engendre des
compressions différentes tant sur le plan quantitatif (degré de compression) que
sur le plan qualitatif. Bien que les études expérimentales se soient multipliées
depuis les années 60, l'absence de pratique commune, de vocabulaire précis et
bien défini pose des problèmes non négligeables quand il s'agit de rassembler
les résultats de plusieurs études. En effet, ce défaut d'unicité dans les termes
employés peut conduire à une confusion ou une interprétation erronée quand les
résultats de différentes expérimentations sont comparés.
Dans les multiples études que nous avons consultées, le degré de compression
est exprimé de diverses façons. Le montant de la compression peut être défini
par le pourcentage du temps de l'enregistrement d'origine qui est conservé quand
le message parlé est reproduit à un taux plus élevé. Dans ce cas, par exemple
une compression de 40 % signifie que le temps d'écoute de la version comprimée
représente 40 % du temps de production de la version originale. Ainsi, un
enregistrement de 60 minutes pourrait être écouté en 24 minutes dans cet
exemple.
Le degré de compression est aussi défini très souvent comme étant le
pourcentage du temps économisé par l'écoute de la version comprimée. Dans notre
exemple 40 % de compression signifie que le temps d'écoute de la version
comprimée est réduit de 40 % , c'est-à-dire qu'un enregistrement de 60 minutes
pourra être entendu en 36 minutes.
Le degré de compression peut également être défini en termes de coefficient
d'accélération du taux des mots dans l'énoncé comprimé par rapport au taux des
mots dans l'énoncé d'origine. Par exemple, un indice de 1,5 signifie que le taux
des mots après compression est 1,5 fois le taux des mots avant la compression.
Lorsque ces deux indices (pourcentage de compression et augmentation du taux des
mots) sont comparés, il convient de rappeler que la relation entre eux n'est pas
linéaire. Ainsi, pour un coefficient d'accélération s'élevant de 1,1 à 1,2
correspond une augmentation de pourcentage de compression de 9% à 17%; alors
que pour un coefficient d'accélération s'élevant de 1,9 à 2 correspond une
modification de compression variant de 47% à 50% (Foulke 1969). En outre, ces
deux indices, pourcentage de compression et coefficient d'accélération du taux
des mots, n'indiquent pas directement le taux des mots de l'énoncé comprimé.
3-Le taux des mots
Le débit des paroles d'un discours parlé peut être défini comme étant le
nombre de mots émis par minute. Le taux des paroles comprimées ou accélérées
dépend avant tout du taux des paroles de l'énoncé d'origine et cela quel que
soit le mode de compression utilisé.
Dans un paragraphe précédent, nous avons signalé que le taux des mots émis
par un locuteur dépend de nombreux facteurs et qu'il varie en moyenne entre 125
(paroles conversationnelles) et 175 (lecture à voix haute) mots par minute. Or,
cet indice (nombre de mots par minute)n'est pas un indice fidèle du débit de la
parole d'un orateur qui peut dépendre de la nature du discours prononcé. En
effet, selon le thème développé et le vocabulaire utilisé, un texte peut être
plus ou moins dense et contenir des mots plus ou moins longs. Un indice plus
précis pourrait être le nombre de syllabes émises par minute plutôt que le
nombre de mots (Carroll 1967, cité par Foulke 1969).
Le taux de lecture orale dépend de la nature du texte lu, mais aussi du style
du lecteur. Ce taux varie considérablement d'un lecteur à un autre et même d'un
passage de lecture à un autre pour un lecteur donné (Foulke 1967). Le débit de
la parole reflèterait "le niveau d'éveil" d'un sujet. Dans une revue, Johnson et
al. (1963) concluent que la perception d'un taux de paroles donné pour un sujet
est lié à son taux de lecture orale: un sujet perçoit d'autant mieux les
paroles rapides que sa vitesse de lecture est élevée. On pourrait donc
s'attendre à de grandes variations inter et même intra sujets dans les études
concernant l'intelligibilité et la compréhension des paroles comprimées.
Dans la plupart des études sur la parole comprimée, la compression est faite
sur un texte lu à voix haute et enregistré. Seul le taux des mots d'un texte
énoncé par un synthétiseur de voix sera régulier et invariable pendant toute la
durée de l'émission.
Il convient de remarquer que dans les expériences sur l'intelligibilité de la
parole comprimée utilisant une présentation de mots individuels, l'indice de
compression ne peut être exprimé en taux de mots. L'indice de compression peut
s'exprimer dans ce cas par un taux ou un coefficient de compression.
IV-INTELLIGIBILITE ET COMPREHENSION DE La PAROLE COMPRIMEE:
1-Définitions:
L'intelligibilité est " l'état ou le caractère de ce qui peut être entendu
distinctement ": c'est une reconnaissance phonétique. Elle dépend du niveau
périphérique du traitement de la parole. qui analyse les caractéristiques
propres à la structure d'un message parlé (phonétiques, phonologiques et
prosodiques).
L'intelligibilité peut être considérée comme une propriété de la
communication parlée impliquant la reconnaissance des sons et faisant
essentiellement appel à la perception auditive (Foulke et Stitch 1969, Lehiste
et Peterson 1959), tout comme la lisibilité dépend d'abord des propriétés
physiques d'un message écrit.
Par contre la compréhension est une reconnaissance sémantique, c'est-à-dire
la saisie du sens d'un message (parlé ou écrit), ce qui implique la prise en
compte du contexte. Un mot isolé, hors contexte peut avoir de multiples
significations ou "ne rien vouloir dire". La compréhension par l'écoute implique
la présentation d'un énoncé continu. La compréhension est définie comme étant la
faculté de concevoir, de pénétrer le sens de ce que dit quelqu'un, de ses
explications ..etc., de se faire d'une chose une juste idée, une idée conforme à
sa nature".
Dans la mesure où les premières étapes de l'analyse et du traitement du
signal vocal retentissent sur la compréhension du message, , l'intelligibilité
d'un discours comprimé ou non retentit de façon évidente sur sa compréhension.
Toutefois selon Lindsay et Norman (1981), toute prise d'information est le
résultat de l'interaction de deux mécanismes, l'un dirigé par données, l'autre
dirigé par concepts. Il sera donc très difficile, en présence d'un discours
continu de dissocier l'influence des facteurs liés à l'intelligibilité de ceux
liés à la compréhension dans l'analyse des résultats d'un sujet.
2-Les indices de mesure:
La mesure de l'intelligibilité de la parole comprimée dans le temps est
définie par la mesure de la capacité à répéter de façon exacte un mot, une
phrase ou quelques lignes.Une procédure classique dans ce domaine consiste à
faire subir une compression temporelle à plusieurs phrases selon un même
procédé, puis les mots sont distribués individuellement à l'auditeur dont la
tâche est de reproduire oralement ou par écrit le mot entendu. Le score du sujet
qui traduit l'indice d'intelligibilité des mots perçus est défini par le
pourcentage des mots identifiés correctement.
Un autre indice d'intelligibilité est le temps de réaction du sujet. Quand un
stimulus est difficile à discriminer le temps de réaction de choix est allongé.
Cet indice serait plus sensible dans la mesure où un changement dans le taux de
compression pourrait produire une même réponse exacte, mais un temps de réaction
de choix plus élevé. Cet allongement du temps de réaction donnerait donc une
information supplémentaire sur l'intelligibilité des paroles comprimées (Foulke
et Stitch 1969).
Un seuil d'intelligibilité de la parole comprimée peut également être défini
par le minimum d'intensité nécessaire pour qu'un certain pourcentage
(habituellement 50 %) des mots d'une liste soit correctement identifiés (Calearo
et Lazzaroni 1957, DeHaan et al. 1978, 1980).
La compréhension est plus difficile à objectiver. Différents tests sont
proposés.
Pour évaluer la compréhension de jeunes enfants par exemple Woods (1965, cité
par Foulke 1969), utilise des ordres que les enfants doivent exécuter:
s'asseoir, se lever, lever un bras, faire l'abeille etc.
Belamy (1966) a utilisé un questionnaire à choix multiple, puis un entretien
(interview) pour compléter l'analyse. D'autres auteurs ont employé des
questionnaires nécessitant des réponses précises, mais très courtes (Friedman et
al. 1966, Myers 1978).
3-Les facteurs influençant l'intelligibilité de la parole comprimée
dans le temps:
a - Les caractéristiques du signal:
L'intelligibilité de la parole comprimée est influencée par la méthode
utilisée pour effectuer la compression temporelle. Le signal vocal est plus
altéré et rapidement moins intelligible par la méthode d'accélération de la
vitesse que par la méthode d'échantillonnage (Nixon et al. 1968, Nixon et Sommer
1968, cités par Foulke 1969).
Un message comprimé par la méthode d'échantillonnage peut être conçu comme
étant une succession de segments temporels, appelés périodes d'échantillonnage.
C'est la fraction restante des échantillons qui détermine le taux de
compression. Si 10 ms (milliseconde) d'une période de 20 ms ou 30 ms d'une
période de 60 ms sont restantes, le montant de la compression est le même soit
50%. L'intelligibilité de la parole comprimée dépend de la longueur de la
portion éliminée et de la fréquence de ces coupures. Quand la durée de la
fraction éliminée dépasse 80 ms, l'intelligibilité diminue de façon
significative (Fairbanks et al., 1957). Pour Gerber et al. (1977),
l'intelligibilité des mots décline rapidement quand l'intervalle d'interruption
excède 60 millisecondes.
Retarder le signal de 7,5 ms dans un écouteur améliore l'intelligibilité, ce
retard provoquant une redondance binaurale (Cramer 1965, cité par Foulke 1969).
Scott (1965) utilise un écouteur pour faire entendre les échantillons restants
de la paroles comprimées et l'autre écouteur pour faire entendre en même temps
les échantillons supprimés. Il obtient ainsi un résultat favorable avec cette
écoute dichotique.
Considérons deux messages identiques: dans l'un de courtes portions sont
effacée mais non enlevées, le message est "interrompu", dans l'autre les
périodes "on" sont seules gardées, les périodes "off" étant éliminées, le
message est alors comprimé. Tant que le montant des portions "off" ne dépasse
pas 50%, il n'y a pas de différence entre le message interrompu et le message
comprimé, mais au-delà les mots interrompus sont plus intelligibles que les mots
comprimés (expériences citées par Foulke 1969).
b-Les facteurs linguistiques:
la méthode d'accélération de vitesse dégraderait davantage les sons contenant
des voyelles que ceux contenant des consonnes, alors que la méthode
d'échantillonnage modifierait davantage les consonnes que les voyelles (Garvey
1953 Tarte et al. 1982).
Dans une expérience dans laquelle le nombre des phonèmes par mot peut varier
de 3 à 9, l'augmentation du nombre des phonèmes améliore l'intelligibilité des
mots ayant subi une compression temporelle par la méthode d'échantillonnage
(Henry 1966). Des phrases courtes entendues à vitesse accélérée sont plus
intelligibles que des mots isolés (Lump et Webster 1961). Les mots longs ou les
phrases courtes apportent davantage d'information auditive et sémantique que les
mots courts et isolés. En outre, quelques mots ou une phrase permettent
d'orienter l'attention et de prédire avec plus ou moins d'exactitude ce qui peut
suivre: ces indices contribuent à améliorer l'intelligibilité d'un discours
continu comprimé dans le temps. mais une question peut égale ment se poser: la
perte d'information provoquée par la compression temporelle d'un
discours continu ne pourrait -elle engendrer une diminution croissante
et cumulative du nombre des indices au fur et à mesure du déroulement de
l'énoncé?
c-Les facteurs liés à l'auditeur:
Une exposition répétée à la parole comprimée améliore son intelligibilité
(Gade et al. 1984). l'entraînement du sujet, la familiarité et la nature
concrète ou abstraite du texte écouté sont des facteurs qui influencent
l'intelligibilité de la parole comprimée (Foulke et Stitch 1969).
4-Les facteurs influençant la compréhension de la parole comprimée:
a-Les facteurs liés au signal sonore:
Trois études citées par Foulke (1969) montrent que l'augmentation du taux des
mots au-delà du taux normal provoque d'abord une diminution modérée de la
compréhension,mais au-delà de 275 mots par minute, le déclin de la compréhension
est brutal et s'accélère. L'efficacité de l'apprentissage définie par Myers
(1978) par un indice qui exprime la quantité d'information comprise et retenue
pour un temps d'écoute donné s'accroit jusqu'à ce que le débit de la parole ne
dépasse pas 280 mots-minute.
b-Compréhension et méthodes de compression:
Des sujets peu habitués à écouter des textes enregistrés et n'ayant jamais
entendu de paroles comprimées, comprennent mieux un discours enregistré à un
taux de 275 mots/minute par la méthode d'échantillonnage qu'un même texte
enregistré au même taux avec la méthode d'accélération de vitesse (McMaine 1962,
Foulke 1962). Toutefois des collégiens aveugles habitués à écouter des énoncés
enregistrés, ne présentent pas de différences dans la compréhension de discours
comprimés avec les deux méthodes (Foulke 1966 a,).
Selon les auteurs (Foulke 1969, Leroy 1982), l'intelligibilité des paroles
comprimées serait plus sensible à la méthode de compression temporelle que la
compréhension.
Pour évaluer l'intelligibilité d'un message parlé, les expérimentateurs
utilisent des mots isolés, des ordres ou de très courtes phrases. L'auditeur ne
peut s'appuyer sur le contexte pour prédire les paroles à venir comme il le
ferait dans un énoncé continu utilisé pour tester la compréhension.Ce résultat
pourrait être expliqué par le fait que la compréhension de la parole comprimée
est influencée par des processus de traitement perceptifs et cognitifs de
l'auditeur.
c-La nature du matériel comprimé:
En s'appuyant sur les réponses à un questionnaire à choix multiple, Foulke et
al. ( 1962) évaluent la compréhension d'un texte littéraire et d'un texte
scientifique quand ils sont entendus à taux normal. Ils trouvent que la
compréhension du thème scientifique est plus difficile que celle du thème
littéraire, mais quand le taux des mots augmente la compréhension de l'énoncé
scientifique ne diminue pas aussi rapidement que celle de l'énoncé littéraire.
Pour Fairbanks et al. (1957), l'effet du taux de compression sur la
compréhension d'un discours ne dépend pas de la complexité de son contenu.
Les difficultés d'un texte écouté ne sont pas les mêmes que celles d'un texte
lu. Les différences qui existent entre un matériel oral et un matériel écrit
oblige l'auditeur et le lecteur à traiter l'information de manière différente.
Une page imprimée est un matériel spatial, le langage parlé, séquentiel est
traité dans une dimension temporelle. Contrairement au lecteur devant une page,
l'auditeur a recours essentiellement à sa mémoire et ne peut exercer aucun
contrôle sur l'ordre dans lequel il rencontre les composants syntaxiques et
sémantiques d'une phrase. Selon Foulke (1969), il n'est pas possible d'utiliser
les mêmes tests pour évaluer la difficulté d'un texte lu et celle d'un texte
écouté.
Newman (1982) a trouvé que la compression temporelle diminue davantage la
perception des items et phrases comprimés non prévisibles que celle des phrases
prévisibles.
Pour cet auteur, sous une condition de stress temporel, des sujets normaux
traitent plus difficilement l'information phonémique et sémantique contenue dans
des phrases réelles mais non prévisibles. Selon lui,dans ces conditions , les
sujets relient l'information linguistique et sémantique contenue dans les
phrases. Les auditeurs déficients dans le traitement linguistique seraient donc
incapables de tirer avantage des données distribuées selon un débit trop élevé.
d-La compréhension et les variables liées à l'orateur:
Les caractéristiques de la voix humaine varient considérablement selon les
sujets. Le timbre, la tonalité, la fréquence et l'intensité d'une voix, le
rythme des paroles diffèrent d'une personne à l'autre et pour un même orateur
ces caractéristiques peuvent varier selon l'état d'éveil du sujet, ses
objectifs, la nature du discours ... Chaque orateur a un style de lecture
particulier. .
Une expérience de Foulke (1964) a montré que l'effet de l'orateur sur la
compréhension des auditeurs ne dépend pas du taux des mots auquel le discours
est présenté.
Les pauses et l'intonation sont des facteurs de compréhension de la parole
comprimée (Buttet 1980, Wingfield 1980). Miron et Brown (1968) constatent que la
meilleure méthode de compression est celle qui conserve les temps de pause
proportionnellement au taux de compression et qui maintient une bonne
distribution des pauses même si celles-ci sont réduites. Pour Friedman et
Johnson (1969), l'insertion de pauses entre les principaux segments d'une phrase
permet un meilleur rappel qu'une insertion de pause entre les phrases. Selon
Goldman-Eisler (1964) et Youngsoo (1984), les pauses donnent un temps de codage
et de décodage de l'information. Tantiblarphol et al. (1984) ont observé 144
lycéens écoutant individuellement une histoire de 20 phrases à 225 m/mn ou 300
m/mn. De façon significative, ils notent un meilleur rappel à 300 m/mn pour une
condition d'insertion d'un temps de pause entre les phrases.
e-La compréhension et les facteurs liés à l'auditeur:
Les caractéristiques liées à l'auditeur peuvent influencer sa compréhension
de la parole comprimée dans le temps. Plusieurs études ont analysé l'influence
du sexe de l'auditeur. En dépit des contradictions dans les résultats, il
semblerait que le sexe ait peu d'influence sur la compréhension d'un discours
comprimé (Foulke et Stitch 1967, et Friedman 1964).
L'âge et le niveau scolaire d'un enfant influencent sa capacité à comprendre
des paroles comprimées (Fergen 1955,Wood 1965). Beasley et al. (1976) montrent
que la discrimination de mots monosyllabiques (présentation comprimée)
s'améliore avec l'âge . Freeman et Beasley (1978) ont répliqué cette expérience.
Veasley et Flaherty-Rintelmann (1976) et Beasley et al. (1980) ont trouvé les
mêmes résultats avec des phrases comprimées. Tous ces auteurs sont cités par May
(1984) qui étudie l'influence de l'âge sur la discrimination de phrases
comprimées à 50 %. Quatre groupes d'âge sont étudiés: 6, 8, 10 et 21 ans.
L'auteur conclut que les capacités de discrimination de la parole comprimée
s'améliorent avec la maturité et que les capacités de traitement auditif
maximales atteignent une asymptote vers 11 ou 12 ans. Selon May (1984), le temps
de traitement phonémique est équivalent à celui des adultes vers l'âge de 12 ans
et l'évolution ontogénétique de l'efficacité du traitement auditif atteint un
stade optimal au début de la deuxième décade de la vie.
Plusieurs auteurs signalent une relation positive entre l'intelligence de
l'auditeur et sa performance dans la compréhension d'un énoncé comprimé en
fonction de l'augmentation du taux des mots (Fairbanks et al. 1957, Godstein
1940, Nelson 1948). Teach (1979) a mis en relation le facteur quotient
intellectuel du sujet avec le débit des mots:le quotient intellectuel n'aurait
pas d'influence sur l'intelligibilité des paroles ayant subi une compression
temporelle, mais l'auteur a observé une influence de ce facteur sur la
compréhension.
La compréhension d'un discours comprimé pourrait être améliorée par
l'entraînement à l'écoute de la parole comprimée. Plusieurs études illustrant
cet effet de pratique sont citées par Leroy (1982). Pour Stitch (1970) les
sujets non entraînés feraient d'abord attention aux "éléments mots" du message.
Après entraînement, ces mêmes sujets s'intéressent davantage aux concepts
présentés.
Les sujets "indépendants à l'égard du champ", capables d'effectuer rapidement
une analyse sémantique pourraient comprendre la parole rapide avec ou sans
expérience (Leroy 1982). Alcala (1984) a utilisé deux taux de compression (225
m/mn et 300 m/mn) et deux modes de présentation: présentation orale seule et
présentation orale associée à des images et observe les effets sur la
compréhension des sujets de style cognitif différent (dépendants et indépendants
à l'égard du champ). Les résultats mettent en évidence une interaction double
entre les variables image, taux de compression et style cognitif. Les sujets
indépendants à l'égard du champ sont capables de traiter des discours comprimés
sans avoir recours à une redondance iconique. Olson (1984) a observé 80
étudiants, dépendants et indépendants à l'égard du champ, écoutant un discours
selon les débits suivants: 90 m/mn, 120 m/mn, 150 m/mn et 250 m/mn. Les sujets
indépendants sont plus performants pour les débits élevés que les sujets
dépendants à l'égard du champ. Alcala en 1985 a obtenu les mêmes résultats.
Les traitements perceptifs et cognitifs responsables des différences
interindividuelles dans la vitesse de lecture d'une page écrite, pourraient
également contribuer aux différences interindividuelles dans les capacités à
comprendre la parole comprimée. Ainsi, les lecteurs rapides pourraient être
capables de comprendre la parole comprimée à un taux plus élevé que les lecteurs
lents. Cette hypothèse étudiée par Goldstein (1940) et par Orr et al. (1965) a
conduit à deux expériences (citées par Foulke 1969) dans lesquelles il existe
une corrélation positive entre la vitesse de lecture d'un sujet et sa capacité à
comprendre la parole rapide. De plus il est démontré également que la pratique
de l'écoute d'une parole rapide conduit à améliorer la vitesse de lecture.
Un autre facteur pourrait influencer la compréhension de la parole rapide:
la préférence de l'auditeur (Lass et al. 1974, Gade 1979, Gade et al. 1980).
Dans une étude concernant la préférence d'écoute d'auditeurs adultes, Cain et
Lass (1974) ont testé 9 taux de mots s'échelonnant de 100 m/m, (mots par minute)
à 300 m/mn. Le taux préféré est de 175 m/mn. Dans une expérience de Orr (1968)
dans laquelle les participants peuvent faire varier eux-mêmes le taux de
présentation orale, le taux choisi est environ 1,5 fois le taux normal. Dans les
mêmes conditions, pour Foulke et Stitch (1966), le taux préféré de lycéens est
de 207 m/mn. Pour Nath et al. (1981), dans un cours de formation continue pour
adulte âgés de 22 à 55 ans, les sujets ont bien accepté un débit de 250
mots/minute correspondant à une compression de 50%. Leeper et Thomas (1978) ont
testé le taux de mots préféré par des enfants de 7 à 9 ans en utilisant un
paradigme de comparaison par paires et neuf taux de mots variant de 100 à 300
m/mn avec des intervalles de 25 m/mn. Les enfants préfèrent le débit de 200 m/mn
et n'apprécient pas le taux de 100 m/mn.
Pour Lambert et al. (1980), la compréhension de la parole comprimée serait
fonction de l'entraînement du sujet.
5-La rétention de la parole comprimée:
La plupart des expériences citées par Leroy (1982) ne concluent pas à une
moins bonne rétention d'un texte entendu avec un débit de paroles élevé (Foulke
1966, Friedman et al.1967). George (1970) n'a pas observé une moins bonne
rétention d'un discours écouté à vitesse rapide s'il a été compris. Arrasjid
(1973) a présenté un test de rétention à des lycéens, une semaine après l'écoute
d'un enregistrement comprimé et d'un enregistrement à taux normal. L'auteur n'a
pas observé de différences en ce qui concerne la rétention des informations
présentées sous ces deux formes.
V-APPLICATIONS POTENTIELLES DE La PAROLE COMPRIMEE ET DE L'ECOUTE RAPIDE
Nous suggérons ici quelques pistes d'études pour des applications
potentielles. Toutes les expériences exposées ont été effectuées avec la langue
anglaise. Il est bien entendu que des recherches approfondies avec la langue
française sont nécessaires pour proposer des applications effectives.
1-Les applications pédagogiques:
La plupart des recherches relatées ici ont été effectuées aux Etats-Unis et
associent une écoute rapide à d'autres formes de présentation de l'information
(Leroy 1982).
a-Ecoute rapide et informations visuelles:
La parole comprimée est présentée en même temps que des schémas ou des images
filmées. Dunathan et al. 1975 ont présenté à des lycéens un film vidéo et un
enregistrement audio au même taux de compression (50%, 33%, 25% et 0%). Les
sujets avaient pour objectif la construction d'un bateau. a 50 % de compression,
les deux présentations simultanées auditives et visuelles ont conduit à la même
performance motrice (construction d'un bateau) qu'avec les taux de compression
plus faibles (0 %, 25 %, 33 %). Ludrick (1974) a utilisé un vidéo enregistrement
à deux taux de présentation (150 et 211 m/mn). Les étudiants pour qui le taux de
présentation était le plus élevé ont obtenu le meilleur résultat. Clements
(1985) a utilisé des schémas associés à l'audition de paroles comprimées par des
collégiens.
b-La présentation orale:
Un groupe de 29 étudiants écoutent un cours de biologie à un taux normal
(entre 113 et 138m/mn) tandis qu'un autre groupe de 28 sujets écoute le même
cours enregistré et comprimé (193 à 238 m/mn) par suppression des pauses
(Sarenpa 1971). Aucune différence significative ne fut observée entre les
connaissances des étudiants utilisant les enregistrements à taux normal et les
connaissances des étudiants utilisant les enregistrements à taux comprimé;
toutefois ce dernier groupe gagne du temps dans l'apprentissage. Lass (1974)
compare les performances des étudiants placés dans deux conditions d'étude.
D'une part ils écoutent des enregistrements comprimés à 50 % par la méthode
d'élimination des pauses, d'autre part, ils sont placés en condition de lecture
libre. Lors d'un examen final, la performance des étudiants est meilleure pour
les réponses aux questions concernant les enregistrements comprimés que sur les
réponses aux questions concernant les lectures libres. Sur les 150 étudiants
interrogés, 82 % préfèrent associer l'écoute d'enregistrements comprimés à des
discussions plutôt que la lecture libre.
D'autre auteurs ont mis en évidence l'utilité et l'efficacité de l'écoute
d'enregistrements comprimés (Challies 1973,Primerose 1973, Shore 1975). En
général les résultats sont favorables à la parole comprimée tant que la
compression ne dépasse pas 50 % et une grande majorité d'étudiants préfèrent
"l'écoute rapide". Les groupes d'étudiants qui utilisent un compresseur gagnent
un temps appréciable. Au-delà de 50 % de compression ou au-delà de 280 m/mn, la
compression est mal acceptée par les auditeurs et entraîne une diminution de la
compréhension pouvant retentir sur la performance (Leroy 1982).
c-La parole comprimée et la lecture:
Plusieurs chercheurs ont proposé d'étudier l'apport de la compression
temporelle dans l'augmentation de la vitesse de lecture. L'audition d'un
enregistrement dont le débit augmente progressivement, associée à la lecture
silencieuse du même texte pourrait améliorer la vitesse de lecture (Orr 1964,
Bradtmueller 1978 et 1979, Freeman et Beasley 1978, Leroy 1983). Toutefois, les
résultats sont contradictoires dans ce domaine. (Reland 1966, Leroy 1982).
Cependant, l'effet bénéfique ou non de la compression temporelle d'un
enregistrement sur la lecture pourrait dépendre de l'âge du sujet et de son
développement cognitif. Pierce (1978) a mis en évidence l'importance du facteur
développemental: pour cet auteur, l'effet bénéfique de la compression sur
l'augmentation de la vitesse de lecture pourrait être observé chez les lycéens.
d-Apprentissage d'une langue étrangère:
Les méthodes d'expansion et de compression temporelle sont utiles pour
développer les capacités d'écoute et de compréhension et pour favoriser
l'apprentissage d'une langue étrangère (Flahorty 1979, Harvey 1984, Vernick,
1985).
e-Formation continue et études supérieures:
Une autre application de la compression temporelle fut proposée pour
accélérer l'acquisition d'une grande quantité d'informations chez les étudiants
à l'université et chez les professionnels en formation continue (Rippey 1975).
Nath et al.en 1981, ont utilisé la technique de compression temporelle dans le
cadre d'une formation continue de pharmaciens et Drake en 1981 pour la formation
continue des enseignants.
Short (1978) utilise la compression temporelle pour l'enseignement et
l'auto-formation des étudiants à l'université de Syracuse. Beatty et al. (1980),
Miner et al. (1980), Olson (1986) notent une plus grande efficacité de
l'apprentissage dans l'enseignement supérieur grâce à l'utilisation de la
compression temporelle.
2-Education spécialisée:
a-Handicap visuel:
Une application proposée et étudiée par un bon nombre d'expérimentateurs se
situe dans le domaine de l'acquisition des connaissances chez les sujets
aveugles (Bischoff 1979). En effet, la lecture braille est relativement lente
comparée à la lecture visuelle silencieuse (Myers 1978, Colleen 1980). En
moyenne, un bon lecteur en braille lit avec les doigts 100 à 120 m/mn alors
qu'un lecteur voyant lit avec les yeux plus de 300 m/mn ( Myers 1978). Foulke à
Louisville fut le premier à s'intéresser à cette application dans les années 60;
de nombreux auteurs ont poursuivi les recherches dans ce domaine (Myers 1978,
Bancroft 1981 et Bendinelli 1982).
b-Retard scolaire:
Des applications de la compression temporelle de la parole ont été proposées
par différents auteurs pour favoriser l'éducation des enfants en difficultés
scolaires à l'école primaire (Zucker et D'Alonzo 1981) et au lycée (D'Alonzo et
Zucker 1981).
3-Tests et diagnostic des pathologies auditives:
Riensche et al. (1983) ont proposé des données normatives sur
l'intelligibilité de la parole comprimée chez 40 auditeurs normaux âgés de 18 à
26 ans. Ils ont proposé aux sujets 5 séquences de rimes extraites du test de
Fairbanks (1958), présentées de façon monaurale à l'aide d'écouteurs à 40
décibels. Les sujets doivent répéter les phonèmes initiaux dans l'ordre entendu.
Les séquences sont présentées à débit normal ou comprimées à 60%, associées à un
masquage multivoix ou non. Les auteurs considèrent que leurs données normatives
permettront une application dans la détection des problèmes auditifs. Ils ont
prolongé cette étude avec 72 enfants droitiers distribués en trois groupes
d'âges différents: 7- 8, 9-10 et 11-12 ans. Beasley et al. (1980) ont établi
des données pour 96 jeunes adultes sans problèmes d'audition avec des
compressions de 40, 50, 60 et 70% et deux degrés d'intensité (24 et 40
décibels).
4-Marketting et publicité:
Schlinger et al. (1983) ont étudié une application originale de la
compression de paroles dans le domaine du marketting et de la publicité. Selon
leurs observations, les consommateurs apprécieraient davantage la parole rapide
plus dynamisante et optimiste. Les personnes qui parlent vite sont mieux
considérées par les auditeurs (Mc Lachlan 1982).
VI - CONCLUSION
Les recherches des acousticiens (Vicard 1987, Wang 1987) et des
informaticiens (Pierrel 1987) qui ont pour objectif la synthèse et la
reconnaissance de la parole, utilisent les résultats des phonéticiens,
des phonologistes, des linguistes, des psychologues, mais en contre
partie vérifient ces résultats:
-
la parole est redondante et reste intelligible après élimination de
petits segments du signal vocal,
-
la durée d'un phonème varie entre 30 millisecondes à quelques centaines
de millisecondes,
-
des "silences" sont indispensables pour la reconnaissance de certaines
consonnes et l'intelligibilité de la parole,
-
les pauses et la prosodie jouent un rôle important dans la compréhension
des informations parlées,
-
la coarticulation et les interactions entre les différentes étapes du
traitement rendent ces études très complexes,
-
la schématisation des mécanismes et des processus mis en jeu est
toujours réductionniste, même si elle permet d'affiner les résultats et
d'améliorer la qualité des synthèses vocales, des progrès sont encore
attendus dans la reconnaissance de la parole,
-
l'attention et la mémoire sont importantes dans l'analyse, la
compréhension et l'interprétation d'un message parlé.
Étudiées sur un plan théorique et pratique surtout à partir des années 60,
les techniques de compression temporelle de paroles ont conduit à différentes
applications. Des revues de questions de Foulke (1969) et Leroy (1982), ainsi
que des différentes expérimentations effectuées dans les années 80, plusieurs
idées générales peuvent se dégager.
À un niveau théorique, deux catégories d'études sont à envisager:
1-Les expériences qui analysent les relations entre le taux des mots d'un
discours et l'intelligibilité de cet énoncé. La compression temporelle produite
par la méthode d'échantillonnage, permet une intelligibilité relativement
correcte avec des taux de compression relativement élevé (50 et 60 %) et avec
une élimination de signal sonore assez importante (jusqu'à 60 millisecondes).
Toutefois, il semblerait que les durées des segments éliminés, pour lesquelles
l'intelligibilité reste optimale, soient comprises entre 10 et 30 millisecondes.
Pour l'intelligibilité associée à un niveau périphérique du traitement du
signal vocal, tous les paramètres n'ont pas la même importance. Par exemple les
deux ou trois premiers formants d'une voyelle sont suffisants pour la
discriminer. D'autre part, l'oreille humaine ne peut percevoir des durée de
signal sonore inférieures à 30 millisecondes. Pour la discrimination de
certaines consonnes, la présence de "silence" étant indispensable, l'élimination
d'une trop grande portion de signal pourrait affecter l'intelligibilité du
message. C'est pourquoi nous pensons que des périodes "off" comprises entre 10
et 30 millisecondes sont préférables.
2-Les études qui évaluent la compréhension liée à l'écoute par rapport à
différents taux de mots. La compréhension décroît modérément en fonction de
l'augmentation du taux des mots jusqu'à une certaine limite qui est de 275 mots
par minute. La compréhension d'un discours diminue brusquement et très
rapidement pour un débit de parole dépassant 275 mots/minute.
L'augmentation du taux de compression a un effet différent sur la
compréhension liée à l'écoute et sur l'intelligibilité des mots.
Enfin il convient de signaler que l'intelligibilité et la compréhension d'un
discours accéléré par la méthode d'accélération de la vitesse de déroulement
d'une bande magnétique, sont fortement diminuées au-delà de 30 %.
Ces résultats montrent que l'intelligibilité des mots ne suffit pas à prédire
le taux de compréhension du discours. La compréhension du langage parlé implique
l'enregistrement continu (codage et stockage) des informations parlées. Elle
nécessite un traitement de l'information et par conséquent un minimum de temps.
Quand le taux des mots est trop élevé, ceux- ci ne peuvent être traités aussi
rapidement qu'ils sont reçus. En conséquence, des informations sont perdues.
La présentation séquentielle d'un énoncé parlé, le temps nécessaire au
traitement perceptif et cognitif d'un signal auditif expliqueraient ce seuil de
275 mots/minute. L'étude de la compréhension d'un discours implique l'écoute
d'une parole continue et de nombreux facteurs peuvent alors être influencés par
la compression temporelle: la coarticulation, la prosodie, l'accès au lexique,
l'intégration syntaxique, la mémoire à court terme (Chodorow 1979). Les
premières expériences que nous avons effectuées avec des étudiants (Richaume
1987, 1988) ont mis en évidence une variabilité interindividuelle assez
prononcée dans l'intelligibilité et la compréhension de la parole comprimée. En
reprenant le point de vue de Baddeley (1986) le rôle de la mémoire à court terme
et de la vitesse d'articulation du sujet sont probablement des facteurs
importants. Quand le sujet doit maintenir une information en mémoire à court
terme, il procède à une auto-répétition de maintenance. L'auto-répétition
mentale dépendrait de la vitesse d'articulation ou du moins de sa vitesse de
répétition intérieure. Plus le sujet articule vite, plus le nombre de mots
répétés est élevé. Nous pensons que le traitement et la mémorisation de
L'information auditive sont favorisés par une articulation rapide: les sujets
qui articulent vite et qui lisent vite comprendraient mieux la parole comprimée.
Au niveau pratique, l'évolution des techniques électroniques, a pu rendre
possible l'insertion de processeurs dans un magnétophone de petite taille et
différents modèles sont en vente actuellement (France, Etats-Unis ect...). Des
compresseurs de paroles plus sophistiqués et des logiciels existent également à
des prix plus élevés.
Le taux de mots correspondant au seuil d'efficacité d'écoute d'un discours
comprimé est environ deux fois le débit normal d'émission des paroles. De plus
ce seuil pour les énoncés familiers, déjà entendus et compris semblerait être
plus élevé. Ainsi, l'intérêt de gagner du temps sans perte dans la compréhension
et l'apprentissage, semble alors évident. La compression temporelle d'un signal
auditif pourrait donc avoir des applications très appréciables tant dans le
domaine de l'enseignement et de l'apprentissage que dans celui de la
réhabilitation des personnes handicapés.
Toutefois, le premier obstacle à cette innovation pédagogique, pourrait être
la non acceptation de cette nouvelle méthode par les utilisateurs potentiels.
Les premières expériences dans ce domaine ont mis en évidence un effet de
pratique et les effets de différents facteurs tels que l'âge, le niveau mental,
le stade du développement cognitif du sujet. Des études théoriques et
expérimentales sont nécessaires pour préciser l'intérêt de la compression et
pour déterminer à quelle population elle s'adresserait de façon préférentielle.
La PAROLE COMPRIMÉE ET L'ÉCOUTE RAPIDE
SECTION 2:
ÉTUDE EXPERIMENTALE
Le problème qui détermine l'organisation et la mise en place de cette étude
expérimentale, concerne la possibilité de la prise de connaissance rapide d'une
information orale.
Avant d'étudier les avantages de l'écoute rapide et les applications aux
sujets susceptibles de bénéficier de ces avantages: lecteurs lents (voyants et
aveugles) et les étudiants qui sont confrontés à une grande quantité
d'information, il convient de déterminer les caractéristiques optimales d'une
compression temporelle. Ces caractéristiques devront être celles qui ne
produisent pas une diminution de l'intelligibilité et de la compréhension du
texte et donc de la performance du sujet (expérience 1). Mais, pour évaluer
l'intelligibilité d'un enregistrement comprimé, une présentation segmentée du
matériel auditif s'impose: présentation mot par mot ou par portion de phrase.
Aussi, une comparaison entre la compréhension des sujets en situation d'écoute
segmentée d'un enregistrement comprimé d'une part et des sujets en situation
d'écoute continue du même enregistrement d'autre part (expérience 2) est
nécessaire pour contrôler si la présentation continue d'un enregistrement
comprimé ne détériore pas excessivement la compréhension et la rétention du
discours. Le seuil, c'est-à-dire la limite de 275 mots par minute à ne pas
dépasser, sous peine de détérioration de l'intelligibilité et de la diminution
de la compréhension et de la performance est étudiée dans l'expérience 3. Enfin,
nous vérifions si en condition de présentation continue, un taux de parole
normale (135 mots/minute) et un taux de paroles comprimées (270 mots/minute)
conduisent à des différences dans la compréhension et la performance des sujets
(expérience 4).
Ces quatre expériences utilisent les deux mêmes textes, l'un qualifié
d'abstrait et relativement difficile, l'autre concret, plus facile.
Notons enfin que la plupart des études théoriques et expérimentales sur la
parole comprimée ont été effectuées aux Etats-Unis et s'adressent donc à la
langue anglaise .
Très peu d'expérience emploient la langue française (Butet 1981).
EXPERIENCE 1
I-PROBLEMES THEORIQUES
En 1950, les travaux de Miller, portant sur la compréhension d'un discours
amputé de segments courts, montrent que des portions peuvent être éliminés dans
un discours sans altérer profondément sa compréhension. Ces résultats offrent
des possibilités théoriques et expérimentales nouvelles. Empruntées par
Fairbanks et al. (1954), elles conduisent ces auteurs à à l'élaboration d'un
nouveau procédé d'augmentation du débit de la parole: La compression
temporelle.
Depuis 1954 des auteurs ont étudié l'effet du débit de la parole (vitesse et
compression) sur l'intelligibilité et la compréhension d'un message comprimé ou
d'un message accéléré. Les résultats expérimentaux montrent que pour une
variation de débit de parole d'un message comprimé qui passe de 175 mots par
minute à 275 mots par minute, la compréhension diminue peu et lentement
(faiblement décroissante), mais qu'au delà de 275 mots par minute, la
compréhension diminue rapidement. D'autre part, l'intelligibilité d'un mot
(exactitude avec laquelle un mot est rapporté quand il a été entendu,pour une
présentation mot par mot) n'est pas inférieur à 90 pour 100 avec un taux de
compression inférieur à 50 pour 100.
Pour Foulke et Sticht, la diminution rapide de la compréhension avec
des taux de compression supérieur à 275 mots par minute, n'est pas due
seulement à la diminution de l'intelligibilité, mais plutôt à une
surcharge de la mémoire à court terme dans le traitement de
l'information. Selon ces deux auteurs:
-
la perte de l'intelligibilité de mots individuels ou connectés
(associés dans une phrase ou un texte) est minimale avec 50 pour 100
de compression;
-
des indices syntaxiques et sémantiques compensent la diminution de
l'intelligibilité produite par la compression;
-
indépendamment du taux de compression employé, la compréhension diminue
rapidement au delà de 275 mots par minute.
De Haan (1977, 1982) a trouvé un seuil de compréhension de la parole
comprimée qu'il situe à environ 52 pour 100 de compression. La diminution du
taux de compréhension pourrait être due à une diminution du taux
d'intelligibilité, quand la compression de la parole atteint ou dépasse 50 pour
100.
Un taux final de 275 mots par minute pourrait être produit avec moins de 50
pour 100 de compression si le taux initial de mots parlés est assez élevé. Le
débit final d'un message est fonction à la fois du taux de compression et du
débit initial d'émission du message.
Plusieurs études expérimentales citées par Foulke et Stitch (1969) et Leroy
(1982) mettent en évidence la supériorité de la parole comprimée sur la parole
accélérée pour un même gain de temps (50 % par exemple.
Dans une première expérience, nous proposons de vérifier les résultats
obtenus par la plupart des auteurs ayant utilisé la langue anglaise: en
particulier quelle est l'influence de trois modes de présentation orale (normal,
accéléré et comprimé) sur l'intelligibilité, la compréhension de deux textes et
la rétention (performance des sujets aux questionnaires à choix multiples).
II-PROBLEMES METHODOLOGIQUES
1-Compression et accélération:
la compression de la parole peut être obtenue par différentes méthodes. Nous
utilisons la méthode dite "d'échantillonnage" comme exemple; Cette méthode
supprime périodiquement de petits segments d'enregistrement (20 millisecondes) à
des intervalles réguliers et met ensuite bout à bout les segments restants.
Le résultat obtenu, est une parole reproduite en moins de temps que pour la
version d'origine, mais sans les distorsions de qualité et de hauteur que l'on
produirait en faisant fonctionner le magnétophone à une vitesse trop rapide.
le débit des paroles d'un enregistrement comprimé ou accéléré , qui
peut être défini par le nombre de mots émis par minute, dépend:
-
du degré d'accélération ou de compression,
-
du débit de la parole du message initial. .
Exemple: un message comprimé de 250 mots par minutes peut être produit par
50 pour 100 de compression d'un message enregistré à 125 mots par minute ou par
une compression de 33 pour 100 d'un message enregistré à 188 mots par minute.
Notons que la différence essentielle entre une compression temporelle et une
accélération est une différence de quantité de signal. Comme avec la plupart des
processus de compression utilisés, dans cette expérience, le mode comprimé est
obtenu par élimination régulière de portions d'enregistrement, les portions
restantes d'abord "dilatées" sont ensuite déroulées 2 fois plus vite que dans le
mode normal. Dans le mode accéléré, la bande enregistrée est déroulée 1,5 fois
plus vite que dans le mode normal.
Conformément aux remarques méthodologiques présentées dans le
chapitre précédent, pour chaque mode de présentation de
l'enregistrement, seront précisés:
-
un coefficient d'accélération ou de compression,
-
un taux d'accélération ou de compression,
-
un nombre de mots par minute.
Le coefficient d'accélération ou de compression est le nombre de fois par
lequel il faut multiplier la vitesse de déroulement de l'enregistrement normal
pour obtenir la vitesse de déroulement de l'enregistrement accéléré ou comprimé.
Le taux de compression ou d'accélération est le pourcentage de temps
économisé à l'écoute.
Les coefficients ont été choisis pour cette étude en accord avec les
résultats expérimentaux relatés dans les nombreux articles consultés.
Pour le mode de présentation accéléré, au-delà de 33 %, d'accélération, les
distorsions sont trop importantes,tandis que pour le mode de présentation
comprimé (élimination de portions associée à une accélération),
l'intelligibilité et la compréhension déclinent rapidement. Dans le mode de
présentation normal, le débit de la parole a été évalué après l'enregistrement à
135 mots/minute.
2-Intelligibilité et compréhension:
L'intelligibilité et la compréhension d'un message accéléré ou d'un message
comprimé dépendent donc des trois paramètres définis précédemment: coefficient
d'accélération, taux de compression et nombre de mots par minute dans
l'enregistrement initial et enfin de l'intensité en décibels des sons émis.
L'intelligibilité est définie par le pourcentage de mots correctement
identifiés. Ce pourcentage est lié à la fois à la perception auditive du sujet
et à sa mémoire à court terme.
La compréhension d'un message comprimé peut être mesurée par le nombre de
réponses exactes données aux questions posées sur le contenu du message
comprimé, mais aussi par le nombre de propositions sémantiquement exactes. La
compréhension fait appel à la mémoire à court terme, aux facultés
interprétatives et à la mémoire à long terme du sujet.
L'intelligibilité de phrases ou de mots comprimés peut être mesurée par le
nombre de mots exacts répétés oralement ou par écrit après écoute des paroles
comprimées. Toutefois il convient de remarquer que le score d'intelligibilité de
mots individuels ne peut pas permettre de déduire l'intelligibilité des mots
dans un message continu.
En effet pour évaluer l'intelligibilité des mots deux conditions
peuvent être étudiées:
-
une condition de présentation de mots individuels dans laquelle,
après la présentation du mot, l'auditeur a un certain temps pour
décider quel est ce mot;
-
une condition de présentation de texte continu dans laquelle les sujets
ont très peu de temps, entre chaque mot, pour décider quel est le mot
entendu. Dans cette deuxième condition, la diminution, même minimale, de
l'intelligibilité de chaque mot pourrait engendrer un effet cumulatif sur la
compréhension du texte écouté.
Aussi, nous introduisons une variable indépendante supplémentaire: la
variable "Essai" dont chaque degré correspond à un groupe de 7 propositions
parmi les 35 propositions de chacun des 2 textes présentés.
III - BUT DE L'EXPERIENCE
L'objectif expérimental est d'effectuer une étude exploratoire concernant la
comparaison entre trois modes de présentation de discours enregistrés à trois
groupes d'étudiants d'Université.
Avant de prolonger nos investigations sur une population de déficients
visuels, dans un premier temps, nous étudierons chez les voyants, l'efficacité
de l'écoute d'un discours dont le débit de mots est augmenté. Si un mode de
présentation orale permet d'appréhender en un temps donné une plus grande
quantité d'information qu'un autre, nous en déduisons alors qu'il est plus
efficace (revues de Foulke et Stitch 1969, Leroy 1982). La quantité
d'information par unité de temps présentée aux sujets est modifiée par les deux
procédés suivant: accélération d'un enregistrement initial et compression de ce
même enregistrement. Une prise d'information orale met en jeu la perception
auditive, la mémoire et la compréhension. La perception dépendant directement de
l'intelligibilité, notre propos est de mesurer l'intelligibilité et la
compréhension d'un discours à un débit de mots normal, puis supérieur grâce à
deux procédés favorisant cette augmentation.
IV - LES VARIABLES
1-Les variables indépendantes:
La première variable indépendante est le mode de présentation du
discours oral. Elle comporte trois degrés:
-
le mode normal (135 mots par minute),
-
le mode accéléré (202,5 mots par minute),
-
le mode comprimé (270 mots par minute).
les paramètres caractérisant chacun des trois degrés de cette
variable sont présentés ci-dessous:
MODE
|
|
NORMAL
|
ACCELERÉ
|
COMPRIMÉ
|
COEFFICIENT
|
|
1
|
1,5
|
2
|
TAUX %
|
|
0
|
33
|
50
|
MOTS/MINUTE
|
|
135
|
202,5
|
270
|
La deuxième variable indépendante est la nature du texte enregistré.
Elle possède deux degrés:
-
un texte A de type abstrait,
-
un texte B de type concret.
La troisième variable indépendante concerne le déroulement de l'écoute. C'est
la variable Essais qui comporte 5 degrés: chaque texte est découpé en 5 groupes
de 7 propositions.
La quatrième variable indépendante est l'heure de la passation. Elle
comprend 4 degrés:
9h, 10h30, 14h, 15h30.
Cette variable permet de contrôler un effet éventuel de l'heure de la journée
sur la performance des sujets (en particulier sur la mémoire à court terme).
2-Variables dépendantes:
a-Intelligibilité:
Elle s'exprime en pourcentage de mots correctement identifiés (rappel
immédiat) par rapport aux mots du texte. Elle est en rapport avec la perception
auditive et la mémoire à court terme.
b-Compréhension:
Elle s'exprime par le pourcentage des propositions sémantiquement correctes,
notées par les sujets par rapport aux propositions des textes. Elle concerne la
mémoire à court terme, des processus de traitement sémantique et les capacités
interprétatives des sujets.
c - Performance:
Elle est définie par le nombre de réponses bonnes à un q c m (questionnaire à
choix multiples). Elle fait appel au traitement sémantique de l'information, à
la compréhension et à la mémoire à long terme.
V - LES HYPOTHESES
Les données expérimentales exposées par les nombreux chercheurs intéressés au
domaine de la parole rapide, nous permettent de formuler quatre hypothèses.
1-Hypothèse 1:
Lorsque le débit de paroles ne dépasse pas 270 mots/minute, l'intelligibilité
des mots reste bonne et les pertes seront inférieures à 10 % quel que soit le
mode de présentation des textes enregistrés (normal, accéléré ou comprimé).
Par conséquent le pourcentage des mots corrects notés par les sujets qui
écoutent deux textes a et B enregistrés à un taux normal (135 m/mn), accéléré
(202 m/mn) et comprimé (270 m/mn) est supérieur à 80.
2-Hypothèse 2:
Pour un débit de paroles inférieur à 270 mots/minute, l'écoute de la parole
comprimée est un mode d'accès à l'information plus efficace que l'écoute de la
parole accélérée, elle-même plus efficace que l'écoute de la parole dite
normale. "Plus efficace" signifie que les sujets ont eu besoin de moins de temps
pour aboutir à une performance relativement correcte.
Par conséquent lors du rappel et de la compréhension le nombre de
propositions correctement rappelées est différent pour les trois modes de
présentation des textes enregistrés a et B, mais reste supérieur à 80 %.
Hypothèse 2b: le pourcentage des propositions sémantiquement correctes
notées par les sujets par rapport au temps d'écoute des texte a et B est plus
élevé pour le mode parole comprimée que pour le mode paroles accélérées,
lui-même plus grand que pour le mode normal.
Hypothèse 2c: le rapport des notes obtenues aux q c m au temps d'écoute des
textes enregistrés est supérieur pour le mode comprimé par rapport au mode
accéléré, lui-même supérieur par rapport au mode normal.
3-Hypothèse 3:
La compréhension et la performance des sujets est meilleure pour l'écoute
d'un texte concret que pour l'écoute d'un texte abstrait.
Hypothèse 3a: les pourcentages des mots exacts et des propositions exactes
seront plus élevés pour le texte B (concret) que pour le texte a (abstrait) pour
les trois modes de présentation.
4-Hypothèse 4:
L'intelligibilité et la compréhension varient durant l'écoute des textes,
soit en raison d'un effet de pratique, soit en raison de l'accumulation des
pertes d'information.
Hypothèse 4a: pour un effet de pratique, les pourcentages des mots corrects
et des phrases sémantiquement exactes seraient plus élevés pour les derniers
groupes d'essais.
Hypothèse 4b: pour un effet de pertes d'information ou de stress, les
pourcentages de mots corrects et de propositions correctes seraient plus faibles
pour les derniers groupes d'essais.
VI-METHODE
1-Les sujets:
L'échantillon est composé de 60 étudiants (48 filles et 12 garçons)
âgés de 18 à 25 ans, la moyenne d'âge étant de 20 ans 1 mois. Les sujets
sont tous français, de langue maternelle française et aucun d'entre eux
ne présente des problèmes d'audition. Les étudiants sont répartis de
façon aléatoire, dans trois groupes principaux:
-
20 en écoute de paroles à taux normal,
-
20 en écoute à taux accéléré,
-
20 en taux comprimé.
2-Matériel:
L'expérience se déroule dans une pièce bien éclairée de 3 mètres sur 5 mètres
environ contenant une grande table et des sièges. Cette salle est relativement
isolée des salles de cours et possède une assez bonne isolation phonique.
Un magnétophone General Electric SNH 00978 (petit modèle) permet d'écouter un
message enregistré sur cassette en mode normal, accéléré, comprimé ou dilaté, et
dont le coefficient d'accélération peut varier de 0,85 à 2.
Six écouteurs individuels de très bonne qualité sont reliés à une boite
relais assurant la diffusion simultanée du message.
Le message enregistré se compose de trois textes (voir annexes), lus par une
voix féminine, c'est-à-dire celle de l'expérimentateur qui donne la consigne aux
sujets. Le premier texte est un extrait du Petit Prince de Saint- Exupéry. les
deux autres, le texte a "L'île du cercle", de type "abstrait" contenant 245 mots
(lus en 109 secondes) et le texte B "Le vieux fermier", de type "concret",
contenant 231 mots (lus en 103 secondes) sont tirés d'un article de Le Bouedec
(1985 ). Pour ces deux histoires une dernière proposition est ajoutée afin
d'obtenir 5 groupes de 7 propositions.
3-Procédure:
a-Le calendrier des passations:
Pour contrôler l'effet des deux variables: ordre de présentation des
textes ( AB ou BA), et moment de la passation dans la journée, chaque
groupe principal est divisé en deux sous-groupes suivant l'ordre de
présentation des textes (exemple NAB pour présentation normale ordre a B
et NBa pour présentation normal ordre B A). Chaque sous-groupe est
partagé en deux sous-groupes de 5 sujets, l'un passant le matin, l'autre
l'après-midi. Ainsi sont constitués 12 groupes de 5 sujets selon le
calendrier de répartition ci- dessous:
heure
|
|
LUNDI
|
MARDI
|
MERCREDI
|
9 h
|
|
NAB
|
ABA
|
CAB
|
10h30
|
|
AAB
|
CBA
|
NBA
|
13h30
|
|
CAB
|
NAB
|
ABA
|
15h
|
|
NBA
|
AAB
|
CBA
|
Pour chaque groupe on cherche à établir par essais successifs, un volume de
son permettant un confort d'écoute acceptable pour chaque sujet.
Avant d'écouter le premier texte (Le Petit Prince), les 5 étudiants entendent
la consigne suivante: "Vous allez entendre une histoire que vous écouterez
attentivement car il faudra ensuite faire un résumé et noter à la fin du résumé
si ce texte vous est connu ou non".
Cette première écoute a pour objectif de mettre les sujets en contact avec le
type de paroles auquel ils seront soumis pendant l'expérience, afin d'éviter une
perturbation possible des performances due à l'effet de surprise et de mise en
route. En outre, , la perspective d'un résumé à faire, devrait stimuler
l'attention des sujets. .
Les deux histoires a et B ou B et a sont ensuite présentées selon le plan
décrit ci-dessus et les instructions suivantes sont données:"Vous allez
entendre successivement deux histoires dont le titre, pour celle qui vous
intéresse présentement est inscrit sur la feuille placée devant vous. Vous
entendrez une portions de phrase et vous noterez sur la feuille, à côté du
numéro 1, dès que possible, exactement ce que vous avez entendu. Vous ferez de
même jusqu'à la fin de l'histoire. Puis, vous répondrez à un q c m". Les sujets
ont à leur disposition un crayon et une feuille de protocole comprenant 35
lignes numérotées et après l'écoute de l'enregistrement un q c m imprimé (annexe
). Après chaque écoute d'une portion de phrase (c'est-à-dire d'une proposition),
l'expérimentateur attend que le dernier sujet ait fini d'écrire pour déclencher
le suivant. , et ainsi de suite jusqu'à la fin de l'histoire. Puis les feuilles
sont retirées aux étudiants et un questionnaire à choix multiple est distribué
après un délai de 1 minute en condition de paroles comprimées et 30 secondes en
condition de paroles accélérées.
Afin d'évaluer la difficulté des Q C M et leur équivalence, un groupe
contrôle de 10 étudiants ont subi les épreuves sans avoir au préalable entendu
les enregistrements. Les scores de réponses justes sont respectivement: 36 pour
cent pour "L'île du cercle" et 35,7 pour cent pour "Le vieux fermier".
4-Plan de l'expérience:
Nous utilisons un plan factoriel avec 3 groupes de 20 sujets indépendants
pour tester la variable mode d présentation N normal, a accéléré, C comprimé.
Nous avions également introduit la variable H (4 degrés correspondant
aux 4 heures de passation) et une variable O correspondant à l'ordre de
présentation des deux textes a et B. Après une première analyse de
variance les variables H et O n'ayant pas d'effet significatif, les
variables étudiées sont les suivantes:
-
P mode de présentation, 3 degrés): N normal, a accéléré, C
comprimé correspondent à des groupes de mesures indépendants;
-
T (textes, 2 degrés): a abstrait, B concret correspondent à des
groupes de mesure appareillés;
-
E (essais, 5 degrés) de E1 à E5 correspondent à des groupes de mesures
appareillés. Notons que cette dernière variable est abandonnée pour l'étude
de la variable dépendante "performance".
Les résultats sont traités par le programme d'analyse de variance VAR3 pour
lequel le plan d'expérience est de la forme S20<P3>*T2*E5 pour les variables
dépendantes intelligibilité et compréhension et de la forme S20<P3>*T2 pour la
variable dépendante "performance".
VII-RESULTATS
1-Les données expérimentales:
Elles sont présentées en annexe. En lignes de S01 à S20 sont exposées les
données pour les 20 sujets du groupe P1 (présentation à taux normal). De S21 à
S40 et de S41 à S60 sont respectivement exposés les résultats des groupes P2 et
P3 correspondant à la présentation à taux accéléré et à taux comprimé. En
colonne T1 (E1 à E5) et T2 (E1 à E5) sont exprimés pour chaque sujet, les
pourcentages des mots exacts par rapport au total des mots de chaque groupe de
propositions (5) pour chaque texte (2) pour l'intelligibilité des mots; le
nombre de propositions sémantiquement exactes par rapport au nombre de
propositions (7) pour chaque groupe de propositions (E1 à E5) pour chaque texte,
en ce qui concerne la compréhension et enfin le pourcentage de bonne réponses
pour chaque texte (2 colonnes) pour la performance.
Les diagrammes illustrent les principaux résultats et expriment les moyennes
des résultats des sujets pour les trois modes de présentation et pour les deux
textes pour l'intelligibilité, la compréhension et la performance.
Le tableau des moyennes et écarts-type est en annexe.
2-Résultats globaux:
Les résultats concernant l'intelligibilité des mots, la compréhension et la
performance des sujets sont tous supérieur à 90 %, pour les trois modes de
présentation et pour les deux textes.
Pour ce qui est de l'intelligibilité l'analyse de variance met en évidence un
effet significatif de la variable mode de présentation (P) sur l'intelligibilité
des mots (F=6.38 (2-57) p<.01), et un effet significatif de la variable nature
du texte (T) sur l'intelligibilité (F=9.89 (9-513) p<.01). L'effet du facteur
"essai" (E) est significative (F'=8.93 (4-228) p<.01) et enfin l'interaction E*T
est significative (F'=10.03 (4-228) p<.01). En ce qui concerne l'intelligibilité
des mots les autres interactions ne sont pas significatives.
En ce qui concerne la compréhension et mémoire à court terme c'est-à-dire le
nombre de propositions sémantiquement exactes, le facteur "mode de présentation"
a un effet significatif (F=4.53 (2-57) p<.05), l'effet du facteur "texte" est
significatif (F'=78.68 ((1-57) p<.001), l'effet du facteur "essai" est
significatif (F'=13.20 (4-228) p<.01), l'interaction E*T est significative
(F'=12.31 (4-228) p<.01) et enfin l'interaction P*T est significative (F'=4.09
(2-57) p<.05). Les autres interactions ne sont pas significatives.
En ce qui concerne la rétention (performance aux questionnaires à choix
multiples) seul l'effet du facteur "texte" est significatif (F=7.23 (1-57)
p<.01). Les effets du facteur "mode de présentation" et les interactions ne sont
pas significatifs.
3-Les résultats spécifiques:
Les analyses de variance sont complétés par des tests T de Student. Ces tests
montrent que l'effet du facteur "mode de présentation" sur l'intelligibilité ,
est dû essentiellement à la différence entre le mode normal et le mode accéléré.
L'intelligibilité est plus faible pour le mode accéléré que pour le mode normal,
mais il n'y a pas de différence significative entre le mode comprimé et le mode
normal.
Toutefois pour les scores de compréhension, les résultats sont plus faible
pour la parole comprimé que pour la parole normale eux-mêmes plus faibles pour
la parole accélérée que pour la parole comprimée (uniquement pour le texte
abstrait).
Il n'y a pas d'effet du mode de présentation sur la compréhension du texte
concret.
Pour les trois variables dépendantes, le facteur "texte abstrait ou concret"
est significatif et les tests de Student tout comme les diagrammes, montrent que
toutes les données concernant le texte a (abstrait) sont inférieures aux données
recueillies pour le texte B (concret).
L'effet du facteur "essai" est dû à la différence entre les essais E1 associé
à E5 d'une part et les essais E2, E3, E4 d'autre part.
VIII - DISCUSSION/CONCLUSION
1-Intelligibilité:
Pour un débit de mots inférieur à 270 m/mn, l'intelligibilité des mots d'un
discours enregistré est supérieur à 90 % quel que soit son mode de présentation
normal, accéléré et comprimé et quelle que soit la nature de son
contenu.(abstrait ou concret). Ces résultats ont été observés dans de nombreuses
expériences relatées dans les revues de Foulke et Stitch (1969) et Leroy (1982).
Toutefois, le pourcentage des mots corrects notés par les étudiants, n'est pas
sensiblement le même quel que soit le mode de présentation. L'effet du mode de
présentation est surtout expliqué par la différence entre le mode de
présentation normale et le mode de présentation accélérée. Ces résultats sont en
accord avec ceux de nombreux expérimentateurs ayant utilisé la langue
anglo-saxonne. L'accélération d'un enregistrement détériore beaucoup plus un
signal vocal que la compression dans le temps et tant que cette compression ne
dépasse 50% et que le débit de la parole ne s'élève pas au-delà de 275
mots/minute, l'intelligibilité des mots parlés reste bonne.
Dans cette étude expérimentale, les résultats sont liés à la perception
auditive des sujets: les facteurs liés à la mémoire à court terme sont peu
influents en particulier pour les propositions courtes. En effet les étudiants
écrivent ce qu'ils entendent au fur et à mesure du déroulement de
l'enregistrement. Une analyse qualitative des résultats montrent que les erreurs
sont plus fréquentes sur les mots très courts: articles et mots de liaison (et,
la, le , des etc..), en particulier pour la parole comprimée. Ce qui se conçoit
bien puisque la compression temporelle implique l'élimination d'un fragment du
signal vocal. Enfin, l'intelligibilité des mots est moins bonne pour le texte
abstrait que pour le texte concret sauf dans le cas du mode de présentation
normale où aucune différence n'est observée. Ces données peuvent être expliquées
par la redondance du texte concret. En effet, bien que plus courts en moyenne,
les mots du texte B (concret) sont répétés plusieurs fois: chien, chat, âne,
étable, lait, etc... En outre ces mots sont fréquents dans la langue et ne
présentent aucune difficulté de compréhension ou de représentation. Les mots du
texte a (abstrait) sont peu redondants dans le texte et moins fréquents dans la
langue.
2-Mémoire à court terme et compréhension:
La seconde catégorie de résultats (pourcentage des propositions
sémantiquement exactes) implique des facteurs principalement liés à la mémoire à
court terme et aux facultés interprétatives des sujets. La variable "mode de
présentation" (normal, accéléré ou comprimé) a globalement un effet sur ces
données dans le cas du texte abstrait, mais n'a pas d'effet dans le cas du texte
concret. Ainsi, les étudiants écoutant un texte concret ont des performances de
rappel de propositions qui ne présentent pas de différences significatives quel
que soit le mode de présentation. Toutefois lors de l'écoute d'un texte
abstrait, des différences significatives sont observées entre la parole normale
et comprimée d'une part et entre la parole normale et accélérée d'autre part. En
outre, quel que soit le mode de présentation envisagé, les performances
concernant le texte abstrait sont toujours inférieures à celles concernant le
texte concret.
L'analyse qualitative concernant la nature et la localisation des erreurs a
montré qu'elles sont de nature interprétative et sont plus souvent localisées à
la fin des propositions les plus longues du texte abstrait. Pour un texte
abstrait plus difficile à comprendre les facultés mnésiques (mémoire à court
terme) et interprétatives des sujets sont plus affectées par l'accélération et
la compression temporelle de l'enregistrement. Un exemple d'erreur: "un
scientifique de Lille" au lieu de "un scientifique de l'île" semble montrer que
le sujet n'a pas le temps nécessaire pour faire une analyse approfondie de ce
qu'il entend: même si l'intelligibilité du discours est bonne, le traitement de
cette information distribuée trop rapidement est plus difficile.
3-Les performances au q c m:
Les résultats relatifs aux réponses des questionnaires à choix multiples, ne
présentent pas de différences significatives quel que soit le type de paroles
écoutées (normale, accélérée ou comprimée) et cela aussi bien pour l'écoute du
texte concret que pour l'écoute du texte abstrait. Toutefois, les performances
au q c m pour le texte abstrait sont inférieures à celles concernant le texte
concret pour un mode de présentation normal, mais non pour les modes de
présentation accéléré et ou comprimé.
Les q c m évoquent dans les choix de réponses possibles la bonne réponse en
reprenant les termes ou l'idée du texte. Il s'agit avant tout d'une tâche de
reconnaissance, de rétention immédiate.
4-Conclusion générale:
Pour un texte concret, (mots redondants, fréquence des mots élevée par
rapport aux mots de la langue ), les performances des sujets impliquant la
perception auditive, les facultés de mémorisation (à court et à long terme), les
facultés interprétatives et de compréhension nécessitant un traitement
sémantique de l'information, ne présentent pas de différences significatives
quel que soit le débit de paroles et le mode de présentation utilisé . Ainsi,
pour une même quantité d'information véhiculée selon les trois débits de mots
différents (135 m/mn, 202 mots/mn et 270 mots/mn), la quantité d'information
comprise reste sensiblement la même et aboutit à la même performance. Or, le
temps nécessaire à cette prise d'information diffère d'un mode de présentation à
l'autre.
Avec un débit de mots de 270 mots /mn, la parole comprimée est le mode de
présentation le plus efficace puisqu'il permet l'accès à une même quantité
d'information dans un minimum de temps soit un gain de temps de 50% avec la
parole comprimée et environ 30% avec la parole accélérée.
Avec le texte abstrait , les performances des sujets pour l'intelligibilité
et la mémoire à court terme accompagnée d'un traitement sémantique présentent
des différences selon le mode de présentation. En revanche aucune différence
significative n'est observée en ce qui concerne le rappel à long terme
accompagné d'un traitement sémantique (réponses aux q c m). En conséquence, nous
pouvons conclure qu'avec les deux types de textes sélectionnés pour cette
expérience, la parole comprimée est un mode de présentation auditive plus
efficace que la parole accélérée, elle-même plus efficace que la parole normale
rejoignant ainsi les travaux de plusieurs chercheurs portant sur des sujets
déficients visuels ( Bankrof et Bandinelli 1982, Myers 1978, Bischoff 1979) et
sur des sujets voyants (Nath et al. 1981, Drake 1981).
Après analyse des résultats, nous constatons que les performances les moins
bonnes ont été obtenues en général, pour l'écoute de la parole accélérée. De
plus les différences inter-individuelles (écart-type) les plus marquées sont
observées pour l'écoute de la parole accélérée. Or, avec ce mode de
présentation, le signal vocal est modifié (hauteur des sons plus élevée). Par
contre, avec la parole comprimée, le signal sonore est peu modifié bien qu'il
existe des effacements courts et réguliers de ce signal et donc une perte
d'information. Il semblerait que les sujets humains soient plus affectés par le
"stress" auditif que par la perte d'une partie du signal vocal.
EXPERIENCE 2
I-PROBLEMES THEORIQUES
Dans notre première expérience, pour tester l'intelligibilité des
mots, les étudiants notent sur une feuille les mots perçus au fur et à
mesure de l'écoute de l'enregistrement. Ils ont quelques secondes pour
finir d'écrire la portion de phrase entendue. Le fait de voir les mots
le temps nécessaire à l'écriture de la proposition, permet de faire
intervenir des mécanismes d'analyse, de mémorisation, d'interprétation
et de compréhension peut être plus élaborés et permet donc d'effectuer
un traitement sémantique plus soutenu de l'information entendue. Aussi
le score d'intelligibilité des mots individuels ou de fragments de
phrases ne peut induire l'intelligibilité des mots d'un message continu
et encore moins sa compréhension. En effet pour un mot individuel ou un
fragment de phrase, les sujets ont un temps de discrimination et de
prise de décision plus long que dans le cas de l'écoute d'un message
continu. Aussi, dans le cas d'un message continu, la diminution même
minime de l'intelligibilité de chaque mot pourrait avoir un effet
cumulatif sur la compréhension de son contenu. Les mots mal perçus
produiront des indices sémantiques et syntaxiques faux pour les mots qui
suivront (Heiman et al. 1986). Heiman et al. ont étudié les deux
facteurs ("vitesse" et "degré de compression") et ont émis les deux
hypothèses suivantes:
-
Si la vitesse est un facteur critique et si 275 m/mn est un seuil,
alors ce sont les contraintes temporelles imposées par la compression qui
entraînent la diminution de la compréhension.
-
Si le taux de compression est le facteur critique de compréhension et
si 50% est un seuil, alors c'est la quantité d'information éliminée qui
entraîne la diminution de la compréhension.
Ces auteurs complètent leurs supposition en proposant que si c'est le facteur
contrainte temporelle qui influence la compréhension, des pertes majeures seront
observées avec un taux de mots supérieur à 275 m/mn indépendamment du taux de
compression et si c'est la quantité de signal sonore qui importe, des
diminutions de compréhension importantes résulteront pour des taux de
compression supérieurs à 50% indépendamment du nombre de mots par minute.
Ces hypothèses sont testées dans deux expériences: dans une première
expérience, les enregistrements de 500 mots présentés en continu, sont
interrompus (et non comprimés) et lorsque 60% du signal vocal est éliminé la
compréhension est réduite malgré l'absence de compression temporelle; dans une
seconde expérience, utilisant une procédure de masquage, il est montré que des
mots masqués, présentés isolément sont moins intelligibles quand ils sont
comprimés. Les auteurs concluent que la diminution de la compréhension d'un
message comprimé résulte de la diminution de l'intelligibilité des mots et de la
quantité des informations qu'il contient.
Par ailleurs, dans notre première expérience nous avions observé un effet du
mode de présentation sur le texte abstrait et non sur le texte concret. Aussi,
il est probable que la nature des enregistrements comprimés ( la familiarité des
mots et la redondance des informations qu'ils contiennent) ait un effet sur leur
compréhension quand ils sont présentés en continu.
II-BUT DE L'EXPERIENCE
Dans cette expérience, la comparaison de deux conditions de présentation
auditive segmentée et continue) de deux textes (abstrait et concret) dont
l'enregistrement a été comprimée dans le temps (50%) et dont le débit des mots
de l'enregistrement d'origine est 135 m/mn (soit 270 m/mn après compression), a
pour objectif d'évaluer l'effet de la compression temporelle sur la
compréhension du message selon la nature de son contenu.
Etant donné qu'en présentation continue du message auditif comprimé, les
étudiants auront moins de temps pour traiter l'information qu'en présentation
segmentée (avec pauses), on peut s'attendre à des scores de compréhension plus
élevés pour le texte concret (redondant) que pour le texte abstrait dans cette
condition de contrainte temporelle. .
Mais puisque le débit de la parole est inférieur à 275 m/mn (soit ici 270) et
que le taux de compression ne dépasse pas 50%, on peut s'attendre à ce que les
scores de compréhension restent bons, c'est-à-dire supérieur à 80% pour les deux
conditions de présentation auditive.
III-LES HYPOTHESES
Quand on passe de la condition de présentation segmentée à la condition de
présentation continue, la compréhension des étudiants est moins perturbée pour
le texte concret que pour le texte abstrait.
La différence entre le nombre de propositions sémantiquement correctes notés
par les étudiants est plus faible pour le texte concret que pour le texte
abstrait quand on passe de la condition de présentation segmentée à la condition
de présentation continue des enregistrements comprimés.
IV-LES VARIABLES
1-Les variables indépendantes:
Après avoir été soumis à une compression temporelle de 50%,
l'enregistrement de deux textes a et B (abstrait et concret)est
distribué à deux groupes d'étudiants suivant deux conditions de
présentation (segmentée et continue). Ainsi deux variables principales
sont étudiées:
a- Présentation (P): 2 degrés (S segmentée et C continue);
b- Textes (T): 2 degrés (a abstrait et B concret).
Deux autres variables sont contrôlées: l'heure de passation des sujets (H)
et l'ordre de présentation des textes (O).
2-Les variables dépendantes:
Deux variables dépendantes sont considérées dans cette expériences:
a-la compréhension des sujets s'appuyant sur le pourcentage des propositions
sémantiquement exactes relativement au total des propositions des textes pour le
groupe P S et relativement au total des propositions notées par les étudiants
pour le groupe P C. Pour l'évaluation des scores de compréhension du groupe
"présentation continue", les récits des étudiants ont été segmentés en
propositions. Sont répertoriées les propositions exactes et les propositions
fausses. Sont fausses toutes les propositions contenant un terme sémantiquement
inexact ou inventé. Pour évaluer l'exactitude de chaque proposition, nous
adoptons la méthode des juges: trois personnes ont à décider si le mot écrit a
le même sens ou non que le mot d'origine.
b- la performance s'appuyant sur les scores des sujets obtenus aux q c m.
V-METHODOLOGIE
1-Les sujets:
40 étudiants de l'Université de Lille (filles et garçons) ont participé à
cette expérience.Tous les étudiants sont volontaires et ont été recrutés dans
les différentes universités de Lille (Lettres, Sciences et Droit).
L'âge moyen des sujets est de 20 ans 5 mois s'échelonnant de 18 ans 3 mois à
25 ans 2 mois. Tous les étudiants sont de langue maternelle française et n'ont
pas de problème d'audition connu.
Les sujets sont répartis de façon aléatoire dans deux groupes principaux: 20
sont ceux provenant du groupe 3 (présentation segmentée mode comprimé) de
l'expérience 1; les 20 autres n'ont pas participé à l'expérience précédente.
Pour ces derniers les enregistrements sont présentés en continu et non
proposition par proposition.
2-Le matériel:
L'expérience se déroule dans la même pièce et avec le même matériel que ceux
utilisés pour la première expérience, c'est-à-dire un magnétophone General
Electric, une boite relais et 6 écouteurs.
Les enregistrements sont également les mêmes que ceux de l'expérience
précédente, c'est-à-dire un extrait du Petit Prince pour la mise en route et les
deux récits a (L'île du cercle) et b (Le vieux fermier).
Toutefois pour le groupe des 20 nouveaux sujets, la passation diffère.
3-La passation:
Pour contrôler l'effet de la variable H moment de la journée, les 20 sujets
sont divisés en 4 groupes de 5 sujets et qui subissent les épreuves aux mêmes
heures respectives que le groupe 3 de l'expérience précédente, soit à 9h 30,
11h, 14h et 15h 30. Pour contrôler l'effet de l'ordre de présentation des textes
a et B, 10 sujets écoutent d'abord le texte a après la mise en route et les 10
autres écoutent d'abord le texte B.
Tous les sujets opèrent une première écoute d'un extrait du Petit Prince qui
a pour objectif de mettre les sujets en contact avec le type de paroles auquel
ils seront confrontés au cours de la suite de l'expérience. Ce travail de mise
en route permet d'éviter une éventuelle perturbation des performances qui
pourrait être due à un effet de surprise. De plus, la perspective d'un résumé à
faire stimule la concentration et l'attention des sujets.
Pour le premier groupe (présentation segmentée ), la consigne et la passation
ont été décrites dans l'expérience précédente.
Pour le deuxième groupe (présentation continue), la consigne est la
suivante:
"Vous allez entendre deux enregistrements. Vous écouterez attentivement
chaque histoire, car ensuite vous aurez à raconter sur une feuille, avec le plus
de détails possible tout ce que vous savez sur ce récit. Puis vous aurez à
répondre à un questionnaire à choix multiple pour chacun des textes écoutés.
Avez-vous des questions à poser? "
Pour les 4 sous-groupes de 5 sujets sous la condition de présentation
continue chaque séance se déroule ainsi:
-
réglage du volume sonore dans les casques,
-
écoute du récit de mise en route (Le Petit Prince)et résumé de
l'histoire,
-
écoute attentive du texte a ou B (suivant les sous- groupes) ,
-
compte-rendu détaillé de l'histoire,
-
réponses au q c m,
-
repos de 2 minutes,
-
écoute de la seconde histoire avec compte-rendu puis réponses au
questionnaire.
4-Plan d'expérience:
Nous utilisons un plan factoriel avec 2 groupes de 20 sujets (groupes
indépendants) afin de tester la variable condition de présentation (P) à 2
degrés (S segmentée ou C continue).
Une seconde variable indépendante, la nature des textes T (2 degrés, abstrait
ou concret) correspond à des groupes de mesures appareillés.
Nous avions également introduit les variables H (4 degrés, moments de la
journée) et O (2 degrés, ordre de présentation des récits a et B).
Une première analyse de variance n'ayant pas montré d'effets significatifs
des variables contrôlées, les données ont été regroupées, puis traitées par le
programme d'analyse de variance VAR3 (Lecoutre )
En définitive, le plan d'expérience est de la forme:
VI-RESULTATS
1-Présentation des données expérimentales:
Les tableaux des données expérimentales sont exposée en annexes.
En ligne sont présentés les groupes P1 et P2 de 20 sujets chacun allant donc
de S1 à S40;
En colonne, sont exposées les résultats pour chaque textes a et B,
c'est-à-dire les pourcentages de propositions correctes pour le tableau
"compréhension" et le pourcentage de bonnes réponses pour le tableau
"performance".
Les 4 diagrammes illustrent les données expérimentales pour chaque variable
dépendante (compréhension et performance) et pour chacun des textes (abstrait, à
gauche et concret à droite).
2-Analyse et description des résultats:
a-Compréhension:
La moyenne des pourcentages des bonnes propositions pour le groupe
"présentation continue" est supérieure à 80% pour le texte a (84.34%) mais il
est supérieur à 90% pour le texte B (99.12%).
La moyenne des pourcentages des propositions sémantiquement exactes pour le
groupe "présentation segmentée" est supérieure à 90% pour les deux récits:
texte a (95.14%), texte B (99.57%).
TABLEAU DE LA VARIABLE DEPENDANTE "compréhension"
|
A
|
B
|
|
|
A
|
B
|
P. SEQUENTIELLE
|
95.14
|
99.57
|
|
P. SEQUENTIELLE
|
2.95
|
1.05
|
P. CONTINUE
|
84.34
|
99.12
|
|
P. CONTINUE
|
8.28
|
1.81
|
MOYENNES
|
|
ECART-TYPE
|
L'analyse de variance met en évidence l'effet significatif du facteur mode de
présentation (segmentée ou continue). Les pourcentages de propositions
sémantiquement exactes sont plus élevés pour le mode de présentation segmentée
que pour le mode de présentation continue (F=29.74 (1-38) p<.01).
Le facteur nature du texte présente également un effet significatif: les
pourcentages de propositions sémantiquement correctes sont plus élevés pour le
texte B (concret) que pour le texte a (abstrait) (F=94.55 (1-38) p<.01).
L'interaction entre les deux facteurs P et T est significative: les
pourcentages de propositions sémantiquement exactes diminuent davantage pour le
texte a (abstrait) que pour le texte B (concret), quand on passe du mode de
présentation segmentée au mode de présentation continue (F=27.48 (1-38) p.01).
De plus on ne note aucune différence entre les scors de compréhension pour les
deux types de présentation quand le texte est concret (B).
b-La performance:
En condition de présentation segmentée , les scores aux q c m sont supérieurs
à 99% pour les deux récits.
En condition de présentation continue, les scores aux q c m sont supérieurs à
80% pour le texte a (87.66%) et à 90% pour le texte B (98.57%).
TABLEAUX DE La VARIABLE DEPENDANTE "PERFORMANCE"
|
A
|
B
|
|
|
A
|
B
|
P. SEQUENTIELLE
|
99.33
|
100.0
|
|
P. SEQUENTIELLE
|
2.06
|
0
|
P. CONTINUE
|
87.66
|
98.57
|
|
P. CONTINUE
|
8.73
|
4.40
|
MOYENNES
|
|
ECART-TYPE
|
Le facteur "condition de présentation" a un effet significatif: pour la
présentation segmentée , les scores aux q c m sont plus élevés que pour la
présentation continue (F=33.38 (1-38) p<.01).
L'effet du facteur "nature du texte" est significatif: les scores aux q c m
sont plus élevés pour le texte B que pour le texte a (F=27.72 (1-38) p<.01).
L'interaction entre les deux facteurs "condition de présentation" P et
"nature des textes" T est significative: quand on passe de la condition de
présentation segmentée à la condition de présentation continue, les scores aux q
c m diminuent moins pour le texte B (concret) que pour le texte a (abstrait)
(F=21.68 (1-38) p.01).
VII - DISCUSSION - CONCLUSION
1-Mémorisation et compréhension:
Les enregistrements écoutés par les 40 étudiants ont subi une compression
temporelle de 50% et le débit des paroles entendues est de 270 mots par minute
pour les deux conditions de présentation. Toutefois, les 20 étudiants qui
écoutent les récits en condition de présentation segmentée (proposition par
proposition) et qui écrivent ce qu'ils entendent, ont plusieurs secondes pour
"voir" chaque séquence de phrase.
La compréhension de messages comprimés à 50% (dont le débit es 270 m/mn), est
présentés de façon segmentée est relativement haute et plus élevée que la
compréhension de ces mêmes messages présentés de façon continue. Deux raisons
peuvent expliquer ce résultat: l'existence d'une redondance perceptive de
l'information et d'un temps de traitement supplémentaire dans la condition de
présentation segmentée . En effet dans cette condition, les étudiants ont non
seulement une information auditive donnée par les enregistrements, mais aussi
une information visuelle puisque les sujets écrivent chaque item entendu dans
cette condition. Même si les notes comportent quelques erreurs, la perception
visuelle de la séquence de phrase écrite donne une information supplémentaire au
sujet. En outre, ce mode de présentation segmentée met en jeu essentiellement
les mécanismes de la mémoire à court terme et les facultés interprétatives des
étudiants, puis le temps de traitement supplémentaire nécessaire à l'écriture
d'une portion de phrase, permet d'améliorer l'organisation des informations dans
la mémoire à long terme et ainsi, d'obtenir non seulement un meilleur résultat
dans les scores de compréhension, mais aussi dans les scores de réponses aux q c
m.
En présentation continue, les mots, les portions de phrase et les phrases
"arrivant" les uns derrière les autres à un débit de 270 mots/minute jusqu'à la
fin du récit, les sujets n'ont pas de pause pour traiter de façon plus
approfondie l'information. La diminution de l'intelligibilité des mots, même
légère, produit des pertes d'information qui sont cumulatives. Cet effet
cumulatif de la diminution de l'intelligibilité est surtout mis en évidence dans
l'analyse qualitative des résultats. En effet, pour le texte abstrait les sujets
ont noté en moyenne 12 propositions pour lesquelles la majeure partie des
propositions sémantiquement correctes correspondent au compte-rendu du début et
de la fin des récits. La majeur partie des erreurs correspond au résumé des deux
blocs de propositions situés au centre de l'histoire. Ce qui ressemble de façon
étonnante à un effet de primauté et de récence.
En ce qui concerne l'analyse qualitative des compte- rendus du texte B
(concret) pour la présentation continue, les étudiants ont noté en moyenne 22
propositions avec très peu d'erreurs. Ils ont tous raconté le déroulement
logique de l'histoire avec de nombreux détails. Les résultats tant quantitatifs
que qualitatifs montrent que le texte B (concret) nécessite moins de temps de
traitement que le texte a (abstrait). Tous les sujets ont trouvé ce texte plus
"facile". La présentation continue à 270 m/mn après une compression temporelle
de 50%, modifie très peu la compréhension du discours et la performance des
sujets au q c m. Pour un récit plus "difficile", un temps de traitement
supplémentaire est nécessaire . Une seconde présentation continue de
l'enregistrement comprimé pourrait-elle améliorer les résultats? Est-ce que la
présentation continue à taux normal (135 m/mn) aboutirait à de meilleurs
résultats? Cette dernière question sera examinée dans une autre expérience.
Dans l'expérience précédente, sous une condition de distribution segmentée ,
l'intelligibilité d'un message auditif ayant subi une compression temporelle de
50% (270 m/mn), bien que légèrement plus faible n'est pas significativement
différente de l'intelligibilité d'un message présenté à taux normal (135 m/mn).
Sous cette condition de distribution, les scores de compréhension et de réponses
aux q c m ne sont pas significativement différents pour les deux modes
d'enregistrement: normal et comprimé.
Sous une condition de distribution continue, les faibles pertes
d'intelligibilité des messages comprimés peuvent être cumulatives et ainsi
diminuer la compréhension et la performance des sujets quand le thème du
discours est plus complexe.
Toutefois, les scores de compréhension ne diminuent pas
significativement pour le texte concret quand on passe de la condition
de présentation segmentée à la condition de présentation continue et les
deux hypothèses d'interaction pour les variables dépendantes
"compréhension" et "rétention" sont vérifiés. Deux explications sont à
invoquer:
-
La compression temporelle efface une partie du signal sonore. La
diminution de la redondance acoustique dans le signal vocal du message
comprimé fait diminuer la vitesse de perception auditive de ce message, un
stimulus évoluant dans un contexte non redondant nécessite un temps de
traitement plus élevé (Heiman 1986).
-
Dans une condition de distribution continue, les pauses nécessaires à
un traitement plus élaboré de l'information sont considérablement réduites.
Il n'est donc pas étonnant que le récit B (concret) dont la plupart des mots
(fréquence élevée dans la langue) sont répétés plusieurs fois soit plus
facilement traitée dans une condition de distribution continue du message
comprimé.
Nous présentons ci-après les résultats des sujets à l'épreuve de
compréhension en présentation continue qui donnent un apperçu plus détaillé des
différences interindividuelles et des différences entre les scores pour les deux
textes.
EXPERIENCE 2: COMPREHENSION EN PRESENTATION CONTINUE
PAROLES COMPRIMEES
Text A
|
1
|
2
|
3
|
5
|
6
|
83,33
|
9
|
13
|
69.23
|
11
|
13
|
84.61
|
7
|
8
|
87.50
|
9
|
13
|
69.23
|
13
|
15
|
86.67
|
8
|
9
|
88.89
|
15
|
15
|
100.00
|
12
|
15
|
80.00
|
11
|
13
|
84.61
|
7
|
10
|
70.00
|
12
|
15
|
80.00
|
7
|
9
|
77.78
|
20
|
21
|
95.24
|
9
|
10
|
90.00
|
11
|
12
|
91.67
|
10
|
12
|
83.33
|
13
|
15
|
86.67
|
12
|
14
|
85.71
|
12
|
13
|
92.31
|
|
Text B
|
1
|
2
|
3
|
19
|
19
|
100,00
|
23
|
24
|
95.83
|
24
|
24
|
100.00
|
22
|
22
|
100.00
|
25
|
25
|
100.00
|
25
|
26
|
96.15
|
20
|
21
|
95.24
|
27
|
27
|
100.00
|
26
|
26
|
100.00
|
22
|
22
|
100.00
|
22
|
22
|
100.00
|
20
|
20
|
100.00
|
20
|
20
|
100.00
|
25
|
25
|
100.00
|
20
|
20
|
100.00
|
22
|
22
|
100.00
|
17
|
17
|
100.00
|
25
|
25
|
100.00
|
20
|
21
|
95.24
|
22
|
22
|
100.00
|
|
(1) nombre de propositions sémantiquement exactes notées par le sujet.
(2) nombre total des propositions notées.
(3) pourcentage des propositions sémantiquement correctes par rapport au
total des propositions notées.
Les sujet ont noté en moyenne 12 propositions pour le texte A et 22
propositions pour le texte B.
EXPERIENCE 3
I-PROBLEMES THEORIQUES
Plusieurs revues de questions (Foulke et Sticht 1969, Leroy 1982) et de
nombreuses données expérimentales ont montré que l'intelligibilité et la
compréhension d'un message sonore après compression temporelle diminuent
rapidement pour un taux de compression supérieur à 50%. De Haan (1977, 1982)
situe le seuil du taux de compréhension d'un message comprimé à environ 52% de
compression. Dans les deux premières expériences ainsi que dans cette troisième
étude, le taux de compression temporelle utilisé est 50%, puisque c'est le taux
de compression maximum qui, selon les résultats expérimentaux, permet encore une
bonne compréhension du message sonore. En outre comme l'intelligibilité et la
compréhension d'un message auditif dépendent également du débit des paroles
émises (nombre de mots par minute) elles diminuent rapidement au-delà de 275
mots/minute. Dans les deux expériences précédentes, le débit des mots après
compression de 50% était de 270 m/mn. Avec de tels paramètre l'intelligibilité
et la compréhension du discours restent bonnes c'est-à-dire supérieures à 90%
dans une condition de présentation segmentée (proposition par proposition) et
supérieure à 80% dans une condition de distribution continue.
Le taux de mots final d'un enregistrement comprimé est fonction à la fois du
taux de compression et du taux de mots initial du message parlé. Dans une
compression temporelle deux éléments entrent en jeu: d'une part une élimination
de signal (la moitié du signal sonore est éliminé pour 50% de compression) et
d'autre part une augmentation du débit de la parole qui dépend du taux de la
compression temporelle mais aussi du débit des mots dans l'enregistrement
initial. Dans la première expérience, dans une condition de distribution
segmentée du message, les scores d'intelligibilité, de compréhension et de
performances ne sont pas différents pour les deux modes d'écoute: parole
normale (135 m/mn) et paroles comprimées (270 m/mn). Toutefois, dans une
condition de distribution continue du message, avec le même débit de paroles et
le même taux de compression (50%) les scores de compréhension et de rétention
sont moins élevés que dans une condition de distribution segmentée (expérience
2). La diminution des scores pourrait être due à la diminution du temps de
traitement des éléments sonores (mots et phrases) imposé par la distribution
continue. Dans une condition de distribution continue les différences entre les
scores pour un mode de paroles normales et pour un mode de paroles comprimées
pourraient déterminer la nécessité d'allouer un temps de traitement
supplémentaire pour le mode comprimé. Ce qui sera testé dans une quatrième
expérience.
Après avoir testé l'influence de la distribution (segmentée ou
continue ) de l'information auditive sur la performance des sujets, nous
nous proposons de tester l'influence du taux des mots de
l'enregistrement initial sur les scores d'intelligibilité, de
compréhension et de rétention des sujets. Est-ce que l'élévation du
débit des mots au-delà de 270 m/mn aura un retentissement sur le
traitement mnésique des éléments du discours.?
II-BUT DE L'EXPERIENCE
L'objectif de cette expérience est de tester l'influence de l'élévation du
débit des paroles initiales sur l'intelligibilité et la compréhension d'un
message auditif ayant subi un taux de compression temporelle de 50% et présenté
aux sujets de façon segmentée .
III-LES HYPOTHESES
1-Avec un débit de paroles supérieur à 275 m/mn, les taux d'intelligibilité
et de compréhension d'un message comprimé seront inférieurs à 90%.
2- Les taux d'intelligibilité et de compréhension d'un message comprimé
seront moins élevés pour un débit de paroles de 300 m/mn que pour un débit de
paroles de 270 m/mn.
3- Les scores de rétention (réponses aux q c m) seront moins élevés pour un
débit de paroles de 300 m/mn que pour un débit de paroles de 270 m/mn.
4-Les scores d'intelligibilité, de compréhension et de rétention seront plus
élevés pour le texte B (concret) que pour le texte a (abstrait).
5-Pour une augmentation du débit des mots de 270 à 300 m/mn, la différence
entre les scores d'intelligibilité et de compréhension sera moins élevée pour le
texte B que pour le texte A.
IV-LES VARIABLES
1- Les variables indépendantes:
-
le débit de la parole P: 2 degrés (270 et 300 m/mn),
-
la nature du texte T: 2 degrés (a abstrait et B concret);
-
l'essai E: 5 degrés (5 blocs de 7 propositions);
-
l'ordre de présentation des textes O: 2 degrés (AB ou BA).
2- Les variables dépendantes:
-
L'intelligibilité sera définie par le pourcentage des mots
correctement notés par les sujets par rapport au nombre total des
mots dans le texte;
-
La compréhension définie par le nombre des propositions
sémantiquement exactes;
-
La performance définie par le pourcentage des bonnes réponses aux q c m.
V-METHODOLOGIE
1-Les sujets:
Les sujets participant à cette expérience sont 20 étudiants des Universités
de Lille, tous volontaires. L'âge moyen est de 20 ans 8 mois s'échelonnant de 18
ans 3 mois à 25 ans 2 mois. Les sujets sont français et n'ont pas de problèmes
auditifs.
2-Le matériel:
Le lieu d'expérimentation et le matériel sont les mêmes que ceux utilisés
pour les deux premières expériences. Toutefois pour un groupe expérimental, les
3 récits sont enregistrés au préalable par la même personne mais avec une
vitesse de lecture plus élevée (environ 150 mots/minute). Avec 50% de
compression temporelle ces enregistrements ont un débit de 300 mots/minute.
3-Procédure:
Les 20 étudiants sont répartis dans deux groupes, eux- mêmes divisés en deux
sous-groupes (présentation AB et BA). Le groupe de 10 sujets à qui sont
présentés les enregistrements comprimés à 50% dont le débit de la parole est de
270 m/mn, est composé des deux sous-groupes de 5 sujets de la première
expérience ayant subi les épreuves expérimentales l'après-midi. Les données
expérimentales proviennent de ces deux sous-groupes et sont comparées aux
données provenant des 10 sujets à qui sont présentés les enregistrements
comprimés à 50% dont le débit est de 300 m/mn.
La passation se déroule comme dans la première expérience et la consigne est
la même.
En définitive, les enregistrements de trois récits sont présentés de façon
segmentée (proposition par proposition) à deux groupes de 10 sujets. Pour l'un
des groupes les enregistrements comprimés sont présentés selon un débit de 270
m/mn et pour l'autre groupe selon un débit de 300 m/mn.
4-Plan d'expérience:
Les données expérimentales sont traités par le programme d'analyse de
variance VAR3 selon le plan expérimental suivant:
Le facteur O ordre de présentation des textes a et B, n'ayant pas
d'effet significatif, les données sont regroupées selon le plan:
-
S10<P2>*T2*E5
-
le facteur P: le débit des paroles à 2 degrés, 270 m/mn et 300
m/mn;
-
le facteur T est la nature des textes à 2 degrés, a abstrait et
B concret;
-
le facteur E est l'essai à 5 degrés, soit 5 blocs de 7 chacun.
VI-RESULTATS
1-Les données expérimentales:
Les données sont présentées en annexe. En ligne de S1 à S10 sont exposées les
données pour les 10 sujets écoutant les enregistrements à 270 m/mn et de S11 à
S20 sont exposées les données pour les 10 sujets écoutant les enregistrements à
300 m/mn.
En colonnes, les pourcentages des scores concernant chacun des 5 blocs de
propositions pour chacun des texte a et B;
Trois tableaux de données sont présentés pour chacune des trois variables
dépendantes: pourcentage des mots exacts, pourcentage des propositions
correctes, pourcentage des bonnes réponses aux q c m.
2-Analyse des résultats:
a-Intelligibilité:
L'effet du facteur "débit des mots" (270/300 mots par minute) est
significatif. Les scores d'intelligibilité (pourcentages des mots exacts notés
par les étudiants) sont plus élevés pour le débit de 270 m/mn que pour 300 m/mn
(F=22.57 (1- 18) p<.01).
L'effet du facteur "nature du texte" T est significatif. Les scores
d'intelligibilité sont moins élevés pour le texte a (abstrait) que pour le texte
B (concret) (F=8.81 (1-18) p<.01).
Les autres facteurs et les interactions n'ont pas d'effet significatif.
b-Mémoire à court terme et compréhension:
Le facteur "débit de mots" a un effet significatif: les scores de
compréhension (pourcentage de propositions sémantiquement correctes) sont plus
élevés pour un débit de 270 m/mn que pour un débit de 300 m/mn (F:21.33 (1-18)
p<.01).
Le facteur "nature du texte" T a un effet significatif: les scores de
compréhension sont plus élevés pour le texte B concret) que pour le texte a
(abstrait) (F=38.53 (1-18) p<.01).
Le facteur "essai" E n'a pas d'effet significatif. Toutefois l'interaction
P*E est significative: les variations entre les scores pour les différents
essais sont plus élevées pour la présentation à 300 m/mn qu'à 270 m/mn (F=4.87
(4-72) p<.05).
L'interaction E*T est significative: les scores pour les blocs d'essais
varient différemment pour le texte a et pour le texte B, les différences entre
les essais étant plus élevées pour le texte a que pour le texte B, et les
graphes des blocs d'essais montrant une élévation des scores pour les derniers
blocs en ce qui concerne le texte a et non pour le texte B (F=5.06 (4-72)
p<.01).
Enfin l'interaction P*E*T est significative: les différences entre les blocs
d'essais sont plus élevées pour le texte a que pour le texte B quand on passe de
la présentation à 270 m/mn à 300 m/mn et les différences entre les scores
diminuent pour les derniers blocs d'essais du texte a quand on passe de la
présentation à 270 m/mn à la présentation à 300 m/mn alors qu'elles changent peu
pour le texte B (F=5.24 (4-72) p<.01).
En ce qui concerne les réponses aux q c m, les effets des facteurs et
interactions ne sont pas significatifs.
VII-DISCUSSION - CONCLUSION
En ce qui concerne l'intelligibilité et la compréhension des enregistrements
ayant subi une compression temporelle de 50%, les scores sont moins élevés pour
un débit de mots de 300 m/mn que pour un débit de 270 m/mn. Toutefois les
performances concernant les réponses aux q c m ne sont pas affectés par une
élévation du débit des mots à 300 m/mn.
Les premiers résultats concernant l'intelligibilité et la compréhension sont
en accord avec ceux de nombreux expérimentateurs: l'intelligibilité et la
compréhension d'un texte déclinent rapidement au-delà de 270 m/mn (Foulke 1969,
Leroy 1982). Mais le résultat concernant la performance des sujets est plus
inattendu bien que différentes explications pourraient en rendre compte. Les
scores pour l'intelligibilité et la compréhension des paroles à 300 m/mn restent
relativement bons (supérieur à 80 %). De plus les sujets sont face aux portions
de phrases qu'ils recopient pendant quelques secondes. L'écriture et la vision
des mots perçus auditivement amélioreraient donc la rétention mnésique des
sujets.
Par ailleurs, l'existence des différentes interactions pour les scores de
compréhension met en évidence l'influence de la nature d'un texte sur sa
compréhension, mais surtout un effet d'apprentissage ou d'habituation aux débits
des mots pour le texte a (abstrait) et non pour le texte B (concret) dont les
scores restent relativement élevés. Le fait de passer de 270 mots/minute à 300
mots/minute diminuent la compréhension des deux textes toutefois, cette
détérioration plus forte au début (trois premiers blocs d'essais) pour le texte
abstrait est plus faible ensuite. Pour le texte concret et redondant, cette
diminution de la compréhension est plus irrégulière et reste relativement
faible. Il semble que les étudiants soient capables de s'adapter aux débits des
mots d'un discours en optimisant leur capacité d'écoute pour des enregistrements
courts.
EXPERIENCE 4
I-PROBLEMES THEORIQUES
Une quatrième expérience est effectuée pour compléter les résultats de
l'expérience 2. En effet, dans une condition de parole comprimée à 50% avec un
débit de 270 mots/minute, les résultats sont meilleurs pour un mode de
distribution segmentée (proposition par proposition) que pour un mode de
distribution continue (l'énoncé intégral). Nous avons alors conclu qu'une pause
de quelques secondes entre chaque proposition favorise la compréhension et la
rétention de la parole comprimée.
Dans l'expérience 2, deux conditions de présentation auditive sont comparées: une présentation segmentée et une présentation continue pour deux récits
(abstrait et concret) dont l'enregistrement a subi une compression temporelle de
50% et dont le débit des paroles est 270 mots/minute après compression. En
présentation continue, les étudiants avaient moins de temps pour traiter
l'information qu'en présentation segmentée . Dans l'expérience 1, en condition
de présentation segmentée , les performances des sujets ne diffèrent pas
significativement après écoute de l'enregistrement normal ou comprimé. Mais,
obtiendrait-on le même résultat en condition de présentation continue de la
parole comprimée et de la parole normale? En effet, en écoute continue, les
suites sonores "s'écoulent" sans interruption à un débit de 270 m/mn pour la
parole comprimée et 135 m/mn pour la parole normale. Est-ce que l'écoute
continue d'un récit présenté à 135 m/mn permet une meilleure performance que
l'écoute continue d'un récit présenté à 270 m/mn? Sur un plan théorique, étant
donné les résultats de la première expérience, le traitement de l'information au
niveau périphérique (intelligibilité) n'est pas détérioré par la compression
temporelle de 50%, pour un débit de l'enregistrement original de 135 m/mn. Il
importe de vérifier l'influence du débit des mots sur la compréhension et la
rétention du discours. Sur un plan pratique, est-ce que la parole comprimée et
donc "l'écoute rapide" est un mode d'accès à l'information parlée intéressant
pour les auditeurs qui ont besoin de gagner du temps (Bishoff 1979, Myers 1978,
Leroy 1982, Foulke et al. 1969).
Par ailleurs, dans la seconde expérience, outre l'effet des facteurs mode de
présentation et nature des textes enregistrés, nous avions observé une
interaction entre ces deux facteurs pour les scores de compréhension et de
rétention. Dans, une même condition de distribution continue des informations,
il est possible que seuls les effets des facteurs débit des mots et nature des
textes soient observés.
II-LES HYPOTHESES
Si le niveau central du traitement des informations parlées est influencé par
le débit de la parole, la compréhension et donc le pourcentage des propositions
sémantiquement correctes notées par les étudiants sera plus faible pour les
paroles comprimées que pour les paroles normales dans une même condition de
distribution continue.
Les scores de compréhension et de rétention seront plus élevés pour le texte
B (concret) que pour le texte a (abstrait).
III-LES VARIABLES
1-Les variables indépendantes
L'enregistrement de deux textes abstrait et concret est écouté par deux
groupes d'étudiants: pour un groupe l'enregistrement est normal (135 m/mn),
pour l'autre groupe il a subi une compression temporelle de 50% (270 m/mn).
Deux variables principales sont observées::
a-Présentation p à 2 degrés N (normal) et C (comprimée).
b-Textes T à 2 degrés A(abstrait) et B (concret).
Deux variables sont contrôlées: l'heure de passation des sujets et l'ordre
de présentation des textes.
2-Les variables dépendantes
Deux variables dépendantes sont considérées ici:
a-La compréhension des sujets définie par le pourcentage des propositions
sémantiquement exactes par rapport au total des propositions notées par les
étudiants. Ce calcul a été effectué selon les mêmes critères et avec la même
méthode que dans l'expérience 2.
b-La rétention traduit par les scores des sujets obtenus aux Q C M.
IV-METHODE
1-Les sujets
40 étudiants de l'université de Lille ( filles et garçons) ont participé à
cette expérience. Tous les étudiants sont volontaires et ont été recrutés dans
les différentes universités de Lille. L'âge moyen des sujets est de 20 ans 9
mois. La langue maternelle de tous les étudiants est le français et les sujets
n'ont pas de pathologies auditive connue. Les sujets sont répartis de façon
aléatoire dans deux groupes: 20 sont ceux provenant de la deuxième expérience
(présentation continue mode comprimé), les 20 autres n'ont pas participé aux
expériences précédentes. Pour ces derniers, les enregistrements sont présentés
en continu mais à vitesse normale (135 m/mn).
2-Le matériel
L'expérience se déroule dans la même pièce et avec le même matériel que ceux
utilisés pour les autres expériences.
3-La passation
Les sujets sont divisés en groupes de 5. L'heure de passation et l'ordre de
présentation des enregistrements sont contrôlés comme dans les trois expériences
précédentes.
Chaque groupe de 5 sujets écoute d'abord l'extrait du Petit Prince pour
mettre les étudiants en contact avec le type de paroles avec lequel ils seront
confrontés au cours de la suite de l'expérience.
La consigne est la même pour les deux groupes. Elle a été exposée dans
l'expérience 2 pour le groupe en condition de présentation continue.
Chaque séance se déroule ainsi:
-
réglage du volume sonore dans les casques,
-
écoute du récit de mise en route (le Petit Prince) et résumé de
l'histoire,
-
écoute attentive des textes a ou B suivant les sous-groupes,
-
pour les groupes écoutant l'enregistrement normal, compte rendu détaillé
de l'histoire immédiatement après l'écoute,
-
pour les groupes écoutant l'enregistrement comprimé, compte-rendu
détaillé de l'histoire après un délai équivalent au temps d'écoute (laissé
inoccupé )afin de placer les deux groupes de sujets dans les mêmes
conditions de rétention,
-
réponses au Q C M,
-
repos de 2 minutes,
-
écoute de la seconde histoire, compte-rendu et réponses au Q C M.
4-Plan d'expérience
Nous utilisons un plan factoriel avec deux groupes de 20 sujets (groupes
indépendants) pour tester la variable "présentation" (P) à 2 degrés normal (N)
et comprimé (C). Une seconde variable indépendante la nature des textes T à 2
degrés abstrait (A) et concret (B) est testée dans des groupes de mesures
appareillées.
Les données ont été traitées par le programme d'analyse de variance VAR3. Le
plan est de la forme: S20<P2>*T2
V - RESULTATS
EXPERIENCE 4:
COMPREHENSION EN PRESENTATION CONTINUE
PAROLES NORMALES
TEXTE A
|
|
TEXTE B
|
1
|
2
|
3
|
|
1
|
2
|
3
|
14
|
17
|
82.35
|
|
23
|
23
|
100.00
|
8
|
14
|
57.14
|
|
21
|
21
|
100.00
|
8
|
10
|
80.00
|
|
18
|
18
|
100.00
|
15
|
22
|
68.18
|
|
24
|
24
|
100.00
|
13
|
15
|
86.67
|
|
19
|
19
|
100.00
|
6
|
9
|
66.67
|
|
23
|
23
|
100.00
|
17
|
17
|
100.00
|
|
21
|
21
|
100.00
|
19
|
19
|
100.00
|
|
21
|
22
|
95.45
|
9
|
12
|
75.00
|
|
17
|
18
|
94.44
|
9
|
12
|
75.00
|
|
19
|
19
|
100.00
|
12
|
16
|
75.00
|
|
17
|
17
|
100.00
|
12
|
16
|
75.00
|
|
16
|
19
|
84.44
|
14
|
16
|
87.50
|
|
18
|
18
|
100.00
|
8
|
13
|
61.54
|
|
11
|
14
|
78.54
|
8
|
11
|
72.73
|
|
17
|
19
|
89.47
|
8
|
10
|
80.00
|
|
18
|
19
|
94.74
|
12
|
14
|
85.71
|
|
22
|
22
|
100.00
|
9
|
13
|
69.23
|
|
10
|
11
|
90.91
|
12
|
17
|
70.58
|
|
14
|
14
|
100.00
|
17
|
19
|
89.47
|
|
19
|
19
|
100.00
|
En moyenne les sujets ont noté 15 propositions pour le texte A et 19
propositions pour le texte B.
Pour les résultats en paroles comprimées voir tableau à la fin de
l'expérience 2.
1-Présentation des données expérimentales
Les tableaux des données expérimentales sont exposés en annexe; En ligne sont
exposés les résultats des groupes P1 et P2 de 20 sujets chacun distribués de S1
à S40.
En colonnes, sont exposés les résultats pour les textes a et B, c'est-à-dire
les pourcentages de propositions correctes pour le tableau "compréhension" et le
pourcentage de bonnes réponses pour le tableau "performance".
2-Analyse et descriptions des résultats
a-Compréhension
La moyenne des pourcentages des propositions sémantiquement exactes notées
par les sujets pour le groupe "paroles normales" est 77.89% pour le texte a et
96.36% pour le texte B.
La moyenne des pourcentages des bonnes propositions par rapport au total des
propositions notées par les sujets pour le groupe "parole comprimée" est 84.34%
pour le texte a et 99.12% pour le texte B.
TABLEAU DE LA VARIABLE DEPENDANTE "compréhension"
|
A
|
B
|
|
A
|
B
|
P. NORMALE
|
77.89
|
96.36
|
P. NORMALE
|
11.42
|
6.18
|
P. COMPRIMEE
|
84.34
|
99.12
|
P. COMPRIMEE
|
8.28
|
1.81
|
MOYENNES
|
ECART-TYPE
|
L'analyse de variance met en évidence l'effet significatif du facteur P type
de paroles normales ou comprimées: les pourcentages de propositions
sémantiquement exactes sont plus élevés pour les enregistrements de paroles
comprimées que pour les enregistrements de paroles normales (F=5.87 (1-38)
p<.05).
Le facteur "nature du texte" a également un effet significatif: les
pourcentages de propositions sémantiquement correctes sont plus élevés pour le
texte B (concret) que pour le texte a (abstrait) (F=115.59 (1-38) p<.01).
L'interaction entre les deux facteurs P et T n'est pas significative.
Pour les enregistrements d'origine (135 m/mn) les étudiants ont noté en
moyenne 15 propositions au total pour le récit a et 19 propositions au total
pour le récit B.
Pour les enregistrements comprimés (270 m/mn), les étudiants ont noté en
moyenne 12 propositions pour le texte a et 22 propositions pour le texte B.
b-La rétention
Tous les scores de réponses aux Q C M sont supérieurs à 87% pour le texte a
et supérieurs à 98% pour le texte B
TABLEAUX DE La VARIABLE DEPENDANTE "rétention"
|
A
|
B
|
|
A
|
B
|
P. NORMALE
|
89.37
|
99.28
|
P. NORMALE
|
7.63
|
3.19
|
P. COMPRIMEE
|
87.66
|
98.57
|
P. COMPRIMEE
|
8.73
|
4.40
|
MOYENNES
|
ECART-TYPE
|
Le facteur "nature du texte" T a un effet significatif: les scores sont plus
élevés pour le texte B (concret) que pour le texte a (abstrait) (F=51.95 (1-38)
p<.01).
Le facteur type de paroles normales ou comprimées n'a pas d'effet
significatif.
L'interaction entre les facteur P et T n'est pas significative.
VI - DISCUSSION / CONCLUSION
1-Mémorisation et compréhension
Les enregistrements écoutés par un groupe de 20 étudiants ont un débit de 135
mots/minute et les enregistrements écoutés par l'autre groupe de 20 étudiants
ont subi une compression temporelle et ont un débit de 270 mots/minute. Chaque
récit est écouté en continu et les sujets rédigent ensuite un compte-rendu
détaillé de l'histoire; puis, ils répondent au questionnaire à choix multiple.
. Les étudiants qui écoutent les récits enregistrés à un débit de 270 m/mn
rappellent plus de propositions exactes que les étudiants qui écoutent les
récits enregistrés à 135 m/mn (F=5.87 (1-38) p<.05). Ce résultat semble, pour le
moins surprenant. Surpris par le débit de l'enregistrement comprimé et stimulés
à la perspective de rédiger un compte rendu détaillé, il est possible que les
étudiants aient maximisé leurs facultés d'attention et de concentration.
Pour le texte abstrait (L'île du cercle), les étudiants ont rapporté moins de
propositions que pour le texte concret (Le vieux fermier), et ce dans les deux
conditions d'écoute (F=115.59 (1-38) p<.01). Pour le texte abstrait, tous les
étudiants ont rappelé correctement les premières et les dernières propositions
du récit, mais ont omis les propositions placées au centre du texte ou ont
rapporté leur contenu de façon plus synthétique et ce, d'autant plus que le
débit des paroles est élevé; toutefois . avec la parole comprimée les sujets
ont moins d'erreur.
Avec des récits relativement courts (quelques minutes), la compréhension et
le rappel immédiat des étudiants n'est pas diminué par une "écoute rapide".
Une fois de plus, dans cette expérience les écarts-type sont importants, ce
qui traduit une grande variabilité interindividuelle. Cette variabilité est plus
forte pour le texte abstrait.
2-La rétention
Bien que légèrement inférieure, la performance des sujets écoutant la parole
comprimée n'est pas significativement différente de celle des sujets écoutant la
parole normale. Ce résultat est en accord avec les conclusions de nombreux
auteurs pour la langue anglo-saxonne (Foulke et al.1969, Myers 1978, Bischoff
1979, Leroy 1982,).
EXPERIENCE 5
I-PROBLEMES THEORIQUES
De nombreux facteurs pouvant influencer l'intelligibilité et la compréhension
de la parole comprimée ont été mis en évidence par les expérimentateurs. Outre
le débit des mots (seuil à 275 m/mn) et le taux de compression (seuil à 50%),
d'autre facteurs liés à l'auditeur sont impliqués et en particulier l'âge des
sujets, leur vitesse d'articulation et de lecture. Beasley et al. (1976) ont
trouvé des différences entre les performances des auditeurs en fonction de l'âge: la discrimination de mots monosyllabiques comprimés dans le temps s'améliore
pour les sujets plus âgés. Freeman et Beasley (1978), Beasley
Flaherty-Rintelmann 1976), puis Beasley et al. (1980) ont trouvé les mêmes
résultats avec des phrases comprimées. Selon May (1984), la compression
temporelle des paroles pourrait être un moyen d'étudier les caractéristiques de
la perception auditive responsables des capacités de discrimination. Pour May,
les capacités de discrimination de la parole comprimée dépendraient de l'âge des
sujets. Dans le but de tester cette hypothèse, l'auteur a étudié quatre groupes
de sujets: 14 sujets de 6 ans 6 mois en moyenne, 20 sujets de 8 ans 6 mois en
moyenne, 16 sujets de 10 ans 6 mois en moyenne et 15 sujets de 21 ans 7 mois en
moyenne. Ces 65 sujets ont un développement cognitif normal et une perception
auditive normale. L'auteur n'a pas observé de différence significative entre les
groupes des 6 ans et des 8 ans d'une part et les groupes des 10 ans et des 21
ans d'autre part. Toutefois les scores des deux groupes plus âgés (10 ans et 21
ans) sont significativement plus élevés que les scores des deux groupes plus
jeunes (6 ans et 8 ans). Selon May (1984), les capacités de discrimination des
paroles ayant subi une compression temporelle, augmentent avec la maturité des
sujets. Les capacités optimales de traitement auditif atteindraient une
asymptote vers 11 à 12 ans. L'évolution ontogénétique de l'efficacité du
traitement auditif, atteint un stade optimal au début de la deuxième décade de
la vie.
Le décodage de l'information parlée est régi par des mécanismes situés à
différents niveaux. Au niveau périphérique, l'analyse du signal vocal dépend des
propriétés physiologiques de l'oreille interne, en particulier de la sensibilité
des structures de la cochlée aux différents paramètres du signal et des seuils
de discrimination associés à la fréquence, la durée et l'amplitude du signal.
L'intelligibilité de la parole comprimée dépend d'abord des processus d'analyse
effectués à ce niveau. Au niveau central, le message parlé en cours de
traitement fait appel à diverses sources de connaissances: acoustiques,
phonétiques, lexicales, syntaxiques et pragmatiques. Les processus cognitifs
impliquent entre autre le fonctionnement de l'attention, et de la mémoire. Le
traitement d'un message parlé passerait par une étape articulatoire pour
entretenir la trace mnésique: après le décodage phonétique, tandis qu'il
procède au traitement syntaxique et sémantique, le sujet effectue "une
verbalisation" de l'information reçue. L'auditeur se répète mentalement ce qu'il
entend (Baddeley 1986). Pour Baddeley, un dispositif de boucle articulatoire
alimenterait le stock phonologique: pour que les "traces" ne s'estompent pas
une révision du matériel (répétition mentale) s'impose. Ce codage est central et
ne dépend pas obligatoirement des mécanisme moteur du système phonatoire. En
outre, la mémoire de travail "maintient en disponibilité immédiate les
informations reçues de la mémoire à court terme ou retrouvées de la mémoire à
long terme". Le nombre des éléments stockés en mémoire à court terme est limité:Miller (1956) a évalué la capacité de la mémoire à court terme à 7 plus ou
moins 2 éléments. De plus, plusieurs auteurs ont situé la capacité temporelle de
la mémoire de travail entre 1,5 et 2 secondes (Baddeley 1986, Hulme et al. 1984,
Schweickert et Boruff 1986 ). Selon ces auteurs, cette durée d'environ 2
secondes serait l'intervalle de temps pendant lequel la trace mnésique peut être
récupérée. Le stockage en mémoire de travail maximum pendant ces deux secondes
ne dépendrait pas seulement du nombre des éléments ou "shunk" mais plutôt d'un
autre facteur: la vitesse de la parole. L'empan mnésique serait fonction
linéaire du taux de prononciation du sujet (Baddeley 1986, Hulme et al. 1984,
Schweickert et Boruff 1986 ).
Dans la série d'expériences précédemment exposées, nous avons souligné à
plusieurs reprises l'existence d'une grande variabilité interindividuelle dans
les résultats après écoute des paroles comprimées. Dans la mesure où la
population de ces expériences est relativement homogène en ce qui concerne la
tranche d'âge et le niveau culturel, cette variabilité pourrait être expliquée
par des "vitesses de traitement du langage" (parlé ou écrit) différentes selon
les sujets. Les sujets capables de lire vite seraient également capables de
mieux traiter la parole comprimée. C'est pour tester ce point de vue et pour
comparer les capacités de traitement de la parole normale et de la parole
comprimée par des collégiens en fonction de leur vitesse de lecture et de l'âge
lexical de ces sujets que nous réalisons cette étude expérimentale.
En particulier, cette étude aura pour objectif d'évaluer l'influence des
facteurs "vitesse de lecture" et "âge lexical" sur l'intelligibilité, la
compréhension et la rétention de la parole comprimée par des élèves de sixième,
cinquième, quatrième et troisième.
II-METHODOLOGIE
A-Les sujets
Les données ont été recueillies sur 80 élèves du collège Henri Durez
à Estaires (Nord de la France), de langue maternelle française, au cours
de l'année scolaire 1988-1989. La sélection des 80 sujets s'est opérée à
partir de trois critères:
-
âge chronologique,
-
vitesse de lecture,,
-
âge lexical.
Pour sélectionner les sujets, 136 élèves (46 en sixième, 28 en cinquième, 35
en quatrième et 29 en troisième) ont passé individuellement plusieurs épreuves.
Le test de "l'Alouette", test d'analyse de la lecture et de dépistage de la
dyslexie a permis de définir la vitesse de lecture et l'âge lexical des sujets.
Les élèves avaient pour consigne de lire le mieux possible les 265 mots du texte
de "l'Alouette". Le temps de lecture est chronométré et la correction consiste à
comptabiliser le nombre d'erreurs non corrigées, les mots ajoutés, les mots
oubliés, les mots non lus en 5 secondes et à soustraire ce nombre au total des
mots lus. Une vitesse de lecture, exprimée en nombre de mots par minute est
calculée en fonction du temps de lecture et du nombre de mots correctement lus.
L'âge lexical est calculé à partir de l'échelle associée au test.
Pour les quatre niveaux scolaires, ont été sélectionnés les enfants d'âge
chronologique correspondant à l'âge d'un élève ayant suivi un cursus scolaire
normal et ont été éliminés les élèves en retard ou en avance. Les groupes ont
été constitués de telle sorte que l'âge moyen de chaque classe (pour la première
phase de l'expérience) soit égal à la médiane en deçà de laquelle sont retenus
les 10 lecteurs les plus lents et au-delà de laquelle sont retenus les 10
lecteurs les plus rapides. L'écart entre le plus lent des lecteurs rapides et le
plus rapide des lecteurs lents est environ 10 mots/minute (8 à 15).
L'échantillon sélectionné se compose de 80 élèves (filles et garçons)
répartis dans quatre groupes de 20 sujets: quatre niveaux d'âge chronologique
correspondant à quatre niveaux scolaires, dans la première phase de l'expérience
et à quatre groupes d'âge lexical différent dans la deuxième phase.
Une seconde épreuve a été présentée aux élèves: pour mesurer leur
vitesse d'articulation. Le sujet doit répéter cinq fois le plus
rapidement possible des mots et des non-mots de 4, 5 et 7 syllabes. Pour
les mots, l'expérimentateur choisit les suites parmi les listes
suivantes:
-
liste 1: (4 syllabes) vélo-sapin, (5 s) souris-mandarine, (7 s)
hippopotame-éléphant
-
liste 2: (4 s- bureau-café, (5 s) ruban-chocolat, (7 s)
automobile-écurie
-
liste 3: (4 s) valet-marin, (5 s) melon-otarie, (7 s)
alligator-pissenlit.
Pour les non-mots, la liste unique est la suivante:
-
(4 s) lasapoti, (5 s) rifomulati, (7 s) piracotufacoté.
Trois listes de mots ont été établies pour éviter la communication entre les
sujets et l'apprentissage de cette liste avant la passation. Une liste de mots
parmi les trois est présentée au sujets et la liste de non-mots. Le temps mis
pour prononcer chaque suite est chronométré, puis le temps pour prononcer une
syllabes est calculé en secondes. Quand un sujet n'est pas capable de prononcer
cinq fois de suite une série, il lui est attribué le temps le plus long mis par
les élèves de son âge pour prononcer cette série.
B-Le matériel
Deux listes de 25 phrases équivalentes en nombre de mots (entre 7 et 9) et en
nombre de syllabes (entre 7 et 12) ont été constituée en sélectionnant ces
phrases parmi les 200 de la liste de Combescure (1984) qui sont phonétiquement
équilibrées et dont la fréquence des phonèmes reflète celle qui existe dans la
langue française.
Les 50 phrases ont été lues par une voix féminine à une vitesse de 135 mots
par minute en moyenne et enregistrées sur cassette. Chaque phrase lue est
terminée par un bip et séparée de la suivante par une pause de 2 secondes
environ.
Un magnétophone (General Electric) permet de faire varier le taux de
compression de l'enregistrement. 25 phrases seront écoutées à taux normal (135
m/mn, 0% de compression) et 25 à un débit de 270 m/mn (50% de compression)
C-Procédure
1-Les groupes de sujets:
20 sujets de chaque niveau scolaire sont rangés dans l'ordre décroissant par
rapport à leur vitesse de lecture (nombre de mots par minute). En respectant le
rang de chaque sujet, pour chaque niveau scolaire, les 20 sujets ont été
répartis en 4 groupes de 5 sujets. Le premier groupe (les 5 premiers lecteurs
rapides) écoutent d'abord 25 phrases en paroles comprimées (PC), puis 25 en
paroles normales (PN). Le deuxième groupe (les 5 lecteurs rapides suivants)
écoutent d'abord 25 phrases en PN, puis 25 en PC. Le troisième groupe (les 5
meilleurs lecteurs lents) écoutent d'abord 25 phrases en PC, puis 25 en PN. Le
quatrième groupe (les 5 lecteurs les plus lents) écoutent d'abord 25 phrases en
PN, puis 25 en PC.
Ainsi, 16 groupes de 5 sujets suivent le déroulement de l'expérience.
2-Déroulement de l'expérience
Dans une pièce isolée des autres salles de cours, 5 tables sont disposées
autour de la table de l'expérimentateur et sont isolées de tel sorte que les 5
sujets voient l'expérimentateur mais ne puissent se voir, ni communiquer entre
eux. Sur chaque table est posé un casque d'écoute, et les 6 casques (1 pour
l'expérimentateur et 5 pour les sujets) sont reliés par l'intermédiaire d'une
boite relais au magnétophone. La passation a lieu en deux temps identiques.
-
chaque sujet reçoit d'abord une feuille blanche et un crayon,
-
après avoir donné les indications pour porter confortablement
les écouteurs, la consigne est ensuite énoncée:
"Ecoutez bien. Pour vous habituer vous entendrez d'abord 5 phrases que vous
n'aurez pas à recopier. Puis, après deux bip sonores, vous allez entendre une
série de phrases. a la fin de chaque phrase, vous entendrez un bip sonore.
Immédiatement après, vous écrirez exactement ce que vous venez d'entendre. Les
fautes d'orthographe ne seront pas pénalisées".
Selon le groupe présent, les 25 premières phrases ont été écoutées en PN ou
en PC.
Les 5 premières phrases ont pour rôle d'éviter un effet de mise en route.
Chaque sujet dispose du temps nécessaire pour recopier chaque phrase.
Quand les 20 phrases ont été écrites, les élèves rendent leur feuille.
-
chaque sujet reçoit alors une feuille sur laquelle sont écrites de façon
incomplète les 20 phrases: pour chacune d'entre elles, il manque deux mots.
La consigne est énoncée:
"Vous avez une feuille sur laquelle sont écrites les 20 phrases que vous
venez d'entendre et de recopier. Attention, il manque 2 mots dans chacune
d'elles. a vous de remplir les "blancs". Si vous ne savez pas, passez à la
suivante. Vous rendrez votre feuille, quand vous estimerez avoir fini. Vous
disposez du temps qui vous est nécessaire".
Le même déroulement a lieu pour les 25 phrases de la deuxième liste
présentées en PN ou PC selon le mode de présentation des 25 premières. Notons
que les 25 phrases écoutées en paroles normales et les 25 phrases écoutées en
paroles comprimées sont les mêmes pour tous les groupes. Seul l'ordre de
présentation change comme indiqué précédemment.
3-Corrections des épreuves
Les 20 phrases entendues en paroles normales et les 20 phrases entendues en
paroles comprimées sont divisées en 4 groupes de 5 en gardant leur ordre
respectif de présentation, ordre identique pour tous les sujets. Cette division
correspond aux 4 degrés de la variable "Essai".
Pour évaluer l'intelligibilité, les sujets ont écrit exactement ce qu'ils
entendaient, phrase après phrase. Pour chaque groupe de 5 phrases, a été calculé
le pourcentage de mots exacts par rapport au nombre de mots total de chaque bloc
de 5 phrases.
Pour évaluer la compréhension, la correction est effectuée également à partir
des phrases écrites intégralement ou non par le sujet. Chaque phrase
sémantiquement correcte vaut 1 point. Huit notes sont attribuées pour chaque
sujet (2 fois 4 blocs de 5 phrases). En exemple de correction si un sujet à
écrit "s'enfuit" au lieu de "a fui", il a faux pour le calcul du score
d'intelligibilité et bon pour celui de la compréhension. Pour évaluer le score
de compréhension, nous utilisons la méthode des juges: trois personnes ont à
décider si le mot écrit a la même sens ou non que le mot d'origine.
Le test de rétention est le test "à trous" (en annexes). Pour chaque bloc de
5 phrases a été calculé le nombre de mots manquants correctement retrouvés:
soit 8 notes pour chaque sujet pouvant varier de 0 à 10.
Pour évaluer l'équivalence des deux séries de 20 phrases du test à trous et
pour mesurer l'influence de l'écoute, un groupe contrôle de 12 sujets ayant subi
les prétests, mais n'ayant pas assisté à l'expérience a rempli les "blancs" du
test de rétention. Pour les 20 phrases écoutées en paroles normales le score est
de 1.13 sur 10 et pour les 20 phrases écoutées en paroles comprimées le score
est de 1.64 sur 10.
D - Hypothèses et variables
1-Variables
-
âge chronologique (A): 4 degrés. 4 groupes de 20 sujets pour chaque
classe de sixième, cinquième, quatrième et troisième correspondent
respectivement aux âges de 12, 13, 14 et 15 ans en moyenne
-
vitesse de lecture (L): 2 degrés. Pour chaque tranche d'âge et donc
chaque niveau scolaire, les sujets sont répartis dans deux catégories:
lecteurs lents ou lecteurs rapides.
-
ordre de présentation (O): 2 degrés. Les phrases sont présentées dans
l'ordre PN-PC ou PC-PN. Cette variable de contrôle permet de vérifier les
effets dus à l'ordre de présentation.
-
mode de présentation (P): 2 degrés. Les phrases sont présentées selon
deux débits de paroles: paroles normales ou paroles comprimées.
-
essais (E): 4 degrés. Les deux listes comportent 25 phrases dont 5 de
mise en route et 20 divisées en 4 blocs de 5 phrases lors de la correction.
Cette variable permet de vérifier un éventuel effet d'habituation, de
fatigue, d'apprentissage ou de pratique.
2-Hypothèses
L'intelligibilité, la compréhension et la rétention seront meilleures chez
les sujets plus âgés. Les performances aux tests d'intelligibilité, de
compréhension et de rétention seront meilleures pour l'écoute des paroles
normales que pour l'écoute des paroles comprimées.
Les lecteurs rapides mémoriseront mieux les phrases immédiatement présentées
que les lecteurs lents. L'intelligibilité et la compréhension des lecteurs
rapides sont meilleurs que celles des lecteurs lents.
La différence entre les performances après écoute des paroles normales et des
paroles comprimées sera plus importante à un âge inférieur qu'à un âge supérieur
(hypothèse d'interaction entre a et P).
Plus le lecteur est rapide, plus la différence entre les performances pour PN
et PC diminue (hypothèse d'interaction entre P et L).
Définitions opérationnelles des variables dépendantes:
-
l'intelligibilité est le pourcentage des mots exacts par rapport au
nombre de mots total,
-
la compréhension est définie par le nombre de phrases sémantiquement
correctes,
-
la rétention est définie par le nombre de "blancs" complétés par des
mots exacts (mots qui ont constitué les phrases précédemment entendues).
Première hypothèse: le pourcentage de mots exacts par rapport au nombre de
mots total, le nombre de phrases sémantiquement correctes et le nombre de
"blancs" correctement complétés seront d'autant plus élevés que l'élève est dans
une tranche d'âge élevée (6ème, 5ème, 4ème, 3ème).
Deuxième hypothèse: le pourcentage de mots exacts par rapport au nombre de
mots total, le nombre de phrases sémantiquement correctes et le nombre de blancs
correctement complétés seront supérieurs pour un taux de compression temporelle
de 0% (paroles normales) que pour un taux de compression de 50% (paroles
comprimées).
Troisième hypothèse: le nombre de "blancs" correctement complétés, le nombre
de phrase sémantiquement correctes et le pourcentage de mots exacts seront plus
importants chez les lecteurs rapides que chez les lecteurs lents.
Quatrième hypothèse: la différence entre la moyenne des scores obtenus après
écoute de la parole comprimée et de la parole normale sera plus importante chez
les élèves de sixième que pour les élèves de troisième.
Cinquième hypothèse: la différence entre les scores obtenus après écoute des
paroles normales et comprimées sera d'autant plus faible que le lecteur sera
rapide.
E-Plan d'expérience
1-Age (A):
-
A1: classe de 3ème (environ 14 ans)
-
A2: classe de 4ème (environ 13 ans)
-
A3: classe de 5ème (environ 12 ans)
-
A4: classe de 6ème (environ 11 ans).
2-vitesse de lecture (L):
3-ordre de présentation (O):
-
O1: comprimée-normale,
-
O2: normale-comprimée.
4-mode de présentation (P):
-
P1: normale,
-
P2: comprimée.
5-essais (E):
-
E1: 1er bloc,
-
E2: 2ème bloc,
-
E3: 3ème bloc,
-
E4: 4ème bloc.
Les résultats sont traités par le programme d'analyse de variance VAR3 pour
lequel le plan d'expérience est de la forme S5<O2*L2*A4>*E4*P2 avec 3 groupes de
mesure indépendants (Age, vitesse de lecture, ordre de présentation) et 2
groupes de mesure appareillées (présentation, essais).
III-RESULTATS
A-Le facteur "âge chronologique"
1-Intelligibilité:
L'effet du facteur "âge chronologique" sur la performance au test
d'intelligibilité est significatif: le pourcentage de mots exacts par rapport
au nombre total de mots écrits par le sujet est d'autant plus élevé que le sujet
est âgé (F=4.767 (3-72) p<.01).
2-Compréhension
L'effet du facteur "âge chronologique" sur la performance au test de
compréhension est significatif: le nombre de phrases sémantiquement correctes
notées par les sujets augmente en fonction de l'âge (F=3.087 (3-72) p<.05).
Il n'existe pas de différence significative entre les performances des sujets
en fonction des niveaux scolaires pris deux à deux (T de Newman-Keuls).
3-Rétention
L'effet du facteur "âge chronologique" sur les performances au test de
rétention n'est pas significatif.
B-Le facteur "mode de présentation"
1-Intelligibilité
L'effet du facteur "mode de présentation" (en paroles normales ou en paroles
comprimées) sur la performance des sujets au test d'intelligibilité est
significatif: le pourcentage de mots exacts par rapport au nombre total de mots
écrits par les sujets est plus élevé pour la présentation en paroles normales
qu'en paroles comprimées (T=11.548 (2-37) p<.01). Les variances n'étant pas
homogènes un T de Student pour groupes appareillés a été calculé pour ce
facteur.
2-Compréhension
L'effet du facteur "mode de présentation" sur les performances des sujets au
test de compréhension est significatif: le nombre de phrases sémantiquement
correctes notées par les sujets est plus élevé pour la présentation en paroles
normales qu'en paroles comprimées (F=49.39 (1-72) p<.01).
3-Rétention
L'effet du facteur "mode de présentation" sur la performance des sujets au
test de rétention est significatif: le nombre de "blancs" complétés par des
mots exacts est plus élevé dans la condition de présentation en paroles
comprimées que dans la condition de présentation en paroles normales (F=19.157
(1-72) p<.01). Ce résultat est contradictoire avec l'hypothèse.
C-Le facteur "vitesse de lecture"
1-Intelligibilité
L'effet du facteur "vitesse de lecture" sur la performance des sujets au test
d'intelligibilité est significative: le pourcentage de mots exacts par rapport
au nombre total de mots est plus élevé chez les lecteurs rapides que chez les
lecteurs lents (F=4.683 (1-72 p<.05).
2-Compréhension
L'effet du facteur "vitesse de lecture" sur la performance des sujets au test
de compréhension est significatif: le nombre de phrases sémantiquement
correctes notées par les lecteurs rapides est plus élevé que celui noté par les
lecteurs lents (F=6.068 (1-72) p<.05).
3-Rétention
L'effet du facteur "vitesse de lecture" sur les performances des sujets au
test de rétention est significatif: le nombre de "blancs" complétés par des
mots exacts est plus élevé chez les lecteurs rapides que chez les lecteurs lents
(F=11.345 (1-72) p<.01).
D-Interaction entre le facteur âge et le mode de présentation
1-Intelligibilité
L'interaction entre le facteur "âge chronologique" et le facteur "mode de
présentation" est significative: la performance des sujets au test
d'intelligibilité augmente en fonction de l'âge chronologique des sujets dans la
condition de présentation en paroles comprimées mais ne change pratiquement pas
dans la condition de présentation en paroles normales (F=4.581 (3-72) p<.01).
2-Compréhension et rétention
Les interactions entre l'âge et le mode de présentation ne sont pas
significatives pour les variables dépendantes compréhension et rétention.
E-Le facteur "essais"
L'effet du facteur "essais" sur l'intelligibilité des sujets est significatif
(F'=24,578 (3-192) p<.01), ainsi que sur la compréhension (F'=21.01 (3-192)
p<.01) et sur la rétention (F'=5.937 (3-192) p<.01).
L'effet de l'interaction entre le facteur "essais" et le facteur "mode de
présentation" sur l'intelligibilité est significatif: la différence entre les
scores d'intelligibilité en faveur de la parole normale est plus élevée pour les
deux premiers blocs d'essais (F'=27.634 (3-192) p<.01).
L'effet de l'interaction entre le facteur "essais" et le facteur "mode de
présentation" sur la compréhension est significatif: la différence entre les
scores de compréhension en faveur de la parole normale est plus élevée pour les
deux premiers blocs d'essais (F'=10.233 (3-192) p<.01).
L'effet de l'interaction entre les facteurs "essais" et "mode de
présentation" sur la rétention est significatif: pour la parole normale les
scores de rétention sont plus élevés pour le premier et le dernier bloc (effet
de primauté et de récence), pour la parole comprimée, les scores s'élèvent du
premier au troisième bloc (effet de pratique) (F'=2.72 (3-192) p<.05).
L'effet de l'ordre de présentation et toutes les autres interactions ne sont
pas significatifs.
F-Vitesse d'articulation
Il existe une différence significative entre la vitesse d'articulation des
lecteurs lents et celles des lecteur rapides: les lecteurs rapides ont une
vitesse d'articulation plus élevée que les lecteurs lents (T=5.447 (1-79)
p<.01).
G-Le facteur "âge lexical"
Dans une deuxième phase de traitement des données, pour étudier le facteur
"âge lexical" indépendamment du facteur âge chronologique" et du niveau
scolaire, les 80 sujets ont été classés en fonction de leur "âge lexical"
d'après le barème du test de "l'Alouette". Quatre niveaux d'âge lexical" ont été
ainsi déterminés distribués du plus faible au plus élevé: A1 à A4. Une analyse
de variance a été effectuée, prenant en compte les facteurs "âge lexical" et
"mode de présentation" suivant le plan: S20<A4>*P2 pour les trois variables
dépendantes: intelligibilité, compréhension et rétention.
1-Intelligibilité
TABLEAU DES MOYENNES ET ECARTS-TYPE
|
P1
|
P2
|
|
|
P1
|
P2
|
A1
|
98.43
|
94.30
|
|
A1
|
1.45
|
3.83
|
A2
|
98.64
|
95.54
|
|
A2
|
1.69
|
2.28
|
A3
|
99.27
|
97.26
|
|
A3
|
1.52
|
1.70
|
A4
|
99.51
|
96.93
|
|
A4
|
0.72
|
2.19
|
L'effet du facteur "âge lexical" est significatif: le pourcentage des mots
exacts par rapport au nombre total de mots écrits par les collégiens est
d'autant plus élevé que leur âge lexical est élevé (F=5.50 (3-76) p<.01).
L'effet du facteur "mode de présentation" est significatif: le pourcentage
des mots exacts par rapport au nombre total des mots notés par les collégiens
est plus élevé dans la condition de paroles normales que dans la condition de
paroles comprimées (F=135.98 (1-76) p<.01). Toutefois l'intelligibilité est
toujours supérieur à 90%.
L'interaction entre les deux facteurs âge lexical et mode de présentation est
significative: la différence entre les scores d'intelligibilité pour la
condition paroles normales et la condition paroles comprimées est d'autant plus
faible que l'âge lexical des collégiens est plus élevé (F=3.17 (3-76) p<.05).
2-Compréhension
TABLEAU DES MOYENNES ET DES ECARTS-TYPE
|
P1
|
P2
|
|
|
P1
|
P2
|
A1
|
4.65
|
4.37
|
|
A1
|
0.33
|
0.46
|
A2
|
4.81
|
4.57
|
|
A2
|
0.24
|
0.29
|
A3
|
4.91
|
4.52
|
|
A3
|
0.15
|
0.31
|
A4
|
4.90
|
4.67
|
|
A4
|
0.17
|
0.31
|
L'effet du facteur âge lexical est significatif: le nombre de phrases
sémantiquement correctes notées par les élèves est d'autant plus élevé que l'âge
lexical est élevé (F=4.77 (3-76) p<.01).
L'effet du facteur mode de présentation est significatif: le nombre de
phrases sémantiquement correctes notées par les élèves est plus élevé dans la
condition paroles normales que dans la condition paroles comprimées (F=50.13
(1-76 p<.01).
Il n'existe pas d'interaction entre le facteur âge lexical et le facteur mode
de présentation.
3-Rétention
TABLEAU DES MOYENNES ET DES ECARTS-TYPE
|
P1
|
P2
|
|
|
P1
|
P2
|
A1
|
6.22
|
7.35
|
|
A1
|
1.17
|
1.15
|
A2
|
6.05
|
6.87
|
|
A2
|
1.23
|
1.052
|
A3
|
7.24
|
7.33
|
|
A3
|
1.61
|
1.61
|
A4
|
7.56
|
8.28
|
|
A4
|
1.54
|
1.07
|
L'effet du facteur "âge lexical" est significatif: le nombre des "blancs"
correctement complétés par les collégiens est plus élevé pour les tranches d'âge
lexical plus élevées (F=5.99 (3-76) p<.01).
L'effet du facteur "mode de présentation" est significatif: le nombre de
"blancs" correctement complétés par les collégiens est plus élevé après écoute
des paroles comprimées qu'après écoute des paroles normales (F=24.08 (1-76)
p<.01).
L'interaction entre les facteurs "âge lexical" et "mode de présentation"
n'est pas significative.
H-Corrélations et analyse de régression hiérarchique
Des analyses complémentaires ont été effectuées dans le but d'évaluer
l'influence des différents facteurs sur la performance des sujets et leurs
inter-corrélations.
En particulier ont été calculées toutes les corrélations existant entre les
différentes épreuves et donc les différents facteurs (voir matrice triangulaire
de corrélation en annexe). Tous les résultats sont significatifs à(p<.05 et
p<.01 pour certains, voir annexe).
Pour évaluer le poids des différents facteurs sur la performance des sujets a
été effectué une analyse de régression hiérarchique. Cette analyse ( en annexe)
montre que la variable "rétention de la parole normale" et la variable
"intelligibilité de la parole comprimée" permettent d'expliquer une part
relativement élevée (25%) de la variance en ce qui concerne les résultats aux
épreuves de lecture (test de l'alouette) et donc de prédire la réussite en
lecture des élèves.
IV-DISCUSSION-CONCLUSION
A-Intelligibilité et compréhension
L'intelligibilité et la compréhension sont meilleures chez les élèves plus
âgés (âge chronologique et âge lexical). Le traitement de l'information parlée
fait appel aux connaissances lexicales du sujet et aux processus de la mémoire à
court terme et ce d'autant plus que le langage parlée est formé d'une suite
d'éléments sonores qui évoluent dans le temps. En effet, contrairement au
langage écrit qui évolue dans une dimension spatiale et pour lequel le lecteur
peut à tout instant vérifier les traces incertaines d'une mémoire défaillante,
le langage parlée évolue dans une dimension temporelle et l'auditeur sait qu'une
fois les paroles émises, il devra compter essentiellement sur ses capacités
mnésiques pour conserver l'information. Dans cette expérience l'intelligibilité
et la compréhension sont testées à court terme et sont directement associées à
la capacité de la mémoire à court terme des élèves. Or, il existe un effet de
l'âge sur l'empan mnésique (F=4.418 (3-76) p<.01): plus les élèves sont âgés
(chronologique) plus l'empan mnésique est élevé. L'augmentation de la capacité
de la mémoire à court terme (nombre des éléments stockés) expliquerait en partie
l'amélioration des performances aux tests d'intelligibilité et de compréhension
en fonction de l'âge.
L'âge lexical des sujets calculé en fonction de la vitesse et de la qualité
de la lecture, a également un effet significatif sur les variables dépendantes
"intelligibilité" (F=5.50 (3-76) p<.01) et "compréhension" (F=4.77 (3-76)
p<.01)dans les deux conditions de présentation.
La variable vitesse de lecture liée à l'âge lexical du sujet) a un effet
significatif sur l'intelligibilité (F=4.683 (1-72 p<.05) et sur la compréhension
(F=6.068 (1-72) p<.05).
En condition de paroles comprimées à 50%, de petits fragments de signal vocal
de 20 millisecondes tous les 40 millisecondes sont éliminés de façon aléatoire
par rapport à la distribution des phonèmes. Du fait du caractère aléatoire de
l'élimination des portions sonores, il est assez peu probable qu'un silence par
exemple, nécessaire à la reconnaissance d'une plosive soit éliminé en entier.
Par ailleurs, l'élimination régulière d'une aussi petite portion de signal
permet une bonne reconnaissance des voyelles, conserve la disposition des
pauses, l'intonation, la prosodie et la fréquence fondamentale. Aussi, bien que
l'intelligibilité soit plus faible en paroles comprimées qu'en paroles normales
(F=135.98 (1-76) p<.01), elle reste supérieure à 94% pour la parole comprimée
(>98% pour la parole normale). Mais les résultats les plus intéressants
concernant cette expérience sont ceux relatifs aux effets d'interaction: de la
variable "mode de présentation" avec les variables "âge" chronologique (F=4.581
(3-72) p<.01) d'une part et lexical (F=3.17 (3-76) p<.05) d'autre part. Les
lecteurs rapides qui traitent mieux l'information visuelle que les lecteurs
lents traiteraient également mieux l'information parlée comprimée (Pierce 1978,
Johnson et al. 1963, Newman 1982, Leroy 1982, Goldstein 1940, Orr et al. 1965,
Foulke 1969).
En raison du caractère séquentiel d'un message parlé, le traitement du signal
fait appel à la mémoire à court terme et selon Baddeley (1986), la capacité de
la mémoire à court terme ne dépend pas seulement du nombre des éléments qu'elle
peut contenir, mais aussi du temps de stockage et si l'on combine ces deux
paramètres du débit des paroles prononcées. Or la vitesse de lecture des sujets
est liée à leur vitesse d'articulation: les lecteurs rapides ont une vitesse
d'articulation plus élevée que les lecteurs lents (T=5.447 (1-79) p<.01). Tandis
que les phrases sont prononcées, le lecteur rapide se répète les mots entendus
plus vite que le lecteur lent Le lecteur rapide peut ainsi se répéter la phrase
un plus grand nombre de fois avant de l'écrire Quand le lecteur rapide commence
à noter la phrase entendue, le nombre de répétition des mots de la phrase a été
plus élevé pour lui que pour le lecteur lent: ce qui expliquerait le meilleur
résultat obtenu par les lecteurs rapides pour les performances au test
d'intelligibilité. L'auto-répétition de maintenance permet un stockage à long
terme de l'information: ce qui expliquerait les scores plus élevés des lecteurs
rapides aux tests de compréhension (ils peuvent mieux interpréter) et de
rétention.
Que l'on considère l'âge chronologique ou l'âge lexical, l'intelligibilité
pour les paroles normales varie peu pour les différents groupes d'âge alors que
l'intelligibilité pour les paroles comprimées augmente en fonction des âges
chronologique et lexical.: plus les sujets lisent vite, mieux ils sont capables
de percevoir la parole comprimée.
B-La rétention
Les sujets procèdent à une tâche de traitement de l'information pendant
l'intervalle de rétention de l'empan mnésique (Klapp et al. 1983).
La rétention est meilleure pour les élèves dont la vitesse de lecture est
plus élevée (F=11.345 (1-72) p<.01) et dont l'âge lexical est plus élevé (F=5.99
(3-76) p<.01).
Dans la mesure où les lecteurs rapides peuvent effectuer plus de répétition
et procéder à un meilleur stockage de l'information à court terme, ce résultat
semble tout à fait logique. En effet l'auto-répétition de maintenance permet un
stockage de l'information à long terme (Baddeley 1986)et en conséquence le taux
de répétition à long terme étant plus élevé chez le lecteur rapide que chez le
lecteur lent, la rétention est meilleure. Le traitement du message parlé ayant
été effectué de façon plus approfondie par les bons lecteurs, la trace mnésique
a été renforcée. Il est à noter que la rétention a pu être favorisée pour tous
les élèves par la nature des tests d'intelligibilité et de compréhension qui
consistaient à écrire sur une feuille ce qui venait d'être entendu. Ainsi une
perception visuelle des phrases écrites pouvait encore améliorer la trace
mnésique.
Mais un autre résultat intéressant et peut-être plus inattendu concerne
l'effet significatif du facteur "mode de présentation" sur la rétention: le
nombre de "blancs" complétés par des mots exacts est plus élevé dans la
condition de présentation en paroles comprimées que dans la condition de
présentation en paroles normales (F=19.157 (1-72) p<.01). Ce résultat est
d'autant plus surprenant que les scores d'intelligibilité et de compréhension en
paroles comprimées sont moins élevés qu'en paroles normales. L'analyse
qualitative des tests d'intelligibilité pour la parole comprimée a montré que
les erreurs des collégiens concernent surtout des mots courts (articles,
conjonction de coordination) et portent plus rarement sur le groupe nominal ou
le groupe verbal. Si bien que ces erreurs n'empêchent pas le maintien de
l'intelligibilité à un bon niveau (94%), de conserver une bonne compréhension
globale et une rétention correcte des indices et éléments pertinents et
essentiels pour pouvoir compléter le test. Par ailleurs, confrontés à un mode de
présentation surprenant (la parole comprimée), les collégiens ont optimisé leurs
capacités d'attention et d'éveil pour pouvoir détecter au mieux les paroles
énoncées qu'ils devaient ensuite écrire. Cette optimisation de l'attention et de
l'activation des capacités perceptives a contribué à améliorer l'encodage du
message entendu et par là-même à parfaire sa rétention. Cela, d'autant plus que
nous avons noté une grande curiosité et une très forte motivation chez tous les
élèves. Quelques questions posées à chaque groupe de sujets après la passation
ont confirmé cette observation. Or, la motivation peut avoir un effet bénéfique
sur le traitement de la parole comprimée (Beatty et al. 1980, Harvey 1981, Gade
et al. 1984).
Un dernier résultat est à considérer tout particulièrement: l'effet du
facteur "essais". L'écoute des cinq premières phrases (non recopiées) avait pour
objectif de familiariser les sujets avec le matériel de l'expérience. Puis les
phrases écoutées (et recopiées) sont réparties en groupes de 5 pour tester un
effet de pratique ou d'habituation éventuel. Toutefois les résultats mettent en
évidence un effet significatif de la variable "essais" sur l'intelligibilité
(F'=24,578 (3-192) p<.01), sur la compréhension (F'=21.01 (3-192) p<.01) et sur
la rétention (F'=5.937 (3-193) p<.01). Ces résultats sont expliqués par l'effet
significatif de l'interaction entre les facteurs "essais" et "mode de
présentation" sur l'intelligibilité (F'=27.634 (3-192) p<.01), sur la
compréhension (F'=10.233 (3-192) p<.01) et sur la rétention (F'=2.72 (3 192) p<.05).
Les scores d'intelligibilité et de compréhension s'élèvent du premier au
deuxième bloc d'essais et atteignent un niveau optimal. au troisième bloc pour
la présentation en paroles comprimées, alors qu'ils fluctuent peu pour la
présentations en paroles normales. Ce qui traduit un effet de pratique pour la
parole comprimée. Plusieurs auteurs ont montré que l'intelligibilité et la
compréhension de la parole comprimée s'améliorent avec l'apprentissage et
l'entraînement (Leroy 1982, Lambert et al. 1980, Stitch 1970, Gade et al. 1984,
). En ce qui concerne les scores de rétention les résultats mettent en évidence
un effet de primauté et de récence dans la condition de paroles normales et un
effet de pratique dans la condition de paroles comprimées.
C-Conclusion
Chez des collégiens de 11 à 15 ans, l'intelligibilité, la compréhension et la
rétention immédiate des paroles comprimées sont meilleures pour les lecteurs
rapides que pour les lecteurs lents. Le matériel utilisé pour cette expérience
est facile, Que deviendraient les scores avec un texte continu, abstrait et plus
difficile? Est-ce qu'une rétention à plus long terme (quelques heures à
quelques jours) ne serait pas plus faible après écoute des paroles comprimées
(King 1989)? Il semblerait que l'écoute, tout comme la lecture fasse appel à un
processus multi-dimensionel et que le traitement des informations écrites et
parlées dépendent de facteurs inhérents aux sujets (entraînement, motivation,
éveil, rapidité de discrimination et de perception...).
La PAROLE COMPRIMÉE ET L'ÉCOUTE RAPIDE
SECTION 3:
CONCLUSION GENERALE
I-RÉSUMÉ DU CHAPITRE
La parole comprimée permet d'entendre dans un temps donné une plus grande
quantité d'information que ne le permet la parole normale. L'augmentation du
débit d'un énoncé pourrait être un moyen d'accélérer l'accès à l'information
auditive. Les techniques de compression temporelle de paroles permettent de
faire varier le débit d'un discours enregistré sans distorsion excessive du
signal vocal.
Dans une revue, nous traçons l'évolution historique des techniques de
compression de paroles. Les problèmes méthodologiques et procéduraux liés à
l'étude de la parole comprimée sont exposés. Les facteurs susceptibles de
modifier l'intelligibilité des mots et la compréhension d'un discours comprimé
sont recensés. Des applications potentielles relatives à la parole comprimée et
à l'écoute rapide sont exposées.
Dans quelles limites la compression temporelle produit-elle un gain de temps
sans diminuer la compréhension et la performance de l'auditeur? Les données
montrent que l'intelligibilité et la compréhension des paroles comprimées
restent correctes jusqu'à ce que le taux de compression temporelle ne dépasse
pas 50% et jusqu'à ce que le débit de la parole ne dépasse pas 275 mots par
minute. Mais la plupart des études sur la compression temporelle concerne la
langue anglaise .
Les objectifs d'une première série de quatre expériences visaient à
évaluer les différences entre les quantités d'information acquises par
des étudiants après écoute d'enregistrement de récits en français
présentés avec différents débits de paroles. Les problèmes considérés
sont multiples:
-
est-ce que la compression temporelle d'un enregistrement permet
de gagner un temps d'écoute appréciable sans diminuer de façon
significative l'intelligibilité, la compréhension et la rétention du
discours?
-
quelles sont les différences entre les performances des
étudiants pour une condition de présentation continue et de
présentation segmentée des enregistrements?
-
pour un même taux de compression quelles sont les différences
entre les performances des sujets pour deux débits de paroles (270
m/mn et 300 m/mn)?
-
dans une condition de présentation continue, quelles sont les
différences entre les performances des étudiants après écoute des
paroles normales et des paroles comprimées?
Dans la premières expérience, 60 étudiants écoutent deux récits (abstrait et
concret) en condition de présentation segmentée . Pour 20 d'entre eux les
enregistrements sont présentés à un taux de paroles normales (135 m/mn), pour un
groupe de 20 à un taux de paroles accélérées (202 m/mn) et pour le troisième
groupe à un taux de paroles comprimées (270 m/mn). Les résultats montrent un
effet du taux des paroles et un effet de la nature des textes: pour
l'intelligibilité, les performances sont plus faibles pour la parole accélérée
que pour la parole normale, mais ne sont pas différentes entre la parole normale
et la parole comprimée. Pour la compréhension et la rétention immédiate, les
scores ne présentent pas de différence significative pour les trois taux de
paroles. Les étudiants ayant écouté les enregistrements en paroles comprimées
sont capables de comprendre la même quantité d'information que les étudiants qui
ont écouté les paroles normales, mais dans un temps plus court. Les performances
des sujets sont plus faibles pour le texte abstrait que pour le texte concret
dans les trois modes de présentation.
Dans une seconde expérience 40 étudiants sont divisés en 2 groupes de 20,
dont l'un écoute les enregistrements présentés de façon continue et l'autre
écoute les enregistrements présentés de façon segmentée . Les scores de
compréhension et de rétention sont plus faibles pour le mode de présentation
continue que pour le mode de présentation segmentée . La différence entre les
scores pour les deux modes de présentation est plus faible pour le récit concret
que pour le récit abstrait.
Dans une troisième expérience, deux groupes de 10 étudiants écoutent deux
récits enregistrés ayant subi une compression temporelle de 50%. Pour l'un le
débit des mots entendus est 270 m/mn, pour l'autre le débit est 300 m/mn. Les
scores d'intelligibilité et de compréhension sont significativement plus élevés
pour les enregistrements à 270 m/mn que pour ceux à 300 m/mn. Toutefois la
différence entre les scores des deux groupes pour les questionnaires à choix
multiples n'est pas significative.
Dans une quatrième expérience, deux groupes de 20 sujets écoutent les deux
mêmes récits enregistrés et distribués sous une même condition de présentation
continue, mais pour l'un des groupes le taux des paroles est normal (135 m/mn) ,
pour l'autre il est comprimé à 50% (270 m/mn). . Les étudiants qui écoutent les
récits enregistrés à un débit de 270 m/mn rappellent plus de propositions
exactes que les étudiants qui écoutent les récits enregistrés à 135 m/mn. Dans
les deux conditions de présentation, les scores pour le texte abstrait sont plus
faible que les scores pour le texte concret.
Selon les résultats expérimentaux, il semble que l'intelligibilité, la
compréhension et la rétention immédiate de deux récits courts et relativement
simples restent bonnes avec une compression temporelle de 50% et un débit de
mots de 270 m/mn. Il semblerait même que la compréhension et la rétention
immédiate soit meilleure dans la condition de compression temporelle à 50%.
Toutefois dans cette condition de grandes variabilités inter-individuelles sont
observées. Des facteurs inhérents aux sujets sont à étudier: âge, vitesse de
lecture, âge lexical, motivation...
Dans une cinquième expérience, 80 collégiens sont divisés en 4 groupes en
tenant compte de l'âge chronologique et la vitesse de lecture dans une première
phase, de l'âge lexical dans une seconde phase. Les scores d'intelligibilité, de
compréhension et de rétention immédiate de 20 phrases écoutées à taux normal et
de 20 phrases écoutées à taux comprimé sont comparés. Les données montrent que
chez des collégiens de 11 à 15 ans, l'intelligibilité, la compréhension et la
rétention immédiate des paroles comprimées sont meilleures pour les lecteurs
rapides que pour les lecteurs lents. Les scores d'intelligibilité et de
compréhension sont plus élevés quand l'âge lexical est plus élevé. Dans cette
expérience, il semblerait également que la rétention immédiate soit meilleure
après écoute des paroles comprimées qu'après écoute des paroles normales.
Dans ces expériences, intelligibilité, compréhension et rétention immédiate
font appel essentiellement aux capacités de la mémoire à court terme. La mémoire
à court terme dépendrait du taux des mots émis et tant que ce taux ne dépasse
pas 4,5 mots par seconde.
D'autres études utilisant différents taux de compression temporelle sont
nécessaires tant sur le plan théorique que sur le plan expérimental et pratique.
Sur un plan théorique pour mieux comprendre la perception du langage et les
processus cognitifs du traitement de la parole comprimée. Quel serait le débit
optimal des paroles pour la mémoire à court terme? quelles pourraient être les
incidences de la parole comprimée sur la mémoire à long terme?
Sur un plan pratique, à partir de ces expérience exploratoires (chapitre 4)
et des données sur la prise de notes (Chapitre 3), la construction de plusieurs
prototypes permettraient une étude sur le terrain afin d'optimiser les
caractéristiques de la parole comprimée dans le but d'une utilisation par des
collégiens, lycéens et étudiants aveugles et d'évaluer plus précisément
l'intérêt de cette technique et ses conditions d'utilisation, ses avantages et
ses inconvénients à court terme et à long terme.
II-UNE EXPERIENCE INDIVIDUELLE PROLONGEE
L'auteur a utilisé à ses propres fins la parole accélérée de 1982 à
1986 et utilise depuis 1986 la parole comprimée. Ces deux types de
paroles (accélérées et comprimées) ont été employés essentiellement dans
les conditions suivantes:
-
rechercher une portion de cours enregistré sur cassette,
-
apprendre un cours écouté et compris auparavant,
-
réviser en vue d'un examen,
-
écouter pour la première fois une revue enregistrée (lecture auditive ou
écoute active) et passer au débit normal pour les portions difficiles ou
accrochant l'intérêt de l'auditeur en vue d'une prise de notes, une
réflexion approfondie.
Différentes observations ont été notées après utilisation prolongée des
enregistrements comprimés à un taux de 50% la plupart du temps. Lorsque le
contenu d'un message enregistré est connu, a été compris ou déjà étudié par
ailleurs, dans le cas d'apprentissage, de ré-apprentissage ou de révisions d'un
cours enregistré, l'écoute en condition de compression temporelle, nous semble
être un mode de travail intéressant. En effet, non seulement l'augmentation du
débit des mots engendre un gain de temps appréciable (pour 45 minutes
d'enregistrement, 22 minutes d'écoute), mais l'observation la plus curieuse et
la plus inattendue (notée également dans les expériences précédentes) est
l'amélioration de la rétention du contenu dans sa globalité. Tout se passe comme
si l'écoute à vitesse rapide d'un thème connu avait un effet de rafraîchissement
des traces mnésiques existantes, des schèmes, et de la configuration déjà
stockée en mémoire. Cette ré-imprégnation semble plus profonde et tenace après
écoute en parole comprimée qu'après écoute du même contenu en paroles normales.
Dans l'état actuel des études, nous ne pouvons donner d'explication structurée à
cette observation inattendue. Toutefois, quelques suppositions peuvent être
émises.
Après avoir travaillé leurs notes, en vue d'un examen, certains étudiants
revoient rapidement et globalement tout le contenu du cours du début à la fin
comme s'ils voulaient se ré-imprégner de l'essentiel, de l'image globale. Ce
survol peut être très rapide sans pour autant perdre son objectif, c'est-à-dire
le rafraîchissement des traces mnésiques. Ce survol, qui n'a pas seulement un
but de répétition, pourrait contribuer à mieux mémoriser l'ordre des données et
la hiérarchie des idées importantes et a se construire une configuration, une
image condensée du contenu. Par analogie, il semble que l'écoute rapide puisse
remplir ces objectifs.
Un lecteur peut lire visuellement trois à quatre fois plus vite qu'il ne
parle: le cerveau pourrait donc traiter très rapidement le langage écrit.
Pourquoi ne pourrait-il pas accélérer la vitesse de traitement du
langage parlé tant que celui-ci reste intelligible?
Nous avons remarqué que l'entraînement favorise et améliore très sensiblement
l'intelligibilité de la parole comprimée. Le débit des mots obtenu après
compression temporelle et écoutés lors des révisions a souvent dépassé 350 m/mn.
Par ailleurs la compression temporelle autorise des répétitions plus nombreuses
de l'écoute d'un enregistrement. Il semblerait que pour une même durée d'écoute,
il soit plus rentable sur le plan mnésique, d'écouter 2fois un enregistrement à
300 m/mn qu'une seule fois un enregistrement à 150 m/mn.
Les processus cognitifs et les mécanismes physiologiques du système nerveux
(influx nerveux, passage des synapses..) s'accommoderaient peut-être bien d'un
rythme de distribution plus rapide du stimulus auditif et ce d'autant plus qu'il
s'agit de la répétition d'une information déjà acquise. Il pourrait peut être
exister un parallélisme entre leur propre rythme de fonctionnement et le rythme
de la distribution de l'information (qu'elle soit de nature auditive ou
visuelle).
Nous avons également utilisé la parole comprimée pour repérer plus rapidement
un passage dans un enregistrement, par exemple sélectionner un article dans
l'enregistrement d'une revue scientifique. Dans ce cas, même si le contenu n'est
pas connu, il est aisé de repérer le thème d'un passage écouté à grande vitesse
(jusqu'à 300 m/mn). Nous avons fait entendre à des néophytes un bon nombre
d'enregistrements comprimés différents et mous leur avons demandé de trouver le
thème du passage entendu. Après le premier moment de surprise passé et un peu
plus d'attention, tous les sujets consultés ont su exprimer le thème du passage
écouté: cuisine, pollution des forêts, vie des Incas...). Repérer une portion
de discours dans un enregistrement avec la compression temporelle procure un
gain de temps de recherche très appréciable.
Nous avons plus rarement utilisé la parole comprimée dans une condition de
première écoute d'un sujet inconnu, excepté pour les récits faciles ayant
uniquement un caractère informatif. Les enregistrements scientifiques ont
souvent été écoutés une première fois en paroles normales, sauf ceux lus très
lentement (100 à 120 m/mn). En effet, nous pensons que pour un thème difficile,
très abstrait et ou complexe, littéraire ou scientifique, nouveau ou contenant
des termes inhabituels, il n'est pas souhaitable d'utiliser la compression
temporelle pour une première écoute.
D'autres expérimentations seraient nécessaires avec des enregistrements plus
longs et des textes plus difficiles. Des expériences individuelles et prolongées
pendant plusieurs mois seraient indispensables pour évaluer avec précision
l'intérêt de la compression temporelle et ses conditions d'utilisation. C'est
pourquoi nous proposons un cahier des charges pour la construction d'un
magnétophone comportant d'une part le système d'enregistrement différé afin de
pouvoir sélectionner les notes à enregistrer et d'autre part le système de
compression temporelle afin de pouvoir écouter ces notes plus rapidement. Par
ailleurs, un système d'indexation permettrait en outre de poser des repères
entre les différentes sections d'un enregistrement.
SECTION 4: APPLICATION
PROJET D'ELABORATION D'UN MAGNETOPHONE SPECIFIQUE
a - La PRISE DE NOTES
I-ORIGINE DU PROJET
À l'origine de ce projet se situe notre recherche, concernant la possibilité
pour un aveugle accidentel ne connaissant pas le braille d'une prise de notes
aidée par l'enregistrement.
Entrée à l'Université en octobre 82, alors qu'elle venait de perdre
la vue depuis quelques semaines, l'auteur a enregistré tous les cours de
psychologie à Lille III et tous les cours de physiologie à Lille I
suivis entre 1982 et 1987 (chapitre 3). Elle a constaté:
-
selon le débit du cours et la redondance du texte, le temps
d'enregistrement d'un cours peut être réduit de moitié, ce qui
réduit d'autant le temps d'écoute ultérieur;
-
à l'aide d'un second enregistrement, en répétant les phrases
bout à bout plus rapidement, il est encore possible de réduire le
temps d'écoute de 50%;
-
une écoute de l'enregistrement condensé à vitesse rapide permet enfin
une "lecture auditive" des notes enregistrées aussi rapide qu'une lecture
visuelle.
Une expérience avec des handicapés moteurs s'étant avérée peu concluante, en
novembre 1986, l'auteur teste le principe du magnétophone à enregistrement
différé. Après avoir fait modifier la capacité de la mémoire-tampon, plusieurs
expériences avec des adolescents aveugles et amblyopes sont entreprises
(chapitre 3).
II-BILAN DES RECHERCHES
Les études effectuées sur la prise de notes aidée par
l'enregistrement, sur la compression temporelle de paroles, et l'écoute
rapide (chapitre 4) permettent d'énoncer les constatations suivantes:
-
il est possible de sélectionner rapidement une information avec
le magnétophone à enregistrement différé quand la mémoire-tampon est
réglée à 2 secondes, plus difficile quand elle est réglée à 5
secondes et au-delà;
-
de réduire et de condenser les notes sélectionnées, ce qui
réduit le temps d'écoute pendant la période d'apprentissage et de
révision des étudiants;
-
d'écouter cette version condensée à vitesse rapide; de ce fait la durée
d'écoute de l'étudiant aveugle pourrait être équivalente à la durée de
lecture de l'étudiant voyant.
-
l'écoute rapide peut se faire soit par accélération de la vitesse de
déroulement de la bande magnétique, soit par compression temporelle dont les
différentes techniques ont été exposées au début de ce chapitre.
-
les études théoriques et expérimentales ont montré que l'intelligibilité
et la compréhension d'un message diminuent très peu tant que le débit de
paroles ne dépasse pas 275 mots par minute et tant que le taux de
compression temporelle ne dépasse pas 50%.
En conséquence, ces différentes études théoriques et expérimentales,
permettent de définir les caractéristiques d'un prototype (magnétophone
essentiellement destiné à la prise de notes) susceptible d'être utilisé par des
aveugles ou des voyants.
-
il est souhaitable de pouvoir stocker une grande quantité d'information
sur une cassette pour économiser des manipulations et éviter de perdre du
temps et des informations lors du retournement de la cassette.
-
il est également souhaitable de pouvoir gérer l'information stockée et
de pouvoir accéder facilement à cette information par l'utilisation d'une
indexation sonore.
III-CAHIER DES CHARGES
1-La fonction de sélection de l'information:
Ce magnétophone comportera une fonction de sélection de l'information à
enregistrer grâce à l'insertion d'une mémoire numérique, d'un codeur et d'un
décodeur à modulation delta dans la chaîne d'enregistrement du magnétophone
(entre le microphone et la tête d'enregistrement). a l'aide d'une commande
marche-arrêt l'utilisateur peut alors transférer sur la bande magnétique les
informations contenues dans la mémoire-tampon. Ainsi, selon la capacité de la
mémoire-tampon que l'on pourra faire varier de 2 à 10 secondes, les quelques
mots ou les quelques phrases émis avant l'appui sur la commande marche-arrêt
sont enregistrés sur la bande magnétique.
Les études expérimentales ont montré que la capacité de la mémoire-tampon
doit pouvoir être réglée à 2 secondes et ne pas dépasser 3 secondes pour une
prise de notes en situation de cours. L'utilisateur pourra disposer (selon la
condition d'utilisation) de 2 à 10 secondes pour décider d'enregistrer ou non
l'information émise durant ce laps de temps.
2-La fonction de compression temporelle:
Une technique de compression temporelle du signal sonore avant
l'enregistrement a pour principe l'élimination d'une fraction du message sonore
d'une durée pouvant varier de 1 à 20 millisecondes à des intervalles réguliers
(pouvant également varier de 2 à 40 millisecondes).
Une compression temporelle de 50% peut être obtenue en supprimant 20
millisecondes du signal sonore toutes les 40 millisecondes ou 10 toutes les 20
etc...
Cette compression temporelle se situe entre le microphone et la tête
d'enregistrement.
3-Un système d'indexation:
Le magnétophone sera équipé d'un système d'indexation sonore pour permettre
l'accès direct et rapide à un paragraphe, à un point important, et faciliter
ainsi toute recherche dans le discours enregistré.
Le repère sonore est un bip que l'on entend lors du déroulement rapide de la
cassette et qui permet à l'utilisateur de stopper le défilement rapide à cet
endroit précis et d'écouter la portion d'enregistrement souhaitée.
Ce repère sonore est complétée selon le choix de l'utilisateur par un chiffre
sonore audible également lors du défilement rapide de la bande magnétique.
Il faut prévoir 4 pistes et 2 vitesses d'enregistrement afin de pouvoir
entrer le maximum de données sur une seule bande magnétique: ce qui permet un
gain de place et un gain de temps dans les manipulations (changement de
cassettes ) .
Le repère sonore peut être distribué sur toutes les pistes.
4-Autres additifs utiles aux non-voyants:
-
l'installation d'un signal sonore à l'approche de la fin de bande
permettra de prévenir l'utilisateur aveugle qui pourra agir en conséquence
et éviter de perdre les information données pendant le défilement de la
partie terminale de la bande magnétique (10 à 15 secondes avant l'arrêt
automatique du magnétophone) . Cette perte d'information existe de même au
début de la bande enregistreuse de la cassette. Le bip sonore permet
d'éviter ces deux causes de pertes d'informations.
-
un signal sonore renseignera sur l'état des piles ou des accus
-
des signes, lettres braille ou symboles en relief sur les
touches permettront des manipulations plus rapides;
-
un capot ajouré rendra possible un accès tactile à l'axe de rotation;
celui-ci présentera en outre un repère;
-
un compte-tours accessibles sera muni de symboles en relief;
-
une fonction de lecture répétée des 4 ou 8 dernières secondes permet une
réécoute immédiate du dernier passage entendu (Sony TCM-R1).
LA SYNTHÈSE VOCALE DANS LES NOUVELLES TECHNOLOGIES
Puisque notre étude concerne l'accès à l'information parlée et qu'il semble
urgent d'orienter les études dans les différents domaines de la promotion, de
l'intégration et de la vie autonome des déficients visuels en général et des
aveugles qui utilisent peu ou pas le braille en particulier (aveugles tardifs,
accidentels, diabétiques et tous ceux qui ont des problèmes de sensibilité
tactile...), nous nous limiterons dans ce chapitre à formuler des interrogations,
mais aussi des propositions concernant l'information et la formation des non
voyants et l'utilisation des techniques nouvelles via la sortie vocale.
Dans le premier chapitre, nous avons montré que la déficience visuelle
entrave et ralentit les mécanismes qui contribuent à l'acquisition des données
informatives et que l'aveugle est confronté à un problème majeur: la lenteur
dans l'accès à l'information. Outre la prise de notes aidée par l'enregistrement
et l'utilisation de la parole comprimée, d'autres outils peuvent actuellement
contribuer à améliorer grandement l'efficacité des déficients visuels: tous ceux
qui peuvent être associés à un micro-ordinateur et utilisés grâce à une
synthèse vocale. C'est pourquoi l'observation de Jean-Marie Pierrel
(1987) dans "Dialogue oral homme-machine" semble particulièrement
concerner le handicapés visuels. "Parmi les avantages de la parole, dans
un système de communication homme-machine, deux me paraissent
suffisamment importants pour motiver les recherches:
-
la parole est indispensable dans certaines situations pour
suppléer les autres canaux de communication, lorsque ceux-ci sont
soit saturés (pilote..), soit inopérants à cause de handicaps divers
(aides aux handicapés);
-
la parole peut être plus efficace que d'autres modes de
communication..."
Les technologies nouvelles en pleine évolution depuis 10 ans ont révolutionné
le traitement de l'information et produiront probablement des applications
encore insoupçonnées. Mais leurs apports effectifs et les espoirs engendrés
bousculent les conceptions classiques sur l'éducation des aveugles, reculent les
limites de la réadaptation et remettent en question des habitudes
d'apprentissage et les idées sur l'intégration.
Dans ce chapitre, notre souhait est:
-
de fournir quelques exemples des applications associées à la sortie
vocale,
-
de faire connaître la demande et les besoins des aveugles aux
spécialistes de l'informatique afin qu'ils puissent mieux adapter leurs
logiciels et qu'ils puissent, à travers les problèmes de l'aveugle trouver
des idées nouvelles à leurs propres recherches,
-
de présenter aux utilisateurs aveugles les réalisations et les espoirs,
mais aussi les limites de l'utilisation des nouvelles technologies.
I - UTILISATION DE La SORTIE VOCALE EN INFORMATIQUE PAR UN OPERATEUR AVEUGLE
A - La synthèse vocale
En france, les travaux sur la synthèse de la parole se sont particulièrement
développés au CNET (Centre National d'Etude des Télécommunications) à LANNION ,
à l'ICP (Institut de la Communication Parlée à Grenoble et au LIMSI (Laboratoire
d'Informatique et de Mécanique pour les Sciences de l'Ingénieur) à Orsay.
La synthèse vocale nécessite une carte et des logiciels d'analyse
grammaticale, de transcription orthographique et phonétique, de calcul
de rythme, de prosodie, un dictionnaire de diphones et un éditeur
vocale. Pour pouvoir poursuivre nos travaux, nous avons utilisé trois
cartes de synthèse de paroles différentes:
-
en 1985, la carte Ferma 5000 et le "WordStar parlant",
-
en 1987 la carte Télévox fabriquée à partir des recherches du CNET et
qui fonctionne avec le logiciel Edivox,
-
en 1988 la carte Synthé 3 qui fonctionne avec le logiciel Sonolect.
-
en 1987, une carte américaine Synphonix 200/PT fonctionnant avec le
logiciel Artic Vision.
Les trois premières cartes permettent de synthétiser toute phrase française
ainsi que les nombres. Certaines sont autonomes (Ferma 5000, Synthé 3) et
n'utilisent aucune ressource mémoire du micro-ordinateur, se comportant comme
une imprimante. a l'heure où nous rédigeons ces travaux la carte Télévox
mobilise une partie de la mémoire vive du micro-ordinateur (environ 120 KO). La
quatrième carte utilisée synthétise toute phrase et chiffre de la langue
anglaise.
Pour qu'un opérateur aveugle puisse se servir d'un micro-ordinateur, grâce à
une sortie vocale, il doit disposer d'un compatible PC, d'une carte de synthèse
vocale et d'un logiciel (éditeur vocal) associé à la carte. L'éditeur vocal
d'écran (Edivox ou Sonolect par exemple) réside en mémoire et peut être appelé à
tout moment selon les besoins de l'utilisateur. Les premiers utilisateurs
aveugles qui ont testé ces nouveaux outils si prometteurs ont contribué via les
problèmes rencontrés, à l'évolution des logiciels qui autorisent maintenant de
nombreuses applications.
L'éditeur vocal gère les déplacements d'un curseur vocal et produit ainsi une
sortie vocale des données affectées à l'écran: toutes les informations affichées
(excepté les données graphiques) peuvent être prononcées caractère par
caractère, mot par mot, ligne par ligne, phrase par phrase (lecture de
tout ou partie d'écran). L'opérateur aveugle peut avoir accès aux
informations de l'écran par l'intermédiaire de la synthèse de paroles en
exploitant les deux possibilités offertes par l'éditeur sonore:
-
Par une "voie interne", il entre dans l'éditeur vocal en quittant son
application (traitement de textes, tableur, gestionnaire de fichiers...) et
peut alors déplacer le curseur vocal faire lire ou épeler un mot, prononcer
une ligne, une phrase, tout ou partie de l'écran, connaître les coordonnées
d'un caractère, chercher un mot, une portion de phrase, chercher également
et faire lire les parties en vidéo inverse.
-
Par une "voie externe" il exploite les moyens donnés par les
macro-commandes qu'il peut construire. Ainsi, sans quitter l'application en
cours, par une seule commande, l'opérateur peut obtenir la plupart des
fonctions de l'éditeur, mais il peut aussi associer plusieurs fonctions et
faire l'économie de nombreuses manœuvres. Il peut ainsi faire lire un
caractère, un mot, une ligne, une phrase, inscrits à un endroit donné de
l'écran, connaître les coordonnées du curseur d'application, faire lire tout
ou partie d'une "fenêtre"....
L'opérateur peut définir et construire des "fenêtres", c'est-à-dire des
portions d'écran qu'il sélectionne selon la nécessité de l'application en cours.
B-Les besoins de l'opérateur aveugle
Une des caractéristiques principales de la population des déficients visuels
est sa grande hétérogénéité, mise en évidence dans le premier chapitre. Mais un
caractère commun à tous les aveugles est la lenteur dans l'accès à l'information
et dans l'acquisition des connaissances. Aussi, tous les moyens actuels
permettant de faciliter et de rendre plus rapide la prise d'information sont à
mettre en œuvre pour améliorer l'autonomie et l'intégration du non voyant.
L'initiation d'un jeune aveugle de naissance à la lecture et à l'écriture
braille est nécessaire pour lui permettre d'accéder à l'enseignement scolaire,
aux connaissances indispensables à son bon développement cognitif. Le jeune
élève aveugle saura d'autant mieux s'intégrer dans une classe de voyant qu'il
pratiquera avec plus d'aisance le braille. Toutefois pour les aveugles tardifs
qui ont perdu la vue progressivement ou brusquement (accidentellement), même
s'il sont "doués" ou s'ils font de gros efforts, la pratique du braille restera
un moyen d'accès à l'information peu rentable. Aussi, et plus encore pour les
aveugles tardifs, tous les moyens susceptibles de remplacer le plus efficacement
possible le "papier-crayon" ou la "tablette-poinçon" sont des outils
inestimables. Parmi eux, le micro-ordinateur, aide déjà fort appréciée de tous
les utilisateurs voyants nous semble être un outil essentiel à une meilleure
intégration scolaire, universitaire et professionnelle des aveugles.
Bien que les possibilités offertes par le matériel informatique pour
accroître l'indépendance et l'autonomie des aveugles soient considérables,
l'âge, l'histoire de la cécité, les connaissances des utilisateurs déficients
visuels potentiels sont si variables, que différents niveaux de formation
doivent être définis et différents types d'application proposés. a partir de
nombreux entretiens entrevues avec des non voyants, et à partir de notre propre
expérience, nous nous bornerons à évoquer la demande de l'étudiant aveugle. Ce
qui permettra de répertorier les besoins et de mieux comprendre une demande
relativement générale et pressante de tous les aveugles.
À l'université, les tâches à effectuer sont nombreuses et variées:
-
rédaction de comptes-rendus, d'exposés, d'articles, de mémoires, de
rapports,
-
classement et organisation des notes,
-
constitution de fiches bibliographiques ou thématiques,
-
traitement de données statistiques, calculs...
-
stockage de données,
-
accès aux banques de données, recherches bibliographiques, recherches
d'informations spécifiques...
-
gestion de dossiers...
Ce que recherche avant tout l'étudiantnon voyant, c'est pouvoir
stocker, organiser, classer et retrouver facilement et rapidement
l'information, pouvoir communiquer et échanger ses données avec les
professeurs et étudiants voyants. Il souhaite également utiliser les
mêmes outils de travail que les voyants afin de mieux échanger,
discuter, critiquer, ses idées, ses méthodes de travail... Que
l'étudiant aveugle utilise les mêmes outils, arrive au même but que
l'étudiant voyant avec des méthodes de travail et des moyens différents
n'est pas gênant , mais que les uns et les autres puissent échanger
facilement leur production et discuter des méthodes, techniques et
logiciels de travail pourraient contribuer à l'enrichissement des uns et
des autres. Ce qui améliore l'efficacité de l'aveugle ne pourrait-il pas
avoir des retombées sur la "rentabilité" du voyant et inversement.?
II-UTILISATION DU MATERIEL INFORMATIQUE PAR L'AVEUGLE
Tout matériel susceptible de pouvoir être exploité par l'aveugle et
permettant d'effectuer les mêmes tâches (dactylographie, traitement de textes,
traitement de données, tableur, gestion de données...) que les voyants et
utilisant les mêmes logiciels semble le mieux indiqué pour faciliter
l'intégration universitaire, puis professionnelle de l'opérateur déficient
visuel. Outre l'allégement du travail attendu, les outils informatiques peuvent
contribuer grandement à améliorer la vitesse d'exécution des nombreuses tâches à
effectuer. Mais ce qui est primordial c'est que ce matériel permette à l'aveugle
d'assurer des tâches jusque là inaccessibles pour lui, faute de moyens
techniques et non faute de moyens intellectuels. Aussi, tout équipement
susceptible d'être utilisé à la fois par des opérateurs aveugles et voyants est
à étudier de façon préférentielle parce qu'il facilitera une meilleure
communication entre eux, et parce qu'il sera moins coûteux que les équipements
spécifiques (standardisation, vente en plus grand nombre).
A-L'équipement informatique
1-Le clavier
Contrairement à de nombreuses croyances et à de nombreux a priori,
apprendre à se servir d'un clavier est relativement facile pour un non
voyant. Un grand nombre de jeunes déficients visuels ont suivi des cours
de dactylographie en institutions spécialisées. Le clavier d'un
micro-ordinateur compatible P C peut se diviser en trois grandes
parties:
-
les touches communes aux machines à écrire, pouvant être employées comme
un clavier AZERTY ou QWERTY?
-
les touches de fonctions distribuées en deux colonnes de cinq
touches à gauche du clavier AZERTY (pour les PC de type XT) et
distribuées en ligne avec parfois un espace plus important toutes
les quatre touches (3 groupes de 4) au-dessus du clavier AZERTY pour
les PC de type AT;
-
le pavé numérique comportant neuf touches disposées en carré de 3 sur 3,
ces touches ayant une double fonction suivant la position de la touche de
blocage numérique (chiffres ou gestion de déplacement du curseur
d'application).
Sur certains claviers, les touches "j", "f" du pavé AZERTY et "5" du pavé
numérique sont marquées d'un indice en relief. Ce repère tactile facilite
beaucoup la localisation de toutes les autres touches et permet de situer
rapidement la première position des dix doigts sur le clavier. D'autres touches
peuvent être mises en évidence à l'aide de caractères braille sur bandes
adhésives transparentes. Bien choisis, adaptés à l'utilisateur et au type de
clavier, ces repères en relief accélère la vitesse de frappe et après quelques
semaines d'utilisation, le clavier ne pose généralement aucun problème à
l'opérateur aveugle.
2-L'écran
Bien que la "sortie écran" ne soit pas utilisée par l'aveugle, il faut
toutefois qu'il sache que les données affichées à l'écran sont distribuées sur
25 lignes et 80 colonnes et que la localisation de chaque caractère affiché à
l'écran peut être défini par ses coordonnées: le numéro de la ligne et le
numéro de la colonne (01,01 situent le premier caractère à gauche de l'écran,
25,80 situent le dernier caractère à droite de l'écran). La représentation de
cette grille et de son contenu (son image mentale) améliore sensiblement les
stratégies d'exploitation du logiciel par l'opérateur privé de vision. Il
semblerait que les aveugles qui ont une bonne représentation de ce qui se passe
à l'écran apprennent plus aisément à se servir d'un logiciel. Dans ce but, ils
doivent exploiter toutes les possibilités de l'éditeur vocal pour étudier
l'écran dans un premier temps, puis confectionner les "fenêtres" et les
macro-commandes les mieux adaptées pour transmettre, via la sortie vocale,
toutes les informations affichées à l'écran. La construction des "fenêtres" et
l'élaboration des macro-commandes doivent utiliser au mieux toutes les commandes
potentielles de l'éditeur vocal en fonction du logiciel d'application auquel
elles s'adressent (traitement de texte, tableur...). On se trouve là, face à une
situation de résolution de problèmes dont les solutions les plus adaptées
répondront le mieux à l'objectif recherché: transmettre le plus rapidement
possible, le plus précisément possible et de façon sélective et séquentielle
(par voie orale) toutes les données informatives d'un écran qui elles, sont
disposées spatialement dans le but d'être rapidement accessibles par la voie
visuelle.
B-Utilisation des logiciels d'application par l'aveugle
Les données des logiciels graphiques, de ceux gérant de nombreux
symboles, ceux dont les commandes d'application s'appuient sur des
couleurs ou des effets différentiels de luminosité ne peuvent être
retransmises par la sortie vocale. Toutefois de nombreux logiciels
peuvent être utilisés par le non voyant. Citons à titre d'exemple:
-
les traitements de texte (Sprint, WordSar, WordPerfect, Writing
Assistant...),
-
les tableurs (Multiplan, )
-
les bases de données (Dbase 3, Filing Assistant...),
-
les émulateur de Minitel (Kortex, Kx-tel2),
-
les logiciels de programmation (Turbo Pascal, Basic...).
1-Le traitement de texte
La pratique d'un traitement de texte nécessite déjà un certain
"investissement intellectuel" chez le voyant. Pour l'opérateur aveugle,
l'apprentissage des fonctions de l'éditeur vocal s'ajoute encore à celui du
logiciel d'application (traitement de texte ou autre).
Un traitement de texte permet de saisir du texte, de le mettre en forme, de
le sauvegarder, de l'imprimer. Lors de la saisie, le texte peut être frappé "au
kilomètre" (sans taper un retour chariot à la fin de chaque ligne. Les fautes de
frappe peuvent être corrigées, des modifications peuvent être effectuées
jusqu'au dernier moment avant sa sortie à l'imprimante.
Une partie quelconque du texte peut être sélectionnée, "coupée et recollée" à
un autre endroit. Une règle de tabulation permet de fixer les marges à droite et
à gauche, de fixer l'interligne et l'alignement du texte. Les titres peuvent
être centrés...Les enrichissements typographiques des caractères sont variés:
italique, gras, souligné...Un traitement de texte peut permettre aussi
la génération de table des matières, la gestion des en têtes, des bas de
page, des index, des renvois en fin de texte... Une fois le texte saisi
et mis en forme, il doit être sauvegardé. Une sauvegarde automatique,
quand elle existe a le grand intérêt de limiter les risques de perte de
document dus aux coupures de courant. Les formations à l'utilisation des
traitements de textes sont souvent standardisées et très coûteuses.
Elles sont essentiellement centrées sur l'apprentissage des différentes
fonctions du logiciel et sont rarement orientées vers les stratégies
opératoires les plus efficaces en tenant compte des tâches à effectuer.
Par ailleurs, l'initiation au traitement de texte implique au moins la
connaissance d'un minimum de vocabulaire informatique. L'exploitation
d'un traitement de texte nécessite la mémorisation des nombreuses
"fonctions" du logiciel utilisé (50 à plus de 150 selon les logiciels).
D'un point de vue ergonomique, nous définissons chaque "fonction" par:
-
une commande (la ou les touches de clavier utilisées),
-
une procédure (la ou les conditions de mise en œuvre),
-
un résultat (la ou les modifications de l'état du système).
Certaines fonctions sont très utilisées, d'autres peu et d'autres
pratiquement jamais: cette probabilité d'emploi dépend des tâches à effectuer
et des stratégies mises en œuvre par l'opérateur. Les traitements de texte sont
présentés à l'écran sous forme de menus d'aide, menus déroulants, menus en
cascades, à multiples fenêtres... Ainsi les fonctions sont réalisées par des
procédures s'appuyant sur des choix affichés à l'écran. Si, pour le voyant cette
forme de présentation facilite la mémorisation des commandes et le guide dans
l'utilisation du logiciel (au moins au début), pour le non voyant, , elle peut
poser un problème. En effet, la synthèse vocale n'annonce pas la liste de ces
choix. Ainsi, si une personne voyante peut, dans un premier temps, faire
l'économie de mémorisation des informations contenues dans les menus, la
personne non voyante doit mémoriser dès le début de l'apprentissage, ces mêmes
informations (mémorisation des fonctions, commandes, procédures et
représentations des résultats précis obtenus). Ce problème peut être résolu
lorsque toutes les fonctions de l'éditeur vocal sont parfaitement connues.
Nous exposons le principe que nous avons expérimenté. En premier lieu, il
convient d'entrer dans l'éditeur vocal et d'explorer toutes les lignes de
l'écran afin de se construire une bonne représentation mentale de la
configuration de l'écran. En second lieu, trouver les coordonnées des "fenêtres"
à faire lire sélectivement et les construire. Enfin construire les
macro-commandes adaptées qui consistent à attribuer à une touche une suite de
commandes. Sorti de l'éditeur vocal, tandis qu'il a repris le cours de son
application, l'opérateur aveugle peut alors, par appui sur shift puis la touche
choisie (pour Edivox), CTRL puis la touche choisie (pour Sonolect), faire lire
sélectivement plusieurs "fenêtres", les mots en vidéo inverse qu'elles
contiennent...Cette préparation à une lecture aisée de l'écran peut demander
plusieurs jours à un aveugle isolé et quelques heures s'il peut se faire aider
par un voyant (même naïf) pour faire déplacer le curseur vocal et définir les
coordonnées des "fenêtres" à construire. L'objectif vise à utiliser au mieux les
possibilités du logiciel d'application, ici du traitement de texte, en combinant
ses fonctions avec les fonctions de l'éditeur vocal. Pour le non voyant, il
s'agit d'une double tâche: trouver les stratégies les plus économiques pour
utiliser les possibilités de correction, de déplacement, de copie, de recherche,
de coupe, d'ajout, de tri, ... du traitement de texte en consultant au bon
moment et au bon endroit de l'écran l'information à faire lire par la synthèse
vocale. C'est pourquoi il faut en premier lieu repérer où, quand, comment est
distribuée l'information affichée à l'écran. Nous avons noté à ce propos que les
voyants ont des difficultés à donner des indications précises sur la position
d'un caractère, d'un mot, d'une ligne ou d'une colonne de l'écran. Pour le
voyant la position d'un objet se définit par rapport à la position des autres
objets situés dans l'espace ou dans le plan et non par rapport à ses
coordonnées. Or pour se représenter une configuration spatiale, le non voyant a
besoin non seulement de connaître la nature des objets qui la composent, mais
aussi les coordonnées des objets les plus pertinents et leur position par
rapport aux autres objets.
L'aide vocale permet de se représenter ce qui se passe à l'écran et dans
l'application en cours mais le repérage demande parfois de nombreuses
manipulations. Par ailleurs la lenteur de la restitution des données
informatives par la synthèse vocale ralentit le rythme de travail de l'étudiant
aveugle et rend parfois pénible l'attente de l'information recherchée.
Le déficient visuel a besoin de connaître tout comme le voyant l'état de
certaines touches: Majuscules/minuscules, num lock..., les informations de la
"ligne d'état" souvent regroupées dans les premières lignes ou les dernières
lignes de l'écran donnant des indications sur l'unité de disque et le directory
en activité, le fichier ouvert, l'heure, les coordonnées du curseur
d'application... Toutes ces indications ne sont pas toujours utiles à connaître
au même moment. D'où l'intérêt de construire des macro-commandes pour faire lire
soit globalement, soit séparément les indications souhaitées pour économiser le
temps d'écoute. En effet un autre problème crucial associé à la synthèse vocale
est celui concernant la sélection des informations pertinentes inscrites à
l'écran. Pour poursuivre sa tâche, nul n'est besoin de faire régulièrement
l'inventaire de toutes les données de l'écran, seules certaines informations et
les changements importent. Pour l'opérateur voyant, un simple coup d'œil au bon
endroit suffit, pour l'opérateur aveugle, il lui faudra multiplier les commandes
et macro-commandes adéquates pour faire lire sélectivement l'information
pertinente.
Avec un bon traitement de texte, il est possible pour un non voyant
de se fabriquer des "outils de bureau" qui lui rendent de grands
services, même s'ils semblent bien rudimentaires pour un voyant. Ainsi,
dès 1985, avec le "Word Star parlant", malgré ses imperfections, ses
manques (seul 70% des fonctions du Word Star étaient accessibles aux non
voyants à l'époque), nous avons pu confectionner:
-
un agenda, un semainier,
-
un annuaire,
-
un cahier de comptes,
-
des fichiers d'indexation,
-
des lettres-types et des en têtes de lettre,
-
les exposés, comptes rendus, mémoires, fiches bibliographiques et
thématiques...
Bien que rudimentaire, avec quelques astuces et l'utilisation optimale des
fonctions restantes du logiciel, cet outil informatique rendait possible
l'exécution de tâches impossibles à effectuer pour une aveugle tardive ne
connaissant pas le braille. Plus tard, , l'utilisation du logiciel Sprint avec
la carte de synthèse vocale Télévox (1988) et la carte Synthé3 (1989), grâce aux
nouvelles fonctions des logiciels et à une plus grande vitesse de fonctionnement
du matériel, a nettement facilité nos travaux et amélioré notre rendement.
2-Les autres logiciels d'application
Le logiciel de traitement de texte fut le premier logiciel utilisé par les
aveugles et reste celui qui est le plus fréquemment utilisé. Toutefois de plus
en plus, par intérêt et peut-être par souci de se confectionner leurs propres
outils de travail, et aussi en raison des nouvelles orientations pédagogiques
dans les institutions spécialisées, des aveugles utilisent les autres logiciels
et se dirigent vers la programmation.
Les tableurs, les logiciels de gestion de fichiers et de base de données
nécessitent une analyse plus approfondie des tâches à effectuer et des
possibilités du logiciel. Toutefois, persuadée que ces programmes peuvent
faciliter considérablement les tâches de l'étudiant aveugle, il nous paraît
urgent d'étudier leurs conditions d'utilisation.
Mais avant tout, il faut envisager plusieurs questions, y apporter
des éléments de réponses ou au moins les garder à l'esprit durant une
réflexion sur l'insertion professionnelle des non voyants:
-
Quels sont les logiciels pouvant rendre le plus de services aux
étudiants déficients visuels?
-
quels sont les logiciels dont les données inscrites à l'écran
peuvent le plus facilement être traduits oralement sans ambiguïté ni
perte d'information?
En ce qui concerne la nature du logiciel, le plus utile pour
l'aveugle est d'abord le traitement de texte, qui remplace le
papier-crayon, qui permet de transcrire les informations d'un fichier en
braille ou en caractères imprimés selon l'imprimante utilisée et qui
facilite ainsi la communication entre l'étudiant non voyant et les
professeurs et étudiants voyants. Les autres progiciels à employer
dépendront évidemment de la nature des tâches à effectuer. Tous ceux qui
aident à la gestion , à l'organisation et au stockage et à la
récupération des données nous semblent être d'un grand intérêt. Comment,
pour un étudiant aveugle retrouver parmi une bibliographie de plus de
500 références tous les auteurs qui, en 1986, ont écrit un article sur
la parole comprimée(compressed speech)? Cette tâche est tout à fait
impossible pour un étudiant aveugle sans moyen informatique. Construire
des tableaux, les remplir de noms ou de chiffres, effectuer des
diagrammes ou des graphes sont autant de travaux impossibles à réaliser
sans l'aide d'outils informatiques bien adaptés. Pour procéder au choix
d'un logiciel, de nombreux éléments doivent être pris en compte et comme
dans toute résolution de problèmes, il faut opérer par étapes:
-
définir avec le plus de précision possible le ou les objectifs à
atteindre,
-
Analyser les fonctions du logiciel afin de posséder une bonne
connaissance de leur organisation et de leur structure,
-
Vérifier si les "menus" et données affichées à l'écran peuvent être
transférés sans ambiguïté via la synthèse vocale,
-
Construire les "fenêtres" et macro-commandes permettant ce transfert,
-
Déterminer la ou les procédures qui permettront d'effectuer la tâche,
-
Tester le logiciel en situation de travail,
-
Rectifier alors les macro-commandes ou en construire de mieux adaptées
si besoin est.
La pratique de l'informatique est bien autre chose qu'une simple interaction
homme-machine. "Cette discipline s'apparente en réalité, pour une large part à
ce que la psychologie nomme résolution de problèmes appliquée au traitement de
l'information" (Dufoyer 1988).
Le choix du matériel dépendant des applications envisagées, pour l'étudiant
aveugle, aux contraintes imposées par la tâche s'ajoute une contrainte
primordiale: la compatibilité du logiciel avec la sortie vocale.
C-Conditions d'utilisation des outils informatiques par l'opérateur aveugle
Les nombreux échanges que nous avons eus avec des opérateurs aveugles nous
ont enseigné qu'il est souhaitable de souligner toute difficulté opératoire,
toute imperfection d'un système en vue d'améliorer le produit et de faire
évoluer les logiciels de façon optimale. Dès lors, à partir de notre propre
expérience, nous nous proposons de souligner les objectifs à viser en priorité
pour optimiser les conditions d'exploitation du matériel informatique par les
utilisateurs aveugles.
1-Favoriser l'accès aux informations de l'écran
L'accès aux données affectées à l'écran est plus lent et plus difficile par
la modalité auditive que par la modalité visuelle. Les messages distribués en
ligne nécessitent moins de manipulations et sont plus facilement lus par la
synthèse vocale que les messages distribués en colonnes.
2-Améliorer la sélection de l'information
Les commentaires et annonces du logiciel utilisé ainsi que la ligne d'état et
toute autre indication donnée en cours d'application seront plus faciles à
sélectionner si les messages sont toujours placés au même endroit de l'écran.
3-Réduire la charge mentale
Favoriser l'accès aux menus d'aide ou aux répertoires des commandes pour
pouvoir retrouver aisément une commande ou une procédure oubliée. Pour cela les
commandes potentielles devraient être rappelées sur une ligne et le menu d'aide
accessible par une touche devrait être distribué en ligne pour ne pas mobiliser
une fenêtre de lecture supplémentaire. Le non voyant devant mémoriser dès le
départ, les commandes et procédures des fonctions, la charge mentale serait
réduite s'il existait toujours un lien logique pour l'utilisateur entre les
touches du clavier utilisées pour les commandes et les fonctions qu'elles
activent: par exemple C pour copy, F pour fichier, M pour mise en forme....
Si une application nécessite une procédure longue et coûteuse en
manipulations, le "chemin" emprunté pourrait être rappelé dans une ligne située
toujours au même endroit.
4-Réduire le nombre des manipulations
L'aide vocale permet de se représenter ce qui se passe à l'écran et dans le
système, mais le repérage nécessite parfois de nombreuses manipulations.
Le logiciel qui donne la possibilité d'effectuer des macro-commandes afin de
regrouper plusieurs manipulations sous une même commande, produit une économie
de temps appréciable pour l'opérateur aveugle qui peut parfaitement mémoriser
quelques macro-commandes pour les fonctions les plus utilisées.
5-Economiser le temps de transfert des informations auditives
En cours d'application, les commentaires, annonces, indications doivent être
courts et précis pour diminuer au maximum le temps d'écoute. Au niveau de
l'éditeur vocal, la possibilité de faire varier le débit des mots prononcés
permet à l'opérateur aveugle d'économiser son temps d'écoute selon l'application
en cours.
6-Donner un écho sonore du fonctionnement du micro-ordinateur
Après l'activation d'une fonction, lors du déroulement d'une procédure, des
mécanismes internes se mettent en route et nécessitent l'arrêt de toute
manipulation du clavier pour aboutir à un bon déroulement des opérations. Pour
le voyant cette période d'attente est signalée, selon les manœuvres en cours,
par la diode clignotante du disque en activité ou par un indice visuel affecté à
l'écran. Pour l'aveugle, ces indices pourraient être des bip, notes de musiques
ou bruits particuliers signalant à l'opérateur que la machine est en train
d'effectuer une opération qu'il ne doit pas interrompre sous peine de stopper le
mécanisme du système.
Toutes les observations et propositions que nous avons transmises aux
différents constructeurs depuis 1985 ont visé à une amélioration de la
représentation du déroulement des opérations déclenchées et de la représentation
du résultat de l'activation des fonctions soit par une aide vocale plus précise,
soit par un écho sonore ("bip", bruit), soit par des manipulations moins
nombreuses. Pour un opérateur aveugle, il importe de connaître l'effet des
manipulations et des fonctions activées pour pouvoir poursuivre l'objectif
associé à l'application en cours. Une aide vocale centrée sur le résultat de
l'activation des fonctions faciliterait la construction et la mobilisation des
représentations qui sous-tendent l'activité de l'opérateur privé des
informations de l'écran.
III-LES SOURCES D'INFORMATIONS ACCESSIBLES GRACE À L SORTIE VOCALE
Tous les nouveaux modes de documentation et de communication susceptibles
d'être accessibles à l'étudiant aveugle via une sortie vocale sont d'un intérêt
capital pour faciliter l'acquisition de ses connaissances. Nous relatons à ce
propos les appréciations d'un intellectuel aveugle: "la plupart des nouveaux
moyens de communication ont beaucoup plus d'importance pour les aveugles que
pour les personnes voyantes. Pour ces dernières, en effet, il ne s'agit en
général que d'un procédé supplémentaire pour obtenir plus aisément ou plus
rapidement un résultat auquel elles pouvaient déjà parvenir normalement. En
revanche, pour les aveugles, c'est parfois une révolution..." (Jaquin 1989).
Parmi les nouveaux supports de l'information le Pinitel, les scanners associés
aux logiciels de reconnaissances de caractères, les CD ROM sont des outils
révolutionnaires pour les déficients visuels parce qu'ils leur permettront
l'accès à des informations auxquelles ils ne pouvaient prétendre jusque là sans
l'aide d'une tierce personne.
A-Accessibilité aux informations du Minitel
Nous avons testé l'accès aux informations du Minitel et profité de
ses services en utilisant la configuration et les adaptations suivantes:
-
un micro-ordinateur compatible PC de type AT,
-
une carte de communication (Kortex) et son logiciel associé
-
une carte de synthèse vocale et son logiciel d'édition vocale.
La carte Kortex permet les appels automatiques des serveurs et la sauvegarde
de l'information dans des fichiers du disque dur du micro-ordinateur. Ainsi les
données enregistrées peuvent être traitées par d'autres programmes tel qu'un
traitement de texte. L'étudiant aveugle peut alors, à son rythme, consulter à
l'aide de la synthèse vocale toutes les informations enregistrées.
Pour utiliser le logiciel d'émulation Minitel, il est relativement aisé de
construire les "fenêtres" et macro-commandes adaptés. Les problèmes ici sont
liés à la nature des caractères affichés et à la variété de la disposition de
l'information. Les caractères disposés sur l'écran sont des lettres majuscules
non accentuées. De ce fait, la lecture par la synthèse vocale est parfois peu
compréhensible: l'éditeur vocal n'étant pas "intelligent", il prononce
strictement ce qui est affiché. Par ailleurs selon les serveurs interrogés, la
disposition des données varie et il n'est pas possible de prévoir la
localisation des informations pertinentes. L'opérateur aveugle est forcé de
faire lire tout l'écran. Il en résulte une perte de temps évidente et une
interrogation parfois coûteuse !
B-Accessibilité aux informations scannées
Un logiciel de reconnaissance de caractères associé à un scanner
fournit un moyen automatique de rentrer dans la mémoire d'un
micro-ordinateur des textes à partir de documents déjà dactylographiés
ou imprimés sans avoir à les saisir manuellement au clavier. Associé à
une synthèse vocale, c'est un système permettant de faire de la lecture
assistée par ordinateur. En effet, grâce à ce dispositif, il est
possible de récupérer des textes imprimés déjà existants pour les
ré-exploiter. L'étudiant aveugle peut se constituer ainsi une base de
données ou saisir du texte pour le faire lire.Pour cela,la configuration
nécessaire est la suivante:
-
un scanner (caméra linéaire électronique),
-
un micro-ordinateur compatible de type AT de préférence,
-
un logiciel de saisie d'images et de reconnaissance de caractères,
-
une carte de synthèse vocale et son logiciel associé.
Le scanner numérise ligne par ligne la page d'un document et la transmet au
micro-ordinateur qui doit posséder une mémoire vive importante compte tenu de la
masse d'informations à traiter.
Lors de la saisie, les caractères non reconnus sont remplacés par une étoile.
Nous avons testé ce type de matériel avec le logiciel de reconnaissance de
caractères ReadStar. Malheureusement, les cartes de synthèse vocale n'ont pu
fonctionner simultanément: l'une d'elles occupant une trop grande place dans la
mémoire vive de l'ordinateur, l'autre associée à un logiciel nécessitant un
"dongle" (clé de protection) incompatible avec le "dongle" du ReadStar. a
l'heure où nous rédigeons notre texte, une personne aveugle ne peut utiliser
seule ce dispositif, mais ayant signalé nos observations aux différents
constructeurs concernés, un espoir est permis.
Nous avons constaté qu'un système de reconnaissance ne peut tout lire: la
qualité du document doit être bonne (frappe, photocopie, impression). Les
caractères de petite taille ou très proches les uns des autres sont difficiles à
reconnaître. Un texte contenant de nombreuses polices de caractères, des images
ou une mise en page complexe est plus long à "saisir".
Toutefois, une personne voyante a pu saisir des documents imprimés,
photocopiés, ou dactylographiés qui ont été lus dans un deuxième temps, par les
synthèses vocales françaises pour les textes en français et la synthèse
américaine pour les articles en langue anglaise. Lorsqu'un tel système de
reconnaissance pourra fonctionner sous les commandes d'un seul opérateur
aveugle, une étape importante sera franchie dans le domaine de l'accès à
l'information chez l'aveugle. Signalons que des "machines à lire", (Kurwail
Reading machine) provenant des Etats-Unis commencent à être commercialisées en
France. Constituées d'un logiciel de reconnaissance automatique des caractères
par contraste entre l'image de la lettre et le fond du papier, informations qui
sont ensuite traitées pour être lues par une synthèse vocale, ce matériel ultra
perfectionné est extrêmement coûteux. Une découverte spectaculaire n'a pas
toujours des retombées immédiates sur les déficients visuels et elle ne
modifiera que lentement leur vie quotidienne si elle ne peut leur être
directement accessible.
C-Les informations stockées sur C D ROM
Cette étude est le résultat d'une longue réflexion à partir des problèmes
rencontrés par les aveugles pour accéder à l'information et à partir de ce qui a
été perçu des potentialités du C D ROM.
1-Caractéristiques du CD ROM
C D ROM signifie Compact Disk Read Only Memory. Les informations stockées sur
C D ROM peuvent être lues, sélectionnées et copiées sur disque dur ou disquette,
mais ,ne peuvent être modifiées ou effacées sur leur support original par
l'utilisateur.
Le CD ROM est un support d'informations très dense, pouvant contenir 20 à 25
fois plus d'informations qu'un disque dur de 20 mégaoctets. C'est un disque de
12 centimètres de diamètre qui a en moyenne une capacité de 550 mégaoctets. Un
lecteur de CD ROM peut donc être intégré dans un micro-ordinateur.C'est un
support très maniable et peu fragile qui a une structure auto-protégée le
mettant à l'abri des poussières, micro-rayures et empreintes digitales. Le C D
ROM est un support relativement résistant ayant une stabilité physico-chimique
permettant une bonne conservation des données pendant quelques dizaines
d'années. Le C D ROM est relativement peu coûteux compte tenu du volume
d'informations enregistrées. Enfin ce produit professionnel s'appuie sur un
standard grand public diffusé mondialement. En 1985, plus de 60 sociétés
importantes avaient déjà acheté la licence du C D ROM".
En résumé, un C D ROM est un support d'informations de très grande capacité,
pouvant contenir plus de 200 000 pages de format A4, peu fragile, très maniable
et amovible (Grumelin et Prost 1987).
2-Matériel nécessaire à son utilisation
La lecture d'un C D ROM nécessite un micro-ordinateur, un lecteur de C D ROM
et des logiciels adaptés. Le micro-ordinateur peut être de type Macintoch ou de
type compatible PC, XT ou AT. Il doit posséder une mémoire vive de 640 KO et un
disque dur de 20 ou 40 MO et un lecteur de disquette de 5 pouces un quart ou 3
pouces et demi. Sur MAC le système d'exploitation utilisé est le dossier système
et sur les compatibles le système MS DOS à partir de la version 3.10. Certains C
D ROM nécessitent la manipulation d'une souris.
Il existe deux types de lecteur de C D ROM: le lecteur externe qui a une
alimentation propre et autonome et le lecteur intégré à l'ordinateur qui utilise
une alimentation du micro-ordinateur. Le C D est facilement introduit dans le
lecteur à l'aide d'une cartouche.
Les logiciels sont de deux types: le logiciel qui assure le dialogue entre
le micro-ordinateur et le lecteur de C D (qui dépend du type de
micro-ordinateur, de son système d'exploitation et du type de lecteur) et le
logiciel qui assure le dialogue entre l'usager et l'application sur C D ROM. Ce
dernier logiciel est un logiciel d'application écrit pour un type de
micro-ordinateur et dédié à un type d'application (exemple le Navigator de
Zyzomys). Le logiciel d'installation est fourni avec le lecteur et s'ajoute au
système d'exploitation du micro-ordinateur, tandis que le logiciel d'application
s'installe sur le disque dur du micro-ordinateur dans un directory et est appelé
par l'usager au moment de la consultation du C D. Il peut y avoir plusieurs
directory et plusieurs logiciels peuvent ainsi être installés sur le disque dur
pour différents C D.
3-Les types de CD ROM
Une assez grande variété de C D ROM commence à être commercialisée.
Etant donné le développement intensif des nouveaux produits la
classification ne peut être exhaustive. a titre indicatif citons:
-
les catalogues de bibliothèques,
-
les banques de données dans les domaines de l'éducation, des sciences
humaines, de la jurisprudence, des finances, de la médecine, de la
technique, du commerce ,
-
la documentation,
-
les encyclopédies,
-
les dictionnaires.
IV-UTILISATION PAR L'AVEUGLE DES INFORMATIONS STOCKEES SUR CD ROM
A-Les difficultés d'accès à l'information pour l'étudiant aveugle
Pour l'étudiant aveugle, deux modes d'accès à l'information sont possibles:
"la lecture tactile et la lecture auditive" c'est-à-dire la lecture braille et
l'écoute. Mais dans les bibliothèques universitaires françaises en général (en
dehors de quelques exceptions), il n'existe ni informations en braille, ni
informations sur cassettes. L'étudiant aveugle doit faire appel aux bonnes
volontés pour faire photocopier les articles et informations qui l'intéresse,
puis faire appel à des organismes, associations et aux bénévoles pour les
retranscrire en braille ou les lire sur cassettes. Il devra parfois patienter
plusieurs mois avant de récupérer l'information souhaitée et que dire quand les
articles et livres sont en anglais ou en allemand. Les lecteurs sont alors moins
nombreux.
Le problème est d'autant plus crucial que le niveau des études atteint est
élevé. En effet lors des premières années d'étude, les cours magistraux et les
travaux pratiques constituent la base du savoir. Une présence régulière et une
prise de notes efficaces, aidée d'un magnétophone le cas échéant, permettent
d'accéder à la majeure partie des informations. Par la suite, cette pratique est
insuffisante et le travail personnel beaucoup plus lourd impose à l'étudiant de
nombreuses investigations dans les différentes sources de données de la
bibliothèque universitaire. L'étudiant aveugle doit donc se faire aider pour
trouver la référence d'un livre, d'un article, d'une revue et la présenter
ensuite à l'employé de la bibliothèque, puis muni de la photocopie ou du livre,
il doit alors faire les démarches nécessaires pour faire transcrire les
informations en braille ou les faire enregistrer sur cassettes. Ce qui nécessite
parfois l'obtention de dérogations spéciales pour les prêts et parfois l'achat
d'un livre quand les lecteurs ou la retranscription nécessitent plus d'un mois
pour achever le travail.
Un autre problème pour l'étudiant aveugle est la place occupée par l'écriture
braille. Une page de caractères imprimés occupe selon sa densité trois à quatre
pages de caractères braille. Le volume d'un dictionnaire retranscrit en braille
est multiplié par dix. Aussi, l'étudiant ou le lycéen aveugle ne peuvent se
charger d'un dictionnaire et que dire d'une encyclopédie !
Il convient de noter également les difficultés que peut avoir un étudiant
aveugle à rechercher une phrase ou un mot dans un texte écrit en braille ou
enregistré.
Plus que quiconque, les aveugles aspirent à un support de l'information
efficace. Le C D ROM pourrait leur permettre un accès à l'information rapide,
facile et surtout direct, sans devoir attendre des semaines, voire des mois pour
récupérer les données.
B-Les promesses d'avenir du CD ROM
Les qualités du C D ROM: transportabilité, haute densité des informations et
accès direct par l'utilisateur permettent d'envisager des applications nouvelles
dans des domaines très variés. En particulier dans le domaine de l'éducation et
de l'apprentissage des jeunes aveugles, le C D ROM semble pouvoir combler
l'espoir de tous les non voyants: celui d'avoir un accès direct à une vaste
quantité d'informations. Or, l'association d'un C D ROM et d'un micro-ordinateur
avec sortie vocale ou sortie braille pourrait fournir à l'aveugle un "média
potentiellement beaucoup plus interactif" que les autres supports actuels. Ces
possibilités d'interaction offertes par le C D ROM permettront un accès direct à
une telle quantité d'informations que les étudiants aveugles auront désormais
des moyens pratiquement analogues à ceux des voyants.
En premier lieu, le dictionnaire sur C D ROM permettra aux jeunes aveugles
d'obtenir rapidement et directement la définition d'un mot, un synonyme, une
conjugaison, une règle grammaticale. L'étudiant aveugle pourra également avoir
un accès direct aux encyclopédies, aux références et aux catalogues des
bibliothèques.
Ainsi ce nouveau support de l'information pourrait apporter aux déficients
visuels un gain de temps considérable, une autonomie toujours souhaitée et une
plus grande indépendance dans son travail. En permettant le stockage d'une
quantité imposante d'informations et la consultation de dictionnaires,
encyclopédies, banques de données, livres scolaires, le C D ROM peut prétendre à
une application assez fascinante: un des meilleurs moyens d'accéder directement
à l'information pour le voyant et surtout pour le non voyant.
C-Les adaptations
Mais pour que le C D ROM puisse être utilisé par les non voyants, il sera
nécessaire de prévoir des adaptations au niveau des logiciels et du matériel
informatique.
Le matériel informatique susceptible d'être adapté aux activités des
aveugles, est actuellement bien distribué par un grand nombre d'associations et
d'entreprises spécialisées. Depuis les années 85 en France, un certain nombre
d'aveugle utilisent ce type de matériel très prometteur. Trois formes
d'adaptations à la déficience visuelle sont à distinguer:
-
l'adaptation au niveau des entrées,
-
l'adaptation des logiciels,
-
l'adaptation au niveau des sorties.
1-L'adaptation des entrées:
L'apprentissage et la pratique de machines à écrire sur clavier AZERTY sont
proposés aux aveugles de naissance dans la plupart des écoles spécialisées. Ce
qui permet une communication et des échanges plus aisés avec les voyants. De
plus, pratiquement tous les aveugles scolarisés ont utilisé régulièrement et
couramment le clavier "braille" sur machine à écrire le braille. Certains sont
plus rapides et efficaces avec ce dernier type de clavier ne comportant que 6
touches et la barre d'espacement. Pour faciliter l'utilisation des
micro-ordinateurs par les aveugles, des constructeurs d'aides techniques pour
handicapés ont adapté le clavier des micro-ordinateurs soit directement, soit
par l'utilisation de logiciels permettant de transformer le clavier classique en
clavier braille par l'utilisation sélective de 6 touches. Pour les aveugles qui
utilisent couramment le clavier AZERTY ou QWERTY classique, des repères en
relief sont placées sur certaines touches dans le but d'accéder rapidement aux
touches stratégiques: J et F, touches de fonction, retour et commandes
spécifiques.
2-L'adaptation des sorties:
Pour remplacer l'écran visuel inaccessible aux aveugles, les adaptations
proposées au niveau des sorties sont de deux formes: soit une sortie vocale,
soit une sortie tactile. Les deux peuvent être utilisées ensembles ou
séparément. La sortie vocale fait appel à un synthétiseur de voix et nécessite
l'adjonction d'une carte et d'un logiciel spécifique. La sortie vocale est plus
ou moins fidèle par rapport aux inscriptions de l'écran et son efficacité dépend
beaucoup du logiciel adapté utilisé. En général, il est possible d'avoir un écho
"écran" ou un écho "clavier", c'est-à-dire de faire lire caractère par
caractère, mot par mot ou phrase par phrase tout ce qui est inscrit à l'écran ou
entré par le clavier. La position du curseur peut être connu à la demande ainsi
que les fonctions utilisées ou les commandes effectuées. Depuis quelques années,
les progrès effectués dans ce domaine sont considérables et les sorties vocales
proposées ont de bonnes qualités sonore et sont également très efficaces. La
sortie vocale est avantageuse pour les personnes qui ne connaissent pas le
braille ou qui sont trop lentes pour le lire. (aveugles tardifs, aveugles
accidentels, personnes plus âgées).
La sortie tactile fait appel à une plage tactile éphémère qui peut contenir
de 12 à 80 caractéres selon le matériel considéré. C'est une véritable fenêtre
tactile ouverte sur une portion de l'écran. Elle a pour avantage de donner une
représentation fidèle de ce qui est inscrit sur l'écran. La plage tactile est
utilisée avec plus d'efficacité par les bons lecteurs de braille.
Il est à noter que ces deux modes de sorties, vocal et tactile, ne permettent
pas actuellement une représentation des graphiques. Mais grâce à ces
adaptations, le non voyant peut utiliser l'informatique comme le voyant et
bénéficier des logiciels de traitement de texte, de gestionnaire de fichier, de
tableur, de base de données....
D-Etude de faisabilité
En 1987, nous avons pris contact avec les éditions Robert pour proposer de
mettre à la disposition des étudiants aveugles un dictionnaire sur disquettes
pouvant être consulté grâce à la sortie vocale d'un micro-ordinateur. Le
directeur général a émis l'idée d'utiliser le CD ROM comme support. Nous avons
alors suggérer les caractéristiques de présentation à adopter pour que ce
produit puisse être accessible à la fois à des étudiants aveugles et voyants
(majuscules accentuées, nombre de fenêtres limité, touches rapides...). En
décembre 1989, nous avons reçu le "Grand Robert Electronique". Nos premières
investigations ont montré que, couplé à une sortie vocale, il peut être
considéré comme étant le premier "dictionnaire parlant" accessible aux aveugles.
En mars 1989, nous avons testé quelques CD ROM et recensé les modifications
nécessaires à apporter aux logiciels ou à la disposition des messages pour que
les informations stockées puissent être directement accessibles à l'utilisateur
aveugle grâce à une sortie vocale.
La gamme de matériel C D proposé actuellement étant déjà assez variée, nous
avons sélectionné ce qui semble être le plus urgent pour l'étudiant aveugle: un
dictionnaire (Zyzomys), des données littéraires (CDLitt), des références de
bibliothèque (Myriade).
Une étude exploratoire avec des collégiens voyants fut entreprise afin
d'évaluer l'intérêt pédagogique du dictionnaire sur CD ROM d'une part et les
modifications à envisager pour que les collégiens aveugles puissent l'employer.
En outre une expérience effectuée par un sujet aveugle et un sujet voyant a
montré que l'utilisateur aveugle avec le clavier est plus rapide que
l'utilisateur voyant avec la souris (Voir annexe).
Pour les C D ROM Zyzomys et Cdlitt, toutes les commandes pouvant être entrées
par le clavier sont accessibles à l'aveugle. Toutefois, les commandes de
sélection qui nécessitent impérativement l'utilisation d'une "souris" ne
permettent pas aux déficients visuels de sélectionner les données.
En ce qui concerne le CD ROM "Myriades", la première version était assez
difficile à utiliser les nombreuses fenêtres et la disposition de certaines
données en colonnes entraînaient une grande perte de temps dans les
manipulations pour obtenir l'écho vocal de la zone sélectionnée. Une seconde
version rend ces manipulations moins nombreuses et de fait ce matériel est
désormais accessible à l'étudiant aveugle.
E-Les propositions
Pour que le C D ROM puisse être accessible à l'utilisateur aveugle,
deux types d'adaptation sont à envisager:
-
les adaptations du logiciel qui assure le dialogue entre l'utilisateur
et l'application sur C D ROM,
-
les adaptations concernant la lecture des informations du C D ROM.
1-Les adaptations des logiciels d'application:
Il est impératif pour le non voyant, que toutes les commandes soient
accessibles à partir des touches du clavier. Les voyants pourraient
éventuellement manipuler ces commandes à l'aide du clavier ou d'une souris.
Il serait souhaitable que les "fenêtres disponibles" soient peu nombreuses ou
disposées une par une toujours au même endroit. Une ligne de rappel des
commandes successives utilisées pourrait être visualisée et sonorisée.
Il est également nécessaire de pouvoir utiliser les flèches de direction et
les fonctions pour sélectionner un bloc de texte.
2-Les adaptations concernant la lecture du texte à l'écran:
Tous les lignes et mots en vidéo inversée sur l'écran doivent pouvoir être
accessibles par un écho sonore repérable. Toutes les abréviations, les symboles
et les icônes pourront être verbalisés, c'est-à-dire être facilement
compréhensibles quand ils sont reçus par "l'écho sonore". Les modifications du
style (italique, gras, souligné) seront également traduit par un écho sonore.
L'objectif de ces différentes adaptations est de traduire de façon sonore
toute modification affichée à l'écran. Grâce à ces aménagements, les
utilisateurs déficients visuels pourront manipuler le matériel d'informations
comme les utilisateurs voyants et pourront bénéficier des mêmes potentialités.
Pour que l'étudiant aveugle dont le système principal d'accès à l'information
est déficient, puisse bénéficier d'un support d'information aussi extraordinaire
et aussi précieux, il est urgent de définir ses besoins parce que "nos besoins
doivent être connus très tôt dans le processus de conception".
V-CONCLUSION
Le handicap quel qu'il soit peut à tout moment concerner n'importe qui
d'entre nous et le savoir ne peut conduire qu'à une amélioration de
l'intégration sociale.
Cette intégration sociale sera d'ailleurs facilitée par une bonne utilisation
des techniques nouvelles.
Les aveugles ne disposent d'aucune source d'information sur les techniques et
matériels modernes susceptibles de les aider. Ils ne connaissent ni les
possibilités techniques, ni les apports potentiels de ces nouveaux outils, ni
les moyens de se procurer un matériel qui leur serait très utile, mais dont
l'achat ne peut être envisagé parce que trop coûteux.
Le magnétophone, l'ordinateur, et les nombreuses adaptations et innovations
qui existent aujourd'hui pourront apporter aux aveugles une aide considérable.
Il est essentiel que ces outils soient faciles d'emploi, efficaces et qu'ils
permettent une économie de temps substantielle. Pour obtenir ce résultat, il
importera de faire des enquêtes auprès des aveugles et d'essayer de comprendre
comment ils peuvent se représenter l'information globale d'un schéma, d'un écran
d'ordinateur, à partir de données ponctuelles, séquentielles et successives. Les
morceaux de phrases ou les quelques mots énoncés par une sortie vocale ou
affichés par une plage tactile d'ordinateur par exemple devront nécessairement
être cumulés avant d'obtenir la globalité de l'information présentée à l'écran.
Aussi, les recherches dont le but sera d'étudier les possibilités de rendre les
déficients visuels plus rapides et plus efficaces aboutiront forcément à une
amélioration de la technologie pour tous. En ce qui concerne les matériaux déjà
existants, il serait souhaitable que les notices explicatives des fabricants
soient présentées en imprimé, en braille et enregistrées sur cassette pour
pouvoir être accessible à tous les cas de cécité.
Nous proposons quelques questions posées par des étudiants et des parents
d'élèves: quels sont les mini-calculateurs scientifiques parlant français ou
anglais?
Quelles sont toutes les adaptations techniques destinées aux ordinateurs
pouvant être utiles aux aveugles? Quelles sont les formations proposées pour
pouvoir utiliser rapidement et facilement ce matériel? Il serait primordial de
tester le matériel pour handicapé afin de déterminer quel "type" de matériel ,
pour quel "type" d'utilisateur, et à quel prix.
L'évolution de la technologie et des nouvelles techniques rend désormais
accessibles aux aveugles des tâches qu'ils ne pouvaient accomplir auparavant.
Des nouvelles possibilités d'orientation vont désormais s'offrir à eux. Ils
pourront choisir leur métier et ne seront plus forcés de se limiter à un domaine
bien trop restreint et qui n'était pas toujours en accord avec leurs aptitudes
réelles et leur goût.
Le besoin d'une éducation adaptée à ces nouveaux domaines d'orientation est
aujourd'hui pressant.
Pour permettre aux aveugles de s'adapter aux nouvelles techniques et à la
technologie de demain, une pédagogie nouvelle doit s'installer. Dans la
formation des aveugles, il ne s'agit pas simplement d'enseigner les technologies
nouvelles, mais d'assurer une formation afin que le jeune aveugle puisse être
capable de s'adapter aux innovations, développer son sens de la créativité et
ses capacités d'adaptation pour le rendre compétitif dans le monde du travail.
Pour cela, il importe de définir les besoins nécessaires à l'apprentissage et à
la formation . Puisque l'enfant aveugle est privé de l'information visuelle, il
s'agira de lui apprendre à se servir au mieux des informations auditives et
tactiles.
Dans les institutions et écoles spécialisées, des hommes et des femmes
remarquables cherchent inlassablement à faire évoluer et à adapter leur
enseignement et leurs méthodes pédagogiques. Aujourd'hui, les jeunes aveugles
sont plus nombreux dans les lycées et certains d'entre eux abordent
l'Université. L'apprentissage et l'utilisation de la lecture et de l'écriture
braille sont à la base de l'acquisition des connaissances chez les jeunes
aveugles et amblyopes profonds. Un grand mérite revient aux professeurs de
braille qui apprennent aux écoliers à améliorer leurs stratégies de palpation
pour accélérer leur vitesse de lecture. Mais pour être compétitifs et pour
pouvoir aborder une grande quantité d'information, les non voyants doivent aussi
améliorer leurs stratégies d'écoute.
Apprendre à écouter est essentiel pour l'aveugle. Ecouter le professeur,
écouter un enregistrement, c'est pouvoir accéder à un maximum d'informations par
unité de temps. L'utilisation du magnétophone peut être un outil précieux tant
pour la prise de notes que pour l'apprentissage des leçons. Il ne s'agit pas,
bien entendu, d'une écoute passive, au même titre que l'écoute des nouvelles à
la radio en prenant son petit déjeuner ou l'écoute du dernier bon livre
enregistré. L'écoute dans le but d'une "lecture auditive" est une écoute active
et intentionnelle. Elle nécessite une attention soutenue et une concentration
intense pour repérer les grandes idées d'un énoncé, sa structure et les données
essentielles afin de pouvoir les intégrer en faire une synthèse, s'en
representer correctement le contenu.
Pour que l'audition devienne efficace et puisse conduire à "une lecture
auditive", et même à un "apprentissage auditif", et remplacer ainsi la lecture
visuelle, l'audition doit être éduquée. Cette éducation doit tenir compte du
développement cognitif de l'aveugle et du rôle de la mémoire pour gérer des
événements séquentiels.
Aussi, l'entraînement s'adressera surtout à l'attention, l'écoute active, la
mémoire et visera à acquérir les meilleures stratégies d'adaptation en vue
d'utiliser le plus efficacement possible les nouvelles techniques qui pourront
être mises à leur disposition.
À l'université, par exemple, l'étudiant aveugle doit soit faire transcrire
ses cours en braille, soit les enregistrer sur cassette et la quantité de
matériel à transcrire ou à enregistrer est considérable. Aussi, il faut trouver
tous les moyens pour gagner du temps. En collaboration avec l'I N S E R M de
Lille, nous avons étudié deux moyens d'accéder rapidement à l'information:
l'utilisation d'un magnétophone à enregistrement différé pour la prise de notes
et l'utilisation de la parole comprimée pour pouvoir gagner du temps dans
l'écoute et l'apprentissage des cours.
C'est en lui donnant les moyens non seulement techniques, mais aussi les
stratégies et les cours adéquats que le lycéen aveugle pourra accéder le plus
aisément à de plus longues études.
Nous avons pu observer que les jeunes possèdent des capacités, mais ils ne
savent pas qu'ils les possèdent; ils savent toutefois bien évaluer la nature de
leurs difficultés. Comme il faut définir avec précision la nature des problèmes
pour trouver les solutions les plus acceptables, il est essentiel de donner en
priorité la parole aux déficients visuels.
En conclusion, nous pouvons assurer que l'intégration scolaire, sociale et
professionnelle des aveugles et amblyopes progressera dans la mesure où il sera
donné une moins grande part au côté négatif du handicap , où la valeur du
déficient visuel sera plus appréciée, et où ses capacités effectives et
potentielles seront plus et mieux exploitées. Lui donner l'information et les
moyens, savoir utiliser ses compétences et ses acquis, développer sa motivation,
son dynamisme, lui apprendre à apprendre pour s'adapter aux changements de
situation, c'est la demande parfois directe, trop souvent secrète de tous les
jeunes aveugles pour qu'il puissent vivre plus libres, se sentir plus utiles,
mieux communiquer et pour qu'ils puissent ouvrir les portes des emplois jusque
là infranchissables.
"Lorsque l'on considère un sujet nouveau, on a fréquemment tendance à tout
d'abord surestimer ce qui paraît déjà intéressant ou remarquable et ensuite par
une sorte de réaction naturelle, à sous estimer l'état réel de la situation
quand nous découvrons que nos idées ont dépassé celles qui étaient réellement
réalisables."
ϟ
Anita Richaume-Crinquette
présentation d'une Thèse de Doctorat soutenue le 8 juin 1990
|