Projet Babel forum Babel
Contact - Règles du forum - Index du projet - Babéliens
INSCRIPTION - Connexion - Profil - Messages personnels
Clavier - Dictionnaires

Dictionnaire Babel

recherche sur le forum
Fréquences relatives des phonèmes - Langues d'ici & d'ailleurs - Forum Babel
Fréquences relatives des phonèmes
Aller à la page 1, 2, 3  Suivante
Créer un nouveau sujet Répondre au sujet Forum Babel Index -> Langues d'ici & d'ailleurs
Voir le sujet précédent :: Voir le sujet suivant
Auteur Message
sab



Inscrit le: 07 Oct 2005
Messages: 466
Lieu: Polynésie / France

Messageécrit le Thursday 09 Feb 06, 10:33 Répondre en citant ce message   

Suite à une remarque faite sur le fil du kotava, je me suis livrée à une analyse de la fréquence réelle et la répartition des sons qu’on y rencontre.

J’aimerais recueillir des informations comparatives dans les différentes langues concernant la fréquence de répartition réelle des phonèmes, et peut être établir une classification des langues selon ce critère (langues vocaliques, etc…)

------------------------------------------------
Ci-dessous, une analyse pour le kotava.

Dans la mesure où en kotava l’écrit suit rigoureusement l’oral, à partir d’un morceau de la traduction d’Anna Karénine, sur un texte de 15.446 caractères (ponctuation comprise), j’arrive aux analyses statistiques suivantes :
15.446 car. = 3.097 mots --> 4,98 car./mot en moyenne
15.344 phonèmes = 3.097 mots --> 4,95 phonèmes/mot en moyenne

Voyelles : (total : 6.610 = 43,07 %)
A : 2.339 = 15,24 %
E [é] : 1.604 = 10,49 %
I : 1.314 = 8,56 %
O : 862 = 5,62 %
U [ou] : 485 = 3,16 %

Semi-voyelles : (total : 631 = 4,11 %)
H : 32 = 0,21 %
W : 113 = 0,74 %
Y : 486 = 3,17 %

Consonnes : (total : 8 .205 = 52,80 %)
R : 868 = 5,66 %
N : 862 = 5,62 %
K : 765 = 4,98 %
T : 744 = 4,85 %
L : 714 = 4,65 %
V : 611 = 3,98 %
S : 562 = 3,66 %
D : 446 = 2,91 %
M : 379 = 2,47 %
B : 293 = 1,91 %
F : 293 = 1,91 %
P : 235 = 1,53 %
G [g] : 213 = 1,39 %
Z [z] : 164 = 1,07 %
X [kh] : 93 = 0,61 %
C [ch] : 82 = 0,53 %
J [j] : 49 = 0,32 %

J’ai également isolé les groupes suivants (en sus de ci-dessus) :
DJ [dj] : 14 = 0,09 %
DZ [dz] : 0
TC [tch] : 82 = 0,53 %
TS [ts] : 3 = 0,02 %

Je ne sais pas si un taux de 43,07 % permet de dire que la langue est vocalique. Pourtant à l’oreille c’est le sentiment qu’on a. Par contre, ce que ces statistiques corroborent, c’est l’importance du phonème A (une voyelle sur 3, un phonème sur 6). Je suis juste surprise de la fréquence également très significative du E qui me semblait bien moins marquant.

Remarques : il y a une légère surpondération des lettres Y (récit au passé, le Y étant la base du suffixe verbal du passé) et du R (récit à la 3ème personne du singulier, R étant la désinence de cette personne)

Merci par avance à tous ceux qui pourront illustrer dans les langues qu’ils connaissent cette notion de fréquence des phonèmes, et peut être de classification des langues selon un nouvel angle.

Sab Question


Dernière édition par sab le Wednesday 15 Feb 06, 10:08; édité 2 fois
Voir le profil du Babélien Envoyer un message personnel
Pixel



Inscrit le: 14 Dec 2004
Messages: 961
Lieu: Au pays des grenouilles, avec vue sur la mare...

Messageécrit le Thursday 09 Feb 06, 10:38 Répondre en citant ce message   

C'est interessant comme analyse. Tu l'as fait avec un outil specifique ?
Voir le profil du Babélien Envoyer un message personnel
sab



Inscrit le: 07 Oct 2005
Messages: 466
Lieu: Polynésie / France

Messageécrit le Thursday 09 Feb 06, 10:44 Répondre en citant ce message   

Etant donné qu'en kotava l'écrit est identique à l'oral, c'est assez facile avec un traitement de texte standard.
Il suffit d'utiliser la fonction de remplacement (ctrl-H dans Woooord), de remplacer, mettons A par #, et là le programme dit qu'il a effectué n remplacements.
Et dans les propriétés du document, on a la statistique du nombre de mots et caractères. Il suffit ensuite de calculer les pourcentages.
Voir le profil du Babélien Envoyer un message personnel
Pixel



Inscrit le: 14 Dec 2004
Messages: 961
Lieu: Au pays des grenouilles, avec vue sur la mare...

Messageécrit le Thursday 09 Feb 06, 10:52 Répondre en citant ce message   

Ok, mais j'esperais justement que tu aies utilise un outil triste
Voir le profil du Babélien Envoyer un message personnel
sab



Inscrit le: 07 Oct 2005
Messages: 466
Lieu: Polynésie / France

Messageécrit le Saturday 11 Feb 06, 13:18 Répondre en citant ce message   

Ci-dessous, une analyse pour l’italien Italien

Sur un morceau de traduction en Italien d’Anna Karénine, sur un texte de 3053 caractères alphabétiques, j’arrive aux analyses statistiques suivantes :
3053 car. = 625 mots --> 4,88 car./mot en moyenne
2806 phonèmes autonomes.

Voyelles : (total : 1343 = 47,86 %)
A : 375 = 13,36 %
E [é] : 314 = 11,90 %
I : 295 = 10,51 %
O : 290 = 10,33 %
U [ou] : 69 = 2,46 %

Semi-voyelles : (total : 29 = 1,03 %)
GL [mouillure] : 26 = 0,93 %
J [mouillure] : 3 = 0,11 %
W : 0
Y : 0

Consonnes : (total : 1422 = 50,67 %)
N : 206 = 7,34 %
R : 180 = 6,41 %
T : 178 = 6,34 %
L : 141 = 5,02 % (dont LL : 29 et L simple : 112)
S [ss] : 110 = 3,92 %
C [k], CH, K : 109 = 3,88 %
D : 108 = 3,85 %
M : 88 = 3,13 %
P : 75 = 2,67 %
V : 71 = 2,53 %
B : 26 = 0,93 %
SC [sch] : 25 = 0,89 %
S [z] : 24 = 0,85 %
G [dj] : 21 = 0,75 %
F : 20 = 0,71 %
G [g dur], GH : 15 = 0,53 %
Z [ts] : 14 = 0,50 %
QU [qw] : 12 = 0,43 %
H [h isolé] : 8 = 0,28 %
GN [ñ] : 3 = 0,11 %
X : 0

-----------------------
L’Italien est réputé être une langue vocalique. Ici : 47,86 % de voyelles

J’aimerais bien que d’autres me livrent des éléments de comparaison ou d’appréciation comparative sur les langues qu’ils connaissent.
A mon avis on peut assez aisément réaliser un tel exercice sur des langues comme l’espagnol, l’allemand voire le russe ou nombre de langues slaves. Par contre, pour le français ou l’anglais, sauf à faire des comptages totalement manuels, ce doit être très compliqué.

Sab idée !
Voir le profil du Babélien Envoyer un message personnel
Jean-Charles



Inscrit le: 15 Mar 2005
Messages: 3124
Lieu: Helvétie

Messageécrit le Saturday 11 Feb 06, 16:01 Répondre en citant ce message   

L'analyse des fréquences de phonèmes permet le décodage de textes cryptés.
Voir le profil du Babélien Envoyer un message personnel
Pixel



Inscrit le: 14 Dec 2004
Messages: 961
Lieu: Au pays des grenouilles, avec vue sur la mare...

Messageécrit le Saturday 11 Feb 06, 16:46 Répondre en citant ce message   

Euuuuuh, pour les textes très mal cryptés très content

Pour le japonais, qui n'est peut-être pas réputé pour être vocalique, je pense que le nombre de voyelles serait supérieur au nombre de consonnes. Cela dit, je ne pense pas que ce soit très pertinent. Comment analyser la fréquence des syllabes e.g., et qu'est-ce que ça pourrait apporter ?
Voir le profil du Babélien Envoyer un message personnel
Psychedelik Barakî



Inscrit le: 06 Dec 2005
Messages: 458
Lieu: Djiblou, Wallifornie

Messageécrit le Saturday 11 Feb 06, 20:49 Répondre en citant ce message   

Pixel a écrit:
Pour le japonais, qui n'est peut-être pas réputé pour être vocalique, je pense que le nombre de voyelles serait supérieur au nombre de consonnes

Ça doit être plus ou moins le même nombre de consonnes que de voyelles, non ?
Voir le profil du Babélien Envoyer un message personnel
Pixel



Inscrit le: 14 Dec 2004
Messages: 961
Lieu: Au pays des grenouilles, avec vue sur la mare...

Messageécrit le Saturday 11 Feb 06, 20:57 Répondre en citant ce message   

Sachant que les voyelles peuvent être utilisées seules - et pas les consonnes (sauf le "n") -, et qu'elles servent à former les voyelles "longues", je pense (je suis sûr) qu'il y a plus de voyelles.

Exemples :
aoi : bleu (bleu/vert)
taiyô = taiyou : soleil
kaku : écrire
shinbun : journal
Voir le profil du Babélien Envoyer un message personnel
bcordelier



Inscrit le: 07 Oct 2005
Messages: 190
Lieu: France

Messageécrit le Saturday 11 Feb 06, 23:15 Répondre en citant ce message   

Oui, mais pour être exact, il faut "évacuer" les lettres muettes dans le contexte oral. En japonais il me semble que la plupart des "u" finals sont muets ou quasiment, ce qui doit faire baisser le taux de vocalisme réel.

Outre le taux de vocalisme global, la fréquence et la distribution des divers phonèmes a également une influence importante sur la perception auditive d'une langue. Apparemment l'italien répartit assez équitablement ses 4 voyelles principales. Cela doit contribuer au caractère mélodieux, abstraction faite des tonalités qui, même si elles n'apparaissent pas là, ont également une influence.
Voir le profil du Babélien Envoyer un message personnel
Pixel



Inscrit le: 14 Dec 2004
Messages: 961
Lieu: Au pays des grenouilles, avec vue sur la mare...

Messageécrit le Sunday 12 Feb 06, 0:06 Répondre en citant ce message   

bcordelier a écrit:
Oui, mais pour être exact, il faut "évacuer" les lettres muettes dans le contexte oral. En japonais il me semble que la plupart des "u" finals sont muets ou quasiment, ce qui doit faire baisser le taux de vocalisme réel.

Les "u" finals ! choqué

Sinon pour les "u" finaux, c'est vrai uniquement pour les verbes dans une certaine forme. Mais c'est sûr que ça peut changer un peu le taux de vocalisme réel, qui doit rester bien élevé.
Voir le profil du Babélien Envoyer un message personnel
bcordelier



Inscrit le: 07 Oct 2005
Messages: 190
Lieu: France

Messageécrit le Sunday 12 Feb 06, 0:11 Répondre en citant ce message   

En vertu du Larousse et du Dictionnaire de la Langue Française, "finals" est la bonne forme. Une des multiples exceptions de notre belle langue Clin d'œil

N'y a t-il que dans les verbes que le "u" final ne se prononce quasiment pas en japonais ? J'ai toujours à l'oreille les formes Shikok (pour l'Île de Shikoku) ou Fukuok (pour Fukuoku) ?
Voir le profil du Babélien Envoyer un message personnel
Jean-Charles



Inscrit le: 15 Mar 2005
Messages: 3124
Lieu: Helvétie

Messageécrit le Sunday 12 Feb 06, 0:25 Répondre en citant ce message   

Fukuoka ?
Voir le profil du Babélien Envoyer un message personnel
Pixel



Inscrit le: 14 Dec 2004
Messages: 961
Lieu: Au pays des grenouilles, avec vue sur la mare...

Messageécrit le Sunday 12 Feb 06, 0:58 Répondre en citant ce message   

Pour "finals", tu m'apprends quelque chose, merci sourire

Cela dit, dictionnaire de l'Académie française, 9ème édition :

Citation:
(1)I. FINAL, -ALE adj. (pl. Finals, -ales ; le masculin Finaux se rencontre aussi, notamment en économie et en linguistique).


Donc y a pas de problème en fait.

Pour le japonais, y a effectivement des fois des "u" muets... (en fait j'ai pas d'exemples), et y a aussi des "i" muets d'ailleurs... mais à l'intérieur des mots seulement je pense. (Jusqu'à ce que je trouve des contre-exemples moqueur)

Pour "Shikoku", j'ai jamais entendu "Shikok", mais bon, je savais même pas qu'en français "finals" ça existait, alors le japonais mort de rire

N.B. : Hop hop hop ! je viens de penser à "yakusoku", qui se prononcerait plutôt "yak'soku" en fait...
Voir le profil du Babélien Envoyer un message personnel
sab



Inscrit le: 07 Oct 2005
Messages: 466
Lieu: Polynésie / France

Messageécrit le Tuesday 14 Feb 06, 9:51 Répondre en citant ce message   

Ci-dessous, une analyse pour l’Espagnol Espagnol

Sur un morceau de traduction en Espagnol d’Anna Karénine, sur un texte de 17.494 caractères alphabétiques, j’arrive aux analyses statistiques suivantes :
17494 car. = 3622 mots --> 4,83 car./mot en moyenne
16318 phonèmes autonomes.

Voyelles : (total : 7741 = 47,44 %)
E [é] : 2242 = 13,74 %
A : 2197 = 13,46 %
O : 1508 = 10,33 %
I : 1278 (dont 114 pour "y" en tant que "i" strict) = 9,24 %
U [ou] : 516 = 3,16 %

Semi-voyelles : (total : 150 = 0,92 %)
Y [mouillure] : 85 = 0,52 %
LL [mouillure] : 64 = 0,39 %
W : 1 = 0,01 %

Consonnes : (total : 8427 = 51,64 %)
S [ss] : 1220 = 7,47 %
N : 1128 = 6,91 %
R : 997 = 6,11 %
D : 782 = 4,79 %
L : 767 = 4,70 %
T : 688 = 4,21 %
C [k], Qu, K : 660 = 4,04 %
B, V : 519 (B : 325, V : 194) = 3,18 %
M : 420 = 2,57 %
P : 397 = 2,43 %
C [z] : 164 = 1,00 %
H [h isolé] : 134 = 0,82 %
G [g dur] : 131 = 0,80 %
J, G [jota] : 119 = 0,73 %
F : 92 = 0,56 %
CH [tch] : 78 = 0,48 %
Z [z] : 54 = 0,33 %
Ñ [gn] : 52 = 0,32 %
RR : 25 = 0,15 %
X : 0

-----------------------
L’Espagnol est presque aussi vocalique que l’Italien. Ici : 47,44 % de voyelles, avec une plus grande importance pour le E. Par contre, assez peu de diphtongues.

J’aimerais bien que d’autres me livrent des éléments de comparaison ou d’appréciation comparative sur les langues qu’ils connaissent : Allemand, Russe, Suédois, etc.

Sab idée !
Voir le profil du Babélien Envoyer un message personnel
Montrer les messages depuis:   
Créer un nouveau sujet Répondre au sujet Forum Babel Index -> Langues d'ici & d'ailleurs Aller à la page 1, 2, 3  Suivante
Page 1 sur 3









phpBB (c) 2001-2008