Voir le sujet précédent :: Voir le sujet suivant |
Auteur |
Message |
sab
Inscrit le: 07 Oct 2005 Messages: 466 Lieu: Polynésie / France
|
écrit le Thursday 09 Feb 06, 10:33 |
|
|
Suite à une remarque faite sur le fil du kotava, je me suis livrée à une analyse de la fréquence réelle et la répartition des sons qu’on y rencontre.
J’aimerais recueillir des informations comparatives dans les différentes langues concernant la fréquence de répartition réelle des phonèmes, et peut être établir une classification des langues selon ce critère (langues vocaliques, etc…)
------------------------------------------------
Ci-dessous, une analyse pour le kotava.
Dans la mesure où en kotava l’écrit suit rigoureusement l’oral, à partir d’un morceau de la traduction d’Anna Karénine, sur un texte de 15.446 caractères (ponctuation comprise), j’arrive aux analyses statistiques suivantes :
15.446 car. = 3.097 mots --> 4,98 car./mot en moyenne
15.344 phonèmes = 3.097 mots --> 4,95 phonèmes/mot en moyenne
Voyelles : (total : 6.610 = 43,07 %)
A : 2.339 = 15,24 %
E [é] : 1.604 = 10,49 %
I : 1.314 = 8,56 %
O : 862 = 5,62 %
U [ou] : 485 = 3,16 %
Semi-voyelles : (total : 631 = 4,11 %)
H : 32 = 0,21 %
W : 113 = 0,74 %
Y : 486 = 3,17 %
Consonnes : (total : 8 .205 = 52,80 %)
R : 868 = 5,66 %
N : 862 = 5,62 %
K : 765 = 4,98 %
T : 744 = 4,85 %
L : 714 = 4,65 %
V : 611 = 3,98 %
S : 562 = 3,66 %
D : 446 = 2,91 %
M : 379 = 2,47 %
B : 293 = 1,91 %
F : 293 = 1,91 %
P : 235 = 1,53 %
G [g] : 213 = 1,39 %
Z [z] : 164 = 1,07 %
X [kh] : 93 = 0,61 %
C [ch] : 82 = 0,53 %
J [j] : 49 = 0,32 %
J’ai également isolé les groupes suivants (en sus de ci-dessus) :
DJ [dj] : 14 = 0,09 %
DZ [dz] : 0
TC [tch] : 82 = 0,53 %
TS [ts] : 3 = 0,02 %
Je ne sais pas si un taux de 43,07 % permet de dire que la langue est vocalique. Pourtant à l’oreille c’est le sentiment qu’on a. Par contre, ce que ces statistiques corroborent, c’est l’importance du phonème A (une voyelle sur 3, un phonème sur 6). Je suis juste surprise de la fréquence également très significative du E qui me semblait bien moins marquant.
Remarques : il y a une légère surpondération des lettres Y (récit au passé, le Y étant la base du suffixe verbal du passé) et du R (récit à la 3ème personne du singulier, R étant la désinence de cette personne)
Merci par avance à tous ceux qui pourront illustrer dans les langues qu’ils connaissent cette notion de fréquence des phonèmes, et peut être de classification des langues selon un nouvel angle.
Sab
Dernière édition par sab le Wednesday 15 Feb 06, 10:08; édité 2 fois |
|
|
|
|
Pixel
Inscrit le: 14 Dec 2004 Messages: 961 Lieu: Au pays des grenouilles, avec vue sur la mare...
|
écrit le Thursday 09 Feb 06, 10:38 |
|
|
C'est interessant comme analyse. Tu l'as fait avec un outil specifique ? |
|
|
|
|
sab
Inscrit le: 07 Oct 2005 Messages: 466 Lieu: Polynésie / France
|
écrit le Thursday 09 Feb 06, 10:44 |
|
|
Etant donné qu'en kotava l'écrit est identique à l'oral, c'est assez facile avec un traitement de texte standard.
Il suffit d'utiliser la fonction de remplacement (ctrl-H dans Woooord), de remplacer, mettons A par #, et là le programme dit qu'il a effectué n remplacements.
Et dans les propriétés du document, on a la statistique du nombre de mots et caractères. Il suffit ensuite de calculer les pourcentages. |
|
|
|
|
Pixel
Inscrit le: 14 Dec 2004 Messages: 961 Lieu: Au pays des grenouilles, avec vue sur la mare...
|
écrit le Thursday 09 Feb 06, 10:52 |
|
|
Ok, mais j'esperais justement que tu aies utilise un outil |
|
|
|
|
sab
Inscrit le: 07 Oct 2005 Messages: 466 Lieu: Polynésie / France
|
écrit le Saturday 11 Feb 06, 13:18 |
|
|
Ci-dessous, une analyse pour l’italien
Sur un morceau de traduction en Italien d’Anna Karénine, sur un texte de 3053 caractères alphabétiques, j’arrive aux analyses statistiques suivantes :
3053 car. = 625 mots --> 4,88 car./mot en moyenne
2806 phonèmes autonomes.
Voyelles : (total : 1343 = 47,86 %)
A : 375 = 13,36 %
E [é] : 314 = 11,90 %
I : 295 = 10,51 %
O : 290 = 10,33 %
U [ou] : 69 = 2,46 %
Semi-voyelles : (total : 29 = 1,03 %)
GL [mouillure] : 26 = 0,93 %
J [mouillure] : 3 = 0,11 %
W : 0
Y : 0
Consonnes : (total : 1422 = 50,67 %)
N : 206 = 7,34 %
R : 180 = 6,41 %
T : 178 = 6,34 %
L : 141 = 5,02 % (dont LL : 29 et L simple : 112)
S [ss] : 110 = 3,92 %
C [k], CH, K : 109 = 3,88 %
D : 108 = 3,85 %
M : 88 = 3,13 %
P : 75 = 2,67 %
V : 71 = 2,53 %
B : 26 = 0,93 %
SC [sch] : 25 = 0,89 %
S [z] : 24 = 0,85 %
G [dj] : 21 = 0,75 %
F : 20 = 0,71 %
G [g dur], GH : 15 = 0,53 %
Z [ts] : 14 = 0,50 %
QU [qw] : 12 = 0,43 %
H [h isolé] : 8 = 0,28 %
GN [ñ] : 3 = 0,11 %
X : 0
-----------------------
L’Italien est réputé être une langue vocalique. Ici : 47,86 % de voyelles
J’aimerais bien que d’autres me livrent des éléments de comparaison ou d’appréciation comparative sur les langues qu’ils connaissent.
A mon avis on peut assez aisément réaliser un tel exercice sur des langues comme l’espagnol, l’allemand voire le russe ou nombre de langues slaves. Par contre, pour le français ou l’anglais, sauf à faire des comptages totalement manuels, ce doit être très compliqué.
Sab |
|
|
|
|
Jean-Charles
Inscrit le: 15 Mar 2005 Messages: 3130 Lieu: Helvétie
|
écrit le Saturday 11 Feb 06, 16:01 |
|
|
L'analyse des fréquences de phonèmes permet le décodage de textes cryptés. |
|
|
|
|
Pixel
Inscrit le: 14 Dec 2004 Messages: 961 Lieu: Au pays des grenouilles, avec vue sur la mare...
|
écrit le Saturday 11 Feb 06, 16:46 |
|
|
Euuuuuh, pour les textes très mal cryptés
Pour le japonais, qui n'est peut-être pas réputé pour être vocalique, je pense que le nombre de voyelles serait supérieur au nombre de consonnes. Cela dit, je ne pense pas que ce soit très pertinent. Comment analyser la fréquence des syllabes e.g., et qu'est-ce que ça pourrait apporter ? |
|
|
|
|
Psychedelik Barakî
Inscrit le: 06 Dec 2005 Messages: 458 Lieu: Djiblou, Wallifornie
|
écrit le Saturday 11 Feb 06, 20:49 |
|
|
Pixel a écrit: | Pour le japonais, qui n'est peut-être pas réputé pour être vocalique, je pense que le nombre de voyelles serait supérieur au nombre de consonnes |
Ça doit être plus ou moins le même nombre de consonnes que de voyelles, non ? |
|
|
|
|
Pixel
Inscrit le: 14 Dec 2004 Messages: 961 Lieu: Au pays des grenouilles, avec vue sur la mare...
|
écrit le Saturday 11 Feb 06, 20:57 |
|
|
Sachant que les voyelles peuvent être utilisées seules - et pas les consonnes (sauf le "n") -, et qu'elles servent à former les voyelles "longues", je pense (je suis sûr) qu'il y a plus de voyelles.
Exemples :
aoi : bleu (bleu/vert)
taiyô = taiyou : soleil
kaku : écrire
shinbun : journal |
|
|
|
|
bcordelier
Inscrit le: 07 Oct 2005 Messages: 190 Lieu: France
|
écrit le Saturday 11 Feb 06, 23:15 |
|
|
Oui, mais pour être exact, il faut "évacuer" les lettres muettes dans le contexte oral. En japonais il me semble que la plupart des "u" finals sont muets ou quasiment, ce qui doit faire baisser le taux de vocalisme réel.
Outre le taux de vocalisme global, la fréquence et la distribution des divers phonèmes a également une influence importante sur la perception auditive d'une langue. Apparemment l'italien répartit assez équitablement ses 4 voyelles principales. Cela doit contribuer au caractère mélodieux, abstraction faite des tonalités qui, même si elles n'apparaissent pas là, ont également une influence. |
|
|
|
|
Pixel
Inscrit le: 14 Dec 2004 Messages: 961 Lieu: Au pays des grenouilles, avec vue sur la mare...
|
écrit le Sunday 12 Feb 06, 0:06 |
|
|
bcordelier a écrit: | Oui, mais pour être exact, il faut "évacuer" les lettres muettes dans le contexte oral. En japonais il me semble que la plupart des "u" finals sont muets ou quasiment, ce qui doit faire baisser le taux de vocalisme réel. |
Les "u" finals !
Sinon pour les "u" finaux, c'est vrai uniquement pour les verbes dans une certaine forme. Mais c'est sûr que ça peut changer un peu le taux de vocalisme réel, qui doit rester bien élevé. |
|
|
|
|
bcordelier
Inscrit le: 07 Oct 2005 Messages: 190 Lieu: France
|
écrit le Sunday 12 Feb 06, 0:11 |
|
|
En vertu du Larousse et du Dictionnaire de la Langue Française, "finals" est la bonne forme. Une des multiples exceptions de notre belle langue
N'y a t-il que dans les verbes que le "u" final ne se prononce quasiment pas en japonais ? J'ai toujours à l'oreille les formes Shikok (pour l'Île de Shikoku) ou Fukuok (pour Fukuoku) ? |
|
|
|
|
Jean-Charles
Inscrit le: 15 Mar 2005 Messages: 3130 Lieu: Helvétie
|
écrit le Sunday 12 Feb 06, 0:25 |
|
|
Fukuoka ? |
|
|
|
|
Pixel
Inscrit le: 14 Dec 2004 Messages: 961 Lieu: Au pays des grenouilles, avec vue sur la mare...
|
écrit le Sunday 12 Feb 06, 0:58 |
|
|
Pour "finals", tu m'apprends quelque chose, merci
Cela dit, dictionnaire de l'Académie française, 9ème édition :
Citation: | (1)I. FINAL, -ALE adj. (pl. Finals, -ales ; le masculin Finaux se rencontre aussi, notamment en économie et en linguistique). |
Donc y a pas de problème en fait.
Pour le japonais, y a effectivement des fois des "u" muets... (en fait j'ai pas d'exemples), et y a aussi des "i" muets d'ailleurs... mais à l'intérieur des mots seulement je pense. (Jusqu'à ce que je trouve des contre-exemples )
Pour "Shikoku", j'ai jamais entendu "Shikok", mais bon, je savais même pas qu'en français "finals" ça existait, alors le japonais
N.B. : Hop hop hop ! je viens de penser à "yakusoku", qui se prononcerait plutôt "yak'soku" en fait... |
|
|
|
|
sab
Inscrit le: 07 Oct 2005 Messages: 466 Lieu: Polynésie / France
|
écrit le Tuesday 14 Feb 06, 9:51 |
|
|
Ci-dessous, une analyse pour l’Espagnol
Sur un morceau de traduction en Espagnol d’Anna Karénine, sur un texte de 17.494 caractères alphabétiques, j’arrive aux analyses statistiques suivantes :
17494 car. = 3622 mots --> 4,83 car./mot en moyenne
16318 phonèmes autonomes.
Voyelles : (total : 7741 = 47,44 %)
E [é] : 2242 = 13,74 %
A : 2197 = 13,46 %
O : 1508 = 10,33 %
I : 1278 (dont 114 pour "y" en tant que "i" strict) = 9,24 %
U [ou] : 516 = 3,16 %
Semi-voyelles : (total : 150 = 0,92 %)
Y [mouillure] : 85 = 0,52 %
LL [mouillure] : 64 = 0,39 %
W : 1 = 0,01 %
Consonnes : (total : 8427 = 51,64 %)
S [ss] : 1220 = 7,47 %
N : 1128 = 6,91 %
R : 997 = 6,11 %
D : 782 = 4,79 %
L : 767 = 4,70 %
T : 688 = 4,21 %
C [k], Qu, K : 660 = 4,04 %
B, V : 519 (B : 325, V : 194) = 3,18 %
M : 420 = 2,57 %
P : 397 = 2,43 %
C [z] : 164 = 1,00 %
H [h isolé] : 134 = 0,82 %
G [g dur] : 131 = 0,80 %
J, G [jota] : 119 = 0,73 %
F : 92 = 0,56 %
CH [tch] : 78 = 0,48 %
Z [z] : 54 = 0,33 %
Ñ [gn] : 52 = 0,32 %
RR : 25 = 0,15 %
X : 0
-----------------------
L’Espagnol est presque aussi vocalique que l’Italien. Ici : 47,44 % de voyelles, avec une plus grande importance pour le E. Par contre, assez peu de diphtongues.
J’aimerais bien que d’autres me livrent des éléments de comparaison ou d’appréciation comparative sur les langues qu’ils connaissent : Allemand, Russe, Suédois, etc.
Sab |
|
|
|
|
|