Abdüssalâm
Inscrit le: 02 Jan 2007 Messages: 909 Lieu: Aiguillon
|
écrit le Thursday 15 Apr 10, 10:39 |
|
|
C'est un très bon outil.
A noter quand même qu'en arabe littéral il s'agit de translittération alors que pour le dialectal, c'est une transcription, donc les résultats ne sont pas toujours similaires.
Je ne peux pas donner d'exemples car ce n'est pas mon ordinateur (il n'accepte pas les caractères spéciaux) mais je le ferai ce week-end.
Les caractères qui ne servent pas parfois en dialectal peuvent être omis et ceux rajoutés comme le g font partie du clavier normal. |
|
Charles Animateur
Inscrit le: 14 Nov 2004 Messages: 2522 Lieu: Düſſeldorf
|
écrit le Thursday 15 Apr 10, 10:48 |
|
|
Ce que je souhaite avoir c'est un outil permettant de déchiffrer un texte en arabe sans connaissance de l'alphabet. On pourrait le perfectionner en ajoutant l'option transcription arabe littéral, arabe algérien, arabe libanais etc. |
|
Abdüssalâm
Inscrit le: 02 Jan 2007 Messages: 909 Lieu: Aiguillon
|
écrit le Saturday 17 Apr 10, 8:46 |
|
|
Un déchiffrage automatique présente, à mon avis, deux problèmes:
1°/ en dialectal, il n'a que peu de raisons d'être car il est constitué esssentiellement de parlers dont la rédaction se fait de plus en plus à l'aide des caractères latins, dont, à mon sens, il faut plutôt encourager l'unification (du système orthographique, surtout pas des dialectes) et la diffusion. Quand la rédaction se fait en caractères arabes, elle suit des règles diverses selon la culture de celui qui écrit, allant d'une fidélité plus ou moins prononcée à l'arabe littéral à quelque chose de totalement personnel et très difficilement lisible pour un arabisant accoutumé au littéral.
2°/ Dans le cas de l'arabe littéral, celui-ci présente quelques particuliarités phonologiques qu'il me semble difficile à prendre en compte dans un système automatique. J'en cite quelques unes mais il y en a d'autres.
a) les hamza instables initiaux: Pour rappel, le hamza est une "attaque" de la voyelle, un peu comme "assez! ici! dit sur un ton autoritaire. Ils sont dit instables parce qu'il n'apparaissent qu'en début de discours. EX:
- al-waladu jâlisun hunâka huwa waladî الولد جالس هناك هو ولدي le garçon assis là-bas est mon fils
mais si le hamza, écrit ici en gras, se trouve précédé par quelque chose, il disparait dans la prononciation:
a-ra'ayta-l-walada jâlisun hunâk ? أرأيت الولد جالس هناك؟ as-tu vu le garçon assis là-bas?
mais celui-ci demeure dans la graphie arabe. Ce hamza instabe concerne non seulement l'article, mais aussi des formes dérivées (7°, 8°, 9° et 10° formes) et l'impératif, autant dire qu'il est très fréquent. De plus il s'écrit à l'aide d'un alif ا qui, contrairement au "hamza stable" ne prend aucune marque et peut être confondu, par un système automatique, avec le â long.
b) l'écriture arabe ne prend pas en compte les voyelles brèves ou les marqueurs de dérivation casuelles, ni les consonnes doubles (qui sont phonétiquement et sémantiquement pertinentes). Il existe une possibilité de les écrire, mais les arabisants ne sont pas partisants d'un marquage systématique qui allourdit considérablement le texte et leur apparait comme inutile . Comment un système automatique prendra en compte la différence entre "katabtu", "katabta" "katabti", katabat" ( j'ai, tu as (masc.), tu as (fem.), elle a écrit)qui s'écrivent tous كتبت [ktbt], alors que seul le contexte permet au lecteur de discerner entre ses différentes solutions? Les lettres solaires qui tout en conservant graphiquement le lâm de l'article prononcent en fait double la lettre initiale du nom:
- الرجل ar-rajul (homme) mais orthographié al-rjl alors que: البنت al-bint (la fille) orthograhié al-bnt?
la pause qui fait disparaitre comme dans l'exemple cité plus haut, la voyelle finale (hunâka/hunâk) et qui, dans le cas du tâ' marbûṭa, donne deux sons différents: -at- en liaison et -ah à la pause?
Enfin, voici quelques exemples (liste non exhaustive) qui me font penser qu'un système automatique de translittération, s'il est applicable aux alphabets grecs ou cyrillique, voire même aux caractères chinois et très difficile techniquement parlant dans le cas de l'arabe littéral et ne peut résulter qu'à une souppe de lettres que seuls les arabisants confirmés pourront déchiffrer correctement, ce qui, vu comme ça, ne sert pas à grand-chose.
Je n'y avais jamais réflêchi, mais l'écriture de l'arabe, par sa complexité même est terriblement humain et quasi-inaccessible à la machine, ce qui n'est pas pour me déplaire ! |
|
Charles Animateur
Inscrit le: 14 Nov 2004 Messages: 2522 Lieu: Düſſeldorf
|
écrit le Wednesday 30 Apr 14, 8:38 |
|
|
Je viens de me rendre compte que j'ai omis un signe de ponctuation caractéristique de l'arabe, le ؟. Y en a-t-il d'autres ?
UPD - wikipedia m'ai aidé, j'ai ajouté quelques signes de ponctuation et les chiffres indo-arabes. |
|