Ce site est dédié à l'apprentissage des langues. Vous trouverez ici les cours du Foreign Service Institute (FSI), les cours du Defense Language Institute (DLI) ainsi que les cours du Corps de la Paix (Peace Corps). J'ai écrit quelques tutoriaux destinés à aider les apprenants à importer des listes de vocabulaire dans leur logiciel préféré, à numériser des documents pour en faire des documents modifiables, à enregistrer des listes de vocabulaire/phrases. J'ai reconstruit le défunt site web "Shtooka" afin que son contenu ne soit pas perdu. Je maintiens également ici une copie des collections shtooka.
Les parties FSI et Corps de la paix sont terminées, et la partie DLI bien avancée, ainsi que les autres parties. N'hésitez pas à me signaler les liens fautifs, merci.
Nouveau! 6 nouveaux cours de Cortina!
Vopyez ces nouveaux cours dans la section Cortina
Nouveau! Programmatic Italian Audio
Demi Puppet a trouvé les enregistrements manquants de Italian Programmatic
Un grand merci à lui!
Le "Foreign Service Institute (FSI)" est la principale institution du gouvernement fédéral Américain, chargée de l'entraînement des personnels des Affaires Etrangères. Elle prépare les diplomates Américains ainsi que d'autres professionels à développer les intérêts Américains à l'étranger ainsi qu'à Washington.
- extrait de Wikipedia
Les cours disponibles ici sont assez anciens. N'oubliez pas de confronter les données de ces cours avec des sources plus récentes. Une langue est évolutive et le vocabulaire peut avoir changé.
Le "Defense Language Institute (DLI)" est une institution de recherche et d'éducation qui dépend du Département de la Defense Américaine. Son but est d'apporter l'apprentissage des langues et de la culture aux employés du Département de la Défense, à d'autres agences ainsi qu'à de nombreux clients étrangers. Ses autres fonctions sont la recherche des techniques d'apprentissage des langues comme seconde langue et le développement personel.
- extrait de Wikipedia
Les cours disponibles ici sont assez anciens. N'oubliez pas de confronter les données de ces cours avec des sources plus récentes. Une langue est évolutive et le vocabulaire peut avoir changé.
Le Corps de la Paix est constitué de volontaires et chapeauté par le gouvernement des Etats Unis. Le but affiché du Corps de la Paix est d'apporter une aide technique, d'aider les populations en dehors des Etats Unis à comprendre la culture américaine ainsi que d'aider les Américains à comprendre les cultures étrangères.
- extrait de Wikipedia
Ces cours ont été principalement développés par des des volontaires. Ils sont disponibles pour une grande variété de languages. Certaines langues sont même très rares.
Le projet Shtooka a été lancé en 2006/2007. Le but de sa création était d'enregistrer et de tagguer des listes de vocabulaire en différentes langues.
Ces listes sont organisées en collections et disponibles en différents formats audio comme ogg, flac, mp3 speex.
Fes informations techniques à propos de l'enregistrements, des informations linguistiques sont associées à chaque fichier audio. Des informations sur les tags utilisés sont disponibles dans ces pages.
Le site original avait disparu depuis un bon moment. J'ai reconstruit le site à partir des Archives Internet. Le nouveau site du Shtooka maintenu par Nicolas Vion est accessible ici: Le nouveau site du Shtooka »
Les collections audio sont constituées d'enregistrements de mots/phrases, taggués avec des informations linguistiques ainsi que des informations sur le locuteur.
Elles sont disponibles en différents formats audio.
Les collections sont disponibles dans les langues suivantes: Arabe, Bielorusse, Tchèque, Chinois/Mandarin, Allemand, Anglais, Italien, Français, Hollandais, Polonais, Portugais, Russe, Espagnol, Suédois, Serbe, Ukrainien, Wolof, Wuu/Shangaï.
Vous pouvez télécharger les enregistrements fichier par fichier ou par collection entière.
Vous trouverez ici des programmes pour parcourir et gérer les collections Shtooka. Certains sont vieux (comme ceux que j'ai écrit en Python), et ont été écrit à l'origine du projet.
Le format de la base de données utilisé par les programmes "swac" a changé, et les programmes anciens ne fonctionneront pas avec le nouveau format.
De nouveaux programmes utilisant le nouveau format de la base de données ont été écrits par Nicolas Vion. Ils ne sont disponibles que sous forme "sources". J'essaierai de les compiler pour les différentes plateformes courantes dès que j'aurai un peu de temps .. oui, éternel problème ...
Cette section sera dédiée à divers domaines tels la numérisation de documents, le découppage de fichiers audio etc ...
J'ai numérisé de nombreux documents (FSI/DLI) que vous pourrez trouver dans la section "Travaux en cours". J'expliquerai ma méthode, indiquerai les logiciels utilisés et donnerai quelques explications sur le format de document retenu.
Un tutorial sur l'utilsation d'Audacity pour découper l'audio est en cours d'écriture.
La section "Travaux en cours" contient les documents que j'ai numérisés, principalement des cours de FSI/DLI.
Ces documents sont disponibles dans différents formats (docbook, epub, pdf, csv). J'utilise le format XML (docbook) afin de pouvoir extraire facilement les données du document, vocabulaire, phrases, et peut-être dans le futur traduire ces documents. Le format docbook permet aussi de produire les différents formats comme PDF, Epub et autres.
Cortina est une companie qui a développé des cours de langues.
Les cours de Français, Allemand, Grec, Italien, Portugais Brésilien, Espagnol, Russe et de Japonais produits par cette companie ont été mis à disposition sur ce site avec l'aimable permission du détenteur du copyright, Magdalen Livesey, Président de Cortina International, Inc.
Je vais garder dans cette section d'autres documents, fichiers, cours audio pour l'apprentissage des langues..