Aller au contenu
Dossier de financement — France 2030 / DAD

Impact — Reo Tahiti AI

Métriques de préservation numérique du Reo Tahiti. Une infrastructure linguistique IA construite pour les 68 000 locuteurs natifs et les générations futures.

Données du corpus

Mis à jour en temps réel depuis Supabase

📄

0

Documents corpus

🔤

0+

Mots préservés

🧩

0

Chunks vectorisés

📖

0+

Entrées dictionnaire

🗂️

0

Sources différentes

🔁

0

Traductions effectuées

Sources du corpus

2.1M+ mots indexés — répartition par source

Hiro'a Magazine733K mots
WebFenua Paroles470K mots
Archive.org (Davies, Rossiter, Jaussen)408K mots
Tahiti Heritage188K mots
Légendes bilingues164K mots
DGEE Manuels scolaires64K mots
Bible NWT57K mots
Wikipedia Reo53K mots
Autres12K mots

Chronologie du projet

De l'idée à l'infrastructure linguistique

Mars 2026

Lancement MVP

Premiers scrapers, indexation corpus, déploiement RAG hybride Cohere + DeepSeek V3.

Mars 2026

Corpus 2 millions de mots

Franchissement du seuil symbolique — le plus grand corpus numérique en Reo Tahiti jamais constitué.

Avril 2026Objectif

Dossier France 2030

Dépôt du dossier de financement. Objectif : structurer l'infrastructure NLP et ouvrir l'API publique.

2026 – 2027Objectif

App mobile, API publique & partenariat UPF

Application iOS/Android, accès développeurs, collaboration avec l'Université de la Polynésie française.

Pourquoi c'est important

Le Reo Tahiti n'est pas un problème technologique — c'est une urgence culturelle

🚨

"En danger" selon l'UNESCO

Le Reo Tahiti figure parmi les langues classifiées en danger par l'Atlas mondial des langues en péril. Sa disparition progressive est documentée depuis les années 1980.

👥

~68 000 locuteurs natifs

Sur 280 000 habitants de Polynésie française, moins d'un quart parlent encore le Reo comme première langue. La transmission intergénérationnelle s'érode chaque année.

🧠

Aucune infrastructure NLP préexistante

Avant ce projet, il n'existait aucun modèle, aucun corpus structuré, aucun outil NLP public pour le Reo Tahiti. Les locuteurs n'avaient aucun équivalent à ce que le français ou l'anglais ont en IA.

🏆

Première IA polynésienne de cette envergure

Reo Tahiti AI est la première plateforme avec un corpus RAG local de 2M+ mots, un moteur de traduction hybride et un dictionnaire intelligent — construite entièrement en Polynésie française.

Construit par

PACIFIK'AI — Papeete, Polynésie française

🌺Essayer la plateforme