DISCOURSE_DRIFT [ EN DÉVELOPPEMENT ] FREN

Mesure de dérive lexicale diachronique

Pour un terme donné et un corpus daté, l'outil quantifie comment le vocabulaire qui entoure ce terme se déplace dans le temps.

  1. 01

    Termes distinctifs par période

    Log-odds pondéré à prior de Dirichlet informatif (Monroe, Colaresi & Quinn, 2008). z-score par terme et seuil de significativité.

  2. 02

    Ampleur de la dérive entre périodes

    Divergence de Jensen-Shannon, significativité évaluée par test de permutation.

  3. 03

    Provenance intégrale

    Chaque mesure remonte aux documents sources. Une période sous-échantillonnée est signalée, jamais comblée.

Corpus-agnostique et source-agnostique : débats parlementaires, textes réglementaires, presse, transcriptions, tout corpus daté.

Pas encore de démo publique, c'est voulu. Laisse ton email pour être prévenu de la mise à disposition.

Pas de spam. Un seul message, le jour où c'est utilisable.

Noté. Je t'écris le jour de la mise à disposition.