Confiance



Pour vous permettre de mieux interpréter les résultats obtenus, nous avons développé un indicateur de fiabilité, que nous avons appelé « Confiance ».

Cette confiance est calculée de la façon suivante.

Les textes soumis sont découpés en morceaux de 15 000 signes. Le calcul de la confiance est basé sur l’homogénéité des résultats sur les morceaux constitués. Pour chaque problématique, chaque morceau est classé et la décision D est celle de la classe majoritaire.

La confiance est alors le rapport entre le nombre de morceaux pour lesquels la décision est D et le nombre total de morceaux.



Ajoutons que s’agissant de la datation des textes, la confiance est calculée un peu différemment. En effet nous avons construit un classifieur à partir d’intervalles d’une durée de 20 ans et chaque morceau est ainsi associé à une classe. La date du texte est alors calculée comme une moyenne des centres des classes trouvées.

La confiance, dans ce cas, traduit alors la dispersion des dates estimées pour les différents morceaux.

La confiance est alors le pourcentage de morceaux dont la classe s’éloigne de la moyenne de moins de deux écarts types.