Classification des documents par apprentissage
Des informations générales:
Magister |
Le niveau |
Classification des documents par apprentissage |
Titre |
| Système d’Information et de Connaissances |
SPECIALITE |
Page de garde:
Sommaire:
Introduction
Chapitre I: Modèles de représentation des documents
La similarité textuelle
Déséquentialistation et Composition :
La Déséquentialistation :
La Composition
La représentation de corpus documentaires :
Les unités linguistiques:
Le prétraitement des documents:
Stemmatisation (radicalisation ou «<< stemming >>)
Lemmatisation
La << stop-list >>
La loi de Zipf.
La recherche du document le plus similaire :
Les modèles vectoriels de représentation de documents :
Le modèle vectoriel standard
La sélection des termes d’indexation:
Les schémas de pondération
Prise en compte des dépendances dans le modèle vectoriel :
Modèle Latent Semantic Indexing (LSI) :
Le Modèle DSIR [Besançon 2002] :
Modèle logique
Modèle probabiliste
Modèle de réseaux de neurones
Conclusion
Chapitre II : Les algorithmes de classification par apprentissage
L’apprentissage automatique
Introduction:
Généralités :
Formulation de la classification en théorie :
Algorithmes de classification
Naïve Bayes
Arbres de décision (AD)
Machines à Vecteurs Supports (SVM):
Qu’est-ce qu’un SVM?
Classificateur linéaire
Définition
Marge de l’hyperplan
La séparabilité
Marge
Marge fonctionnelle d’un exemple
Marge géométrique d’un exemple
Marge géométrique d’un taraining set
L’hyperplan canonique
Un problème d’optimisation
Le problème à résoudre par la SVM
Cas séparable
Marge souple
Les fonctions Noyaux (Kernels)
L’espace des caractéristiques
Conditions pour avoir un noyau
Exemples de kernels
Kernel polynomial
Le kernel RBF (Radial Basis Function)
Composition des kernels
Formulation de SVM
Cas linéairement séparable
Formulation Soft Margin
Conclusion
Chapitre III: Les algorithmes de décomposition
Introduction
Les méthodes de décomposition
Structure commune des algorithmes de résolution
Algorithmes de décomposition
L’algorithme SMO (Sequential Minimal Optimization)
L’algorithme de décomposition D’Osuna
L’algorithme SVMlight
Proposition et implémentation
La stratégie de l’algorithme
Conception algorithmique
Stockage des documents et calcul des kernels
Optimisation quadratique
Implémentation de l’algorithme
Résultat d’apprentissage et de test
Discussion
Conclusion et perspectives
Bibliographie
Télécharger:
Pour plus de sources et références universitaires (mémoires, thèses et articles ), consultez notre site principal.


