La détection automatique de l’ironie dans les tweets algériens
Des informations générales:
Master |
Le niveau |
La détection automatique de l’ironie dans les tweets algériens |
Titre |
| Système d’Information et de Connaissances (S.I.C) |
SPECIALITE |
Page de garde:
Sommaire:
Introduction générale
1. Les concepts de base des réseaux sociaux
1.1. Introduction
1.2. Différents types des réseaux sociaux
1.2.1. Les réseaux sociaux à dominante visuelle
1.2.2. Les réseaux sociaux professionnels
1.2.3. Blogging et micro blogging
1.2.4. Facebook
1.3. Les données massives sur les réseaux sociaux
1.3.1. Relation entre réseaux sociaux et Big data
1.3.2. Les réseaux sociaux comme source d’information et de données potentielles
1.4. Fouille de données sur Big Social Data
1.4.1. Des algorithmes de Data Mining
1.4.2. Des outils indispensables à la fouille de données
1.4.3. Mesurer l’efficacité d’une stratégie Sociale Media
1.5. Langage figuratif
1.5.1. Présentation
1.6. Conclusion
2. Annotation et techniques d’analyse des données des réseaux sociaux
2.1. Introduction
2.2. Différence entre sentiment et opinion
2.2.1. Principe du sentiment
2.2.2. Principe d’opinion
2.3. Aperçu historique sur les Opinions
2.3.1. Opinions basées sur la rumeur
2.3.2. Opinions basées sur les sondages
2.3.3. Opinion mining
2.4. Collecte des données
2.4.1. Les caractéristiques majeures des données extraites des réseaux sociaux
2.4.2. Changement d’échelle des données
2.4.3. Vers une automatisation de la collecte du corpus
2.4.4. Les APIs comme moyen d’accès aux données des réseaux sociaux
2.4.5. Les différents APIs dédiés à l’extraction des données des réseaux sociaux
2.5. Les différentes méthodes d’analyses des données
2.5.1. Méthode lexicale
2.5.1.1. La méthode manuelle
2.5.1.2. Méthode basée dictionnaire
2.5.1.3. Méthode basée corpus
2.5.2. Classification automatique
2.5.2.1. Définition de l’apprentissage artificiel
2.5.2.2. L’apprentissage supervisé
2.5.2.3. Apprentissage non supervisé
2.5.2.4. Apprentissage semi-supervisé
2.5.3. Méthode d’hybridation
2.6. Conclusion
3. Préparation et annotation du corpus
3.1. Introduction
3.2. Les outils utilisés
3.2.1. Anaconda
3.2.2. Python
3.2.3. Twitter API
3.2.4. Bibliothèques
3.3. Les caractéristiques des données sur les tweets
3.4. La collecte des tweets
3.5. La catégorisation du corpus réalisé
3.6. Nettoyage des données
3.6.1. Détection automatique du langage des tweets
3.6.2. Tokenisation et élimination des mots vides
3.6.2.1. Tokenisation
3.6.2.2. Élimination des mots vides
3.6.3. Lemmatisation
3.6.3.1. Lemmatisation des textes anglais
3.6.3.2. Lemmatisation des tweets français
3.6.3.3. Lemmatisation des tweets arabes
3.6.3.4. Lemmatisation des tweets mixtes
3.6.4. L’analyse des mots
3.6.5. L’analyse des hashtags
3.6.6. Traitement des fautes d’orthographe et abréviations
3.7. Phase d’annotation du corpus
3.7.1. Les types de textes dans le corpus
3.7.2. Annotation manuelle des tweets
3.7.3. La nature des tweets algériens
3.8. Conclusion
4. Classification automatique des tweets
4.1. Introduction
4.2. La classification des tweets
4.2.1. Métriques utilisées
4.2.2. Courbes utilisées
4.2.2.1. AUC-ROC
4.2.3. Précision-Rappel
4.2.4. Apprentissage supervisé
4.2.4.1. Première expérimentation
4.2.4.2. Deuxième expérimentation
4.2.5. Apprentissage semi supervisé
4.2.5.1. Première expérimentation
4.2.5.2. Deuxième expérimentation
4.2.6. Apprentissage non supervisé
4.2.6.1. Première expérimentation
4.2.6.2. Deuxième expérimentation
4.3. Conclusion
Conclusion générale
Bibliographie
Télécharger:
Pour plus de sources et références universitaires (mémoires, thèses et articles ), consultez notre site principal.


