20/04
Yingzi :
Après avoir consulté les corrections du prof sur le TP-distant et les avoir combinées avec la version élaborée par Xiaohua, j'ai effectué les modifications suivantes sur mon TP-distant et complété les parties que je n'avais pas terminées auparavant :
Ajout des bibliothèques supplémentaires : pickle, tarfile, re, os.path, io, json, et les bibliothèques nltk.
Importation des structures de données personnalisées : Corpus, Article, Analyse.
Modification des fonctions de chargement de fichiers : load_file_xml, load_file_json, load_file_pickle.
Ajout du traitement des bigrams avec la fonction bigram utilisant le modèle Phrases.
Modification de la fonction de filtrage des termes extrêmes avec la fonction filter_extremes utilisant l'objet Dictionary.
Modification de la fonction de construction du modèle LDA avec la fonction train_lda_model utilisant LdaModel.
Modification de l'affichage de la cohérence des sujets avec la fonction topic_coherence.
Ajout de l'analyse des arguments de ligne de commande avec la bibliothèque argparse.
Appel des fonctions appropriées dans la fonction principale en fonction des arguments de ligne de commande.
Ajout d'instructions d'impression pour afficher des informations pendant l'exécution.
TP-distant est fini. Nous allons commencer à faire la mise en forme des sorties du modèle.