[Sequanux-ml] COMPTAGE DE MOTS
Émile CARRY
emile.carry at sequanux.org
Ven 17 Avr 11:52:57 CEST 2015
Le 17/04/2015 11:02, SDS a écrit :
> Bonjour, j'aurais besoin d'un logiciel qui fasse un comptage de type de mots,
> par exemple combien de fois le mot patriotisme apparaît dans un discours, etc.
tout dépend du format du fichier de départ.
Si c'est un fichier text, en ligne de commande ce sera par exemple :
grep -o patriotisme fichier.txt|wc -l
le grep -o donne les occurrences du mot recherché (et l'affiche sur une ligne)
et le wc -l compte le nbr de ligne...
Si c'est un fichier libreoffice, il doit bien y avoir une fonction de comptage
de mot (on me confirme)
si c'est un pdf, on peut déjà le convertir en texte avec par exemple pdftotext
(paquet poppler-utils sous debian) et du coup revient au cas du fichier texte.
et il doit y avoir encore plein de solutions à coup de python et autres...
> Existe-t-il un logiciel tout fait et en plus gratuit ?
Et libre...
Bonne journée
mil
Plus d'informations sur la liste de diffusion Sequanux-ml