Home > Listati di programmi C > Conteggio parole in file di testo

CONTEGGIO PAROLE IN FILE DI TESTO

Il programma ftesto.c riceve in input un file di puro testo; individua tutte le parole e le inserisce in una lista ordinata alfabeticamente; alle parole sono associate le frequenze assolute e relative. La stessa parola non puo' essere inserita piu' di una volta nella lista; quando viene letta dal file una parola gia' in lista, il programma incrementa di 1 la relativa frequenza assoluta.

Durante la lettura dei caratteri del file vengono contate anche le lettere.

Dopo la lettura del file di testo, la lista viene percorsa per calcolare anche la frequenza relativa di ogni parola.

Poi i dati messi nella lista vengono copiati in un blocco di memoria heap, per subire ulteriori elaborazioni (su richiesta dell'utente): ordinamento decrescente per frequenza e salvataggio in un file di struct contenente parole e frequenze.

Il file di struct cosi' creato puo' essere passato in input al programma crea_html.c, che crea una pagina HTML con una tabella contenente le parole e le relative frequenze.

Per compilare (con gcc): gcc -o nome_eseguibile nome_sorgente.c testo_lib.c

File testo_lib.h

File testo_lib.c

Programma per il conteggio di parole con (a richiesta) salvataggio dei risultati

Programma per creare file HTML con i risultati del conteggio


Esempi di risultati ottenuti con testi normativi prelevati da www.normattiva.it, nella versione vigente il 1-6-2015

Codice dell'amministrazione digitale (D.Lgs. n.82-2005), puro testo

Codice dell'amministrazione digitale, parole in ordine alfabetico

Codice dell'amministrazione digitale, parole in ordine decrescente di frequenza

Codice civile, puro testo

Codice civile, parole in ordine alfabetico

Codice civile, parole in ordine decrescente di frequenza


Home


www.corradodamiano.it a cura di Corrado Damiano

posta@corradodamiano.it