Controllare se file è .txt, .pdf, .doc, .odt.. e migliori librerie Py

di il
0 risposte

Controllare se file è .txt, .pdf, .doc, .odt.. e migliori librerie Py

Salve ragazzi, mi sto incartando non poco sulla ricerca di una parola all'interno di un file.

Devo cercare un testo all'interno di un file, ma prima voglio controllare che sia un file di testo, o quantomeno che concettualmente contenga del testo. Nel senso: se è un file video, audio, mp3, immagine ect, non ha senso cercare una certa parola nel testo, corretto?

Quindi diciamo che restringrei (per farla breve) il campo solo a: .txt, .pdf, .docx, .odt

Insomma, come faccio con le librerie di Python a controllare queste tipologie di file? Potrei farlo con l'estensione ma questo bene o male riesco a farlo, ma c'è un modo alternativo/evoluto per farlo?

L'AI mi ha tirato fuori questo codice: 

import magic
def is_text_file(file_path):
    mime = magic.Magic()
    file_type = mime.from_file(file_path)
    return 'text' in file_type

Va bene come codice? Controllo il mimetype per vedere se è un file di testo? Idee alternative? Mi accontento di controllare l'estensione?

Grazie mille

Devi accedere o registrarti per scrivere nel forum
0 risposte