Cercare file in sotto directory

di Anonimizzato32244 il 13 giu 2022, 15:06

1 risposte

Anonimizzato32244

Utente anonimizzato

13 giu 2022, 15:38

Buongiorno,

ho aggiustato ed ampliato questo script


import PyPDF2
import openpyxl
import os

filenames = []
directory = r"C:\\Users"
for filename in os.listdir(directory):
    if filename.lower().endswith('.pdf'):
        filenames.append(os.path.join(directory, filename))

wb = openpyxl.load_workbook('excel.xlsx')
sheet = wb.active
sheet.title = 'MyPDF'

for row, filename in enumerate(filenames, start=1):
    with open(filename, 'rb') as f:
        pdfReader = PyPDF2.PdfFileReader(f)
        count=pdfReader.numPages
        pageObj = pdfReader.getPage(0)
        mytext = pageObj.extractText()
        for i in range(count): 
            page = pdfReader.getPage(i)
            output = []
            output = page.extractText() 
            print(output)

    sheet[f'A{row}'].value = '\n'.join(output)
    sheet[f'B{row}'].value = filename

wb.save('excel.xlsx')
print('DONE!!')

Per poter estrarre il testo da tanti file pdf e salvarlo su excel, il consiglio che vi chiedo, c'è modo modo di estendere la ricerca a delle sotto directory? ho provato con glob ma senza successo.
Cosa mi consigliereste?

1 Risposte

Timer86

Utente Attivo

Iscritto da: giu, 2019
Messaggi: 69

13 giu 2022, 16:22

Io ho fatto così


def scan_file():
    import os
    import xmltodict
    # files = []
    fdir = "PRODUCT/Account Payable/"

    for root, dirs, files in os.walk(fdir):
        for file in files:
            varpath = os.path.join(root, file)
            print(varpath)

NB io sono un niubbo, ho iniziato a studiare da un mese python dunque prendi con le molle il mio codice.

Devi accedere o registrarti per scrivere nel forum

1 risposte

Recruiting IT

Vuoi inserire un Annuncio di Lavoro su iProgrammatori.it?

OFFRO LAVORO

Aziende che cercano personale IT

Pubblica offerte lavoro IT
Accedi al Database CV

Iscrizione Aziende

CERCO LAVORO

Sviluppatori e informatici che cercano lavoro

Crea un profilo professionale
Candidati alle offerte di lavoro

Iscrizione Informatici

Discussioni recenti

determinazione data

29/07/2026 sihsandrea
Aggiornamento tabella access

28/07/2026 Hollywood
l'IA ci ruberà il lavoro? Si! No! ... Forse

26/07/2026 Delphinium
Accesso utente non in domain controller

26/07/2026 asql
AIUTO!! CAMBIO LAVORO

26/07/2026 migliorabile

Ultime offerte di lavoro

Sistemista Storage
Silicondev Spa

30/07/2026 Roma
Smart Working
Junior/Middle Bid Manager (HZN)
Herzum Software S.R.L. Unipersonale

30/07/2026 Remoto
Remote Working
QA Test Coordinator (Manual Testing)
Herzum Software S.R.L. Unipersonale

30/07/2026 Remoto
Remote Working
System Engineer
Itconsulting srl

30/07/2026 Remoto
Remote Working
Sviluppatore Power BI Senior (DEN)
Herzum Software S.R.L. Unipersonale

30/07/2026 Biella
Smart Working

Vai alle offerte di lavoro

Cercare file in sotto directory

1 Risposte

Chi siamo

Link utili

Contatti