Colpilot per estrazione dati da bollette.

di il
10 risposte

Colpilot per estrazione dati da bollette.

Buongiorno a tutti e grazie per l'accoglienza.

È la prima volta che mi iscrivo ad un forum su questi argomenti e se fossi inopportuno o indesiderato, vi prego di avvisarmi e lascerò subito questo ambiente. Premetto anche non sono un esperto e mi limito all'utilizzo di programmi disponibili per migliorare il mio lavoro.

Analizzo continuamente i consumi di energia di enti pubblici e sto cercando di usare Colpilot e ChatGPT per creare una tabella con i dati che mi occorrono (POD/PDR, mese di riferimento della bolletta, energia e valore bolletta da pagare).

Le bollette da caricare sono molte: una bolletta per ogni POD/PDR, per ogni mese dell'anno per due o tre anni: per ogni ente ci vogliono anche settimane per creare una tabella completa ed attendibile.

Colpilot e ChatGPT promettevano miracoli, ma poi, dopo due settimane di test intensi, tra perdite di dati, pause ed errori di varia natura li ho mollati.

Carico uno screenshot della tabella che vorrei realizzare usando IA per non aprire tutte le bollette una ad una (anche più di mille) e ringrazio anticipatamente chi vorrà aiutarmi in questa ricerca.

Disponibile a collaborare con eventuali sviluppatori che volessero sviluppare un servizio per Energy Manager, EGE, aziende, enti, consulenti tecnici e tanti altri potenziali utilizzatori 

Grazie e buona giornata.

10 Risposte

  • Re: Colpilot per estrazione dati da bollette.

    Ciao, ottima scelta abbandonare la via della IA. Gli strumenti che hai tentato di usare sono "banalmente" dei "generatori" di testi e poco sanno di estrazione e aggregazione di dati, soprattutto se effettuati in più passaggi.
    Possono fare una analisi precisa per singola operazione, ma poi aggregare il tutto non è il loro "pane".

    Da ciò che si capisce, devi effettuare una lettura della bolletta ("cartacea" o in formato digitale tipo PDF ?) ed estrarre i dati "notevoli" per poi archiviarli e renderli fruibili per analisi.

    Per fare ciò ti serve:

    1. Scanner e software OCR;
    2. Software per l'analisi dei singoli modelli di fattura (o bolletta) di tutti i fornitori per l'estrazione dei dati dall'OCR;
    3. Database di archiviazione dei dati estratti;
    4. Software per la lettura ed analisi (anche un Excel o simili potrebbero andare bene).

    Ovviamente in linea di massima, poi ognuno potrebbe proporti una soluzione diversa più o meno complessa. E ovviamente bisogna entrare nel dettaglio.

    Hai un paio di strade da percorrere: pubblicare come hai fatto qua in una moltitudine di forum dedicati ai vari linguaggi di programmazione le tue esigenze e attendere che qualcuno si faccia vivo, o contattare direttamente professionisti o aziende che sviluppano soluzioni ad hoc, usando anche i canali come quello che mette a disposizione questo forum di offerte di lavoro.

    Ritengo improbabile che qualcuno sviluppi una simile applicazione per hobby (anche perchè la manutenzione del software la vedo abbastanza pesante visto che i modelli di fattura cambiano spesso), quindi è probabile che dovrai rivolgerti o attendere che qualche professionista si presenti per concordare eventuali costi.

    Buon lavoro e buona fortuna.

  • Re: Colpilot per estrazione dati da bollette.

    Ciao Delphinium e grazie per la tua risposta.

    Le bollette che analizzo sono in PDF, raramente cartacee.

    Dei punti elencati mi manca il 2: farò una ricerca del software per completare la risposta.

    Mi sembra chiaro che per ottenere il risultato al quale ambisco non ci sono risorse open e cercherò qualcosa sul mercato.

    Sei stato molto cortese e ti auguro buona giornata.

  • Re: Colpilot per estrazione dati da bollette.

    09/09/2025 - SuperG ha scritto:

    Le bollette che analizzo sono in PDF, raramente cartacee.

    Dei punti elencati mi manca il 2: farò una ricerca del software per completare la risposta.

    Mi sembra chiaro che per ottenere il risultato al quale ambisco non ci sono risorse open e cercherò qualcosa sul mercato.

    Non so se sul mercato c'è qualcosa già pronto che fa al caso tuo, ho l'impressione che dovrai commissionarlo se non hai le capacità di svilupparlo da solo o in collaborazione. Magari poi ci sono le singole funzionalità e basta solo "congiungerle".

  • Re: Colpilot per estrazione dati da bollette.

    Trovare autonomamente  una soluzione mi darebbe più soddisfazione, ma devo capire quali programmi occorrono.

    Le bollette sono tutte in pdf: l'OCR è integrato anche in alcuni programmi di scanner e multifunzione e non dovrei avere problemi, ma il programma che riconosce i caratteri e li trasferisce in excell non ho idea di quale sia.

    Faccio un po' di ricerche...

    Grazie.

  • Re: Colpilot per estrazione dati da bollette.

    09/09/2025 - SuperG ha scritto:

    Colpilot e ChatGPT promettevano miracoli, ma poi, dopo due settimane di test intensi, tra perdite di dati, pause ed errori di varia natura li ho mollati.

    Hai provato a usare Claude Desktop (Anthropic)? Possiede diversi connettori che via MCP possono accedere a file e relativi contenuti e operare diverse tipologie di operazioni.

  • Re: Colpilot per estrazione dati da bollette.

    Ciao Alka.

    Non lo conosco. Faccio immediatamente una prova.

  • Re: Colpilot per estrazione dati da bollette.

    09/09/2025 - SuperG ha scritto:

    il programma che riconosce i caratteri e li trasferisce in excell non ho idea di quale sia.

    Se hai le bollette in PDF, puoi estrarre i dati tramite PowerQuery ed ottenerli in forma tabellare in Excel. Per le cartacee, visto che son poche, potresti ipotizzare un inserimento manuale (io con gli OCR ci ho sempre bisticciato un po', quindi non saprei quanto possa essere facile in realtà facendo le cose fatte bene).

    L'immagine purtroppo non riesco a vederla, ma immaginando che poi dovrai fare un'analisi di questi dati, credo tu possa valutare anche PowerBI a seconda di quanto è preponderante l'aspetto visuale delle elaborazioni.

    Secondo me, il trucco sta solo nel porre la domanda in modo corretto all'IA. :) Non le adopero, ma vedendo altri utenti in altri forum, mi son fatto l'idea che è più difficile impostare la domanda che interpretare la risposta. Un giorno la proverò e mi toglierò il dubbio.

  • Re: Colpilot per estrazione dati da bollette.

    10/09/2025 - Alka ha scritto:

    09/09/2025 - SuperG ha scritto:

    Colpilot e ChatGPT promettevano miracoli, ma poi, dopo due settimane di test intensi, tra perdite di dati, pause ed errori di varia natura li ho mollati.

    Hai provato a usare Claude Desktop (Anthropic)? Possiede diversi connettori che via MCP possono accedere a file e relativi contenuti e operare diverse tipologie di operazioni.

    Provato.

    Funziona molto bene e realizza ottime strutture di tabelle in tempi brevi, ma ha un limite assurdo: ho potuto caricare solo n. 2 bollette in pdf.

    Peccato, ma grazie per la segnalazione.

  • Re: Colpilot per estrazione dati da bollette.

    11/09/2025 - Sgrubak ha scritto:

    09/09/2025 - SuperG ha scritto:

    il programma che riconosce i caratteri e li trasferisce in excell non ho idea di quale sia.

    Se hai le bollette in PDF, puoi estrarre i dati tramite PowerQuery ed ottenerli in forma tabellare in Excel. Per le cartacee, visto che son poche, potresti ipotizzare un inserimento manuale (io con gli OCR ci ho sempre bisticciato un po', quindi non saprei quanto possa essere facile in realtà facendo le cose fatte bene).

    L'immagine purtroppo non riesco a vederla, ma immaginando che poi dovrai fare un'analisi di questi dati, credo tu possa valutare anche PowerBI a seconda di quanto è preponderante l'aspetto visuale delle elaborazioni.

    Secondo me, il trucco sta solo nel porre la domanda in modo corretto all'IA. :) Non le adopero, ma vedendo altri utenti in altri forum, mi son fatto l'idea che è più difficile impostare la domanda che interpretare la risposta. Un giorno la proverò e mi toglierò il dubbio.

    Ciao.

    Il tuo suggerimento è molto interessante, ma ci vorrebbero basi di excell un po' più avanzate delle mie.

    Ho aperto l'excell ed incollato poche colonne della tabella che vorrei costruire, quindi, da "Dati" ho aperto "Recupera dati" e poi da "Pdf"... fin qui tutto facile.

    A quel punto, ho selezionato i blocchi di dati da considerare (in questi blocchi ci sono i dati che mi servono, ma anche tante cose da non considerare) ed avviato l'estrapolazione che mi ha restituito una tabella con tutto ciò che è presente nei blocchi selezionati.

    Da qui in poi non so come procedere: dovrei selezionare i dati che mi occorrono e farli allocare nella casella corretta della tabella.

    Grazie per il tuo riscontro.

  • Re: Colpilot per estrazione dati da bollette.

    11/09/2025 - SuperG ha scritto:

    ci vorrebbero basi di excell un po' più avanzate delle mie.

    In realtà Excel è solo lo strumento che usi per poi visualizzare il risultato. Quello che in realtà serve è PowerQuery (d'ora in avanti per brevità PQ) ed il suo ambiente (anche una dose del linguaggio M, ma verrà col tempo e con lo studio durante gli approfondimenti che affronterai).

    11/09/2025 - SuperG ha scritto:

    Ho aperto l'excell ed incollato poche colonne della tabella che vorrei costruire

    Questo passaggio non ti serve. La tabella sarà il risultato dell'elaborazione di PQ. 

    11/09/2025 - SuperG ha scritto:

    Quindi, da "Dati" ho aperto "Recupera dati" e poi da "Pdf"... fin qui tutto facile.

    Quasi giusto. Secondo me ti conviene organizzare manualmente le bollette per gestore raggruppandole in cartelle differenti con path dedicate. Esempi banali potrebbero essere C:\Bollette\Gestore1, C:\Bollette\Gestore2 e così via..

    Quello che farà PQ sarà applicare delle trasformazioni (escludi delle righe, nascondi delle colonne, estrai testo, e chi più ne ha più ne metta) ai dati trovati dentro i PDF. Ma le bollette avranno la stessa struttura solo a parità di gestore (e fintato che quest'ultimo non cambia il layout). Quindi le trasformazioni che applicherai ad una singola bolletta per ricavare in una riga i dati di tuo interesse, se applicate a tutti gli altri PDF dello stesso gestore produrranno il tuo risultato parziale. Trovata la logica per "Gestore2" e ottenuta una seconda tabella di risultati potrai accodarle. Continuando ad accodare in un calderone unico tutti i gestori otterrai la tua base dati effettiva.

    Ti direi di provare organizzando pochi files e prendere dimestichezza con l'ambiente partendo da questo link. Poi avrai a disposizione la IA per approfondire e magari farti produrre il codice M per le trasformazioni.

Devi accedere o registrarti per scrivere nel forum
10 risposte