Collegamento db excel-cataloghi PDF

di il
20 risposte

20 Risposte - Pagina 2

  • Re: Collegamento db excel-cataloghi PDF

    OsvaldoLaviosa ha scritto:


    1. Un foglio elettronico di Excel non può raggiungere più di qualche migliaio di righe (non conosco il numero esatto)
    Sono 65.535 per le versioni fino a 2003, e 1.048.576 da 2007 in poi (anche per i 64 bit)
    Una tabella di Access può gestire tranquillamente centinaia di migliaia di record se non addirittura milioni (vado sempre a braccio senza numeri precisi).
    Bhè diciamo che milioni di record Access (JET) non è che siano proprio consigliabili
  • Re: Collegamento db excel-cataloghi PDF

    dvaosta ha scritto:


    A me il problema più complesso da risolvere sembra invece la conciliazione delle fonti...
    Vanno scritti riconoscitori per leggere i vari formati e scriverli in un db standard.
    Riguardo la selezione della pagina di un pdf, la vedo relativamente semplice: pdf è un linguaggio di markup con una struttura ad albero e tag (mi pare che la sintassi sia simile a latex per certi versi), per cui basta sapere i tag che delimitano le pagine e contare finché non si arriva alla pagina giusta.
    PDF non è AFFATTO un linguaggio di markup (magari), è di una complessità smodata e nasce in realtà come evoluzione di postscript, in versione poi EPS e così via.
    Dando per scontato che è irrealistico scriversi un proprio reader, ci si può orientare su prodotti già fatti (librerie), oppure su tentativi di automazione di sumatra, foxit o reader
  • Re: Collegamento db excel-cataloghi PDF

    OsvaldoLaviosa ha scritto:


    A seconda della bravura del programmatore potrebbe trattarsi di un lavoro di ordinaria amministrazione...io lo trovo impegnativo, ma non saprei quantificarne i costi.
    Ne ho fatti di simili, il "piccolo" particolare è che un verticale del genere, per un singolo cliente, ha costo a tempo, il che presuppone una forte volontà di investire in uno strumento del genere (fascia 5.000-10.000).
    Un qualche prodotto già fatto, bene o male, immagino si possa trovare a molto meno
  • Re: Collegamento db excel-cataloghi PDF

    Beh dai se fossero anche 10k ci potrebbe stare...
  • Re: Collegamento db excel-cataloghi PDF

    +m+ ha scritto:


    dvaosta ha scritto:


    A me il problema più complesso da risolvere sembra invece la conciliazione delle fonti...
    Vanno scritti riconoscitori per leggere i vari formati e scriverli in un db standard.
    Altrimenti detti strumenti ETL.
    Riguardo la selezione della pagina di un pdf, la vedo relativamente semplice: pdf è un linguaggio di markup con una struttura ad albero e tag (mi pare che la sintassi sia simile a latex per certi versi), per cui basta sapere i tag che delimitano le pagine e contare finché non si arriva alla pagina giusta.
    PDF non è AFFATTO un linguaggio di markup (magari), è di una complessità smodata e nasce in realtà come evoluzione di postscript, in versione poi EPS e così via.
    Dando per scontato che è irrealistico scriversi un proprio reader, ci si può orientare su prodotti già fatti (librerie), oppure su tentativi di automazione di sumatra, foxit o reader[/quote]
    Postscript è un linguaggio di descrizione di pagina (che è leggermente diverso da un linguaggio di markup). PDF è un evoluzione che semplifica il linguaggio, ad esempio eliminando cicli e blocchi condizionali.
    In particolare, se leggi l'ISO 32000, puoi vedere che pagine, immagini e via dicendo sono delimitate dai tag obj e endobj, e definite da appositi attributi. Quindi si può ben approssimare il formato pdf come un linguaggio di markup.

    Riguardo al reader, so bene che esistono librerie in grado di fare una cosa del genere. Io ad esempio ho usato delle librerie php durante un tirocinio, che permettevano sia di creare pdf da 0 che di modificare file già esistenti.
  • Re: Collegamento db excel-cataloghi PDF

    dvaosta ha scritto:


    Altrimenti detti strumenti ETL
    Detti anche "strumenti che non funzionano"
    Non ci sono metodi magici, per l'importazione dei dati servono verticali mirati e precisi alla singola cella excel ed al singolo formato impostato.
    Nel senso che gli importatori vanno scritti a manina, l'utilizzo di strumenti automatici è tra l'inutile e il dannoso, per progetti "veri" (non accademici)
    Riguardo al reader, so bene che esistono librerie in grado di fare una cosa del genere. Io ad esempio ho usato delle librerie php durante un tirocinio, che permettevano sia di creare pdf da 0 che di modificare file già esistenti.
    Ma nessuna libreria PHP ti MOSTRA un PDF sul client.
    Qui stiamo parlando di PDF già fatti: una strategia abbastanza comune è quella di rasterizzare le singole pagine e (una volta) fare un flash player che le mostra(va).
    Oggi o si mostrano direttamente le pagine raster (mezza schifezza, ma rapido e poco costoso), oppure si adottano strategie moooolto più complicate, che prevedono la conversione dei PDF in altro formato "sfogliabile".
    Cosa fattibile, ma con costi non indifferenti e lavori spesso difficili
Devi accedere o registrarti per scrivere nel forum
20 risposte