Tecnologia OCR e architettura del software

di il
9 risposte

Tecnologia OCR e architettura del software

Salve a tutti!
sono uno studente di design e come tesi sto sviluppando un'applicazione di food management con l'obiettivo di ridurre gli sprechi alimentari nell'ambito domestico.
Seppur sul mercato ci sono già delle soluzioni a questo tipo di problema, il 100% delle applicazioni ha dei punti deboli a livello di user experience e di funzionalità del prodotto stesso.
Attualmente il progetto è in fase di concept quindi mi servirebbero solo alcune info, premetto, inoltre, che ho pochissime conoscenze di programmazione quindi le domande saranno leggermente creative:

1_ Con la tecnologia OCR è possibile che il software trasformi la parola letta in un dato digitale (nel senso che la parola fotografata diventi input per altre azioni del software)?
2_ è possibile che più utilizzatori con più dispositivi interagiscano allo stesso tempo con un profilo dell'applicazione?
3_ in molte applicazioni quando si aprono determinate sezioni, hanno l'interfaccia di altri siti/app da cui attingono le informazioni di quella precisa sezione. è possibile ottenere le stesse informazioni senza il bisogno di reindirizzare l'utilizzatore al sito/app in questione?

Inoltre, come ultima cosa, se ci fosse un programmatore così gentile da darmi il suo contatto per semplici informazioni in corso d'opera sarei felicissimo!
Grazie!

9 Risposte

  • Re: Tecnologia OCR e architettura del software

    Dav14 ha scritto:


    1_ Con la tecnologia OCR è possibile che il software trasformi la parola letta in un dato digitale (nel senso che la parola fotografata diventi input per altre azioni del software)?
    2_ è possibile che più utilizzatori con più dispositivi interagiscano allo stesso tempo con un profilo dell'applicazione?
    3_ in molte applicazioni quando si aprono determinate sezioni, hanno l'interfaccia di altri siti/app da cui attingono le informazioni di quella precisa sezione. è possibile ottenere le stesse informazioni senza il bisogno di reindirizzare l'utilizzatore al sito/app in questione?
    1 sì
    2 sì
    3 sì
    Inoltre, come ultima cosa, se ci fosse un programmatore così gentile da darmi il suo contatto per semplici informazioni in corso d'opera sarei felicissimo!
    Grazie!
    lascerei francamente perdere questo progetto: come studente di design mi sembra un bel po' fuori dalle competenze
  • Re: Tecnologia OCR e architettura del software

    "lascerei francamente perdere questo progetto: come studente di design mi sembra un bel po' fuori dalle competenze"
    Sono cosciente che a livello tecnico è fuori dalle mie competenze; le mie competenze però sono:
    _ Analisi del comportamento dell'utilizzatore e come esso interagisce con gli oggetti. (UX design)
    _ Conoscenza del processo di progettazione tramite lateral thinking e altri processi di approccio al problema
    _ conoscenze riguardanti l'interpretazione di determinati stimoli sensoriali (come le persone interagiscono con il suono, luce, tatto, udito e olfatto)
    _ Fino alle conoscenze del designer più note a tutti: conoscenze di grafica, modellazione 3d, rappresentazione 2d, creazione di story line, ecc. (in sostanza rappresentazione a tutto tondo di un progetto)

    Inoltre, più precisamente riguardante il progetto.
    _ Conoscenze nella gestione delle risorse alimentari nella ristorazione (esperienza pluriennale nell'ambito della ristorazione)

    Per questo motivo sto cercando un programmatore, sennò non avrei creato un argomento in questo forum...
    1 sì
    2 sì
    3 sì
    Grazie comunque delle risposte

    Un'altra domanda, il processo di elaborazione dell'immagine tramite OCR è interno al dispositivo o dev'essere elaborato esternamente?
  • Re: Tecnologia OCR e architettura del software

    Tra desiderare di saper fare una cosa, e farla realmente in ambito informatico, la differenza è abissale.

    Francamente non comprendo come un progetto di questa portata possa essere realizzato da uno studente che di programmazione non sa niente.
    Per essere più preciso...

    Domandona:
    A) Quali strumenti vorresti utilizzare, sia software che hardware, per la realizzazione di questa applicazione di food management ad uso domestico ?
    B) Ultimato tutto il lavoro per la realizzazione di questa applicazione, il fruitore dovrebbe poterla sfruttare/utilizzare mediante l'uso di quali strumenti ?
  • Re: Tecnologia OCR e architettura del software

    Assioma : QUALUNQUE cosa tu vorresti fare, si puo' fare.
    Eventualmente, ci saranno dei limiti legati alla tecnologia a disposizione

    Il problema e' che programmare NON E' un'attivita' semplice: escludendo gli esempi banali composti da un massimo di 10/20 righe di codice, un'applicazione mediamente intelligente richiede competenze acquisite in ANNI di studio/pratica.

    Per quanto riguarda l'OCR, si puo' usare entrambi gli approcci. Ma non basta solo l'ocr! E' solo uno di molti componenti necessari per realizzare l'applicazione

    Purtroppo un contatto non ti basta, ti serve qualcuno che collabori al tuo progetto ESPERTO di programmazione. Non ti bastano solo delle dritte!
  • Re: Tecnologia OCR e architettura del software

    Ok mettiamo che effettivamente io necessiti di un programmatore esperto che collabori al progetto, avete idea come trovarne uno nella mia città? perchè è un pezzo che cerco ma è come cercare una mosca bianca!

    Comunque per precisare il concetto: non sto fisicamente sviluppando un'app (quindi le righe di codice infinite delle quali non ne capisco niente), sto sviluppando il concept che sta alle spalle di tale applicazione, ovviamente tale concept deve avere un minimo di concretezza, concretezza data anche (ma non solo) da un effettiva possibilità di realizzazione del progetto.


    Esempio semplificato:

    Uber o BlaBlaCar---> applicazioni di sharing economy,

    Approccio del designer:
    1. problema: sovrabbondanza di mezzi per le strade, eccessiva emissione di CO2
    2. bisogno dell'utilizzatore diretto: alternativa al mezzo pubblico, più tempestivo ed economico.
    3. bisogno dell'utilizzatore indiretto: l'idea iniziale era quella di ridurre i costi agli automobilisti.
    4. soluzione: creare una community di automobilisti che diano la possibilità di fare servizio taxi.

    Designer: Ma si può realizzare una piattaforma digitale di questo tipo?
    Programmatore: (Si, si può! e so come farla!) o (NO, non si può realizzare)
    A) Quali strumenti vorresti utilizzare, sia software che hardware, per la realizzazione di questa applicazione di food management ad uso domestico ?
    B) Ultimato tutto il lavoro per la realizzazione di questa applicazione, il fruitore dovrebbe poterla sfruttare/utilizzare mediante l'uso di quali strumenti ?
    A_ Questa è una domanda che potrei farti io, se ho capito cosa intendi.
    B_ Tramite l'utilizzo di smartphone e tablet.
    Assioma : QUALUNQUE cosa tu vorresti fare, si puo' fare.
    Per la semplicità di tale applicazione confido in questa frase però qualche dubbio l'ho avrò comunque!
  • Re: Tecnologia OCR e architettura del software

    Ma non basta solo l'ocr! E' solo uno di molti componenti necessari per realizzare l'applicazione.
    Posso chiederti cosa intendi?
  • Re: Tecnologia OCR e architettura del software

    Nessuno risponde alla tua richiesta perchè quello che chiedi non è sicuramente di facile realizzazione anche per un progettista software esperto.

    Suggerimenti, molto approssimativi (perchè bisognerebbe studiare per bene quello che vorresti realizzare, e purtroppo il tempo non c'e'):

    - Tablet e smartphone utilizzano due OS tra i più diffusi al mondo: Android e IOS. Per tale motivo dovresti creare l'app per questi due sistemi.
    - L'app la devi necessariamente creare su un computer e naturalmente per Android usi Windows, mentre per IOS usi un Mac.
    - Devi poggiarti su un server che gestisca questa app in remoto, e siccome dovrebbe gestire teoricamente utenti da tutti il mondo, il server deve essere bello potente.
    - per gestire e creare anche il software sul server ti servono conoscenze approfondite di concetti complessi e diversificati sulla trasmissione dei dati sia verso sistemi Android che verso sistemi IOS.
    - il software di OCR scordati di volerlo creare tu da zero... non ci riusciresti ne tu e ne 10 programmatori che eventualmente riusciresti a mettere insieme, almeno non in tempi brevi.
    - esistono già software di OCR, eventualmente cerca librerie già preconfigurate per Java e C++, cosa che poi dovresti eventualmente passare al tuo collega programmatore, che magari miracolosamente hai trovato disponibile.
    - E' un progetto abbastanza corposo, capisco anche che lo vorresti realizzare con molto entusiasmo, ma senza una remunerazione (senza un ritorno economico), lanciarti in uno progetto del genere diventa durissima, sopratutto se pensi che il tuo eventuale collaboratore programmatore lo trovi gratis...

    Difficilmente trovi qualcuno che si ci butterebbe free...

    Ps. e tutto questo non è neanche il 20% di quello che ti servirebbe sapere per partire con la tua idea.

    Poi fai tu... alla fine sei tu che devi decidere.
  • Re: Tecnologia OCR e architettura del software

    L'unica è trovare qualche professore di una facoltà di informatica disposto a cercare un tesista per una tesi collegata alla tua.
  • Re: Tecnologia OCR e architettura del software

    Ciao, ho sviluppato un programma che utilizza l'OCR per analizzare documenti e fare delle cose. In pratica l'utilizzatore usa uno scanner per generare dei PDF che vanno a finire in una cartella, poi da lì i files vengono elaborati dall'OCR che estrae il testo e lo passa al mio prog, il quale a sua volta completa l'elaborazione.
    Quasi tutte le volte che qualcuno lo vede tuttavia mi chiede di fare qualcosa che il mio programma attualmente NON fa, per esempio scannerizzare bolle di consegna per automatizzare il carico di magazzino, e altre cose del genere. Cose estremamente complicate in realtà. Tanto più complicate in quanto basta che l'OCR cicchi un carattere (e un 8 stampato male diventa un 6, per esempio) e tutto l'automatismo se ne va, e occorre sempre una supervisione umana. Però se si trattase solo di trovare una certa sigla stampata bella grossa (con una laser magari) all'interno di un documento, beh allora siamo nel campo dell'automazione totale del processo possibilissima. FineReader su caratteri belli grossi e nitidi e scansioni ben fatte raggiunge in pratica il 100% di riconoscimento.
    Dato che nessuno sano di mente si metterebbe a sviluppare un OCR oggi e da zero, si devono usare per questo scopo programmi o librerie già pronti. Il kit di sviluppo per implementare nativamente FineReader costava 6000 dollari l'ultima volta che ho chiesto (per cui la mia soluzione usa un OCR standalone). Ah, c'è anche un OCR public domain, si chiama Tesseract. Ma scordatri la precisione dei prodotti commerciali di punta (sto parlando dei prodotti con prezzo umano: FineReader, ReadIRIS, Nuance... c'è anche roba MOLTO costosa in giro, soluzioni "corporate" offerte anche da pezzi grossi come IBM ecc.) Quindi ci sono grossi problemi dovuti a limiti tecnologici e costi elevati. Magari la tua idea è fattibile, ma bisogna vedere in realtà cosa tu vuoi fare esattamente, che grado di automatismo, qualità dei documenti ecc, perché non si può assolutamente parlare "in generale".
Devi accedere o registrarti per scrivere nel forum
9 risposte