Estrazione dati tar

di il
1 risposte

Estrazione dati tar

Ciao a tutti,
sono nuovo con python e sto cercando di estrarre stringhe di testo in due lingue da due file bz2.
Le istruzioni che devo seguire sono :
"Download and extract the alignment information:
wget http://optima.jrc.it/Resources/DCEP-2013/langpairs/DCEP-DA-LV.tar.bz2
tar jxf DCEP-DA-LV.tar.bz2
The alignment information contains correspondence between numerical indices
of sentences, in the next step we will turn these into actual sentence pairs
Now we download, extract, and run the tool that generates the bicorpus from the above data:
wget http://optima.jrc.it/Resources/DCEP-2013/DCEP-extract-scripts.tar.bz2
tar jxvf DCEP-extract-scripts.tar.bz2
./src/languagepair.py DA-LV > DA-LV-bisentences.txt
"
Una volta avviato python riesco solo a far girare la prima linea di codice(wget).
la seconda riga mi da come risultato:
" 2 [main] tar 8424 find_fast_cwd: WARNING: Couldn't compute FAST_CWD pointer. Please report this problem to
the public mailing list
tar (child): DCEP-EN-IT.tar.bz2: Cannot open: No such file or directory
tar (child): Error is not recoverable: exiting now
tar: Child returned status 2
tar: Error is not recoverable: exiting now"

il mio pc ha windows 10.
Qualcuno mi sa dare una mano?
Grazie

1 Risposte

  • Re: Estrazione dati tar

    Ciao, il problema non è legato a python.
    Quel pezzo di codice che stai cercando di eseguire in python è in realtà uno script per bash (che windows non ha).
    Questo comunque non è un problema, in quanto le uniche cose che devi fare sono:
    • Scaricare il file dal link che hai incollato (puoi farlo tranquillamente dal browser)
    • Unzipparlo, ad esempio con WinRar o 7z (quest'ultimo è gratuito)
    • posizionarti con un prompt nella cartella che hai unzippato ed eseguire lo script python: ./src/languagepair.py DA-LV > DA-LV-bisentences.txt
    Alla fine ti troverai il risultato, qualunque esso sia, all'interno del file "DA-LV-bisentences.txt"
Devi accedere o registrarti per scrivere nel forum
1 risposte