fbpx
Skip to main content

progetto BDD (ovvero IR)

  • COM_EASYSOCIAL_GUEST_NAME
  • Avatar di COM_EASYSOCIAL_GUEST_NAME Autore della discussione
  • Visitatori
  • Visitatori
19 Anni 11 Mesi fa #19229 da COM_EASYSOCIAL_GUEST_NAME
progetto BDD (ovvero IR) è stato creato da COM_EASYSOCIAL_GUEST_NAME
Innauguro il Topic.
Postate qui problemi, soluzioni....

Io ora mi sto studiando il funzionamento di LUCENE e di WORDNET.
Pensavo di fare il progetto 2.III

Si prega Accedi o Crea un account a partecipare alla conversazione.

  • COM_EASYSOCIAL_GUEST_NAME
  • Avatar di COM_EASYSOCIAL_GUEST_NAME
  • Visitatori
  • Visitatori
19 Anni 11 Mesi fa #19240 da COM_EASYSOCIAL_GUEST_NAME
Risposta da COM_EASYSOCIAL_GUEST_NAME al topic progetto BDD (ovvero IR)
Ciao!! Tanto per cominciare male...non riesco a far partire neanche le demo di lucene....
Cosa intende per {index-dir} nel comando "java........demo.IndexHTML -create -index {index-dir}? La directory che voglio indicizzare? Ossia la sotto directory di webapps di Tomcat? Oppure non sto capendo nulla? Inoltre devo creare io .../opt/lucene/index?
Grazie

Si prega Accedi o Crea un account a partecipare alla conversazione.

  • COM_EASYSOCIAL_GUEST_NAME
  • Avatar di COM_EASYSOCIAL_GUEST_NAME Autore della discussione
  • Visitatori
  • Visitatori
19 Anni 11 Mesi fa #19248 da COM_EASYSOCIAL_GUEST_NAME
Risposta da COM_EASYSOCIAL_GUEST_NAME al topic progetto BDD (ovvero IR)

Ciao!! Tanto per cominciare male...non riesco a far partire neanche le demo di lucene....
Cosa intende per {index-dir} nel comando "java........demo.IndexHTML -create -index {index-dir}? La directory che voglio indicizzare? Ossia la sotto directory di webapps di Tomcat? Oppure non sto capendo nulla? Inoltre devo creare io .../opt/lucene/index?
Grazie

Direttamente da Lucene in Action (Manning, 2005):

A.3 Running the web application demo
The web demo is slightly involved to set up and run properly. You need a web container; our instructions are for Tomcat 5. The docs/demo.html documentation provides detailed instructions for setting up and running the web application, but you can also follow the steps provided here.
The index used by the web application differs slightly from that in the command-line demo. First, it restricts itself to indexing only .html, .htm, and .txt files. Each file it processes (including .txt files) is parsed using a custom rudimentary HTML parser. To build the index initially, execute IndexHTML:

java -cp lucene-1.4.2.jar;lucene-demos-1.4.2.jar
org.apache.lucene.demo.IndexHTML -create -index webindex docs
.
.
.
adding docs/resources.html
adding docs/systemproperties.html
adding docs/whoweare.html
Optimizing index...
7220 total milliseconds
The -index webindex switch sets the location of the index directory. In a moment, you’ll need the full path to this directory to configure the web application. The final docs argument to IndexHTML is the directory tree to index. The –create switch creates an index from scratch. Remove this switch to update the index with files that have been added or changed since the last time the index was built.

Quindi {index-dir} è la directory dove vuoi che venga scritto l'indice (composto da un insieme di file). Poi devi specificare anche quello che vuoi indicizzare.

Invece se vuoi usare IndexFiles, la sintassi è questa:
java -cp lucene-1.4.2.jar;lucene-demos-1.4.2.jar
org.apache.lucene.demo.IndexFiles docs

Si prega Accedi o Crea un account a partecipare alla conversazione.

  • COM_EASYSOCIAL_GUEST_NAME
  • Avatar di COM_EASYSOCIAL_GUEST_NAME
  • Visitatori
  • Visitatori
19 Anni 11 Mesi fa #19252 da COM_EASYSOCIAL_GUEST_NAME
Risposta da COM_EASYSOCIAL_GUEST_NAME al topic progetto BDD (ovvero IR)
Grazie!!!

Si prega Accedi o Crea un account a partecipare alla conversazione.

  • COM_EASYSOCIAL_GUEST_NAME
  • Avatar di COM_EASYSOCIAL_GUEST_NAME
  • Visitatori
  • Visitatori
19 Anni 10 Mesi fa #20131 da COM_EASYSOCIAL_GUEST_NAME
Risposta da COM_EASYSOCIAL_GUEST_NAME al topic progetto BDD (ovvero IR)
Ragazzi, mi appresto ad implementare un parser per il corpus cranfield, dato che Lucene non supporta direttamente il formato in cui i documenti si trovano nel file cran.all. Avete qualche dritta su qualche parser noto(già implementato), perchè le mie ricerche sono state vane.... :cry: :lol: :roll:
Qualcuno ha agito diversamente per indicizzare il file cran.all su Lucene?

Grazie in anticipo!! :P

Si prega Accedi o Crea un account a partecipare alla conversazione.

  • COM_EASYSOCIAL_GUEST_NAME
  • Avatar di COM_EASYSOCIAL_GUEST_NAME Autore della discussione
  • Visitatori
  • Visitatori
19 Anni 10 Mesi fa #20147 da COM_EASYSOCIAL_GUEST_NAME
Risposta da COM_EASYSOCIAL_GUEST_NAME al topic progetto BDD (ovvero IR)

Qualcuno ha agito diversamente per indicizzare il file cran.all su Lucene?

Io ho creato un mio parser.
Non è difficile.
Ci vuole solo molta pazienza... :shock:

Si prega Accedi o Crea un account a partecipare alla conversazione.