progetto BDD (ovvero IR)
- COM_EASYSOCIAL_GUEST_NAME
-
Autore della discussione
- Visitatori
-
Postate qui problemi, soluzioni....
Io ora mi sto studiando il funzionamento di LUCENE e di WORDNET.
Pensavo di fare il progetto 2.III
Si prega Accedi o Crea un account a partecipare alla conversazione.
- COM_EASYSOCIAL_GUEST_NAME
-
- Visitatori
-
Cosa intende per {index-dir} nel comando "java........demo.IndexHTML -create -index {index-dir}? La directory che voglio indicizzare? Ossia la sotto directory di webapps di Tomcat? Oppure non sto capendo nulla? Inoltre devo creare io .../opt/lucene/index?
Grazie
Si prega Accedi o Crea un account a partecipare alla conversazione.
- COM_EASYSOCIAL_GUEST_NAME
-
Autore della discussione
- Visitatori
-
Direttamente da Lucene in Action (Manning, 2005):Ciao!! Tanto per cominciare male...non riesco a far partire neanche le demo di lucene....
Cosa intende per {index-dir} nel comando "java........demo.IndexHTML -create -index {index-dir}? La directory che voglio indicizzare? Ossia la sotto directory di webapps di Tomcat? Oppure non sto capendo nulla? Inoltre devo creare io .../opt/lucene/index?
Grazie
Quindi {index-dir} è la directory dove vuoi che venga scritto l'indice (composto da un insieme di file). Poi devi specificare anche quello che vuoi indicizzare.A.3 Running the web application demo
The web demo is slightly involved to set up and run properly. You need a web container; our instructions are for Tomcat 5. The docs/demo.html documentation provides detailed instructions for setting up and running the web application, but you can also follow the steps provided here.
The index used by the web application differs slightly from that in the command-line demo. First, it restricts itself to indexing only .html, .htm, and .txt files. Each file it processes (including .txt files) is parsed using a custom rudimentary HTML parser. To build the index initially, execute IndexHTML:The -index webindex switch sets the location of the index directory. In a moment, you’ll need the full path to this directory to configure the web application. The final docs argument to IndexHTML is the directory tree to index. The –create switch creates an index from scratch. Remove this switch to update the index with files that have been added or changed since the last time the index was built.java -cp lucene-1.4.2.jar;lucene-demos-1.4.2.jar org.apache.lucene.demo.IndexHTML -create -index webindex docs . . . adding docs/resources.html adding docs/systemproperties.html adding docs/whoweare.html Optimizing index... 7220 total milliseconds
Invece se vuoi usare IndexFiles, la sintassi è questa:
java -cp lucene-1.4.2.jar;lucene-demos-1.4.2.jar
org.apache.lucene.demo.IndexFiles docsSi prega Accedi o Crea un account a partecipare alla conversazione.
- COM_EASYSOCIAL_GUEST_NAME
-
- Visitatori
-
Si prega Accedi o Crea un account a partecipare alla conversazione.
- COM_EASYSOCIAL_GUEST_NAME
-
- Visitatori
-
Qualcuno ha agito diversamente per indicizzare il file cran.all su Lucene?
Grazie in anticipo!!
Si prega Accedi o Crea un account a partecipare alla conversazione.
- COM_EASYSOCIAL_GUEST_NAME
-
Autore della discussione
- Visitatori
-
Io ho creato un mio parser.Qualcuno ha agito diversamente per indicizzare il file cran.all su Lucene?
Non è difficile.
Ci vuole solo molta pazienza... :shock:
Si prega Accedi o Crea un account a partecipare alla conversazione.