- Messaggi: 32
- Ringraziamenti ricevuti 0
Intelligenza Artificiale 07-08
- COM_EASYSOCIAL_GUEST_NAME
-
- Visitatori
-
cmq per ora ho fatto così... ho fatto [leggi trovato Smile ] un programmino java che trasforma html in txt levando i tag... poi questo txt va dato a chaos... fin qui ci siamo... [spero], una volta avviato chaos, devo usare solo il tokenizzatore o parsare il txt, mettendo il check su tutte le caselle [nelle impostazioni del server] ?
Sì,ma devi usare le API di chaos altrimenti non puoi prendere i costituenti riguardo ad ogni parola. Devi fare qualche metodo di parsing e far partire il server, come diceva arale, con il Runtime.getRuntime().exec().....
Dopodichè hai finito l'analisi sintattica delle parole. Questa è una strada.
Altrimenti puoi seguire la mia,dopo che ho tokenizzato a mano tutte le parole,una per una,l'ho data in pasto a Chaos e quello mi ha detto cosa è quella parola....Come faccio a sapere dove si trova? Mi tengo la posizione nel file html....
quello che non capisco è... che differenza c'è tra tokenizzarsi un file di testo con un programma scritto a mano, oppure con chaos... l'unica cosa che mi viene in mente è il formato output, che magari se fatto con chaos [.cha] potrebbe generare problemi per i passi successivi....
e poi... una volta tokenizzata una stringa, si passa alla fase della segmentazione, giusto? e anche qui sono ancora nel buio...
Se lo fai a mano,hai bisogno solo delle API di chaos,eliminando molti problemi di lentezza e prestazioni (chaos è pesantissimo). E come hai detto tu,il file .cha,oltre ad essere sconosciuto è anche,a mio parere,un passaggio inutile.
Una volta che hai tokenizzato tutto il txt,con il segmentatore devi riconoscere solo le parole che ti servono.E qui entra in gioco la genialità e la fantasia.Comincia ad inventare delle tue regole,perchè la parola "Roma" deve essere presa e la parola "quando" no.
Io ti dò un consiglio,utilizza chaos,e molte parole le fiondi......
Si prega Accedi o Crea un account a partecipare alla conversazione.
- COM_EASYSOCIAL_GUEST_NAME
-
- Visitatori
-
cmq ieri mi sono fatta il tokenizer a mano in java, dove io gli do stringhe [o file] di testo e lui tokenizza le parole... una volta fatto questo... le parole le do a chaos e mi faccio fare l'analisi sintattica, cioè per ogni parola mi faccio dire cosa è quella parola, giusto? e contemporaneamente a questo, devo cmq trovare un modo per tracciare la posizione delle parole nel file html... giusto?
grazie ancora
Si prega Accedi o Crea un account a partecipare alla conversazione.
- COM_EASYSOCIAL_GUEST_NAME
-
- Visitatori
-
Una volta che hai identificato tutte le parole hai finito il segmentatore.Ovviamente non ti basta sapere solo dove si trovano, ti interessa anche sapere cosa sono quelle parole e se quelle parole che tu stai analizzando sono utili o inutili. (Infatti ti dicevo prima che Chaos serve principalmente per questo...per scartare avverbi,proposizioni,verbi....etc etc) dopo,ti ripeto,la genialità e la furbizia nello scegliere ti vale il voto all'orale.Perchè quello ti chiederanno...Questa è la parte un pò più delicata...
Si prega Accedi o Crea un account a partecipare alla conversazione.
- COM_EASYSOCIAL_GUEST_NAME
-
- Visitatori
-
detto questo me ne vado in vacanza pure io e torno a romperti le scatole tra una settimanella
grazie infinite per il tuo aiuto
Si prega Accedi o Crea un account a partecipare alla conversazione.
- Francesco Mele
-
- Offline
- Junior Member
-
L 'errore che ho e' ClassDefFoundError: and .
Ho provato sia con Java 1.6 .. e mi dava un casino di errori al lancio di chaosserver ed ora con la 1.5 mi da questo singolo errore.
Ho settato le variabili di ambiente e il PATH come indicato nell installazione.
Grazie a tutti!
Ciaoooo
Si prega Accedi o Crea un account a partecipare alla conversazione.
Si prega Accedi o Crea un account a partecipare alla conversazione.