Intelligenza Artificiale 07-08
- COM_EASYSOCIAL_GUEST_NAME
-
- Visitatori
-
Si prega Accedi o Crea un account a partecipare alla conversazione.
- COM_EASYSOCIAL_GUEST_NAME
-
- Visitatori
-
ma per il gold standard voi avete fatto una tabella con i campi delle classi? tipo person, org, place, date... e per ogni parola avete visto quante volte occorre in ciascuna di esse?
e il conteggio va ovviamente fatto a mano guardando il campo type bei file xml?
Si prega Accedi o Crea un account a partecipare alla conversazione.
- COM_EASYSOCIAL_GUEST_NAME
-
- Visitatori
-
per tokenizzare le parole usiamo chaos giusto?
ma bisogna dagli in pasto i file .html?
Noi non abbiamo usato Chaos,l'abbiamo fatto a mano e gli abbiamo dato in input file txt derivanti dal html...(Al tokenizzatore)
La trasformazione l'abbiamo fatta a manovella,oppure puoi utilizzare dei programmi che la fanno,scaricabili dal web...Ma sono fatti male e su pagine di wikipedia non funzionano bene...Noi abbiamo fatto una scriptino che oglieva e vari tag e permetteva al file di essere letto correttamente da Chaos...voi partite dai file html, poi li trasformate in txt e li mandate al tokenizer di chaos? [e come fate la trasformazione html -> txt? ]
ma per il gold standard voi avete fatto una tabella con i campi delle classi? tipo person, org, place, date... e per ogni parola avete visto quante volte occorre in ciascuna di esse?
e il conteggio va ovviamente fatto a mano guardando il campo type bei file xml?
Assolutamente no. Noi abbiamo fatto 4 tabelle diverse con degli attributi che indicano la posizione della parola classificata nel testo,a chi si riferisce (se quindi è una further annotation) e a seconda del tipo veniva scelta la tabella...
Il conteggio ovviamente va fatto a mano,ma non ho ben capito a cosa ti serve...a te interessa sapere soltanto quali parole e perchè quelle parole...non quante....
Si prega Accedi o Crea un account a partecipare alla conversazione.
- COM_EASYSOCIAL_GUEST_NAME
-
- Visitatori
-
Si prega Accedi o Crea un account a partecipare alla conversazione.
- COM_EASYSOCIAL_GUEST_NAME
-
- Visitatori
-
cmq per ora ho fatto così... ho fatto [leggi trovato
grazie 1000000000000000
Si prega Accedi o Crea un account a partecipare alla conversazione.
- COM_EASYSOCIAL_GUEST_NAME
-
- Visitatori
-
e poi... una volta tokenizzata una stringa, si passa alla fase della segmentazione, giusto? e anche qui sono ancora nel buio...
Si prega Accedi o Crea un account a partecipare alla conversazione.