Intelligenza Artificiale 07-08

COM_EASYSOCIAL_GUEST_NAME
Visitatori

17 Anni 11 Mesi fa #78641 da COM_EASYSOCIAL_GUEST_NAME

Risposta da COM_EASYSOCIAL_GUEST_NAME al topic Intelligenza Artificiale 07-08

Da quello che ho capito io:
deve essere sempre presente in un file arff e indica la classe di appartenenza dell'istanza....Infatti nella creazione di un arff tramite le API di Weka bisogna indicare qual'è l'attributo class del file....

prendere con le pinze......

:-)

Si prega Accedi o Crea un account a partecipare alla conversazione.

COM_EASYSOCIAL_GUEST_NAME
Visitatori

17 Anni 11 Mesi fa #78673 da COM_EASYSOCIAL_GUEST_NAME

Risposta da COM_EASYSOCIAL_GUEST_NAME al topic Intelligenza Artificiale 07-08

quindi sarebbe tipo così?

@ATTRIBUTE class {Person, Organization, Location, Date}

Si prega Accedi o Crea un account a partecipare alla conversazione.

Francesca Morozzi
Offline
Senior Member

Di più

17 Anni 11 Mesi fa #78724 da Francesca Morozzi

Risposta da Francesca Morozzi al topic Intelligenza Artificiale 07-08

scusate ma qualcuno sa dove è lo studio di Zanzotto?

Si prega Accedi o Crea un account a partecipare alla conversazione.

COM_EASYSOCIAL_GUEST_NAME
Visitatori

17 Anni 11 Mesi fa #78737 da COM_EASYSOCIAL_GUEST_NAME

Risposta da COM_EASYSOCIAL_GUEST_NAME al topic Intelligenza Artificiale 07-08

E finalmente è finita!
Dunque,l'orale ( o presentazione del progetto che si voglia) è abbastanza tranquillo. Diventa una chiaccherata dove si espongono le scelte progettuali e la prof valuta se realmente si è capito il PERCHE' del progetto.
A noi non l'ha neanche fatto girare perchè credo gli siano piaciute le scelte che abbiamo portato avanti.Ha visto soltanto un file di output di weka e il db risultante.
Ci ha un pò rotto con la relazione (che abbiamo scritto un 2 ore) ed è per questo che non ha messo la lode.
Comunque sia un consiglio : curate OTTIMAMENTE la relazione,capite bene WEKA e azzeccate le feature,perchè alla fine,sono quelle che a lei interessano...

Buone vacanze a tutti!

Si prega Accedi o Crea un account a partecipare alla conversazione.

COM_EASYSOCIAL_GUEST_NAME
Visitatori

17 Anni 11 Mesi fa #78762 da COM_EASYSOCIAL_GUEST_NAME

Risposta da COM_EASYSOCIAL_GUEST_NAME al topic Intelligenza Artificiale 07-08

complimenti pax

cmq, qualcuno può dare delle dritte generiche su come procedere? magari anche i link delle pagine sulle quali si è documentato... grazie.

Si prega Accedi o Crea un account a partecipare alla conversazione.

COM_EASYSOCIAL_GUEST_NAME
Visitatori

17 Anni 11 Mesi fa #78821 da COM_EASYSOCIAL_GUEST_NAME

Risposta da COM_EASYSOCIAL_GUEST_NAME al topic Intelligenza Artificiale 07-08

Noi abbiamo proceduto così e sembra che alla prof/Zanzotto sia piaciuto molto.
All'inizio abbiamo creato il gold standard,utilizzando tutti i file xml di testing.
Poi abbiamo costruito il segmentatore, tokenizzando tutte le parole e identificando quelle che per noi erano importanti e quelle che rispettassero tutte le feature. Le feature le abbiamo identificate sia a livello logico che a livello ortografico delle stringhe.
Fatte tutte queste cose, abbaimo identificato le date ed eliminate dal vettore delle parole segmentate.
Qui finisce il segmentatore (che a parer mio è la parte più difficile perchè diviene difficile identificare le parole importanti e quelle no, vi consiglio di usare o il "bag of word" oppure una libreria come XPointer per muovervi all'interno del testo html di riferimento).
Poi abbiamo preso tutti i file xml di training e li abbiamo parsati,ciascun type del file lo abbiamo sottoposto all'identificatore delle feature, creando pian piano un immenso file arff di un boato di esempi.
Una volta creato questo file arff di training lo abbiamo buttato in weka scegliendo un classificatore affidabile (consiglio : J48 con le feature nominali).
Qui si conclude la fase di training.
Per il testing,la prof vi dà un file html in input,quindi dovete parsarlo in txt,facendo attenzione a tutti i tag etc etc... Da questo riapplicate il segmentatore ed estrate le parole importanti...Ancora riapplicate l'identificatore di feature e create un altro file ARFF di cui ovviamente non sapete quali sono le categorie.
Lo buttate in weka e l'uccello vi restituirà un nuovo file arff con la sua "predizione",parsate questo file,riempite un altro db con questi valori e confrontate quest'ultimo con il vostro gold standard. Da lì calcolate precision,recall ed F-Measure.
Ovviamente più la precision si avvicina,più l'annotatore non è casuale. E non preoccupatevi se non arrivate alla perfezione,la maggior colpa è di Chaos che identifica Vanigli come ARTICOLO!!!

Buon lavoro....

Si prega Accedi o Crea un account a partecipare alla conversazione.