fbpx
Skip to main content

MMI

Di più
17 Anni 5 Mesi fa #76056 da Lavinia Laurenti
Risposta da Lavinia Laurenti al topic MMI

Ciao, noi abbiamo lo stesso problema! Tu hai risolto in qualche modo?
Ti ho anche mandato un pm!


Risp ad un pò di domande e ne faccio qualcuna anche io:
1) penso che sia sbagliato dividere i documenti in classi equiprobabili perchè vedendo il log dell'anno scorso c'erano oggetti piccoli molto probabili, quelli medi e poi oggetti grandi poco probabili. noi ci siamo orientati in questo senso e cioè creando un numero fisso di cluster.
2) Abbiamo notato che per la dimensione delle pagine html la lognormale non è mai superiore a 10240 quindi la pareto non viene mai usata, i valori vengono sempre intorno al valore 9. Non sono pochi 9 byte? Anche gli Object vengono quasi tutti di circa 10 byte
3) per la gaussiana inversa abbiamo problemi poichè per tracciare il suo grafico utilizziamo la cumulativa F(x) che ha come componente la CDF della distribuzione normale. ma è la normale standard?

Si prega Accedi o Crea un account a partecipare alla conversazione.

  • COM_EASYSOCIAL_GUEST_NAME
  • Avatar di COM_EASYSOCIAL_GUEST_NAME
  • Visitatori
  • Visitatori
17 Anni 5 Mesi fa #76059 da COM_EASYSOCIAL_GUEST_NAME
Risposta da COM_EASYSOCIAL_GUEST_NAME al topic MMI

Ciao, noi abbiamo lo stesso problema! Tu hai risolto in qualche modo?
Ti ho anche mandato un pm!


Risp ad un pò di domande e ne faccio qualcuna anche io:
1) penso che sia sbagliato dividere i documenti in classi equiprobabili perchè vedendo il log dell'anno scorso c'erano oggetti piccoli molto probabili, quelli medi e poi oggetti grandi poco probabili. noi ci siamo orientati in questo senso e cioè creando un numero fisso di cluster.
2) Abbiamo notato che per la dimensione delle pagine html la lognormale non è mai superiore a 10240 quindi la pareto non viene mai usata, i valori vengono sempre intorno al valore 9. Non sono pochi 9 byte? Anche gli Object vengono quasi tutti di circa 10 byte
3) per la gaussiana inversa abbiamo problemi poichè per tracciare il suo grafico utilizziamo la cumulativa F(x) che ha come componente la CDF della distribuzione normale. ma è la normale standard?


ciao!
Sul punto 1 anche noi ci siamo convinti che quella delle classi equiprobabili non era proprio la strada (anzi era proprio una caxxxxx :) )..
Sul punto 2 invece noi abbiamo modificato il nostro ragionamento: facendo l'integrale tra 0 e 10240 della lognormale abbiamo la probabilità che venga generato un valore di x compreso in quell'intervallo. Tale valore è circa 0.95, quindi con probabilità pari al 95% si ha un valore preso dalla lognormale e il restante 5% delle volte si usa la pareto.
Infine, al punto 3 ancora non ci siamo arrivati ma sto scaricandomi matlab per vedere se ci verrà in aiuto. Comunque user think time e numero di richieste per sessione entrano in gioco dopo aver fatto la caratterizzazione del carico, vero?

Certo che per il 4 la vedo sempre + dura e spero davvero che si decidano a concederci una data a fine mese (specie con questo cavolo di progetto 1 che ci sta facendo perdere un botto di tempo solo per fare un lavoro che nel progetto 2 è "gratis"!)

Ciao e.. let's keep in touch!

Si prega Accedi o Crea un account a partecipare alla conversazione.

Di più
17 Anni 5 Mesi fa #76071 da Lavinia Laurenti
Risposta da Lavinia Laurenti al topic MMI

ciao!
Sul punto 1 anche noi ci siamo convinti che quella delle classi equiprobabili non era proprio la strada (anzi era proprio una caxxxxx :) )..
Sul punto 2 invece noi abbiamo modificato il nostro ragionamento: facendo l'integrale tra 0 e 10240 della lognormale abbiamo la probabilità che venga generato un valore di x compreso in quell'intervallo. Tale valore è circa 0.95, quindi con probabilità pari al 95% si ha un valore preso dalla lognormale e il restante 5% delle volte si usa la pareto.
Infine, al punto 3 ancora non ci siamo arrivati ma sto scaricandomi matlab per vedere se ci verrà in aiuto. Comunque user think time e numero di richieste per sessione entrano in gioco dopo aver fatto la caratterizzazione del carico, vero?

Certo che per il 4 la vedo sempre + dura e spero davvero che si decidano a concederci una data a fine mese (specie con questo cavolo di progetto 1 che ci sta facendo perdere un botto di tempo solo per fare un lavoro che nel progetto 2 è "gratis"!)

Ciao e.. let's keep in touch!


1) il #richieste per sessione secondo me è specifico della generazione dei dati perchè ogni utente apre una sessione, per ogni sessione vi è un num di richieste ben preciso, per ogni richiesta viene prodotta una pagina web, ogni pagina web avrà all'interno una serie di risorse embedded di una data dimensione.
2) per la gaussiana stiamo avendo un bel pò di problemi.
3) il 4 è veramente dura però noi stiamo facendo il possibile per fare in tempo...in ogni caso speriamo anche in un appello a fine mese (anche se è una sfacchinata a fine luglio)

Si prega Accedi o Crea un account a partecipare alla conversazione.

  • COM_EASYSOCIAL_GUEST_NAME
  • Avatar di COM_EASYSOCIAL_GUEST_NAME
  • Visitatori
  • Visitatori
17 Anni 5 Mesi fa #76080 da COM_EASYSOCIAL_GUEST_NAME
Risposta da COM_EASYSOCIAL_GUEST_NAME al topic MMI

ciao!
Sul punto 1 anche noi ci siamo convinti che quella delle classi equiprobabili non era proprio la strada (anzi era proprio una caxxxxx :) )..
Sul punto 2 invece noi abbiamo modificato il nostro ragionamento: facendo l'integrale tra 0 e 10240 della lognormale abbiamo la probabilità che venga generato un valore di x compreso in quell'intervallo. Tale valore è circa 0.95, quindi con probabilità pari al 95% si ha un valore preso dalla lognormale e il restante 5% delle volte si usa la pareto.
Infine, al punto 3 ancora non ci siamo arrivati ma sto scaricandomi matlab per vedere se ci verrà in aiuto. Comunque user think time e numero di richieste per sessione entrano in gioco dopo aver fatto la caratterizzazione del carico, vero?

Certo che per il 4 la vedo sempre + dura e spero davvero che si decidano a concederci una data a fine mese (specie con questo cavolo di progetto 1 che ci sta facendo perdere un botto di tempo solo per fare un lavoro che nel progetto 2 è "gratis"!)

Ciao e.. let's keep in touch!


1) il #richieste per sessione secondo me è specifico della generazione dei dati perchè ogni utente apre una sessione, per ogni sessione vi è un num di richieste ben preciso, per ogni richiesta viene prodotta una pagina web, ogni pagina web avrà all'interno una serie di risorse embedded di una data dimensione.
2) per la gaussiana stiamo avendo un bel pò di problemi.
3) il 4 è veramente dura però noi stiamo facendo il possibile per fare in tempo...in ogni caso speriamo anche in un appello a fine mese (anche se è una sfacchinata a fine luglio)


ma quindi voi, se ho ben capito, state cercando in pratica di generarvi un logfile usando tutte le distribuzioni? E' cosi'?
grazie ciao

Si prega Accedi o Crea un account a partecipare alla conversazione.

Di più
17 Anni 5 Mesi fa #76115 da Lavinia Laurenti
Risposta da Lavinia Laurenti al topic MMI

ma quindi voi, se ho ben capito, state cercando in pratica di generarvi un logfile usando tutte le distribuzioni? E' cosi'?
grazie ciao


yes. voi come fate?

Si prega Accedi o Crea un account a partecipare alla conversazione.

Di più
17 Anni 5 Mesi fa #76242 da Lavinia Laurenti
Risposta da Lavinia Laurenti al topic MMI

2) Abbiamo notato che per la dimensione delle pagine html la lognormale non è mai superiore a 10240 quindi la pareto non viene mai usata, i valori vengono sempre intorno al valore 9. Non sono pochi 9 byte? Anche gli Object vengono quasi tutti di circa 10 byte


noi continuiamo ad avere questo problema e casalicchio ci ha detto che anche altre persone hanno riscontrato un prob simile e ci ha suggerito di utilizzare librerie esterne e non csim per la generazione dei dati. qualcuno di voi le ha utilizzate?e se si, quali?grazie

Si prega Accedi o Crea un account a partecipare alla conversazione.