altre destinazioni

vedi anche

ultimi post

ultimi commenti

tag principali

categorie

archivi

powered by

  • WPFrontman + WP

friends

copyright

  • © 2004-2011
    Ludovico Magnocavallo
    tutti i diritti riservati

Diamo un'occhiata alla lista dei blog

18 luglio 2006

61 commenti

tag

categorie

Anche se mancano ancora un sacco di funzionalità (feed, favicon, statistiche sull’andamento storico, tag, commenti, ecc.), ho messo in linea la nuova applicazione sulle statistiche dei blog italiani in modo da poter discutere e calibrare i dati. I settaggi utilizzati sono:

  • serie di valori su scala logaritmica, come consigliato da Luca e Fullo
  • score composti applicando pesi diversi ai valori delle singole serie:
    • Technorati: score * 1.5
    • Pagerank: score * 1
    • Alexa, Google, Google Blog Search, Yahoo!: score * 0.5

Sono ovviamente privilegiati i blog che hanno punteggi su tutte le serie, cosa che mi sembra positiva dato che indica una maggior completezza ed affidabilità ad esempio nel Pagerank, o un archivio ampio nei backlink di Yahoo! ecc. Sono penalizzati alcuni blog che non hanno un dominio loro, e i blog di splinder che non hanno punteggi individuali su Alexa, e anche questo è secondo me un fattore positivo, dato che a prezzo di qualche piccola “ingiustizia” privilegia i blog più “curati” con una identità e una infrastruttura più solida.

La lista risultante è quindi sensibilmente diversa da quella basata sul solo rank di Technorati. A me convince molto di più, mi piacerebbe sapere cosa ne pensate. Non risparmiate commenti, correzioni e segnalazioni di blog da aggiungere (sopo aver verificato che riescano ad entrare almeno in una delle sotto-liste).

61 commenti

  • Andrea Beggi
    18 luglio 2006 #

    Mi sembra manchi il mio concittadino Andrea Baresi: http://www.webdomus.it/tao/

  • eìo
    18 luglio 2006 #

    non mettetelo andrea! che a me piace, il numero 42! :)

  • eìo
    18 luglio 2006 #

    manca anche granieri.

  • zen
    18 luglio 2006 #

    Uops… forse non dovevo cliccare su uno dei link… Django si e` arrabbiato, e mi ha sbrodolato addosso il debug :) Gli manca il template per il 404? (404.html)

  • ludo
    18 luglio 2006 #

    L’avevo scritto che mancano ancora tre quarti delle funzionalità. Comunque ho aggiunto i template per le pagine di errore, almeno ora il messaggio è più umano. :)

    Aggiunti i blog segnalati, grazie!

  • Luca Zappa
    18 luglio 2006 #

    Ludo bellissimo lavoro … complimenti!!!

  • ludo
    18 luglio 2006 #

    Uhhh grazie, ma siamo solo al 10-20% delle funzionalità che ho in mente. Luca, secondome dovresti fare un po' di ping a Technorati per sbloccarti, l'ultimo aggiornamento del tuo blog risale a 1 anno e 3 mesi fa… :)

  • Luca Zappa Web Corner
    18 luglio 2006 #

    Ludo ha rivisto/rifatto l’applicazione dei top100 blog italiani.
    Qui è possibile discuterne per vedere di migliorarla/tararla.
    Complimenti Ludo!
    Link: Statistiche dei blog italiani

  • Pandemia
    18 luglio 2006 #

    Ludo ha aperto al pubblico una nuova versione della sua Top 100 Blog Italia. Questa volta non c'

  • Matteo
    18 luglio 2006 #

    Gran bel lavoro… :D

  • Samuele
    18 luglio 2006 #

    E' difficile creare una classifica del genere. Alexa funziona poco e male. Però è sicuramente più completa di molte altre… perfettibile comunque…

  • Mauro Lupi
    19 luglio 2006 #

    Magari dico una scemenza, ma Alexa becca i dati solo del dominio di 2° livello. Altri (penso ad esempio a Leonardo.blogspot.com chè il primo 3° livello nella lista) non viene beccato perché terzo livello, non perché non rilevante. O no? il dato può essere utile per chi viene rilevato ma non può incidere sulla correlazione con gli altri. Per il resto: ottimo lavoro!

  • ludo
    19 luglio 2006 #

    Mauro grazie dei complimenti. Alexa "dovrebbe" supportare i domini di 3o livello, in realtà non lo fa e quindi li escludo io a mano. Il peso assegnato ad Alexa è basso, un terzo di Technorati, ma mi sa che lo abbasserò ancora perchè sfalsa un po’ le cose.

    Sono però abbastanza convinto che preso a piccole dosi sia un indicatore utile delle dimensioni di un blog, e credo anche che in qualche modo vada "premiato" chi ha fatto lo sforzo di prendere un dominio di 2o livello per il proprio blog.

    Vediamo come va nei prossimi giorni, e se le tarature dei pesi migliorano situazioni come quella di Leonardo.

  • Vittorio Pasteris
    19 luglio 2006 #

    Il lavoro è eccellente, per quel che contano grossi complimenti !!! mi resta un dubbio perche occorre aggiungere a mano i blog non segnalati, come ricavi i dati grezzi dei diversi "fornitori" ? VP

  • ludo
    19 luglio 2006 #

    Occorre aggiungerli a mano per contenere la lista e attuare un minimo di filtro, dato che gira tutto su un vecchio Celeron che già ospita un po’ di blog, compreso questo. :)

    I dati li prendo tramite le API esposte da Technorati, Google, Alexa ecc. L’aggiornamento e il calcolo dei rank è un processo che, per ora, lancio a mano ogni mattina. Quando ho finito le funzionalità pubbliche aggiungo qualche opzione da linea di comando e lo metto in cron.

  • Matteo
    19 luglio 2006 #

    Personalmente - andrò controcorrente - ma io mi fido molto meno di Technorati (rispetto ad Alexa, ad esempio, pur con i suoi limiti). Le segnalazioni di technorati sono troppo esposte agli umori dei tenutari di altri blog. Insomma definiscono la popolarità di un blog su altri blog e non sulla rete. Quindi, a mio parere, lo pesi troppo rispetto al pagerank. Poi Ludo, stavo pensando, credi che sia possibile integrare i dati di feedburner, qualora presenti? Credo che un indicatore importante sia il numero di abbonati RSS, ovvero lo "zoccolo duro" di un blog.

  • Vittorio Pasteris
    19 luglio 2006 #

    concordo sull'ipotesi di usare gli RSS salvo crei problemi tecnici: il problema è come pesarli … piccola cadidatura anche per bloglines … VP

  • Salvatore Aranzulla
    19 luglio 2006 #

    Davvero ottima: complimenti.

  • Matteo
    19 luglio 2006 #

    @Vittorio Pasteris: Penso che considerare Bloglines sia un po' come voler considerare quanti utenti usano Firefox per visitare il tuo sito. Anche se simile al discorso FeedBurner non è cmq la stessa cosa.

  • eugenio
    19 luglio 2006 #

    Che bello svegliarsi e scoprire che ce' una classifica che ti dice che sei 20esimo! ma ho vinto qualcosa? :-) Complimenti per l'applicazione!

  • fullo
    19 luglio 2006 #

    pork.. mi stai sul collo.. devo assolutamente tirare fuori un web-servizio anche io prima di essere sopraffatto ;)

    scherzi a parte di technorati che valori hai poi usato? solo gli imbound link o anche il ranking?

  • Vittorio Pasteris
    19 luglio 2006 #

    Ok matteo bloglines è un po' particolare, resta il problema di "pesare" i RSS rispetto agli altri strumenti

  • ludo
    19 luglio 2006 #

    Hahahah fullo il sorpasso è imminente :) Di Technorati uso inboundblogs, che è poi il valore usato dal ranking.

    Matteo: concordo che Technorati non è il massimo, ed è troppo sensibile ai meccanismi di gruppo. Però è anche l’unico dato insieme al Pagerank (e forse ai Google backlinks che però tengono conto anche dei propri post e privilegiano chi pubblica molto) in grado di dare una vista d’insieme su tutti i blog. Il Pageranl poi è troppo omogeneo, funziona bene come correttivo ma non è abbastanza per stilare un ranking. Provo comunque nell’aggiornamento di oggi ad alzare il peso del Pagerank e abbassare quelli di Yahoo! e Alexa, che non tutti hanno.

    Riguardo a Feedburner, anche ammesso che espongano i dati tramite API pubbliche (non credo) è comunque un servizio opt-in, quindi non va bene per la classifica aggregata: mentre Alexa e Yahoo! almeno esprimono un giudizio sulla qualità dell’infrastruttura del blog (dominio di primo livello, traffico oltre una certa soglia, ecc.) Feeburner svantaggerebbe tutti quelli che vogliono esporre i propri feed in proprio. Bloglines è un altro discorso, dato che è un servizio abbastanza diffuso da poter essere considerato come indicatore. Il problema è che ogni blog può avere vari feed, e tenere traccia di tutti è un po’ complicato. Vedo di controllare nei prossimi giorni.

  • Matteo
    19 luglio 2006 #

    Uhm, capisco le tue obiezioni ma sono perplesso. Tu gà operi una serie di pesature di tipo opt-in (sulla scelta del tipo di dominio, ad esempio). Siamo d'accordo che può essere particolarmente indicativo monitorare la diffusione degli RSS? Se la risposta è sì, discutiamo poi del come farlo. A mio avviso l'uso di feedburner è piuttosto indicativo sia per diffusione sia per definire (non me ne voglia chi non lo usa) la qualità delle informazioni e dei servizi offerti da quel blog. Feedburner è una sorta di standard de facto in questo. Insomma, il parametro si affianca a quello dell'uso del dominio di 3° livello. E le API effettivamente consentono di monitorare il numero di abbonati. Su bloglines invece non sono assolutamente d'accordo. E' sì diffuso ma è assolutamente in disarmo. Alzi la mano chi non ha un account bloglines non aggiornato e ora usa altri aggregatori? O una volta che siete passati ad altro (es. Rojo) avete poi tenuto allineati i diversi OPML?

  • ludo
    19 luglio 2006 #

    Matteo, ti rispondo "a caldo" penso però che sarebbe interessante avere un confronto collettivo su pesi e misure, che sia un po’ più usabile dei commenti di questo post. :)

    Per opt-in intendo che se non vuoi usare FeedBurner (io ad esempio non voglio, le statistiche di accessi me le faccio da me) avresti un impatto negativo sulla classifica. Impatto che non rispecchia una minore qualità del tuo blog rispetto a chi usa FB, ma solo una scelta diversa e sarebbe quindi una penalizzazione ingiusta, anzi una pubblicità impropria per FB. Su FB al massimo si può fare una classifichetta "blog che usano FB", ma non potrà mai essere unindicatore globale.

    Al contrario, se hai fatto la fatica e hai speso i soldini per dare al tuo blog un dominio di primo livello, invece che affidarti ad uno dei tanti servizi di mass-blogging, secondo me è giusto che le classifiche lo riflettano. Non c’entra (forse) con la qualità dei contenuti, ma con la cura dedicata al blog si, e la qualità dell’infrastruttura tecnica. In questo senso, sia pure per pochi centesimi di punto, Yahoo! e Alexa hanno un ruolo che FB non può avere (anzi ha il ruolo opposto).

    Allo stesso modo, se potessi avere un indicatore per la qualità e la cura grafica dei blog e uno per l’usabilità li metterei dentro e anzi gli darei un peso abbastanza "pesante". Molti dei blog che vedo in giro con template raffazzonati o che impazziscono in un browser diverso da quello dell’autore mi fanno cadere le braccia, così come i commenti che si aprono in finestrine popup microscopiche, ecc.

    Sono convinto che la qualità di un blog non sta solo nei contenuti, nel traffico, nel numero di link o nell’effetto community, ma debba essere un indicatore globale in cui entrano appunto anche l’usabilità, la raggiungibilità/visibilità (dominio), il piacere estetico, ecc.

    Per Bloglines ho verificato, e non è fattibile per problemi tecnici.

  • Matteo
    19 luglio 2006 #

    Grazie Ludo, sei stato chiaro e condivido il senso di quello che hai scritto.

    Concordo anche sul fatto che possa essere interessante trovare un luogo ad hoc per discutere non tanto della classifica e dei pesi e delle misure, quanto delle metriche per la valutazione della qualità di un blog.
    La classifica che hai stilato potrebbe essere la base di un nuovo servizio di valutazione/rating.

    Un forum? Un wiki? Uno Skypecast?
    Io molto sono interessato.

  • Matteo
    19 luglio 2006 #

    PS. Ciò non toglie che al momento un indicatore estremamente importante sulla popolarità di un blog (la diffusione RSS) non venga ancora considerato (e forse non potrà essere considerato). :P

  • [...] Ludo sta nuovamente lavorando alla sua classifica top100. Qui invece impazza la discussione.Più che la classifica in sè credo che il lavoro di Ludo meriti una segnalazione perchè si tratta di un valido esempio di classifica “pesata”, ovvero dove il risultato finale è il frutto della somma mediata e calibrata di più indicatori (pagerank, technorati, alexa, backlinks google e yahoo, ecc). Credo che una volta calibrato tutto il sistema di pesi e contrappesi il suo algoritmo possa diventare un punto di riferimento non solo ai fini della classifica ma anche per una valutazione assoluta della popolarità del proprio blog. Penso magari a un badge o a un semplice “qix rating” …Attualmente il mio QIX è 2.47390 (96esimo… destinato a uscira presto dalla classifica, ovviamente!!!) Probabilmente ti può interessare leggere anche: [...]

  • Tambu
    19 luglio 2006 #

    HEY! manco anche in questa!!! ma mi stai sabotando??? :P :P

  • ludo
    19 luglio 2006 #

    Tambu aggiunto, sei un paio di posizioni sopra a Qix. :)

  • Luca Conti
    19 luglio 2006 #

    Mi inserisco sul discorso Feedburner-Bloglines.

    Compareblogs.com usa proprio Bloglines e Feedburner per trarre dati storici di confronto fra i vari blog inseriti. Ognuno puo suggerire blog con lingua, paese e indirizzi dei feed.

    Fernando Plaza li inserisce nel motore e dopo qualche giorno sono consultabili. Dopo aver inserito Pandemia ho indicato anche Macchianera e Beppe Grillo per poter avere un confronto con i blog internazionali.

  • ludo
    19 luglio 2006 #

    Luca, ripeto le miei osservazioni su Feedburner. Compareblogs non mi piace tanto, è troppo complicato, quello che interessa a me è dare a colpo d’occhio una visione panoramica sulla blogosfera che sia il più oggettiva possibile.

    Per Bloglines Matteo mi ha puntato nella direzione giusta, il problema è che il servizio è poco affidabile:

    * pandemia ad esempio non risulta avere lettori

    * qix risulta solo con il feed rss e non con quello atom, e vengono aggiunti i lettori del mio vecchio blog inglese che non c’entrano nulla

    Vedrò nei prossimi giorni se riesco a cavare fuori da Bloglines qualcosa di più stabile.

  • [...] Sarà per questo che non mi meraviglio di essere, credo, tra i pochi a non unirmi al coro di elogi verso la nuova classifica dei primi 100 blog elaborata da ludo di qix. [...]

  • Luca Conti
    19 luglio 2006 #

    Ludo, il mio voleva essere un consiglio nel caso volessi intraprendere quella strada, tutto qua.

    Comprendo i tuoi dubbi e li condivido nel momento in cui dici che Feedburner non ce l’hanno tutti e che Bloglines fornisce dati parziali. Per parlare di feed credo siano i maggiori riferimenti, però.

  • ludo
    19 luglio 2006 #

    Luca, sarebbe bello avere delle statistiche affidabili sui feed ma mi sembra difficile. Se riesco a capire perchè Bloglines ha dei "buchi" (come ad esempio per pandemia) lo userò sicuramente.

  • Qix.it
    19 luglio 2006 #

    Prima di decidermi ad aggiungere alla base dati un campo (anzi due) per i feed di ogni blog, ho fatto girare uno script per vedere quanti feed non hanno un tag che permetta l’autodiscovery (la lista più giù) e mi sono accorto che alcuni blog, s…

  • CarloB
    19 luglio 2006 #

    Queste classifiche lasciano il tempo che trovano. E POI COSA VEDO!!! La mia azienda ha sponsorizzato proprio un blog che appare nella vostra classifica e dopo un mese abbiamo chiesto la rescissione del contratto. Abbiamo riscontrato un numero di accessi pari ad 1/5 (1/5 per davvero, no tanto per dire) di quelli che riportavano i loro grafici presentati in fase di contratto. Per non parlare dei click: 10/12 di media al giorno, roba da sitarello amatoriale. Il bello è che li ho presentati io proprio per i dati che leggevo in giro. I capi mi volevano linciare! Un'altra volta, un blog che si trova nelle primissime posizioni della vostra classifica ha scritto un post linkando la pagina di un nostro prodotto: abbiamo ottenuto scarsi 10 accessi da quel link. Da un link pubblicato su un blog di una ragazzina abbiamo ricevuto oltre 200 accessi in un solo giorno! (tanto per chiarire, in azienda mi occupo del settore informatico) Diciamoci la verità: ci sono blog che non vengono menzionati mai che stanno fuori dal giro e che hanno una marea di lettori e di commenti. Se non vengono inseriti come fate a calcolare il loro "rank"? Un blog come pulsatilla.splinder.com (tanto per fare un esempio) supera per numero di lettori il 70% dei blog presenti in questa classifica. Per di più validissimo per stile e linguaggio. Io ogni giorno trovo qualche blog sconosciuto con post che arrivano a superare i 100 commenti. Se quel blog di cui conosco perfettamente le performances (ovviamente avevamo l'accesso alle statistiche per il controllo delle impressions) si trova nella prima pagina di questa classifica, bè allora c'è qualcosa che non funziona nella blogosfera italiana.

  • Matteo
    19 luglio 2006 #

    "tanto per chiarire, in azienda mi occupo del settore informatico…"

    Mettiamo i puntini sulle i… ;)

  • baldo
    19 luglio 2006 #

    come faccio ad essere "classificato" con il mio blogghettino che mi da tante soddisfazioni (forse non in campo italiano o forse non paragonabili ad altri blog)???

  • ludo
    20 luglio 2006 #

    CarloB grazie, un commento denso di riflessioni e spunti interessanti, basate su dati oggettivi e verificabili…

    Baldo, non puoi: il tuo blog è scritto in inglese. Peccato perchè ha un bel design (dico sul serio). :)

  • Mauro Lupi
    20 luglio 2006 #

    Su Yahoo! e Google la ricerca è sulle versioni .it o .com?

  • ludo
    20 luglio 2006 #

    Sulle versioni .com, in effetti potrei aggiungere anche .it, credi che valga la pena?

  • Mauro Lupi
    20 luglio 2006 #

    Più che aggiungere, potrebbe aver senso sostituire. Strano che il mio blog non risulta avere link da Y! mentre invece ne ha. Usi le API o fail il parser di una query?

  • fullo
    20 luglio 2006 #

    io terrei entrambe le versioni valutando un (0.6*.com + 0.4*.it)

  • Mauro Lupi
    20 luglio 2006 #

    Però trattandosi di blog italiani e considerando che le query fatte sui .it sono (in genere) calibrate sui siti italiani, non pensi che sarebbe meglio invertire le % (dando maggior peso ai .it) ?

  • ludo
    20 luglio 2006 #

    Mauro, uso le API (il link non va ovviamente, manca la mia key e la url). Più tardi provo a fare una chiamata a mano alle API per il tuo blog e ti mando l’XML.

    Anche secondo me avrebbe senso privilegiare i risultati italiani. Vedo di aggiungerli questo weekend.

  • ludo
    20 luglio 2006 #

    Ahhh che idiota, dimenticavo che dalle API di Yahoo escludo i siti che hanno un path nella URL, come il tuo.

    E in effetti chiedo i risultati per l’italia, alla URL della query è attaccato un region=it. cosa che non faccio per Google, e non so neanche se si può fare.

    Le interfacce alle API le ho scritte qualche mese fa, se scoprite che certe limitazioni (tipo il path per Yahoo!) non esistono più o che è possibile restringere i risultati per l’Italia, fatemi sapere.

  • fullo
    20 luglio 2006 #

    mmh.. si.. 0.6* .it e 0.4*.com pero' se non erro il .com è più aggiornato/attento alle modifiche..

  • ludo
    20 luglio 2006 #

    Occhio che adesso Yahoo! ha un peso di 0.125. Da ieri compreso i pesi sono:

    RANKTECHNORATI_WEIGHT = 1.5
    RANKPAGERANK_WEIGHT = 1.5
    RANKALEXA_WEIGHT = 0.25
    RANKGOOGLE_WEIGHT = 1
    RANKGOOGLEBLOG_WEIGHT = 0.5
    RANKYAHOO_WEIGHT = 0.125

    La classifica mi sembra più equilibrata.

  • fullo
    20 luglio 2006 #

    ok pero' quello che intendevo io era RANKYAHOO_WEIGHT * (0.6 * YAHOO_IT + 0.4 * YAHOO_COM)

  • fullo
    20 luglio 2006 #

    e far su una ML per gestire sti discorsi? che seguire 20 feed di commenti non è molto comodo ;)

  • ludo
    20 luglio 2006 #

    Fullo ok, mi sembra chiaro. Il problema è che ora come ora il servizio di Yahoo! dà un errore 503 (Service Unavailable). Non vorrei ci fosse un limite di query giornaliere o un throttle, mi sembrava di no…

  • ludo
    20 luglio 2006 #

    Metto su una ML. Quasi sono i 20 feed (considerando che io non ho il feed di commenti)? :)

  • Matteo Balocco
    20 luglio 2006 #

    Mettimi in ML!!!! :D

  • ludo
    20 luglio 2006 #

    I risultati delle query per il blog corporate di Ad Maiora e per il blog di Mauro Lupi sembrano confermare la possibilità di fare query anche in presenza di un path nell’URL. I dati per it e non it cambiano di pochissimo.

    http://top100.qix.it/media/risultati.xml

    I prossimi interventi in mailing list più tardi.

  • ludo
    20 luglio 2006 #

    Seguendo i consigli di Fullo e Luca ho aperto un gruppo per discutere con più agio

    Blog Metrics Italia

    Sposterei lì le discussioni. Luca, apri tu un thread su categorie/ecc?

  • fullo
    20 luglio 2006 #

    ludo: http://feed43.com/feed.html?name=1477382404835703 il problema è che posso vedere 20 feed per volta e quindi appena superi i 20 commenti mi devo creare una nuova regola ;)

  • .mau.
    20 luglio 2006 #

    con i valori che vedo dovrei essere anch'io in classifica, anche se probabilmente a pagina 2… (per dire, technorati mi dà 49.526 come rank, come travelblog che è 112°. Epperò io ho pagerank 6 e Alexa non so come mai mi manda su…

  • Maxime
    20 luglio 2006 #

    Fico. Quindi praticamente io l'ho preso brutalmente nel di dietro grazie a Google che non si decide ad aggiornare il mio PageRank da 2 ad un valore più veritiero (secondo i siti che calcolano il pagerank reale dovrebbe essere 4 o 5). ;)

  • fullo
    20 luglio 2006 #

    pagerank e technorati non combiaciano tra di loro. Per avere pagerank alto basta avere link da altri siti con pagerank altro.

    Per salire in cima a technorati ne devi avere un bel po’ di link…

    maxime: i pagerank di google vengono calcolati su differenti server, se non erro l’applet di googlebar si connette la prima volta a random su uno dei meno trafficati (e poi usa sempre quello). se molti siti ti danno pr tra 4 e 5 è probabile che effettivamente sia quello il tuo.

  • ludo
    20 luglio 2006 #

    Mau: ti ho aggiunto, al prossimo refresh entri in lista.

    Per tutti gli altri: chiudo i commenti, chi volesse discutere o segnalare nuovi blog lo può fare sulla lista.