altre destinazioni

vedi anche

ultimi post

ultimi commenti

tag principali

categorie

archivi

powered by

  • WPFrontman + WP

friends

copyright

  • © 2004-2011
    Ludovico Magnocavallo
    tutti i diritti riservati

I primi 100 blog italiani

4 novembre 2005

16 commenti

tag

categorie

Raccogliendo la proposta di Luca ho realizzato un elenco dei primi 100 blog italiani secondo Technorati. Di seguito come funziona la classifica, e su che criteri mi sono basato.

Prima di continuare, vi segnalo anche la top 100 di blogitalia, andata in linea dopo la mia (eh sì, la mia era on-line da questa mattina…) ma annunciata per prima a dispetto dei tempi di sviluppo annunciati, che strano… :)

La lista

Il primo approccio, quello di scaricare l’elenco dei blog di Blogitalia (caro vecchio screen-scraping) e usarlo come base, si è presto rivelato impossibile:

  • i blog in lista sono 5800 e Technorati permette un massimo di 500 chiamate alla API in 24 ore
  • l’elenco è incompleto, mancano blog conosciuti
  • un sacco di blog nell’elenco non sono blog, non sono italiani, o sono spam, come ad esempio
    • http://www.chiedere-prestito.info
    • http://it.groups.yahoo.com/group/dig-ita/
    • http://www.ebay.de
    • http://www.andrimail.it/risparmio-carburanti/
    • e altri ancora più comici, mi sa che Toni dovrà dare un bel colpo di spazzola alla lista, o qualcuno prima o poi se ne verrà fuori con un servizio più attendibile (hint, hint…)

Ho deciso quindi di compilare la lista a mano, partendo dai blog che conosco e i loro linkblog, e per ogni indirizzo facendo la ricerca su technorati per estrarre gli indirizzi di chi li linka, per poi ricomnciare il processo. Uno spider umano… Mancano ancora alcuni blog conosciuti, ma il grosso dovrebbe esserci e credo che nel giro di pochi giorni la lista dovrebbe essere abbastanza stabile.

Mi chiedo come fa Blogitalia a fare la scansione di 5800 blog, se siano un blog siti come i miserabili che oggi è in 11esima posizione, e come mai mancano blog come Luca Zappa (in 5a posizione sulla mia lista), Wittgenstein (in 11esima posizione), ecc. Mah…

Criteri di aggiornamento

Per ora la lista è modificabile solo da me, visto che ho iniziato lo sviluppo ieri verso le sei di pomeriggio e il tempo è quello che è. Entro uno-due giorni, metterò on line una form per permettere l’inserimento pubblico di nuovi blog. Date le limitazioni imposte da Technorati, l’aggiornamento della lista funzionerà così:

  • ogni mattina (da domani) i primi 250 blog verranno aggiornati con gli ultimi dati di Technorati
  • a seguire, verranno aggiornati i 100 blog che sono stati aggiornati meno di recente, in modo da permettere a chi è oltre la 100esima posizione di rientrare in classifica
  • durante la giornata, saranno a disposizione 100 inserimenti di nuovi blog
  • ogni sera, i blog dalla 351esima posizione in avanti verranno eliminati dalla base dati, e non potranno essere reinseiriti per una settimana

Questo processo dovrebbe permettere di avere una lista fedele e non troppo chiusa, e di incorporare rapidamente gli eventuali blog ad alto traffico ora esclusi. Se avete consigli, lasciate un commento qui sotto.

Funzionalità aggiuntive

Non facciamo regali alla concorrenza…. Quello che posso dirvi è che fra non molto sarà disponibile l’andamento storico per ogni blog, e un colpo d’occhio sulle variazioni in classifica. Le altre novità, tra cui alcune molto interessanti suggerite da Sasaki nei prossimi giorni…

16 commenti

  • Luca Togni
    4 novembre 2005 #

    Ottimo lavoro.

  • gabryella
    4 novembre 2005 #

    Un blog è sempre e solo un blog,cioè una piccola zona relax per chiunque a manie "da scribacchino"come la sottoscritta,qualunque sia l'argomento che si voglia postare,ora con tutte queste liste che stanno nascendo come funghi,non pensate che potreste essere anche voi fautori "della caccia al blog piu' strafigo e/o piu' letto ,adorato etc etc….Mi sembra che stiamo entrando in zona"reality show"Dio mai lo voglia!!!707babelle1/gabry/babelle

  • eìo
    4 novembre 2005 #

    è davvero un ottimo lavoro. complimenti.

  • PiOvRa
    4 novembre 2005 #

    Mi complimento con te per l'ottimo lavoro. Ho scoperto l'esistenza di questo sito grazie alle statistiche di provenienza che ho nel mio space. E' stato puramente un caso, visto che raramente ci guardo ed ho visto delle visite. Effettivamente, stavo dando un'occhiata su blogitalia e riscontravo questa strana cosa. Negli spazi di MSN italiani, Bruno Berti è il più popolare ed il suo link non è mai apparso nella top 100 di blog italia. Confrontandolo poi con technorati, avevo intuito che c'era qualcosa di errato nei conteggi. Comunque le mie congratulazioni, sicuramente sei messo nei miei link preferiti. Ciao, Mat

  • ludo
    4 novembre 2005 #

    Grazie dei complimenti, che ricambio di cuore. Anche per me questa è stata (è) l'occasione per scoprire blog nuovi, che non avrei mai creduto fossero così popolari.

  • Luca Conti
    5 novembre 2005 #

    @ Piovra

    Bruno Berti l’ho segnalato a Ludo e a Bruno Berti, già ieri, ho anche scritto perche’ si iscrivesse a BlogItalia, per entrare anche in quella classifica, come è giusto che sia :)

    La strana cosa si giustica così.

  • Robinik
    5 novembre 2005 #

    Ottima iniziativa. L’ho rilanciata da me.

    P.S: Vi ho anche scritto una mail ;)

  • giorgio
    5 novembre 2005 #

    i primi 100 "secondo technorati" è ben detto. technorati non funziona bene da tempo, i link sono fatti un po' coi piedi. molti di quelli in lista hanno più link di quelli che technorati gli assegna per via di dissesti successi in passato (tipo link azzerati e cose simili), altri nemmeno indicati ne hanno più di blog presenti. è un'iniziativa lodevole ma per l'oggettività occorre affidarsi ad altri servizi

  • ludo
    5 novembre 2005 #

    Giorgio, se mi segnali gli "altri servizi" provvedo… :)

  • chartitalia
    5 novembre 2005 #

    uhmm… le classifiche, la mia passione; però capisco poco cosa si conteggia: i link al blog? crtierio piuttosto arbitrario; per me una hit parade è per prima cosa basata sugli "hit" quindi sugli accessi; mi confermi che questi sono esclusi e la classifica si basa solo su link? ciao .chartitalia

  • ludo
    6 novembre 2005 #

    La classifica si basa sui dati di Technorati, niente di più niente di meno. Una classifica basata sul traffico è impossibile. Quello che si può fare è integrare i dati di Alexa, che anche se parziali sono pubblici.

  • Julio Alonso
    6 novembre 2005 #

    Ludo, ottima idea ed ottimo sviluppo. Mi piace l’idea di partire di un elenco selezzionato manualmente e fare possibile un’aggiornamento dei blog inclusi in automatico.

    Mi dai una mano e facciamo la medesima cosa per i blog spagnoli?

  • luca zappa
    7 novembre 2005 #

    ottimo lavoro ludo … e poi non so perchè, ma la tua classifica mi piace di più di quella di BlogItalia ;-)

  • viridian
    7 novembre 2005 #

    Ludo, ti faccio anch'io i miei complimenti, per lo sbattimento e per i risultati (e ammetto di essermi stupita alquanto, a trovarmi in classifica!)

  • ludo
    7 novembre 2005 #

    Julio tio ho scritto, quando vuoi sono a disposizione. Tieni conto che i prossimi tre giorni sarò in giro.

    Luca grazie, anche a me piace di più :) E sono in arrivo altre novità. Come si suol dire, stay tuned.

    Viridian, grazie e ricambio i complimenti per il sito.

  • Mr Reset
    8 novembre 2005 #

    L'idea della classifica mi piace, per due motivi: tiene conto di dati oggettivi e quindi non ci sono! Ma va benissimo così. Bel lavoro.