lunedì 7 agosto 2006

Classifiche di blog e riflessioni

Le novità in circolazione impongono di ritornare sull’argomento classifiche per i blog. Da tempo stiamo lavorando a una classifica che prenda in considerazione non solo Technorati ma anche altre fonti (Google, Yahoo!, Bloglines ecc.). Generare un algoritmo che dia risultati privi di anomalie macroscopiche non è facile. Ad esempio i dati di Alexa (che sono condizionati dall’installazione di una barra da parte dell’utente), se inclusi nell’algoritmo, generano grossi problemi.

Altri hanno ripreso a “misurare” i blog, portandosi però dietro vecchi problemi. Partiamo dal minore. Nel creare una classifica è poco raccomandabile partire da una base numerica di blog limitata, per almeno un motivo: la classifica non sarà in grado di tenere conto dei meme (che fanno acquistare molti link in periodi di tempo brevi). Faccio un esempio concreto: se ho ben capito Alex sta creando tanti blog-civetta su Blogspot per hackerare la sua posizione nelle classifiche (credo che lo faccia a scopo provocatorio e di test); la classifica di BlogItalia, comprendendo quasi 8000 blog anche senza link, era già “reattiva” ieri, mentre l’altra non riportava il blog in ascesa.

Eppure il problema maggiore che ci si trova ad affrontare è un altro: si possono escludere dei blog per il loro contenuto? La classifica aggregata esclude i blog che forniscono template e secondo me è un errore. Il blog è un CMS, quindi se io volessi riportare ogni giorno (esempio) il mio abbigliamento e i lettori mi leggessero e linkassero non trovo motivi per un’esclusione. Semmai il punto è un altro: alcuni blog di template richiedono come condizione necessaria per l’utilizzo dei template che venga inserito un link. Potrebbe essere questo un criterio di esclusione, vista la “non-volontarietà” (o “libertà condizionata”) del link? In linea teorica sì, però una riflessione approfondita ci porta a chiederci se tutti i link inseriti in altri casi siano “liberi”. I link dei nostri blogroll non hanno tutti lo stesso peso: alcuni sono inseriti per stima, altri per scambio, altri per i motivi più disparati. In questo contesto, nell’impossibilità di tenere conto delle motivazioni del singolo link, credo che non si possano effettuare esclusioni perché risulterebbero arbitrarie. Il criterio (discutibilissimo) è “un link = un punto”, tanto più che il risultato finale, la classifica, non sarà rappresentativa e andrà considerata semplicemente uno strumento orientativo. Assolutamente errato, a mio avviso (e anche un po’ “ego-élitista”?), escludere i blog che non hanno un feed.

AGGIORNAMENTO: Ludo faccio appello a te per rendere open source l’applicazione che effettua le interrogazioni via API e genera la classifica in modo da poter adottare criteri diversi dai tuoi. Lo farai? ;)

AGGIORNAMENTO 2: come prevedibile ha detto di no.



TRACKBACK TRACKBACK


Il TrackBack URL per questo post è

http://www.deeario.it/2006/08/07/classifiche-di-blog-e-riflessioni/trackback/


COMMENTI COMMENTI


  1. lunedì 7 agosto 2006

    Tony..in privato ti ho mandato una seconda mail, non lo faccio qui.. sai com’è.. meglio dirtele in privato certe cose

    Separatore
  2. lunedì 7 agosto 2006

    E perché? Parla, dai. :)

    Separatore
  3. lunedì 7 agosto 2006

    Finalmente un post… era da un pezzo che non ne vedevo su questo blog, il lavoro fatto da Alex e da Me è una piccola dimostrazione di come certi network e relativi autori vivano grazie all’autoreferenza dei link..
    In sintesi linkandosi alcuni autori non si accontentano di avere l’ego appagato ma ritengono anche di essere autorevoli, ma non solo si mettono anche a scrivere libri, fare conferenze e similaria…ed infine a pontificare…
    Ti inviterei a visitare i link nella top100 (tua o di ludo) e vedrai come scritto nel post sui nostri siti, è cosi.. poca qualità, molti link tra amci..commenti a zero..

    Separatore
  4. lunedì 7 agosto 2006

    Chiariamo: io scrivo il blog in primis per me e quindi affermo il diritto di scrivere ciò che mi pare. Corto, lungo, serio, faceto, argomentato o linkato che sia.
    L’autoreferenzialità non mi pare quella che intendi tu e se qualcuno ci invita ai convegni e riteniamo opportuno andare non credo ci siano ostacoli.
    I cluster sono una cosa comunissima nelle reti e pochi commenti non sono univocamente interpretabili come fai tu. Lurkare non è intrinsecamente un male.

    Buona lettura. :)

    Separatore
  5. lunedì 7 agosto 2006

    Ma chi ti vuole togliere la libertà di scrivere cio che ti pare.. vai dove ti pare…lungi da me.
    PS: A proposito di cluster e lurkare, La bolla 1.0 è già esplosa, non è che stai respirando ancora i fumi?

    Separatore
  6. lunedì 7 agosto 2006

    Classifiche di blog e riflessioni
    Qualche commento veloce sull’ultimo post di Tony Siino (cui per comodità ho copiato il titolo) sulle classifiche di blog.

    Nel creare una classifica è poco raccomandabile partire da una base numerica di blog limitata, per almeno un motivo: la c…

    Separatore
  7. lunedì 7 agosto 2006

    Tony, dici delle cose condivisibili ma tralasci, secondo il mio personalissimo punto di vista, alcuni punti fondamentali:
    primo: una classifica dichiara U]cosa si propone di misurare; il blog più visitato, quello più autorevole, quello più votato, etc.
    Senza questa precisazione iniziale di quale classifica stiamo parlando?
    secondo: con che criterio selezioni i blog da inserire in classifica? la cosa è tutt’altro che secondaria sia perchè banali questioni di tecnicismi possono, per esempio, escludere interi blocchi di blog sia perchè dovresti definire a priori con che criterio distingui ciò che è blog da ciò che blog non è; e su questo punto la questione si fa pelosa assai; autolimitarsi a blog secondo criteri più astrusi (es. la presenza o meno dei feed, cosa per me sbagliata in linea di principio: è come se in una classifica di auto escludessi tutte quelle senza abs) mi pare un rimedio peggiore del male.
    terzo: ci sarebbe da discutere sulla validità dei meccanismi di calcolo della classifica; Alexa e Technorati prendono delle sonore cantonate e falsano i risultati, per esempio
    Ma questo del meccanismo di calcolo è un punto minore; se chiarissi i primi due punti avresti già raggiunto un risultato da premio ;-)

    Carlo

    Separatore
  8. lunedì 7 agosto 2006

    Grazie per il tuo commento Carlo.

    Quanto al primo punto le classifiche contano i link perché il dato che abbiamo è quello. Caricarlo di significati è per me un buon modo per finire per sbagliarsi.
    Per la selezione dei blog su BlogItalia (la classifica è comunque un servizio per gli iscritti) il criterio è l’iscrizione: chi è iscritto a noi e a Technorati viene “misurato”. Non è il migliore criterio forse, anzi se dovessi suggerirne uno penso al respondent driven sampling. Non proseguo per non entrare in questioni metodologiche “hard”.

    Separatore
  9. lunedì 7 agosto 2006

    Il blog è un CMS?!
    Oggi è ripartito alla grande il meme l’algoritmo per la classifica dei blog è fallace perchè [aggiungete la vostra…] .
    Partendo dal presupposto che è tendenzialmente vero, in quanto creato da esseri umani, perchè prende dati statistici, qu…

    Separatore
  10. lunedì 7 agosto 2006

    Guardate questo blog in top100:
    Il mio amico Antonio De Chiara, chiedeva in un commento come fosse possibile che un blog con una media inferiore a 400 visite giornaliere e con commenti quasi nulli fosse in top100 ( cliccate sul logo shinistat ):
    http://www.webdomus.it/tao/?p=709

    Oggi dopo la pubblicazione dell’articolo oltre a non aver mai risposto ha censurato la domanda commento del povero Antonio De Chiara.

    Separatore
  11. lunedì 7 agosto 2006

    Non entro nel merito del discorso tecnico..la posizione in classifica del mio blog la seguo distrattamente, la verifico cioè ogni tanto senza dargli molto peso, perchè credo che il valore di un blog, ed il suo potenziale interesse per eventuali inserzionisti pubblicitari, dipende più dall’avere un pubblico omogeneo, piuttosto che un’audience vasta ma assortita in modo dispersivo..

    non posso fare a meno però di notare che nel secondo trimestre del mio blog, nato a gennaio, ho raddoppiato i contatti rispetto al primo, ma Techonati fa scendere il mio blog dalla centoventesima posizione circa del primo trimestre alla circa 300esima attuale.

    Chiedo agli esperti: come funziona il meccanismo? meno lettori si hanno e più si sale? E viceversa?

    Già che ci sono, segnalo un’ altra incongruenza: come fanno alcuni blog appartenenti a network a spiccare nella classifica “combinata” di tua creazione, se non sono i primi neppure nel loro circuito?

    Se non sono primo su dieci, come faccio ad essere primo su mille? (mentre gli effettivi primi di questi network non appaiono neppure nei bassifondi della classifica generale?)..

    posso fare questo discorso serenamente e super partes perchè purtroppo non mi sto riferendo al mio blog: molti colleghi di Blogosfere hanno molti più contatti di me..

    Senza entrare nel tecnico, però, mi sembra che gli esempi che ho citato siano l’harakiri della logica più elementare!!

    Separatore
  12. lunedì 7 agosto 2006

    Ma se stiamo parlando di posizioni basate sul numero dei link che c’entrano commenti e visite?

    Separatore
  13. martedì 8 agosto 2006

    Mai parlato di commenti. Ho sollevato un problema di carattere generale: la sensazione che i risultati sono dopati, alla luce di incongruenze evidentissime e facili da rilevare anche da un non tecnico come me. Dagli esperti mi aspetto spiegazioni scientifiche, ma per stigmatizzare che due più due non fa sette non ho bisogno della laurea in informatica o matematica…

    Separatore
  14. martedì 8 agosto 2006

    Beh Ernesto…sono meno linkati evidentemente. Le query a Technorati sono riproducibili da chiunque e quindi il processo è assolutamente trasparente.

    Separatore
  15. martedì 8 agosto 2006

    algoritmi? anomalie? sono ben altre le misure che ci interessano carino!

    Separatore
  16. martedì 8 agosto 2006

    Ma perchè prima di fare appelli dall’alto dei tuoi seminari sull’open source a Palermo non rendi pubblico Blogitalia? Sarebbe un primo passo no?

    Separatore
  17. martedì 8 agosto 2006

    Non mi pare che BlogItalia sia privato. ;)

    Separatore
  18. martedì 8 agosto 2006

    La pena della classifica
    Ieri è partita una divertentissima discussione tra sordi dedicata alla spinosa questione delle classifiche dei blog. Si parla, guardacaso, di affidabilità delle fonti (i blog stessi), di definizione di blog e ci si rintuzza tra gelosie varie e quant&#8…

    Separatore
  19. martedì 8 agosto 2006

    a dire il vero io rientro nelle statistiche di alexa e non mi pare di avere mai aggiunto nessuna “alexa bar”.

    Separatore
  20. martedì 8 agosto 2006

    Mau tu rientri come tenutario di blog. I dati del tuo blog vengono contati in base a quanto lo visitano gli utenti con le barre installate.

    Separatore
  21. martedì 8 agosto 2006

    In caso il trackback non arrivi e ti fischiano le orecchie, passa da me ;-)

    Separatore
  22. martedì 8 agosto 2006

    Bene mi dai l’indirizzo ftp che scarico il sorgente allora..

    Separatore
  23. martedì 8 agosto 2006

    Eccoti l’indirizzo: http://ftp.nonèmicaunprogramma.blogitalia.it. ^__^

    Separatore
  24. martedì 8 agosto 2006

    So che non è un programma è un’applicazione web.
    Visto che blogitalia dici che non privato sarebbe giusto che rendi pubblici i sorgenti,no? magari la comunità open che tu conosci attraverso la frequentazione dei due seminari a Palermo lo può migliorare.. no? oppure il concetto open per te è “quello che è mio è mio, quello che è tuo è mio”..

    Separatore
  25. martedì 8 agosto 2006

    Scusami ma adesso ho la riunione della setta dei blogger ma linkonici con Mantellini e gli altri. A dopo! :)

    Separatore
  26. martedì 8 agosto 2006

    Vedi tony, fare lo sbruffone e prendere in giro, non rispondere alle domande ed evitarle, non ti fanno onore. mi sarei aspetto almeno un contradditorio, si vede che è il tuo modus quando capisci che non hai argomenti per pontificare…

    Separatore
  27. martedì 8 agosto 2006

    Non è che non ti voglia rispondere. Per quanto mi riguarda il codice che genera le pagine di BlogItalia te lo posso pure dare ma senza dati che te ne fai? Non voglio continuare questa discussione a due perché la trovo balneare e inutile per come è declinata e da un po’ di interventi non ti poni garbatamente e sei cospirazionista…e poi, come ti ho detto, siamo in riunione con la setta ché dobbiamo decidere a morra cinese a chi toccano i link oggi! Un po’ di tatto! :P

    Separatore
  28. martedì 8 agosto 2006

    Tu incomincia a rendere veramente open tutta l’applicazione blogitalia, poi deciderò magari passo la serata a leggere codice anzichè la gazzetta.. come sai non è importante cosa ne faccia.. lo pubblichi con la sua bella licenza e vedrai no? Poi come lo scarico io potranno farlo miliardi di persone..cosa fai chiedi a tutti cosa ci fanno?Non lo hanno spiegato ai due seminari di palermo, come funziona l’open source?
    Per quanto riguarda la mancanza di rispetto delle persone ..comunque vedo che continui,eppure sei siciliano e qualcosa nel DNA dovresti ancora averlo. Sai che nn c’è nessuna teoria dei blogcospiratori o altre fesserie…se pensi di deligittimare chi la pensa diversamente da te,dileggiandolo, vai avanti..pensavo di trovare una persona preparata ed in grado di fare un confronto costruttivo…ma sembri piuttosto il classico “personaggio ” tutte chiacchere e distintivo…
    Resto in attesa dell’indirizzo del server ftp

    Separatore
  29. mercoledì 9 agosto 2006

    yup, me ne sono accorto dopo che la barra serve a chi mi contatta per indicare ad Alexa che mi ha contattato. Mi sembra un sistema strano per calcolare la popolarità, ma chi sono io per giudicare?

    Separatore
  30. giovedì 10 agosto 2006

    Apre il blog della Top100 italiana
    Arriva finalemente il blog della “Statistica dei blog italiani” (ex Top 100) di Ludovico, proprio mentre si scatenano le polimiche.
    C’è chi ne mette in dubbio la buona fede e tenta di sabotarla a scopo dimostrativo, chi ne fa un’analisi di orientamento p

    Separatore

Scrivi un commento


Chiudi
Invia e-mail