Johan Larsson

Om bloggar, internet och annat.

Posts Tagged ‘spam’

Om Knuff.se, Twingly.com och bloggsökmotorer i allmänhet

Posted by johan på 23 januari, 2008

Efter att ha läst om den nya versionen av Twinglys globala bloggsök

Instead of trying to index every blog in existence and then removing spam via black lists and other methods, they are limiting the blogs they [Primelabs/Twingly] monitor to those that are proven to be legitimate. They started with a small list of known blogs, and then spidered out from there based on links to other blogs. The assumption, which is fairly sound, is that good/real blogs will not link to spam blogs. The end result is a white list of real blogs that are indexed – everything else is ignored.

…så kanske det är dags att avslöja, för de som ännu inte har listat ut det, att det är exakt så knuff.se har fungerat under de senaste åren. Det är en mycket bra metod för att få grundplåten till att slippa många blah-bloggar och rena spam-bloggar (tyvärr på tillväxten även här i Sverige). Den största anledningen till att jag inte uttryckligen har förklarat det tidigare har varit att jag är extremt trött på de som försöker kopiera allt det uppenbara rakt av (Knuffportalen) istället för att försöka göra något nytt och annorlunda som vi alla tjänar på.

  • Man måste inte pinga nyligen.se för att hamna i bloggsökmotorn knuff.se. Lite AI suger automatiskt in bloggar som anses vara en kvalitativ del av den svenska bloggosfären.
  • Det räcker inte med att pinga nyligen.se för att hamna i bloggsökmotorn knuff.se. Man ska även uppfylla en mängd andra kvalitetskrav (t.ex. inte vara en blogg som enbart är skapad för lite SEO åt en annan vanlig sajt).
  • Huvudsyftet med nyligen.se är tidsinformation. Genom att pinga nyligen.se berättar du att du har skrivit något nytt och knuff.se kan på så sätt mycket snabbare hitta och visa det för intresserade bloggläsare. Istället för att en robot frågar ”har du skrivit något nytt nu?” varje minut så berättar du när du har gjort det.

Aja, här kommer i vilket fall en snabb analys av bloggsökmotorer i allmänhet och Twingly i synnerhet…

  • Twinglys framtida begränsning till ”kvalitetsbloggar” verkar inte gälla svenska bloggar då de indexerar och visar länkar till flera (IMHO) spambloggar på ex. SvD.se. Överlag tror jag att det blir svårt att göra en avvägning mellan att erbjuda seriösa mediasajter ”länka till oss så länkar vi till dig” och samtidigt undvika att spambloggar slinker igenom medans man slipper att förklara för t.ex. nystartade seriösa bloggar varför deras återlänkar/kommentarer inte syns. Tidigare har Twingly sagt att de indexerar ”allt” för att sedan låta mediasajterna rensa ut spam och annat opassande. Knapparna på skärmdumpen pekar mot att de fortfarande tänker indexera allt (”Search”) men försöka erbjuda en spam-fri sökning (”Spam-free search”), vilket gör mig ännu mer konfunderad då jag inte förstår varför man frivilligt skulle välja att söka igenom spambloggar (som står bakom 99% av alla ping). Att visa läsvärda och relaterade blogginlägg oberoende av om de länkar (som ex. Sphere eller det som jag testkör på några bloggar) tror jag tyvärr kommer bli mycket svårare att sälja till tidningsredaktioner.
  • Primelabs/Twingly litar inte helt på automatiken. De söker t.ex. en ”blogg-granskare” som för 94kr/h manuellt ska välja ut och sammanfatta vad som skrivs om företag i bloggosfären. Det är mycket hälsosamt att inte lita fullständigt på automatiken – själv jobbar jag stenhårt med att automatiken så mycket som möjligt ska fungera som en avlastning för mig, men det kommer aldrig gå att lita på den till 100%. Ibland måste beslut tas av en människa. När man ger sig på den globala bloggosfären så tror jag att besluten som bör tas av en människa kommer att bli för många och dyra.
  • Lokala tjänster kommer alltid att vara överlägsna på den lokala marknaden. Knuff.se är fortfarande rejält överlägsen t.ex. både Technorati och Google blogsearch i Sverige då de de av någon anledning bl.a. missar enormt många svenska kvalitetsbloggar. De globala tjänsterna saknar även den fingertoppskänsla som en lokal person (t.ex. jag) kan tillföra. Visar det sig att Primelabs/Twinglys affärsmodell att visa länkwidgets på mediasajter fungerar (dvs. går med vinst) även i andra länder så kommer det i många fall att startas konkurrerande lokala tjänster som vill ha hela eller delar av kakan. Ett exempel är Danmarks största bloggportal Overskrift.dk som sedan i förrgår visar vad danska bloggar skriver omtidningen Information.dk. Primelabs kan mycket väl ha en tekniskt mer avancerad produkt, men jag skulle ändå satsa mina danska pengar på Overskrift.dk.
  • Överlag förstår jag inte alls fördelarna med globala bloggsök. Det är bara att inse att Google numera är extremt snabba (några få minuter) på att indexera nya blogginlägg i sitt vanliga webbsök från de globalt mest läsvärda och stora bloggarna. Jag använder aldrig t.ex. Technorati för att se vad bloggar i världen skriver om något världsaktuellt. Jag använder Google då jag då även får massa relevanta träffar från ex. forum och webbtidningar. Att begränsa sig till bloggar fungerar jättebra när man håller sig inom en nisch (ex. Sverige eller teknik). Varför ska man söka på Twingly.com istället för Google.com?

Spana även in andra svenska bloggars åsikter om , , , , , och .

Posted in bloggosfären, internet, media, widgets | Taggad: , , , , , , , | 9 Comments »