yashke.com

Kuba Filipowski @ December 30th, 2007

The Implicit Web - jak meta-redagować?

Na Read/Write Web jest podsumowanie, w którym redaktorzy bloga wybrali najciekawsze artykuły mijającego roku. Polecam. Właśnie w tym przeglądzie wyróżniono tekst pod tytułem “The Implicit Web: Last.fm, Amazon, Google, Attention Trust“.

W wielkim skrócie chodzi o to by algorytmy meta-redakcyjne (czyli wszelkiej maści rankingi, polecenia itd) bazowały nie na ocenach internautów wyrażonych wprost (czyli nie tak jak wykop, czy jakiś system gwiazdkowania) ale, żeby zbierały dane poboczne, które pełnią rolę wskaźnika oceny. Takich danych jest sporo i dość łatwo można je zbierać.

Na przykład jest to mierzenie czasu - dzięki temu wiemy, że dana treść została faktycznie odebrana - ale wskaźnik ten nie jest bez wad - może się zdarzyć sytuacja, którą w skrócie nazwałbym “przypadkiem Pana Gąbki” - gdzie długi jest czas pozyskiwania treści a nie jej odbierania (lub - bardziej wulgarnie - konsumowania). Wskaźnik zawodzi bo nie pokazuje rzeczywistych preferencji, raczej problemy techniczne.

Innym wskaźnikiem jest przesyłanie informacji o danej treści innym użytkownikom. Można to mierzyć zarówno badając częstotliwość użycia poszczególnych funkcjonalności, które wspierają takie przesyłanie (przycisk “share” w google reader i na youtube) lub sprawdzając ilość refererów.

Można też sprawdzać ilość komentarzy albo po prostu hitów lub ilości zamówień.

Mnie najbardziej interesują różnice wyników. Okazuje się, a widać to dobitnie na Youtube, że różnice są duże w zależności od sposobu oceny (lub meta-oceny) danych.

Zobaczcie jak zmienia się lista pierwszych 10 wideo przy wyborze takich kryteriów sortowania jak:

Różnice są spore. Wybranie właściwych lub odpowiednie łączenie kilku to sposób na skuteczny data mining. Skuteczny data mining to coś czego wartość trudno przecenić - to sukces Google i Amazona.

Tagi: ,

Skomentuj ten wpis!