Een recent gepresenteerd onderzoeksverslag toont Microsoft’s interesse aan voor gepersonaliseerde zoekresultaten. Het onderzoek getiteld ‘Personalizing Search via Automated Analysis of Interests and Activities’ werd gepresenteerd op de recent gehouden ACM SIGIR Conference on Research and Development in Information Retrieval.
Waar gaat het onderzoek specifiek over? In de abstract wordt gesproken over het presenteren van zoekresultaten op basis van eerder verrichtte zoekacties. Op basis van dit gedrag kunnen opvolgende zoekresultaten beter gerangschikt worden. De reden waarom Microsoft gepersonaliseerde zoekresultaten interessant vindt is gebaseerd op het verkrijgen van een beoogd marktleiderschap met de zoekmachine MSN Search. De vraag of het hiermee lukt is natuurlijk natte vinger werk. Opvallend is overigens wel dat de onderzoekers gebruikersinteresse wil achterhalen via onder meer gedane zoekacties, bezochte websites, maar ook geopende documenten en emails. De conclusie luidt “Our research suggests that rich representations of the user and the corpus are important for personalization, but that it is possible to approximate these representations and provide efficient client-side algorithms for personalizing search. We show that such personalization algorithms can significantly improve on current Web search.”
Personalisatie is niet iets nieuws. Het wordt wel anders op het moment dat computerprogramma’s de informatie van ons gedrag gaan opslaan om daarmee zoekresultaten te rangschikken en presenteren. Niet alleen rijst dan de vraag ‘hoe zit het met privacy?’ en ‘wat gebeurt er met de informatie over mijn gedrag?’. Zeker gezien het gegeven dat ook geopende documenten en emails gebruikt kunnen worden voor personalisatie van zoekresultaten. Dat betekent dus ook dat vertrouwelijke informatie naar buiten kan lekken zonder dat we het weten.
In tegenstelling tot veel andere personalisatie diensten als de systemen van bijvoorbeeld Amazon waarmee je je profiel kunt samenstellen op basis van je waardering voor bepaalde boeken, films of muziek, gaat het voorstel zoals onderzocht is veel verder. In het onderzoek is overigens de kwestie privacy benoemd. Vandaar dat het ontwikkelde gebruikersprofiel lokaal wordt opgeslagen en niet over internet zou worden verstuurd. Dat betekent dus dat de zoekresultaten pas op de computer gerangschikt worden, en niet op internet. “The system we used indexed all of the information created, copied, or viewed by a user. Indexed content includes Web pages that the user viewed, email messages that were viewed or sent, calendar items, and documents stored on the client machine. All of this information can be used to create a rich but unstructured profile of the user. The most straightforward way to use this index is to treat every document in it as a source of evidence about the user�s
interests, independent of the query.”