Learning diverse rankings with multi-armed bandits

Robert Kleinberg
Filip Radlinski
Thorsten Joachims

Publication date

December 2014

Abstract

The probabilistic ranking principle advocates ranking documents in order of de-creasing probability of relevance to a query, independent of how other documents are ranked. The result is that similar documents are often ranked at similar po-sitions. In contrast, empirical studies have shown that a diverse set of results is often preferable over one containing redundant results, as typical web queries of-ten have different meanings for different users (such as jaguar). We present a new multi-armed bandit learning algorithm that directly learns a diverse ranking of results based on users ’ clicking behavior. In particular, it maximizes the proba-bility that a relevant document is found in the top k positions of a ranking. After T presentations...

Extracted data

We use cookies to provide a better user experience.

Data Protection

Learning diverse rankings with multi-armed bandits

Abstract

Extracted data

Learning diverse rankings with multi-armed bandits

Abstract

Extracted data

Related items

Related items