DBLab School of Computer and Electrical Engineering KDBSL NTUA
Thursday, July 02, 2020

Ομιλίες 2007-2008

Βελτιστοποίηση ταξινόμησης αποτελεσμάτων αναζήτησης στο διαδίκτυο με βάση το ιστορικό του χρήστη

Η ταξινόμηση των αποτελεσμάτων που επιστρέφει μία μηχανή αναζήτησης στο διαδίκτυο γίνεται κατά βάση με το βαθμό ομοιότητας που παρουσιάζουν οι λέξεις-κλειδιά της αναζήτησης με το κείμενο των επιστρεφόμενων ιστοσελίδων. Μηχανισμοί βελτίωσης του παραπάνω τρόπου εκμεταλλεύονται πληροφορία που προκύπτει από την αναζήτηση και αφορούν, για παράδειγμα, πιθανές συσχετίσεις μεταξύ των αποτελεσμάτων ή προτιμήσεις του χρήση για συγκεκριμένα αποτελέσματα. Ένας τέτοιος μηχανισμός είναι η χρησιμοποίηση δεδομένων clickstream, τα οποία αποτελούν ουσιαστικά το ιστορικό της αναζήτησης του χρήστη και αποθηκεύονται στο log του server. Από αυτά τα δεδομένα, μπορεί να γίνει συσχέτιση ερωτημάτων με συγκεκριμένα url (ή με άλλα ερωτήματα) που πατήθηκαν από το χρήστη, αλλά και σύγκριση της προτίμησης του χρήστη για ορισμένα url σε σχέση με άλλα. Στην παρουσίαση εξετάζεται μία συγκεκριμένη προσέγγιση, που αφορά την αυτόματη εκπαίδευση ενός συστήματος μηχανικής μάθησης (με τη χρήση SVM) με δεδομένα εισόδου προερχόμενα από το log προηγουμένων αναζητήσεων του χρήστη. Μέσω αυτής της εκπαίδευσης, προκύπτουν κάποιες συναρτήσεις, οι οποίες μεταβάλλουν την αρχική ταξινόμηση των αποτελεσμάτων, λαμβάνοντας υπόψιν τις προτιμήσεις του χρήστη, όπως αυτές προέκυψαν από προηγούμενες του αναζητήσεις.

A Survey of Context and Context Management
Bertinoro Workshop on Information Integration [INFINT'07]

http://www.dis.uniroma1.it/~lenzerin/INFINT2007/index.shtml

Τήρηση Ιδιωτικότητας σε Δημοσιευμένα Δεδομένα
Evaluation of Partial Path Queries on XML Data [CIKM'07]
Mining User Navigation Patterns for Personalizing Topic Directories [WIDM'07]