DBLab School of Computer and Electrical Engineering KDBSL NTUA
Thursday, July 02, 2020
Τίτλος Optimizing search engines using clickthrough data
Έγγραφο Προβολή εγγράφου
Συγγραφέας Yiorgos Giannopoulos
Περιγραφή

Η ταξινόμηση των αποτελεσμάτων που επιστρέφει μία μηχανή αναζήτησης στο διαδίκτυο γίνεται κατά βάση με το βαθμό ομοιότητας που παρουσιάζουν οι λέξεις-κλειδιά της αναζήτησης με το κείμενο των επιστρεφόμενων ιστοσελίδων. Μηχανισμοί βελτίωσης του παραπάνω τρόπου εκμεταλλεύονται πληροφορία που προκύπτει από την αναζήτηση και αφορούν, για παράδειγμα, πιθανές συσχετίσεις μεταξύ των αποτελεσμάτων ή προτιμήσεις του χρήση για συγκεκριμένα αποτελέσματα. Ένας τέτοιος μηχανισμός είναι η χρησιμοποίηση δεδομένων clickstream, τα οποία αποτελούν ουσιαστικά το ιστορικό της αναζήτησης του χρήστη και αποθηκεύονται στο log του server. Από αυτά τα δεδομένα, μπορεί να γίνει συσχέτιση ερωτημάτων με συγκεκριμένα url (ή με άλλα ερωτήματα) που πατήθηκαν από το χρήστη, αλλά και σύγκριση της προτίμησης του χρήστη για ορισμένα url σε σχέση με άλλα. Στην παρουσίαση εξετάζεται μία συγκεκριμένη προσέγγιση, που αφορά την αυτόματη εκπαίδευση ενός συστήματος μηχανικής μάθησης (με τη χρήση SVM) με δεδομένα εισόδου προερχόμενα από το log προηγουμένων αναζητήσεων του χρήστη. Μέσω αυτής της εκπαίδευσης, προκύπτουν κάποιες συναρτήσεις, οι οποίες μεταβάλλουν την αρχική ταξινόμηση των αποτελεσμάτων, λαμβάνοντας υπόψιν τις προτιμήσεις του χρήστη, όπως αυτές προέκυψαν από προηγούμενες του αναζητήσεις.

Η ταξινόμηση των αποτελεσμάτων που επιστρέφει μία μηχανή αναζήτησης στο διαδίκτυο γίνεται κατά βάση με το βαθμό ομοιότητας που παρουσιάζουν οι λέξεις-κλειδιά της αναζήτησης με το κείμενο των επιστρεφόμενων ιστοσελίδων. Μηχανισμοί βελτίωσης του παραπάνω τρόπου εκμεταλλεύονται πληροφορία που προκύπτει από την αναζήτηση και αφορούν, για παράδειγμα, πιθανές συσχετίσεις μεταξύ των αποτελεσμάτων ή προτιμήσεις του χρήση για συγκεκριμένα αποτελέσματα. Ένας τέτοιος μηχανισμός είναι η χρησιμοποίηση δεδομένων clickstream, τα οποία αποτελούν ουσιαστικά το ιστορικό της αναζήτησης του χρήστη και αποθηκεύονται στο log του server. Από αυτά τα δεδομένα, μπορεί να γίνει συσχέτιση ερωτημάτων με συγκεκριμένα url (ή με άλλα ερωτήματα) που πατήθηκαν από το χρήστη, αλλά και σύγκριση της προτίμησης του χρήστη για ορισμένα url σε σχέση με άλλα. Στην παρουσίαση εξετάζεται μία συγκεκριμένη προσέγγιση, που αφορά την αυτόματη εκπαίδευση ενός συστήματος μηχανικής μάθησης (με τη χρήση SVM) με δεδομένα εισόδου προερχόμενα από το log προηγουμένων αναζητήσεων του χρήστη. Μέσω αυτής της εκπαίδευσης, προκύπτουν κάποιες συναρτήσεις, οι οποίες μεταβάλλουν την αρχική ταξινόμηση των αποτελεσμάτων, λαμβάνοντας υπόψιν τις προτιμήσεις του χρήστη, όπως αυτές προέκυψαν από προηγούμενες του αναζητήσεις.

[ Back ]