DBLab School of Computer and Electrical Engineering KDBSL NTUA
Tuesday, July 07, 2020

Ομιλίες 2004-2006

Διαχείριση Ιεραρχικών Σχημάτων στον Σημασιολογικό Ιστό (υποστήριξη διατριβής)

Θοδωρής Δαλαμάγκας

Dynamic-Content Web Caching with Cooperative Proxy Scheme

Μανώλης Βελισκάκης

Συστήματα Ρευμάτων Δεδομένων για Κινούμενα Αντικείμενα

Κώστας Πατρούμπας

Personalized Mobile Services

Γιάννης Σταύρακας

Μοντέλα Απεικόνισης και Παρουσίασης Πολυδιάστατων Πληροφοριών από Αποθήκες Δεδομένων

Ανδρέας Μανιάτης

Handling Spatial Data in P2P Systems

Virena Kantere

A model for context-aware databases

Ioannis Roussos

Υποστήριξη Λειτουργιών Βάσεων Δεδομένων σε Συστήματα Peer-to-Peer

Η τεχνολογία Peer-to-Peer (P2P) είναι πολύ δημοφιλής τόσο στους απλούς χρήστες όσο και στην ερευνητική κοινότητα, λόγο του ότι διευκολύνει την ανάπτυξη κατανεμημένων αποθηκών ψηφιακών δεδομένων. Τα συστήματα P2P αποτελούνται από μεγάλο αριθμό διασυνδεόμενων κόμβων με παρόμοιες αρμοδιότητες που ανταλλάσσουν δεδομένα ή υπηρεσίες. Στην παρουσίαση αυτή θα εξεταστούν περιληπτικά οι κυριότερες αρχιτεκτονικές συστημάτων P2P (structured, unstructured, hybrid). Μεγαλύτερο βάρος θα δοθεί στην υποστήριξη λειτουργιών Βάσεων Δεδομένων σε περιβάλλον P2P (caching, semantics, XML, Information Retrieval). Θα παρουσιαστεί η δουλειά της ερευνητικής ομάδας στο National University of Singapore και οι δυνατότητες συνεργασίας / υποτροφιών για μεταπτυχιακές σπουδές.

Querying Tree-structured Data using Dimensions Graphs

Dimitris Sacharidis

Captain Nemo: A metasearch engine with personalized hierarchical search space.

Stefanos Souldatos

Evolutionary energy management and design of wireless sensor networks

We present an evolutionary optimization methodology for
self-organizing, adaptive wireless sensor network design and energy
management, taking into consideration application-specific requirements,
communication constraints and energy conservation characteristics. A
precision agriculture application of sensor networks is used as an example.
We use genetic algorithms as the optimization tool of the developed system
and an appropriate fitness function is developed to incorporate many
aspects of network performance. The design characteristics optimized by the
genetic algorithm system include the status of sensor nodes (whether they
are active or inactive), network clustering with the choice of appropriate
clusterheads and finally the choice between two signal ranges for the
regular sensor nodes. We show that optimal sensor network designs
constructed by the genetic algorithm system satisfy all
application-specific requirements, fulfill the existent connectivity
constraints and incorporate energy conservation characteristics. Energy
management is optimized to guarantee maximum life duration of the network
without lack of the required by the specific application network
characteristics.

Scalable Clustering of Categorical Data and Applications

Clustering is a problem of great practical importance in numerous
applications. The problem of clustering becomes more challenging when
the data is categorical, that is, when there is no inherent distance
measure between data values. In this talk, we introduce LIMBO, a
scalable hierarchical categorical clustering algorithm that uses an
intuitive information-theoretic distance measure for categorical tuples
and values. When clustering values, LIMBO can give useful hints about
potential duplication and errors that may exist in a data set. As a
hierarchical algorithm, LIMBO has the advantage that it can produce
clusterings of different sizes in a single execution and within a memory
bounded summary model for the data. We present results from our
experimental evaluation of LIMBO, which show the increase in efficiency
without significant loss in the quality of the produced clusterings. We
move on to show how the algorithm can be used to produce valid and
useful clusterings of large software systems. In this case, LIMBO is
applied in the presence of both structural and non-structural
information about the software systems and, thus, allows for an
evaluation of their usefulness in understanding them. Finally, we
conclude the talk with a set of research challenges that present
themselves for the future.

Prefetching Algorithms for Semantic Caching
Indexing Views to Route and Plan Queries in a Peer Data Management System
Hecataeus: A framework for representing SQL constructs as graphs
Hecataeus: A framework for representing SQL constructs as graphs

George Papastefanatos

Συμπίεση δεδομένων τροχιάς κινούμενων αντικειμένων]

Τα τελευταία χρόνια, η διαχείριση δεδομένων τροχιάς που παράγονται από
κινούμενα αντικείμενα, βρίσκεται στο επίκεντρο του ενδιαφέροντος της
ερευνητικής κοινότητας των χωρικών βάσεων δεδομένων. Τα δεδομένα τροχιάς
εμπίπτουν στο μοντέλο των ρευμάτων δεδομένων. Τα ρεύματα δεδομένων
περιγράφουν πρόσκαιρη πληροφορία και όχι στατική όπως συμβαίνει στις
παραδοσιακές σχεσιακές βάσεις δεδομένων. Το μοντέλο ρευμάτων δεδομένων θέτει
συγκεκριμένες προδιαγραφές, τις οποίες οφείλουν να τηρούν οι τεχνικές
συμπίεσης. Οι προδιαγραφές αφορούν τις απαιτήσεις των τεχνικών σε χώρο, σε
χρόνο επεξεργασίας, σε χρόνο απάντησης και σε ακρίβεια απάντησης.

Η εργασία επικεντρώθηκε σε τρεις άξονες. (i) Αναπτύχθηκαν τεχνικές
δειγματοληψίας τροχιάς που λειτουργούν με βάση χωροχρονικά κριτήρια και
επιλέγουν τα πιο χαρακτηριστικά δεδομένα της τροχιάς. (ii) Αναπτύχθηκε
αμνησιακή δομή (αμνησιακό δένδρο) που δίνει έμφαση στην επίκαιρη πληροφορία,
μειώνοντας με την πάροδο του χρόνου την ακρίβεια για το παρελθόν. (iii)
Αναπτύχθηκαν συνόψεις για γρήγορη εκτίμηση συναθροιστικών ερωτημάτων, με
συνδυασμό σκίτσων, χωρικών δεικτών και του αμνησιακού δένδρου. Όλες οι
τεχνικές πληρούν τις προδιαγραφές που θέτει το μοντέλο ρευμάτων.

Με εφαρμογή των παραπάνω τεχνικών σε συνθετικές τροχιές, πάνω στο οδικό
δίκτυο της Αθήνας πραγματοποιήθηκαν πειράματα, από τα οποία προέκυψαν πολύ
ενθαρρυντικά αποτελέσματα. Επιπλέον, επιβεβαιώθηκαν οι αναμενόμενες
επιδόσεις τους σχετικά με τους απαιτούμενους πόρους και την ακρίβεια των
προσεγγιστικών απαντήσεων σε χωροχρονικά ερωτήματα. Συνολικό συμπέρασμα της
εργασίας είναι ότι η συμπίεση των δεδομένων τροχιάς κινούμενων αντικειμένων
πραγματοποιεί το συμψηφισμό μεταξύ απαιτούμενων πόρων συστήματος και
ακρίβειας απαντήσεων.

Προσέγγιση Δεδομένων με Πολλαπλές Μετρήσιμες Ποσότητες

Αντώνης Δεληγιαννάκης

Data Integration by Bi-Directional Schema Transformation Rules

καθ. Αλεξάνδρα Πουλοβασίλη

Guaranteeing Security and Privacy in Cyberspace

Prof. Reind van de Riet

Εξατομίκευση Ερωτήσεων σε Βάσεις Δεδομένων

Γιούλη Κούτρικα

Next Generation Location Based Services: Issues and Technologies

Καθ. Γιάννης Θεοδωρίδης

Μέθοδοι αποδοτικής αναζήτησης σε P2P δίκτυα