DBLab School of Computer and Electrical Engineering KDBSL NTUA
Thursday, June 04, 2020

Internal Seminars 2004-2006

Hierarchical Schema Management for the Semantic Web (PhD defense)

Theodore Dalamagas

Dynamic-Content Web Caching with Cooperative Proxy Scheme

Manolis Veliskakis

Data Stream Systems for Moving Objects

Kostas Patroubas

Personalized Mobile Services

Yiannis Staurakas

Models for Visualizing and Presenting Multidimensional Information from Data Warehouses

Andreas Maniatis

Handling Spatial Data in P2P Systems

Virena Kantere

A model for context-aware databases

Ioannis Roussos

Υποστήριξη Λειτουργιών Βάσεων Δεδομένων σε Συστήματα Peer-to-Peer

Η τεχνολογία Peer-to-Peer (P2P) είναι πολύ δημοφιλής τόσο στους απλούς χρήστες όσο και στην ερευνητική κοινότητα, λόγο του ότι διευκολύνει την ανάπτυξη κατανεμημένων αποθηκών ψηφιακών δεδομένων. Τα συστήματα P2P αποτελούνται από μεγάλο αριθμό διασυνδεόμενων κόμβων με παρόμοιες αρμοδιότητες που ανταλλάσσουν δεδομένα ή υπηρεσίες. Στην παρουσίαση αυτή θα εξεταστούν περιληπτικά οι κυριότερες αρχιτεκτονικές συστημάτων P2P (structured, unstructured, hybrid). Μεγαλύτερο βάρος θα δοθεί στην υποστήριξη λειτουργιών Βάσεων Δεδομένων σε περιβάλλον P2P (caching, semantics, XML, Information Retrieval). Θα παρουσιαστεί η δουλειά της ερευνητικής ομάδας στο National University of Singapore και οι δυνατότητες συνεργασίας / υποτροφιών για μεταπτυχιακές σπουδές.

Hierarchically Compressed Wavelet Synopses

Dimitris Sacharidis

Captain Nemo: A metasearch engine with personalized hierarchical search space.

Stefanos Souldatos

Evolutionary energy management and design of wireless sensor networks

We present an evolutionary optimization methodology for
self-organizing, adaptive wireless sensor network design and energy
management, taking into consideration application-specific requirements,
communication constraints and energy conservation characteristics. A
precision agriculture application of sensor networks is used as an example.
We use genetic algorithms as the optimization tool of the developed system
and an appropriate fitness function is developed to incorporate many
aspects of network performance. The design characteristics optimized by the
genetic algorithm system include the status of sensor nodes (whether they
are active or inactive), network clustering with the choice of appropriate
clusterheads and finally the choice between two signal ranges for the
regular sensor nodes. We show that optimal sensor network designs
constructed by the genetic algorithm system satisfy all
application-specific requirements, fulfill the existent connectivity
constraints and incorporate energy conservation characteristics. Energy
management is optimized to guarantee maximum life duration of the network
without lack of the required by the specific application network
characteristics.

Scalable Clustering of Categorical Data and Applications

Clustering is a problem of great practical importance in numerous
applications. The problem of clustering becomes more challenging when
the data is categorical, that is, when there is no inherent distance
measure between data values. In this talk, we introduce LIMBO, a
scalable hierarchical categorical clustering algorithm that uses an
intuitive information-theoretic distance measure for categorical tuples
and values. When clustering values, LIMBO can give useful hints about
potential duplication and errors that may exist in a data set. As a
hierarchical algorithm, LIMBO has the advantage that it can produce
clusterings of different sizes in a single execution and within a memory
bounded summary model for the data. We present results from our
experimental evaluation of LIMBO, which show the increase in efficiency
without significant loss in the quality of the produced clusterings. We
move on to show how the algorithm can be used to produce valid and
useful clusterings of large software systems. In this case, LIMBO is
applied in the presence of both structural and non-structural
information about the software systems and, thus, allows for an
evaluation of their usefulness in understanding them. Finally, we
conclude the talk with a set of research challenges that present
themselves for the future.

Prefetching Algorithms for Semantic Caching
Indexing Views to Route and Plan Queries in a Peer Data Management System
Querying Tree-structured Data using Dimensions Graphs

Theodore Dalamagas

Hecataeus: A framework for representing SQL constructs as graphs

Yiorgos Papastefanatos

Συμπίεση δεδομένων τροχιάς κινούμενων αντικειμένων

Τα τελευταία χρόνια, η διαχείριση δεδομένων τροχιάς που παράγονται από
κινούμενα αντικείμενα, βρίσκεται στο επίκεντρο του ενδιαφέροντος της
ερευνητικής κοινότητας των χωρικών βάσεων δεδομένων. Τα δεδομένα τροχιάς
εμπίπτουν στο μοντέλο των ρευμάτων δεδομένων. Τα ρεύματα δεδομένων
περιγράφουν πρόσκαιρη πληροφορία και όχι στατική όπως συμβαίνει στις
παραδοσιακές σχεσιακές βάσεις δεδομένων. Το μοντέλο ρευμάτων δεδομένων θέτει
συγκεκριμένες προδιαγραφές, τις οποίες οφείλουν να τηρούν οι τεχνικές
συμπίεσης. Οι προδιαγραφές αφορούν τις απαιτήσεις των τεχνικών σε χώρο, σε
χρόνο επεξεργασίας, σε χρόνο απάντησης και σε ακρίβεια απάντησης.

Η εργασία επικεντρώθηκε σε τρεις άξονες. (i) Αναπτύχθηκαν τεχνικές
δειγματοληψίας τροχιάς που λειτουργούν με βάση χωροχρονικά κριτήρια και
επιλέγουν τα πιο χαρακτηριστικά δεδομένα της τροχιάς. (ii) Αναπτύχθηκε
αμνησιακή δομή (αμνησιακό δένδρο) που δίνει έμφαση στην επίκαιρη πληροφορία,
μειώνοντας με την πάροδο του χρόνου την ακρίβεια για το παρελθόν. (iii)
Αναπτύχθηκαν συνόψεις για γρήγορη εκτίμηση συναθροιστικών ερωτημάτων, με
συνδυασμό σκίτσων, χωρικών δεικτών και του αμνησιακού δένδρου. Όλες οι
τεχνικές πληρούν τις προδιαγραφές που θέτει το μοντέλο ρευμάτων.

Με εφαρμογή των παραπάνω τεχνικών σε συνθετικές τροχιές, πάνω στο οδικό
δίκτυο της Αθήνας πραγματοποιήθηκαν πειράματα, από τα οποία προέκυψαν πολύ
ενθαρρυντικά αποτελέσματα. Επιπλέον, επιβεβαιώθηκαν οι αναμενόμενες
επιδόσεις τους σχετικά με τους απαιτούμενους πόρους και την ακρίβεια των
προσεγγιστικών απαντήσεων σε χωροχρονικά ερωτήματα. Συνολικό συμπέρασμα της
εργασίας είναι ότι η συμπίεση των δεδομένων τροχιάς κινούμενων αντικειμένων
πραγματοποιεί το συμψηφισμό μεταξύ απαιτούμενων πόρων συστήματος και
ακρίβειας απαντήσεων.

Data Approximation with Multiple Measures

Antonis Deligiannakis

Data Integration by Bi-Directional Schema Transfor

Prof. Alexandra Poulovassilis

Guaranteeing Security and Privacy in Cyberspace

Prof. Reind van de Riet

Query Personalization in Database Systems

Georgia Koutrika

Next Generation Location Based Services: Issues and Technologies

Prof. Yiannis Theodoridis

A Comparison of Peer-to to-Peer Search Methods

Dimitris Tsoumakos