Motifs: From theory to practice

Frederique van Leeuwen

Research output: ThesisDoctoral Thesis

65 Downloads (Pure)

Abstract

This dissertation explores the application of motif discovery in real-world time series, specifically focused on the impact of preprocessing steps on the detection of exact and approximate meaningful motifs (chapters 3 and 4). The results shed light on the discrepancy between commonly held assumptions about normalization and parameter settings and the practical utility of motif discovery. Nevertheless, when suitable preprocessing steps are employed, motif discovery can effectively be used as subroutine into various applications, including robust time series labeling and driver correction detection, as outlined in chapters 5 and 6.

-

De exponentiele groei van het aantal verbonden apparaten en sensoren heeft geleid tot de aanwas van een continue stroom aan tijdreeksgegevens. Deze gegevens op zichzelf hebben geen waarde en worden pas waardevol wanneer ze correct worden verzameld en nauwkeurig worden geïnterpreteerd. Hoewel mensen van nature in staat zijn om data om te zetten in waardevolle kennis, maakt het volume, de snelheid en verscheidenheid van de binnenkomende gegevensstromen het onmogelijk om deze capaciteit te benutten. Computers, in tegenstelling tot mensen, beschikken over uitzonderlijke rekenkracht, waardoor complexe en intensieve berekeningen continu kunnen worden uitgevoerd. Het doel van tijdreeks datamining is om kennis te halen uit tijdgebonden gegevens. Het identificeren van eerder onbekende, vaak voorkomende patronen in tijdreeksen, bekend als motieven, helpt verborgen structuren en relaties in de data bloot te leggen. Ook kan het dienen als een subroutine voor verschillende taken in diverse toepassingsgebieden. In de loop der jaren zijn tal van verbeteringen aan motiefdetectie-algoritmen ontwikkeld, met als doel onder andere de schaalbaarheid, efficiëntie en de detectie van motieven met variabele lengte te verbeteren. Ondanks de verscheidenheid aan voorgestelde methoden, steunen ze grotendeels op aannames met betrekking tot vereiste voorbewerkingsstappen die niet altijd aansluiten bij situaties in de echte wereld. Dit proefschrift presenteert toegepast onderzoek dat tot doel heeft de praktische bruikbaarheid van motiefdetectie in tijdreeksen te verkennen. Na de introductie in hoofdstuk 1 en de relevante achtergrond informatie in hoofdstuk 2, onderzoeken we in hoofdstuk 3 en 4 de invloed van verschillende voorbewerkingsstappen op de detectie van motieven. Via experimenten tonen we dat gangbare aannames met betrekking tot normalisatie en parameterinstellingen niet altijd gunstig zijn voor de detectie van betekenisvolle motieven. Op basis van de nieuw verkregen inzichten presenteren we twee casussen. In hoofdstuk 5 introduceren we het Robust Time Series Labeling (RTL) algoritme, om de inspanning van het labelen van tijdreeksen te minimaliseren zonder de kwaliteit van de labels te beinvloeden. We beginnen met het identificeren van de essentiële kenmerken die nodig zijn om een robuuste methode te hebben, en laten zien dat het gebruik van motieven een positief effect kan hebben op de efficiëntie en robuustheid van het labelen van tijdreeksen. Dat motiefdetectie ook kan worden gebruikt om abnormaal rijgedrag te detecteren, tonen we aan in hoofdstuk 6. Terwijl het meeste onderzoek naar afleiding tijdens het rijden doorgaans gebaseerd is op gelabelde gegevens en sensoren en camera’s in voertuigen, presenteren wij een experiment waarbij we uitsluitend gegevens van het Controller Area Network (CAN) gebruiken om afleiding te detecteren. Resultaten laten zien dat afleiding en corrigerende acties nauwkeurig kunnen worden gedetecteerd via het detecteren van motieven. Vanwege de eenvoudige en transparante aard van het algoritme, kan het gebruikt worden als input voor initiatieven zoals de Pay-How-You-Drive (PHYD) verzekering. In hoofdstuk 7 gaan we in op de bijdragen en beperkingen van het onderzoek dat in deze dissertatie wordt gepresenteerd, en we sluiten af met de conclusie en mogelijke toekomstige onderzoeksrichtingen in hoofdstuk 8. Onze bevindingen suggereren dat momenteel gebruikte voorbewerkingsstappen een kloof kunnen creeren tussen de theorie en de praktische toepassing van het detecteren van motieven. Niettemin tonen we aan dat met de juiste voorbewerkingsstappen motieven effectief kunnen worden ingezet als hulpmiddel in diverse toepassingen, waaronder het robuust labelen van tijdreeksen en de detectie van correcties gemaakt door afgeleide bestuurders.
Original languageEnglish
QualificationDoctor of Philosophy
Awarding Institution
  • Tilburg University
Supervisors/Advisors
  • van den Born, Arjan, Promotor
  • Postma, Eric, Promotor
  • Bosma, Bas, Co-promotor
Award date12 Dec 2023
Place of PublicationTilburg
Publisher
Print ISBNs978 90 5668 727 4
DOIs
Publication statusPublished - 2023

Fingerprint

Dive into the research topics of 'Motifs: From theory to practice'. Together they form a unique fingerprint.

Cite this