Abstract
Deze dissertatie richtte zich op het ontwikkelen van nieuwe uitbreidingen voor het relationeel evenementenmodel (REM). Het oorspronkelijke doel van dit werk was het ontwikkelen van multilevel-uitbreidingen van het relationeel evenementenmodel en hypothesetoetsingsmethoden, kwesties die onderontwikkeld zijn in de REM-literatuur. Echter, vanwege ernstige computationele inefficiënties veroorzaakt door zowel de multilevel-structuur (Betancourt & Girolami 2015) als door de algemene modelformulering en de aard van relationele evenementgegevens (Butts 2008), werd de focus verschoven naar het ontwikkelen van algoritmische strategieën die de computationele problemen van het model zouden kunnen omzeilen. De voornaamste reden voor deze verschuiving was de overtuiging dat, tenzij er efficiëntere computationele strategieën werden ontwikkeld, de adoptie van onze methoden beperkt zou blijven.
In Hoofdstuk 2 begint deze dissertatie met het voorstellen van een multilevel-uitbreiding van het DyNAM (Stadtfeld & Block 2017; Stadtfeld et al. 2017a). Dit model analyseert de activiteit van zenders en de keuze van ontvangers als afzonderlijke processen, wat inzicht kan geven in de voorkeuren van actoren in sociale interacties. Daarnaast hebben we ook een veelheid aan hypothesetoetsingsmethodologieën voorgesteld op basis van Bayes-factoren, die het mogelijk maken een groot aantal inhoudelijk interessante en wetenschappelijk gemotiveerde hypothesen te toetsen.
Hoewel we in Hoofdstuk 2 veelbelovende stappen hebben gezet in het ontwikkelen van multilevel-methodologieën voor het relationeel evenementenmodel, werden we geconfronteerd met een van de grootste knelpunten van het REM: de computationele intensiteit ervan. Daarom richtten we ons in Hoofdstuk 3 op het ontwikkelen van een methode die de schattingsprocedure van het model zou kunnen versnellen. We presenteerden toepassingen op multilevel-gegevens en datastreams. De methode is gebaseerd op meta-analyse (Borenstein et al. 2010, 2011), waarbij elk onafhankelijk netwerk (of een batch daarvan) wordt beschouwd als een onafhankelijke meta-analytische studie waarop een relationeel evenementenmodel wordt toegepast. Vervolgens worden, net zoals bij meta-analyse, de schattingen van deze modellen samengevoegd tot algehele modelschattingen. Uitgebreide simulaties werden uitgevoerd om de equivalentie tussen de meta-analyse en de exacte modellen aan te tonen. Als resultaat werd een R-pakket ontwikkeld (zie https://github.com/TilburgNetworkGroup/remx).
In Hoofdstuk 4 herpakten we de kwestie van het testen van homogene (of heterogene) effecten in multilevel-modellen die voor het eerst werd besproken in Hoofdstuk 2. Dit is een vraagstuk van dermate groot belang in multilevel-analyse dat we besloten er een heel hoofdstuk aan te wijden. Het opnemen van willekeurige effecten in een model kan ernstige inefficiënties veroorzaken bij de parameterschatting (zoals besproken door Betancourt & Girolami 2015). Daarom moet, tenzij er voldoende heterogeniteit in de groepen is om de aanwezigheid van willekeurige effecten te rechtvaardigen, een eenvoudiger model de voorkeur krijgen. We introduceerden de Empirical Bayes factor (EBF) als een methode die enkele van de problemen kan omzeilen die geassocieerd zijn met de momenteel beschikbare alternatieven. De EBF maakt het mogelijk om meerdere
willekeurige effecten tegelijkertijd te toetsen en is goedkoop om te berekenen.
Tot slot, in Hoofdstuk 5, probeerden we het probleem van tijdsafhankelijke effecten in relationele evenementgegevens aan te pakken door een state-space modeluitbreiding van het REM voor te stellen. Het merendeel van de literatuur die empirische gegevens analyseert met behulp van REM’s gebruikt het model met temporeel statische parameters. Zoals aangetoond in Hoofdstuk 5, kan deze aanname te restrictief zijn voor de meeste toepassingen. Daarom is er overtuigend bewijs dat modellen die tijdsafhankelijke parameters toestaan, zoals het state-space model, meer zouden moeten worden toegepast (en misschien de standaard zouden moeten worden) in de analyse van relationele evenementgegevens.
_
This dissertation focused on developing new extensions for the relational event model (REM). This work originally intended to be centered on the development of multilevel extensions of the relational event model and
hypothesis testing methods, issues that are underdeveloped in REM literature. However, due to severe computational inefficiencies caused both by the multilevel structure (Betancourt & Girolami 2015) as well as by the general model formulation and nature of relational event data (Butts 2008), the focus was then shifted towards the development of algorithmic strategies that could circumvent the model's computational issues. The main reason for this shift was the belief that unless more efficient computational strategies were developed, the adoption of our methods would be limited.
Hence, in Chapter 2, this dissertation starts proposing a multilevel extension of the DyNAM (Stadtfeld & Block 2017; Stadtfeld et al. 2017a). This model analyzes the activity of senders and the choice of receivers as
separate processes, which can provide insights into actors' preferences in social interactions. In addition, we also proposed a multitude of hypothesis testing methodologies based on Bayes factors, which allow the testing of a plethora of substantively interesting and scientifically motivated hypotheses.
Even though, in Chapter 2, we made promising strides in developing multilevel methodologies for the relational event model, we were confronted with one of the REM's major bottlenecks: its computational
intensiveness. Thus, in Chapter 3, we focused on developing a methodology that could speed up model estimation. We presented applications to multilevel data and data streams. The methodology is based on meta-analysis (Borenstein et al. 2010, 2011), where each independent network (or a batch thereof) is considered an independent meta-analytic study to which a relational event model is fitted. Then, just as in meta-analysis, the estimates of these models are pooled into overall model estimates. Extensive simulations were conducted to show the equivalence between the meta-analysis and the exact models. An R package was developed as a result (see https://github.com/TilburgNetworkGroup/remx).
In Chapter 4, we readdressed the issue of testing homogeneous (or heterogeneous) effects in multilevel models first discussed in Chapter 2. This is a question of such an extreme importance in multilevel analysis that we decided to devote an entire chapter to it. The inclusion of random effects in a model can cause severe inefficiencies in parameter estimation (as discussed by Betancourt & Girolami 2015). Thus, unless there is enough heterogeneity in the groups to justify the presence of random effects, a simpler model should be preferred. We introduced the Empirical Bayes factor (EBF) as a method that can circumvent some of the problems associated with the alternatives currently available. The EBF allows the testing of multiple random effect simultaneously and it is inexpensive to compute.
Finally, in Chapter 5, we sought to tackle the problem of time-varying effects in relational event data by proposing a state-space model extension of the REM. Most of the literature that analyzes empirical data using REMs employs the model with temporally static parameters. As shown in Chapter 5, this assumption might be too restrictive for most applications. Therefore, there is compelling evidence that models that allow time-varying
parameters, such as the state-space, should be more utilized (and maybe become the standard) in the analysis of relational event data
In Hoofdstuk 2 begint deze dissertatie met het voorstellen van een multilevel-uitbreiding van het DyNAM (Stadtfeld & Block 2017; Stadtfeld et al. 2017a). Dit model analyseert de activiteit van zenders en de keuze van ontvangers als afzonderlijke processen, wat inzicht kan geven in de voorkeuren van actoren in sociale interacties. Daarnaast hebben we ook een veelheid aan hypothesetoetsingsmethodologieën voorgesteld op basis van Bayes-factoren, die het mogelijk maken een groot aantal inhoudelijk interessante en wetenschappelijk gemotiveerde hypothesen te toetsen.
Hoewel we in Hoofdstuk 2 veelbelovende stappen hebben gezet in het ontwikkelen van multilevel-methodologieën voor het relationeel evenementenmodel, werden we geconfronteerd met een van de grootste knelpunten van het REM: de computationele intensiteit ervan. Daarom richtten we ons in Hoofdstuk 3 op het ontwikkelen van een methode die de schattingsprocedure van het model zou kunnen versnellen. We presenteerden toepassingen op multilevel-gegevens en datastreams. De methode is gebaseerd op meta-analyse (Borenstein et al. 2010, 2011), waarbij elk onafhankelijk netwerk (of een batch daarvan) wordt beschouwd als een onafhankelijke meta-analytische studie waarop een relationeel evenementenmodel wordt toegepast. Vervolgens worden, net zoals bij meta-analyse, de schattingen van deze modellen samengevoegd tot algehele modelschattingen. Uitgebreide simulaties werden uitgevoerd om de equivalentie tussen de meta-analyse en de exacte modellen aan te tonen. Als resultaat werd een R-pakket ontwikkeld (zie https://github.com/TilburgNetworkGroup/remx).
In Hoofdstuk 4 herpakten we de kwestie van het testen van homogene (of heterogene) effecten in multilevel-modellen die voor het eerst werd besproken in Hoofdstuk 2. Dit is een vraagstuk van dermate groot belang in multilevel-analyse dat we besloten er een heel hoofdstuk aan te wijden. Het opnemen van willekeurige effecten in een model kan ernstige inefficiënties veroorzaken bij de parameterschatting (zoals besproken door Betancourt & Girolami 2015). Daarom moet, tenzij er voldoende heterogeniteit in de groepen is om de aanwezigheid van willekeurige effecten te rechtvaardigen, een eenvoudiger model de voorkeur krijgen. We introduceerden de Empirical Bayes factor (EBF) als een methode die enkele van de problemen kan omzeilen die geassocieerd zijn met de momenteel beschikbare alternatieven. De EBF maakt het mogelijk om meerdere
willekeurige effecten tegelijkertijd te toetsen en is goedkoop om te berekenen.
Tot slot, in Hoofdstuk 5, probeerden we het probleem van tijdsafhankelijke effecten in relationele evenementgegevens aan te pakken door een state-space modeluitbreiding van het REM voor te stellen. Het merendeel van de literatuur die empirische gegevens analyseert met behulp van REM’s gebruikt het model met temporeel statische parameters. Zoals aangetoond in Hoofdstuk 5, kan deze aanname te restrictief zijn voor de meeste toepassingen. Daarom is er overtuigend bewijs dat modellen die tijdsafhankelijke parameters toestaan, zoals het state-space model, meer zouden moeten worden toegepast (en misschien de standaard zouden moeten worden) in de analyse van relationele evenementgegevens.
_
This dissertation focused on developing new extensions for the relational event model (REM). This work originally intended to be centered on the development of multilevel extensions of the relational event model and
hypothesis testing methods, issues that are underdeveloped in REM literature. However, due to severe computational inefficiencies caused both by the multilevel structure (Betancourt & Girolami 2015) as well as by the general model formulation and nature of relational event data (Butts 2008), the focus was then shifted towards the development of algorithmic strategies that could circumvent the model's computational issues. The main reason for this shift was the belief that unless more efficient computational strategies were developed, the adoption of our methods would be limited.
Hence, in Chapter 2, this dissertation starts proposing a multilevel extension of the DyNAM (Stadtfeld & Block 2017; Stadtfeld et al. 2017a). This model analyzes the activity of senders and the choice of receivers as
separate processes, which can provide insights into actors' preferences in social interactions. In addition, we also proposed a multitude of hypothesis testing methodologies based on Bayes factors, which allow the testing of a plethora of substantively interesting and scientifically motivated hypotheses.
Even though, in Chapter 2, we made promising strides in developing multilevel methodologies for the relational event model, we were confronted with one of the REM's major bottlenecks: its computational
intensiveness. Thus, in Chapter 3, we focused on developing a methodology that could speed up model estimation. We presented applications to multilevel data and data streams. The methodology is based on meta-analysis (Borenstein et al. 2010, 2011), where each independent network (or a batch thereof) is considered an independent meta-analytic study to which a relational event model is fitted. Then, just as in meta-analysis, the estimates of these models are pooled into overall model estimates. Extensive simulations were conducted to show the equivalence between the meta-analysis and the exact models. An R package was developed as a result (see https://github.com/TilburgNetworkGroup/remx).
In Chapter 4, we readdressed the issue of testing homogeneous (or heterogeneous) effects in multilevel models first discussed in Chapter 2. This is a question of such an extreme importance in multilevel analysis that we decided to devote an entire chapter to it. The inclusion of random effects in a model can cause severe inefficiencies in parameter estimation (as discussed by Betancourt & Girolami 2015). Thus, unless there is enough heterogeneity in the groups to justify the presence of random effects, a simpler model should be preferred. We introduced the Empirical Bayes factor (EBF) as a method that can circumvent some of the problems associated with the alternatives currently available. The EBF allows the testing of multiple random effect simultaneously and it is inexpensive to compute.
Finally, in Chapter 5, we sought to tackle the problem of time-varying effects in relational event data by proposing a state-space model extension of the REM. Most of the literature that analyzes empirical data using REMs employs the model with temporally static parameters. As shown in Chapter 5, this assumption might be too restrictive for most applications. Therefore, there is compelling evidence that models that allow time-varying
parameters, such as the state-space, should be more utilized (and maybe become the standard) in the analysis of relational event data
Original language | English |
---|---|
Qualification | Doctor of Philosophy |
Supervisors/Advisors |
|
Award date | 6 Nov 2024 |
Place of Publication | s.l. |
Publisher | |
DOIs | |
Publication status | Published - 6 Nov 2024 |