Modèle tensoriel pour l'entreposage et l'analyse des données des réseaux sociaux Application à l'étude de la viralité sur Twitter

Résumé : Dans cet article, nous montrons comment la notion de tenseur permet de construire un modèle multi-paradigmes pour l'entreposage des données sociales. D'un point de vue architecture , cette approche permet de lier différents systèmes de stockage (polystore) et de limiter l'impact des outils ETL réalisant les transformations de modèles pour alimenter différents al-gorithmes d'analyse. Ainsi, le modèle proposé permet d'assurer l'indépendance logique entre les données et les programmes implantant les algorithmes d'analyse. Avec un cas concret ex-trait d'une étude de la viralité sur Twitter durant la période de l'entre deux tours de l'élection présidentielle française de 2017, nous mettons en évidence les apports de notre modèle. ABSTRACT. In this article, we show how the notion of tensor can be used to build a multi-paradigm model for the storage of social data. From an architectural point of view, this approach allows to link different storage systems (polystore) and thus limits the impact of ETL tools performing model transformations to feed different analysis algorithms. The proposed model allows to reach the logical independence between data and programs implementing analysis algorithms. With a concrete case study on message virality on Twitter during the period between the two rounds of the French presidential election of 2017, we highlight the contributions of our model. MOTS-CLÉS : stockage polyglotte, réseau multi-relationnel, tenseur, OLAP
Type de document :
Communication dans un congrès
Liste complète des métadonnées

Littérature citée [41 références]  Voir  Masquer  Télécharger

https://hal-univ-bourgogne.archives-ouvertes.fr/hal-01821102
Contributeur : Eric Leclercq <>
Soumis le : mardi 23 juillet 2019 - 09:02:10
Dernière modification le : jeudi 25 juillet 2019 - 01:23:03

Fichier

INFORSID_2018_final.pdf
Accord explicite pour ce dépôt

Identifiants

  • HAL Id : hal-01821102, version 1

Citation

Eric Leclercq, Marinette Savonnet. Modèle tensoriel pour l'entreposage et l'analyse des données des réseaux sociaux Application à l'étude de la viralité sur Twitter. INFORSID 2018, May 2018, Nantes, France. ⟨hal-01821102⟩

Partager

Métriques

Consultations de la notice

54

Téléchargements de fichiers

22