L'Université de Tsukuba, qui promeut la "Recherche et développement de la technologie d'intégration et d'analyse de données pour l'utilisation des mégadonnées dans le monde réel" par le ministère de l'Éducation, est une plate-forme performante qui traite divers flux (* 1) de données. comme Twitter et les données des capteurs.Nous avons clarifié les principales réalisations du premier semestre dont le système.
Nous avons également développé une méthode pour estimer des attributs tels que les informations de localisation et l'âge des utilisateurs de médias sociaux avec le plus haut niveau de précision au monde.Les informations de localisation et les attributs sont des informations supplémentaires importantes lors de l'interprétation du contenu, mais ils ne sont pas explicitement divulgués.Par conséquent, tout en établissant une méthode d'estimation avec une grande précision basée sur le contenu de l'énoncé, nous développons également une méthode pour estimer les attributs d'utilisateur inconnus sur la base des relations entre les utilisateurs et les attributs d'utilisateur connus.
De plus, nous avons réussi à développer un système qui correspond de manière réaliste aux actualités en ligne et à Twitter avec une grande précision.En reliant en temps réel les articles d'actualité aux réactions Twitter qui s'y rapportent, il sera possible de résumer facilement le niveau élevé d'intérêt du public pour les actualités et les diverses opinions.
La recherche et le développement de la technologie d'intégration et d'analyse des données pour l'utilisation des mégadonnées dans le monde réel est un projet que le ministère de l'Éducation promeut depuis quatre ans à partir de 2014, avec l'Université de Tsukuba comme école représentative, l'Université de Tokyo, Tohoku Université et Université Keio.Un total de quatre écoles collaborent pour poursuivre le développement technologique.
(* 1) Les données de flux sont considérées comme « fluantes », les données entrantes sont des entrées et les données sortantes sont traitées comme des sorties.Il existe différents types tels que ceux qui gèrent les entrées/sorties de fichiers et ceux qui gèrent la communication réseau.