Le projet PlaIR, réalisé durant la période 2010-2012, se donnait pour objectif de mutualiser, d'une part, un ensemble de ressources documentaires numériques, et, d'autre part, les composant logiciels permettant d'analyser automatiquement ces ressources. Ceci était fait dans le but de constituer une plateforme d'indexation et de recherche d'information multi-domaines et multi-usages. Quatre domaines d'applications avaient été retenus pour constituer autant de démonstrateurs de cette plateforme : la santé, l'ingénierie, le droit, ainsi que les archives patrimoniales numérisées.
Le projet s'articulait autour de trois objectifs complémentaires :
Dans sa continuité, le projet PlaIR 2.0 (2013-2015) est en passe d'aboutir. Ces projets ont reçu le soutien de la Région Haute Normandie, de l'Union Européenne à travers le FEDER, ainsi que de l'ANR.
Dans le cadre de l'application sur les archives patrimoniales, PlaIR a donné naissance au projet PIVAJ. Nos outils ont pour but d'extraire l'information contenue dans les archives de journaux, ainsi que sa structure, et de proposer leur consultation en ligne à l'aide d'une plateforme alliant visualisation des pages, consultation des articles transcrits automatiquement, recherche plein-texte et correction collaborative.
Grâce à une collaboration avec les Archives Départementales de Seine-Maritime, nous avons construit un premier prototype mettant en ligne 80 années du Journal de Rouen, un des plus anciens titres de presse locale de France. Le succès de PIVAJ auprès des utilisateurs, en comparaison des solutions existantes, nous a convaincu de chercher à pérenniser ce travail en améliorant nos outils de traitement et en modernisant la plateforme de consultation.
Notre équipe de développement fait partie de l'équipe Document et Apprentissage du LITIS, à l'Université de Rouen. Au cours de la vie du projet, nous avons bénéficié du soutien de plusieurs partenaires et financeurs.
Dr. Pierrick Tranouez est ingénieur de recherche dans l'équipe Document et Apprentissage du LITIS, à l'Université de Rouen. Dans le cadre de ses activités liées aux documents patrimoniaux, il est impliqué dans les projets PlaIR et DocExplore. Il dirige actuellement les développements de PIVAJ. |
|
Julien Lerouge est ingénieur chez Normandie Université, rattaché à l'équipe Document et Apprentissage du LITIS. Diplômé en 2013 de l'INSA de Rouen et de l'Université de Rouen dans la spécialité informatique, il travaille depuis sur des projets liant traitement d'images et apprentissage automatique. Il est actuellement le développeur principal de PIVAJ, travaillant sur l'analyse des images de journaux ainsi que sur la plateforme en ligne. |
|
Dr. Stéphane Nicolas est maître de conférence à l'Université de Rouen. Il est spécialiste dans l'analyse de la mise en page de documents, et a participé, avec David Hébert, à l'élaboration des algorithmes permettant l'analyse des images de journaux, à l'aide de champs aléatoires conditionnels. Il est aussi impliqué dans le projet DocExplore avec Pierrick Tranouez. |
|
Prof. Thierry Paquet est professeur à l'Université de Rouen. Il a co-dirigé le projet PlaIR, et est l'actuel directeur du LITIS. Ses nombreux travaux dans le domaine de la reconnaissance de l'écriture apportent à l'équipe Document et Apprentissage les compétences nécessaires pour traiter tout type de documents. |
Dr. David Hébert est un expert du traitement d'images, de l'analyse de documents et de l'apprentissage sur des données séquentielles. Les modèles de Markov cachés et les champs aléatoires conditionnels sont au cœur de son travail, il a soutenu sa thèse intitulée Champs Aléatoires conditionnels pour l'extraction de structures dans les images de documents en 2013. Ses recherches ont permis de réaliser les algorithmes ayant traité les archives du Journal de Rouen pour les besoins du premier demonstrateur de la plateforme. |
|
Thomas Palfray est un ingénieur spécialisé dans les méthodes d'analyses automatiques permettant de valoriser les corpus documentaires. Il a travaillé 5 ans au sein du LITIS, dans l'équipe Document et Apprentissage. Il a réalisé le premier démonstrateur de la plateforme. En 2013, il a rejoint le département R&D du groupe NUMEN, département qu'il dirige désormais depuis 2014. |
Le LITIS est l'unité de recherche dans le domaine des STIC de Haute-Normandie. Le laboratoire développe des démarches cohérentes pour mieux comprendre et maîtriser la nature de l'information et de son utilisation contextuelle. Les recherches portent à la fois sur des aspects théoriques, algorithmiques et sur la mise en œuvre de systèmes sensibles au contexte, du capteur à la base de données. |
|
Hamelin est une entreprise familiale française et un leader dans le domaine de la fabrication d’articles scolaires et de bureau. Leader européen du marché des cahiers notamment avec la marque Oxford, Hamelin a toujours mis la compréhension des consommateurs et l’innovation au centre de sa stratégie : invention de l’agenda scolaire, qualité Optik Paper®, gamme International pour les managers, cahier Infinium à la couverture indéchirable, application SCRIBZEE® de gestion numérique des notes manuscrites, cahier connecté, easyBook® … |
|
Former, innover, professionnaliser. Implantée depuis près de 40 ans au coeur de la Normandie, en bord de Seine, l'Université de Rouen répond à ces trois missions avec des objectifs : adapter son offre de formation aux réalités socio-économiques, travailler sur les sujets de recherche de demain, renforcer son ouverture sur le monde, accueillir et accompagner au mieux ses quelques 25 000 étudiants. |
|
La ComUE Normandie Université est un EPSCP qui regroupe 6 établissements d'enseignement supérieur et de recherche normands liés par la volonté commune de proposer une offre de formation et de recherche au meilleur niveau, de veiller au développement de l'innovation sous toutes ses formes. |