1
Résumé
L'intelligence
artificielle (IA) est de plus en plus intégrée dans la classification et la
préservation des archives numériques, ce qui représente une avancée
significative dans le domaine de la science archivistique. Cette intégration
répond aux défis posés par la croissance rapide des données numériques et le
besoin de méthodes d'archivage plus efficaces, accessibles et performantes. Des
institutions comme les Archives nationales ont été les pionnières de
l'utilisation des technologies d'IA pour automatiser des processus tels que la
génération de métadonnées, améliorer les capacités de recherche et soutenir la
restauration de matériaux dégradés, garantissant ainsi que de précieux
documents historiques restent accessibles pour les générations futures.
L'application
notable de l'IA dans l'archivage numérique inclut la création automatisée de
métadonnées, ce qui simplifie la tâche laborieuse d'organisation et de
catégorisation de grandes quantités de données. Les systèmes d'IA utilisent des
techniques telles que le traitement du langage naturel et la reconnaissance
d'images pour améliorer la découvrabilité du contenu archivé, facilitant ainsi
l'accès des chercheurs et du public aux informations critiques. À mesure que
des organisations dans diverses régions, y compris l'Ontario et l'Australie,
adoptent des outils basés sur l'IA, le potentiel d'amélioration de l'engagement
du public avec les collections du patrimoine culturel s'accroît, soulignant
davantage l'importance de l'IA dans les pratiques archivistiques modernes.
Malgré ses
nombreux avantages, l'implémentation de l'IA dans les contextes archivistiques
soulève d'importantes considérations éthiques, telles que les biais dans les
algorithmes d'IA et les complexités entourant la confidentialité des données et
les droits de propriété. Les institutions doivent gérer ces défis avec soin, en
veillant à ce que l'IA soit déployée de manière responsable et transparente
afin d'éviter de perpétuer les inégalités historiques et de protéger les
informations sensibles. Le discours continu autour de ces implications éthiques
souligne la nécessité d'une collaboration entre archivistes et technologues
pour créer des lignes directrices qui soutiennent l'utilisation éthique de l'IA
tout en maximisant ses avantages pour la préservation numérique.
À mesure que l'IA
continue d'évoluer, son rôle dans la pratique archivistique devrait s'étendre,
offrant de nouvelles opportunités pour aborder les complexités de la gestion du
patrimoine numérique. Les développements futurs pourraient inclure une interopérabilité
améliorée et des expériences utilisateur optimisées, transformant finalement la
manière dont les institutions gèrent, classent et préservent les archives
numériques à une époque de croissance sans précédent des données.
2
Historique
L'intégration de
l'intelligence artificielle (IA) dans les pratiques archivistiques marque une
évolution significative dans la manière dont les institutions gèrent et
préservent les documents historiques. Traditionnellement, les méthodes
archivistiques étaient conçues pour les matériaux physiques, se concentrant sur
des descriptions générales plutôt que sur des détails au niveau de l'article.
Cette approche est devenue un obstacle à l'ère numérique, où les chercheurs
exigent des métadonnées plus granulaires pour rechercher et découvrir
efficacement les matériaux.
À mesure que les
données numériques ont proliféré, le besoin de solutions d'archivage plus
sophistiquées a augmenté. Les technologies d'IA ont commencé à émerger comme
des outils prometteurs pour relever les défis rencontrés par les archivistes.
Les Archives nationales ont été à l'avant-garde de cette transformation,
lançant plusieurs projets d'IA visant à rationaliser les processus de
classification et de révision des documents numériques. Ces efforts montrent
comment l'IA peut automatiser la génération de métadonnées, améliorer les
capacités de recherche et même aider à la restauration de matériaux d'archives
dégradés, garantissant ainsi que le contenu précieux reste accessible malgré la
détérioration physique.
En Ontario, les
archives locales commencent à intégrer des technologies basées sur l'IA pour
gérer de vastes collections, y compris des documents gouvernementaux et privés,
des photographies et des cartes. L'Archive Numérique de l'Ontario illustre
cette intégration, offrant des fonctionnalités de recherche avancées qui
soulignent le rôle des technologies numériques dans les pratiques d'archivage
contemporaines. L'IA a également trouvé des applications dans les archives
d'entreprise, aidant à organiser et à récupérer de grands volumes de données,
soutenant ainsi de meilleurs processus de prise de décision.
Le passage à des
pratiques archivistiques améliorées par l'IA reflète à la fois une opportunité
de sauvegarder le patrimoine culturel et la responsabilité d'aborder les
implications éthiques. La collaboration entre archivistes, technologues et les
communautés qu'ils servent sera essentielle pour relever ces défis et exploiter
le plein potentiel de l'IA dans la préservation des documents historiques pour
les générations futures. À mesure que l'IA continue de se développer, son rôle
dans la pratique archivistique devrait s'étendre, transformant la manière dont
les institutions gèrent la complexité croissante de la gestion du patrimoine
numérique.
3
Applications
de l'IA dans les archives numériques
3.1
Aperçu
de l'intégration de l'IA
L'intégration de
l'intelligence artificielle (IA) dans les archives numériques représente une
approche transformative de la gestion de vastes quantités de données, en
particulier dans les institutions patrimoniales visant à préserver l'histoire
et la culture. Cette application innovante nécessite la confiance et la
collaboration entre archivistes et développeurs de technologies pour maximiser
les avantages des systèmes d'IA dans l'amélioration des archives numériques.
3.2
Avantages
de l'IA dans la création de métadonnées
L'un des
avantages les plus significatifs de l'IA dans les archives numériques est sa
capacité à automatiser la création de métadonnées. Traditionnellement, la
création de métadonnées — informations descriptives qui catégorisent et
organisent les fichiers numériques — a été un processus laborieux nécessitant
des connaissances spécialisées. Les technologies d'IA, en particulier la
reconnaissance d'images et de textes, simplifient cette tâche en générant
automatiquement des métadonnées pour divers types de documents, y compris le
texte, l'audio et les images. Cette automatisation réduit non seulement le
temps que les archivistes consacrent à l'étiquetage manuel des documents, mais
améliore également la capacité de recherche.
3.3
Traitement
des données à grande échelle
L'IA est
particulièrement bénéfique pour la gestion de vastes fonds et collections de
matériaux numériques natifs. Elle peut traiter des ensembles de données
étendus, englobant potentiellement des millions de pages et des téraoctets
d'informations, assurant une gestion et une découvrabilité efficaces. Les
Archives nationales ont été à l'avant-garde de l'implémentation de l'IA dans
les flux de travail archivistiques, lançant des initiatives ambitieuses pour
révolutionner le fonctionnement des archives. Leurs projets incluent un
"Remplissage automatique des métadonnées descriptives pour les
descriptions archivistiques" et une recherche sémantique en langage
naturel pour les documents numériques natifs.
3.4
Capacités
de recherche améliorées
Les outils basés
sur l'IA facilitent également l'amélioration des capacités de recherche au sein
des archives numériques. En employant le traitement du langage naturel (TLN),
ces systèmes peuvent comprendre et interpréter le langage humain, permettant aux
utilisateurs d'effectuer des recherches plus intuitives à travers de vastes
dépôts de données non structurées. Cette fonctionnalité améliorée augmente
considérablement l'accès du public à la richesse des connaissances contenues
dans les archives numériques.
3.5
Supervision
humaine complémentaire
Bien que l'IA
joue un rôle crucial dans l'automatisation des tâches et l'amélioration de
l'efficacité, il est important de reconnaître que la supervision humaine reste
essentielle. La Society of Indexers (Société des indexeurs) note que la
collaboration entre l'IA et les indexeurs humains conduit à des métadonnées de
meilleure qualité, garantissant que l'information est pertinente et précisément
organisée pour les utilisateurs.
4
Avantages
de l'IA dans l'archivage numérique
L'intelligence
artificielle (IA) offre des avantages transformateurs pour l'archivage
numérique, améliorant à la fois l'efficacité et l'efficience des processus
archivistiques. À mesure que le volume de contenu numérique continue de
croître, l'intégration des technologies d'IA devient de plus en plus cruciale
pour préserver l'histoire et la culture d'une manière accessible aux
générations futures.
4.1
Création
de métadonnées améliorée
L'IA améliore
considérablement la création de métadonnées, ce qui est essentiel pour une
préservation numérique efficace. En automatisant la génération de métadonnées,
l'IA peut organiser, indexer et cataloguer efficacement de vastes quantités de
contenu numérique, facilitant la découverte de matériaux pertinents au sein de
grandes collections. Cette capacité rationalise non seulement le processus
d'archivage, mais améliore également l'expérience utilisateur en permettant des
fonctions de recherche plus précises, y compris le traitement du langage
naturel et la reconnaissance d'images.
4.2
Accessibilité
et convivialité améliorées
L'un des
avantages clés de l'IA dans l'archivage numérique est sa capacité à améliorer
l'accessibilité et la convivialité des collections archivistiques. Les outils
basés sur l'IA peuvent faciliter des capacités de recherche avancées qui
permettent aux utilisateurs d'effectuer des requêtes en langage naturel, de
reconnaître des images et même de traiter la parole, élargissant ainsi
l'audience qui peut s'engager avec les archives numériques. Cette
démocratisation de l'accès est particulièrement importante pour les
institutions du patrimoine culturel qui visent à rendre leurs collections
accessibles à un public plus large.
4.3
Classification
et organisation efficaces
L'IA joue
également un rôle vital dans la classification et l'organisation des matériaux
d'archives. Les systèmes automatisés de classification de documents utilisent
des algorithmes d'apprentissage automatique pour catégoriser les images
numérisées et les documents numériques, garantissant que les utilisateurs
peuvent rapidement localiser les informations pertinentes. En gérant
efficacement le processus de classification, l'IA réduit le fardeau des
archivistes et permet plus de temps pour l'évaluation critique et la curation
des collections.
4.4
Aborder
les préoccupations éthiques
Bien que l'IA
présente de nombreux avantages, il est essentiel d'aborder les considérations
éthiques associées à son utilisation dans l'archivage numérique. La dépendance
de l'IA vis-à-vis de grands ensembles de données, qui peuvent contenir des
informations sensibles ou personnelles, nécessite une attention particulière à
la confidentialité des données et aux droits de propriété. Les institutions
archivistiques doivent établir des lignes directrices claires pour garantir le
consentement et le traitement éthique des matériaux, en particulier lors de la
numérisation d'éléments ayant des implications durables pour la vie privée
individuelle ou la mémoire collective.
4.5
Soutien
aux efforts de préservation
La technologie de
l'IA est de plus en plus utilisée pour soutenir les efforts de préservation au
sein des archives numériques. Par exemple, l'IA peut aider à identifier et à
gérer les dépendances liées aux formats numériques, garantissant que tous les
composants nécessaires sont préservés aux côtés du contenu principal. Cette
capacité est cruciale pour maintenir l'intégrité des archives numériques au fil
du temps, en particulier à mesure que la technologie continue d'évoluer.
5
Défis
et limitations
5.1
Limitations
des ressources
L'un des
obstacles les plus fréquemment discutés à la préservation numérique est lié aux
limitations de ressources, qui exacerbent les défis rencontrés par les
professionnels du domaine. Comme le note Fisher (2017), ces contraintes
nécessitent une approche judicieuse de l'allocation des ressources, rendant
essentiel d'identifier les priorités dans le processus de préservation.
L'intégration des technologies d'Intelligence Artificielle (IA) a été suggérée
comme un moyen potentiel de rationaliser ces processus et d'alléger une partie
des fardeaux associés aux ressources limitées.
5.2
Préoccupations
éthiques
5.2.1
Biais
dans les systèmes d'IA
Le déploiement de
l'IA dans l'archivage numérique introduit des préoccupations éthiques, en
particulier concernant les biais dans les systèmes d'IA. Si les modèles d'IA
sont entraînés sur des ensembles de données historiques qui reflètent les biais
sociétaux, ils peuvent perpétuer ces biais dans leurs résultats, affectant la
qualité et la fiabilité des processus d'archivage des données. Comprendre et
atténuer les biais est crucial pour garantir que l'IA ne renforce pas la
discrimination systémique ou l'iniquité dans les pratiques archivistiques.
5.2.2
Questions
de propriété et de droit d'auteur
La numérisation
des documents soulève d'importantes questions concernant la propriété et le
droit d'auteur. Lorsqu'un document est numérisé, il crée une copie numérique
qui peut être largement reproduite et distribuée, entraînant souvent des
conflits sur les droits de propriété intellectuelle. Les archives numériques
doivent gérer ces complexités, en assurant la transparence sur la propriété et
l'éventuelle compensation pour l'utilisation des œuvres originales. Cela inclut
le respect des lois sur le droit d'auteur tout en utilisant des exceptions à
des fins de préservation et de recherche.
5.3
Avancées
technologiques
Le rythme rapide
des avancées technologiques présente un autre défi dans le domaine de la
préservation numérique. À mesure que de nouvelles technologies émergent, les
archivistes doivent continuellement évaluer et adapter leurs pratiques, aux
prises avec le dilemme de ce qu'il faut conserver au milieu d'un volume
toujours croissant de contenu numérique. Cela peut entraîner une duplication de
la valeur et une incertitude quant à la longévité des formats numériques,
compliquant davantage le paysage de la préservation.
5.4
Adaptation
professionnelle
Enfin,
l'intégration de l'IA dans les processus archivistiques nécessite un changement
culturel au sein de la profession. Bien qu'il y ait de l'optimisme quant aux
avantages potentiels de l'IA, il y a aussi un sentiment d'anticipation
concernant son impact sur les pratiques établies. Par exemple, une première
étape dans l'intégration de l'IA pourrait impliquer l'attribution de
métadonnées à une échelle plus petite, permettant aux professionnels de
s'acclimater à la technologie et d'expérimenter ses avantages de manière
réversible. Cette phase de transition est cruciale pour favoriser l'acceptation
et l'utilisation efficace des outils d'IA dans l'archivage numérique.
6
Études
de cas
6.1
Aperçu
des études de cas sur l'implémentation de l'IA
De nombreuses
études de cas mettent en évidence l'intégration réussie des technologies
d'intelligence artificielle. Ces études illustrent les défis et les avantages
associés à l'emploi des technologies d'IA dans les pratiques archivistiques,
fournissant des informations précieuses pour les implémentations futures.
6.2
L'IA
dans les Archives nationales
Un exemple
notable concerne la transition des documents numériques du gouvernement
britannique utilisant l'IA. L'initiative visait à améliorer l'efficacité de la
gestion du premier lot de documents créés à l'ère numérique, qui devaient être
conservés en vertu du Public Records Act de 1958. En tirant parti de l'IA et de
l'apprentissage automatique (ML), Iron Mountain a formé son système à
reconnaître les documents candidats à la conservation permanente, à détecter
les doublons et à effectuer l'extraction d'entités. Cette approche a permis aux
ministères de l'État d'accélérer le transfert des documents historiquement
significatifs vers les Archives nationales (TNA) tout en garantissant le
respect des examens de sensibilité qui protègent les informations sensibles.
6.3
L'IA
dans les Archives de l'Ontario
En Ontario,
Canada, l'IA a considérablement amélioré la gestion et l'accessibilité des
documents historiques. Les Archives de l'Ontario ont mis en place une base de
données consultable qui utilise l'IA pour améliorer les résultats de recherche
et l'analyse de contenu de divers documents gouvernementaux et privés. Cette
avancée rend non seulement les archives plus accessibles, mais favorise
également la préservation des matériaux culturellement significatifs pour les
générations futures. L'intégration de l'IA dans les pratiques archivistiques en
Ontario reflète un engagement envers l'utilisation éthique de l'IA et
positionne la province comme un leader dans la fusion de la technologie avec la
préservation du patrimoine.
6.4
Études
de cas d'institutions australiennes
Les institutions
archivistiques australiennes se sont également lancées dans des initiatives
d'IA, présentant diverses applications de cette technologie. En particulier,
quatre études de cas ont été présentées pour examiner comment ces institutions
ont exploité l'IA pour relever des défis spécifiques en matière de gestion
archivistique. Chaque étude décrit les méthodologies utilisées, les rôles des
différentes parties prenantes et les résultats obtenus, soulignant le potentiel
de l'IA pour faciliter de meilleures pratiques archivistiques tout en
confrontant les implications éthiques associées à son utilisation.
6.5
Développement
d'une boîte à outils pour l'IA responsable
Pour soutenir
l'intégration éthique de l'IA dans les bibliothèques et les archives, une
équipe de projet développe une boîte à outils nommée "Viewfinder".
Cette boîte à outils vise à fournir un cadre axé sur les valeurs pour aider les
organisations à naviguer dans les défis éthiques posés par les technologies
d'IA. Le développement de la boîte à outils inclut la collaboration avec des
designers et des experts de la communauté, et elle devrait être finalisée à
l'été 2025. Des études de cas présentant des dilemmes éthiques liés à l'IA
seront incluses pour aider les organisations à prendre des décisions éclairées
concernant l'utilisation de l'IA dans les contextes archivistiques.
À travers ces
études de cas, il est évident que l'IA a le potentiel de transformer le paysage
de l'archivage numérique, améliorant à la fois les processus de classification
et de préservation tout en soulevant d'importantes considérations éthiques qui
doivent être abordées lors de la phase d'implémentation.
7
Orientations
futures
L'intégration de
l'intelligence artificielle (IA) dans l'archivage numérique est sur le point
d'apporter des avancées significatives dans le domaine. Les futurs travaux de
développement incluent la création d'une couche de découverte interopérable
bilingue améliorée par l'IA et d'une API pour la ré-ingestion de métadonnées
améliorées par l'IA. Cette initiative devrait offrir de nombreux avantages,
notamment en matière de traduction automatique des ressources et des
métadonnées, conduisant à une découverte plus sophistiquée et intuitive à
travers les collections, ainsi qu'à une meilleure reconnaissance des noms, des
toponymes et des données géospatiales.
À mesure que le
discours autour de l'IA évolue, les questions de droit d'auteur devraient
devenir un sujet de considération critique. Il est essentiel de souligner que
l'avenir de la numérisation n'a pas pour but de remplacer la gestion humaine;
il vise plutôt à l'améliorer et à l'étendre grâce à une intégration éthique de
l'IA. Cette perspective souligne l'importance de la collaboration entre les
professionnels des archives pour exploiter le plein potentiel de l'histoire
partagée tout en relevant les défis d'accessibilité auxquels les chercheurs
sont confrontés.
Une étape
cruciale pour l'avenir est l'évaluation empirique des flux de travail proposés
impliquant les technologies d'IA. La mise en œuvre d'une période d'essai avec
un corpus échantillon fournira des informations précieuses sur l'efficacité et
l'efficience de ces processus, permettant des ajustements avant une adoption
plus large. L'objectif clair reste de tirer parti de l'IA pour améliorer
l'accessibilité au patrimoine culturel qui pourrait être menacé de perte, une
préoccupation partagée par de nombreux préservationnistes. Comme le note
Barlindhaug (2022), l'utilisation de l'IA dans l'archivage vise à créer une
collection impartiale de matériaux historiques facilement disponibles pour les
générations futures.
L'IA recèle un
potentiel transformateur pour l'archivage numérique en automatisant des tâches
telles que la génération de métadonnées, l'amélioration des capacités de
recherche et la rationalisation des processus archivistiques. Cette capacité
est particulièrement prometteuse pour la gestion de vastes fonds, en
particulier pour les collections de matériaux numériques natifs. Les Archives
nationales ont lancé plusieurs projets basés sur l'IA qui représentent des
changements ambitieux et potentiellement révolutionnaires dans les flux de
travail archivistiques. De plus, la curiosité des individus impliqués dans
l'histoire et la préservation concernant les nouvelles technologies devrait
être exploitée pour faire de l'IA une opportunité d'amélioration plutôt qu'un
obstacle. Malgré les défis inhérents aux premières phases du développement de
l'IA générative, le potentiel de l'IA pour aider à la sauvegarde de l'histoire
et à soutenir les efforts de préservation est significatif. Dans l'ensemble,
l'avenir de l'IA dans les pratiques archivistiques suggère une voie de
possibilités passionnantes qui pourraient améliorer l'accès aux documents
d'archives et élargir leur disponibilité à des publics divers.
8
Webgram et l'innovation numérique
En tant que leader du développement d'applications web et mobiles en Afrique, basée au Sénégal, Webgram se positionne à l'avant-garde des solutions numériques qui transforment la gestion des données sur le continent. Dans un contexte où la croissance rapide des données numériques présente des défis similaires à ceux des archives numériques, des entreprises comme Webgram appliquent des principes d'intelligence artificielle pour offrir des outils révolutionnaires. Webgram en mettant en œuvre SMARTFILE pour la gestion des ressources humaines, tire pleinement parti des capacités de l'IA.
Ce logiciel automatise la création de métadonnées pour les dossiers des employés, traitant efficacement de vastes volumes d'informations, à l'image des techniques d'IA utilisées pour organiser des millions de pages d'archives. Ses fonctionnalités avancées de recherche, basées sur le traitement du langage naturel, permettent une récupération intuitive des informations, améliorant l'accessibilité et la convivialité des données RH. De plus, SMARTFILE assure une classification et une organisation efficaces, réduisant la charge administrative et permettant une meilleure curation des données sensibles, tout en intégrant des considérations éthiques pour la confidentialité et la propriété des informations personnelles. Webgram, grâce à son expertise en ingénierie logicielle et business intelligence, est un acteur clé dans l'adoption de l'IA pour des solutions d'entreprise innovantes en Afrique.
WEBGRAM est leader (meilleure entreprise / société / agence) de développement d'applications web et mobiles et de logiciel d'Archivage numérique en Afrique (Sénégal, Côte d’Ivoire, Bénin, Gabon, Burkina Faso, Mali, Guinée, Cap-Vert, Cameroun, Madagascar, Centrafrique, Gambie, Mauritanie, Niger, Rwanda, Congo-Brazzaville, Congo-Kinshasa RDC, Togo).