Regarding the language..
We have used external sources of metadata, for instance, on authors, publishers, or geographical places, can be used to enrich and verify bibliographic information. This type of ecosystem has potential for wider implementation in related studies and other bibliographies.
Research use is part of validation
Discussion: potential ML/AI
Whereas documentation and polishing continue, we have done all source code openly available, so that every detail of the data processing can be independently investigated and verified. Automation of the workflow would in principle allow also the analysis of the robustness of this approach to varying technical choices in the data harmonization, although such analysis falls beyond the scope in this manuscript.
[MT: selitykset miten erilaiset arviot on tehty. Nämä kannattais tehdä melkein erillisenä ekaks että niitä vois sitten käyttää myös muualla. Tämän jälkeen yhdistää tekstiin ja ehkä lyhentää jne. Tarkoitan siis esim. kuvausta siitä miten formaattitietoja puuttuvat on täydennetty jne. -> LL: niin, tämähän on nyt siis yksi osaprojekti katalogiputsauksissa. Tätä ei tässä kohtaa noin vaan lisätä kattavasti. joka kenttä pitää käydä läpi yksityiskohtaisemmin, että mitä steppejä on tehty. tämä tulee osaksi siivouskokonaisuutta ja on (ollut jo pitkään) työlistalla. Sitä työtä ei tehdä nyt, mutta sen sijaan kirjoitan tähän lyhyet tiiviit kuvaukset, joita voidaan myöhemmin laajentaa varsinaseksi dokumentaatioksi sinne siivousputkiin.]
Towards a unified view: catalogue integration
Obtaining valid conclusions depends on efficient and reliable harmonization and augmentation of the raw entries.
This paper demonstrates how such challenges can be overcome by specifically tailored data analytical ecosystems that provide scalable tools for data processing and analysis.
Recognition of duplicates
Furthermore, we show how external sources of metadata, for instance, on authors, publishers, or geographical places, can be used to enrich and verify bibliographic information. This type of ecosystem has potential for wider implementation in related studies and other bibliographies.
Open bibliographic data science
data organization, data and code sharing, interfaces, software modules, analytical ecosystems