Dans le cadre d’un projet appelé « Internet Archive », des millions de livres qui sont hors du droit d’auteur ont été numérisés et mis en ligne.
Cependant, bien que le texte a été soumis à un système OCR et rendues facilement accessibles, les systèmes OCR ont été programmés pour ignorer toutes les zones des pages qui contiennent des photos.
Qui a entraîné une énorme archive consultable de texte de 600 millions de pages, mais pas de moyen efficace pour regarder les images qui se trouvaient sur ces pages
Un universitaire aux États-Unis a réussi à écrire un logiciel spécial qui a épluché automatiquement par le biais de ces 600 millions de pages à la recherche de photos. Le logiciel a alors étiqueté avec des métadonnées utiles et les a uploadé sur Flickr. Jusqu’à présent, 2,6 millions d’images ont été téléchargées. Au total, 12 millions d’images ont été trouvés, et ils sont tous en train d’être téléchargé en ce moment.
Parce que les livres numérisés étaient tous hors du droit d’auteur, datant de 1500 à 1922, toutes les images sont libres de droit aussi. Vous pouvez consulter et télécharger ces images comme vous le souhaitez, et les utiliser comme bon vous semble
Pour commencer, cliquez sur ce lien https://www.flickr.com/photos/internetarchivebookimages pour voir ce qui est disponible.
