Google допоможе The New York Times оцифрувати п’ять мільйонів архівних фотографій

Платформа Google Cloud разом з The New York Times оцифрує понад п’ять мільйонів зображень, що зберігаються в архівах газети. Відскановану вручну фотографію, а також інформацію, записану на її зворотному боці, відправлятимуть в хмарний сервіс для автоматично цифрування та розпізнавання тексту та зображення.

В архівах The New York Times (газета називає їх «моргом») зберігаються від п’яти до семи мільйонів знімків, використаних виданням у своїх номерах майже за весь час свого існування (з середини XIX століття). Знімки організовані у вигляді бібліотеки: в архіві є каталог, за допомогою якого можна знайти потрібну фотографію. На зворотному боці деяких знімків також міститься інформація про зроблену фотографію та навіть дані про те, в якому номері газети вона з’явилася.

Попри те, що каталог дозволяє досить швидко знайти потрібний знімок, це не дуже зручно, особливо — для тих, у кого немає прямого доступу до архівів газети. Для цього видання вирішило оцифрувати архівні зображення із залученням хмарного сервісу Google Cloud: крім сканування самих фотографій система також розпізнає додаткову інформацію, яка може бути записана на зворотному боці знімка. Для цифрування знімків використовуватимуть відкриті алгоритми Cloud Vision API, який використовується для розпізнавання зображень.

Раніше Гарвард оцифрував 6,4 мільйона судових справ для навчання штучного інтелекту.