AI 시대의 진짜 병목이 수십 년치 디지털화되지 않은 종이 기록임이 밝혀지면서, 그것을 보유한 정부와 병원이 지구에서 가장 강력한 데이터 행위자로 부상한다.
기업 AI 도입의 병목은 컴퓨팅 파워도, 모델도, 인재도 아닌 것으로 드러났다. 아무도 디지털화하지 않은 60년치 손으로 쓴 접수 양식, 아날로그 사건 파일, 종이 장부였다. 한국의 보험사들이 이 격차를 가장 먼저 발견했다. AI 역량과 AI 실제 배치 사이의 거리는 거의 전적으로 OCR 문제였다. 정부들이 종이 아카이브, 즉 인구조사 기록, 의료 기록, 법원 파일이 대체 불가능하고 구조적으로 고유한 학습 데이터임을 깨달았을 때 계산이 뒤집혔다. 미디지털화 아카이브가 가장 많은 국가들, 대부분 글로벌 사우스에 속한 나라들은 예상치 못한 레버리지를 쥐고 있음을 발견했다. 아카이브 접근권은 AI 라이선스 협상의 협상 카드가 되었다. 한때 비효율의 상징이었던 종이 관료주의가 10년의 가장 치열한 쟁탈 대상 데이터 자원이 되었다.
41세의 아마라 디알로는 세네갈 보건부 기록물 관리국장이다. 2032년 봄, 그녀는 같은 주에 세 개의 AI 기업과 두 나라의 정부 대표단을 맞이한다. 모두 같은 것을 원한다. 농촌 진료소에서 60년간 수기로 작성된 환자 접수 기록, 즉 어떤 형식으로도, 어디에도 존재하지 않는 서아프리카 인구 집단의 유일한 종단 건강 데이터셋이다. 그녀는 아직 그것이 얼마만큼의 가치인지 결정하지 않았다. 그녀는 커리어 처음으로 서두르지 않는다.
프라이버시 옹호자들은 오래된 기록의 디지털화 경쟁이 AI 준비태세라는 명목 아래 수백만 명을 감시와 데이터 착취에 노출시킨다고 경고한다. 여러 나라에서 긴급 디지털화가 의미 있는 동의 체계 없이 진행되며, 기록 당사자들이 발언권 없이 소급하여 데이터화된다. 2033년 유럽인권재판소는 역사적 종이 기록이 작성 당시 시대의 프라이버시 기대를 계속 담고 있다고 판결하며 디지털화 파도를 복잡하게 만들지만 멈추지는 못한다.