얼마 전에 공개한 구글 Books Ngram Viewer에 대해서 프린스턴 대학교 역사학과에 박사과정으로 재학 중인 Benjamin Schmidt는 재밌는 지적을 했음. 1800년대를 기점으로 사라진 long s(ſ ; medial, descending s)를 OCR 프로그램이 f로 판독하는 한계 때문에 발생하는 재미난 그래프를 보여준 것. 1800년을 기점으로 long s와 short s의 사용 빈도가 대칭을 이루는 모습을 그래프를 통해 확인할 수 있음.

Historical usage of long s

Benjamin Schmidt의 블로그에는 디지털 도구를 이용한 문헌 연구와 관련된 재밌는 글들이 많이 있으니, 관심 있는 사람이라면 구독해도 좋을 듯함.