DigitalSinology(2026) Paper02
CNUDH
NYPL Repo API Review
(URL: https://www.nypl.org/research/resources/public-domain-collections)
호남학과 박사과정 이홍범
목차
Contents
뉴욕공립도서관 디지털 콜렉션 API
뉴욕공립도서관이 운영하는 공공도메인(저작권이 만료된 저작물) 공유 API[1] 서비스
일명 리포Repo API((Republic Digital Repository API)라고 칭합니다.
누가(Who)
만들었는가?
뉴욕공립도서관(이하 NYPL) Repo API는 기관 내 IT 부서에서 개발했다. 본 API에서 제공하는 (전산가능한) 데이터는 NYPL과 구글의 협업에서 시작한다. 해당 도서관이 갖고 있는 수백만의 자료를 디지타이징하여 공유하는 <구글 북스 프로젝트>에서 본격화되었다.
* 질문1 : 이 도서관은 어떤 곳이길래, 대학처럼 '연구소'가 있는가?
담당 부서는 Digital Collections & Services 또는 Digital Research and Programming 부서
언제(When)
본문/ Repo API는 다음 연보순서로 기획 및 개발되었다.
2013년 1월 <what's on the Menu? " API 서비스 개시 : 뉴욕시 내외의 식당 메뉴판 데이터를 API 서비스를 통해 제공.
2013년 4월 NYPL Repo API 발표
2016년 6월 대규모 퍼블릭 도메인 이미지 공개
2022년 7월 NYPL Repo API V2 : 버전 업 서비스 제공
2023년 1월 NYPL Repo API V1 : 구버전 API 폐지 공고
...
2026년 8월 1일 Repo API 종료 예정
Newyork Public Library뉴욕공립도서관 API 의 시작은 2012로 wehre Repo API는 2013년 실험적인 API 서비스를 시도하면서 비롯했다.
2013년 1월 <what's on the Menu? " API 서비스 개시 : 뉴욕시 내외의 식당 메뉴판 데이터를 API 서비스를 통해 제공.
본문내용
2025년 1월, 뉴욕 공립 도서관의 "오늘의 메뉴(What's on the Menu)" 웹사이트는 소프트웨어 및 하드웨어 노후화로 인한 사이버 보안 위험 때문에 서비스가 종료되었습니다. 해당 웹사이트와 관련 데이터 세트의 인기로 인해 서비스 종료는 여러 차례 연기되었습니다. 데이터에 대한 자세한 정보는 아래에서 확인할 수 있습니다.
"메뉴에 뭐가 있을까요?"의 역사 "What's on the Menu?" 웹사이트는 뉴욕 공공 도서관(NYPL)에 있어 역사적인 이정표가 되었으며, NYPL이 직접 구축한 최초의 API입니다. 이 사이트는 도서관이 소장한 디지털화된 메뉴 모음에서 음식과 가격을 추출하여 검색 가능한 색인과 시간 경과에 따른 음식 종류 및 가격 변화를 보여주는 시각화 도구를 구축하기 위한 크라우드소싱 프로젝트였습니다. 이 프로젝트를 위해 45,000개 메뉴 중 17,000개 이상이 디지털화되었습니다. 또한 뉴욕시 전역의 다양한 레스토랑 위치를 지도에 표시하기 위해 크라우드소싱 기반의 지오코딩 기능도 추가되었습니다. 프로젝트 기간 동안 17,562개의 메뉴에서 총 1,335,570개의 음식 정보가 추출되었습니다. 사용자들은 프로젝트 기간 내내 데이터를 탐색하고 자신만의 프로젝트를 구축하기 위해 API 키를 꾸준히 요청해 왔습니다.
2013년 4월 NYPL Repo API 발표
어디서(Where)
본문
맨해튼에 4개의 연구 센터와 맨해튼, 스태튼 아일랜드, 브롱크스 전역에 88개의 지역 도서관을 보유한 뉴욕 공립 도서관은 여러분을 환영합니다. 도서관은 단순한 도서 및 자료 제공을 넘어 유아부터 청소년, 노인에 이르기까지 모든 연령대를 위한 연간 55,000개의 무료 프로그램을 제공합니다. [2]
퍼블릭 도메인 / 미국 저작권 제한 없음
현재 디지털 컬렉션에는 약 50만 건의 공개 자료가 있으며 , 그 수는 매일 증가하고 있습니다. 이러한 자료를 사용하기 위해 뉴욕 공공 도서관(NYPL)의 허가를 받을 필요는 없으며, 사용에 대한 알려진 제한 사항도 없습니다. 그러나 자료의 형식과 내용에 따라 사생활 보호권, 초상권 또는 기타 제한 사항이 적용될 수 있습니다. 이러한 권리를 존중하는 것은 사용자의 책임입니다.
필수 사항은 아니지만, 저작권이 만료된 자료를 이용하실 경우 "뉴욕 공립 도서관 제공"이라는 출처 표기를 해 주시고, 디지털 컬렉션 웹사이트의 해당 자료 링크를 제공해 주시기 바랍니다. 이렇게 해주시면 컬렉션 이용 현황을 파악하고 향후 더 많은 콘텐츠를 공개하는 데 도움이 됩니다.
뉴욕 공공 도서관(NYPL)의 공공 자료 및 프로젝트에 대한 자세한 내용은 " 모두를 위한 무료: NYPL, 공유 및 재사용을 위한 공공 자료 컬렉션 강화 " 를 참조하십시오. [3]
뉴욕 공립 도서관의 네 곳의 연구 센터는 학자, 작가, 학생 및 모든 분들을 환영합니다. [4]
무엇을(What)
"뉴욕 공공 도서관(NYPL)은 개방형 접근(open access)이라는 목표를 더욱 효과적으로 달성하기 위해, 자사 저장소 API를 통해 즉시 이용 가능한 특정 서지 메타데이터 레코드 (이하 "메타데이터 레코드")를 선정했습니다. 이 메타데이터 레코드는 NYPL 웹사이트에서 찾아볼 수 있는 일부 자료에 대한 것입니다."(NYPL)> [5] [6]
본문 what
본문 what 2
.
본문 what 3
MODS(https://www.loc.gov/standards/mods/)
리포Repo API의 메타데이터는 MODS(Metadata Object Description Schema)기준을 따른다., 미국 의회 도서관의 기준으로 정리한 메타데이터로 자료가 구성되어 있다.
다시 말하자면, 데이터베이스의 구조와 제약 조건의 설계도를
[7]
서지 정보의 기준을 매우 중요하게 여기는 것으로 보인다.
본문 what 4
어느내용
본문 what 5
본문 what 6
본문 what 7
참조문법/
- 어느 내용 으로 시각화하여 보여줍니다.
- 어느 내용
- 시대별로 어느 내용
- 각 시인에 대한 어느 내용
- 배경 지도를 어느 내용 .
1. what 8
- 어디에 위치한 유적지와 그와 관련된 중국 고전 시문 정보를 지도 위에서 시각적으로 탐색할 수 있습니다.
- 사용자는 api 호출 리스트 를 확인할 수 있으며, 이를 json과 xml형태로 호출을 부를 수 있습니다. 각 지점과 연관된 고전 시문, 인물, 역사적 사건 등 다양한 문헌 자료에 접근할 수 있습니다.
2. what 8
- 내용
3. what 8
- 어떤 내용
본문 본문
- 어떤 본문
어느 내용
- 어떤거 2에는 세부내용
- 어떤거 3은 세부내용
- '어떤거 4세부내용
. - 어떤거 5 어쩌고 저쩌고 합니다.
어떻게(How)
본문 HOW 어떻게 사용하냐
100년이 넘는 세월 동안 뉴욕 공립 도서관은 기록된 지식의 모든 영역을 아우르는 희귀하고 독특한 자료들을 방대하게 축적해 왔습니다. 이제 처음으로 도서관의 디지털화된 소장 자료 중 상당 부분이 기계 판독 가능한 데이터로 제공됩니다. 백만 개가 넘는 자료와 기록을 검색하고, 탐색하고, 연산할 수 있습니다. 지금 바로 가입하고 해킹을 시작해 보세요!
[8]
https://api.repo.nypl.org/api/v2/items/search?q=dogs&publicDomainOnly=true&per_page=100
API를 시작하는 사이트 내 API 사용법 안내를 주고 있다.
https://api.repo.nypl.org/api/v2/items/search?q=dogs&publicDomainOnly=true&per_page=100
만약 메타데이터를 보거나 보고싶다면, 메타데이터를 uuid, 고유 id를 찾아서 일일이 받고 이를 다시 호출해야하는 불편함이 크다. 이를 해결하기 위해 사이트 안내에도 편의를 위한 파이썬 작업을 안내하고 있다.(이렇게 메타데이터 리스트만 불러오는 것은 별도의 '토큰'을 지불하지는 않는다
사용 절차 및 주요 기능
본문내용 HOW2
뉴욕공립도서관이 보유하고 있는 데이터 공개 자료 50만 건 중 18만건을 별도로 제공한다. 그러나 실상 호출 할 수 있는 자료를 살펴보면 약 10만여건.
본문 what 2
.
본문 what 3
본문 what 7
참조문법/
ㅏㅏㅏ ㅏㅏㅏ적ㅏㅏㅏㅏㅏ하여 보여줍니다.
1. what 8
- 사용자는 된 고전 시문, 인물, 역사적 사건 등 다양한 문헌 자료에 접근할 수 있습니다.
2. what 8
- '보여줍니다.
3. what 8
본문 본문
- 어떤 본문
기타 유용한 기능
api 메타데이터 호출시 웹사이트의 prety
왜(Why)
왜 WHY 왜 했지. 왜 닫았지?
뉴욕공립도서관 Repo API는 데이터를 호출하는 디지털 기술을 접목하여, 다양하고 다른 각 저장소에 분절된 정보를 한번에 색인하는 것을 목표로 합니다.
이를 통해 연구자들이 분절된 저장소를 각각 색인할 필요없이 하나의 창구에서 원하는 정보의 리스트를 1차적인 크롤링을 가능케합니다.
본 api 서비스는 일반적인 이용자에는 숙련과정이 따르는 불편함은 있습니다. 그럼에도 문제의식이 있는 연구자나 이런 API호출 같은 호출이 익숙한 개발자들은 별 문제가 안되었습니다. 그러나 본 리포 API는 2026년 여름에 폐쇄됩니다.
그 문제는 더 '편리한' 도구가 생겨서일까요? LLM과 같은 대화형 인공지능의 등장으로? 이제 사람들은 도서관에 갈 필요도 없고 일일이 검색키워드를 넣을 필요도 없게 되었습니다. 본인이 궁금하게는 문제와 문제의식 자체에 필요한 것을 ai에게 찾아달라고 부탁하면 되니까요.
2013년 1월 <what's on the Menu? " API 서비스 개시 : 뉴욕시 내외의 식당 메뉴판 데이터를 API 서비스를 통해 제공.
2013년 4월 NYPL Repo API 발표
2016년 6월 대규모 퍼블릭 도메인 이미지 공개
2022년 7월 NYPL Repo API V2 : 버전 업 서비스 제공
2022년 11월 30일 chat gpt open ai 공식 런칭.
2023년 1월 NYPL Repo API V1 : 구버전 API 폐지 공고
...
2026년 8월 1일 Repo API 종료 예정
기계적 자료 공유방식을 포기한 것 같지은 않은데
엔드포인트를 관리하는 관리자을 채용하고있다. 또한 그 해당 역할에 향후 MDM 현대화 (LLM/클라우드) 역량을 요구한다. [9]
또한 트리플if(IIIF)? 기술 프로젝트에 참여
https://iiif.io/ 개방형 API를 통해 사일로를 허물어라 연구에 필수적인 이미지와 시청각 자료들은 대부분 분산된 저장소에 존재하며, 접근은 로컬에서 개발한 애플리케이션으로 제한됩니다. IIIF는 여러분과 여러분의 청중에게 이러한 장벽을 넘어 자유롭게 협업할 수 있는 기회를 제공합니다.
- 현재 뉴욕공립도서관이 자금을 지원한 프로젝트임. 현재 주목받는 api 방식인가
- 동영상과 관련 텍스트가 동시에 시각적으로 제공 ex) 피아노 연주가 있으면, 피아노 연주의 악보의 음계를 실시간으로 보여주는 서비스)
주석
- ↑ (Application Programming Interface)
- ↑ https://www.nypl.org/about/locations
- ↑ https://digitalcollections.nypl.org/about#public_domain
- ↑ https://www.nypl.org/about/divisions
스티븐 A. 슈워츠만 빌딩 일반 연구 부서 드윗 월리스 정기간행물실 도로트 유대인 부서 헨리 W. 및 앨버트 A. 버그 영문학 및 미국 문학 컬렉션 원고 및 기록 보관 부서 라이오넬 핀커스와 피리알 공주 지도 부문 이르마와 폴 밀스타인 미국사, 지역사 및 계보학 부서 칼 H. 포르츠하이머의 셸리와 그의 주변 인물 컬렉션 희귀 도서 부서 조지 아렌츠 컬렉션 미리엄과 아이라 D. 월라치 부서 미술 및 건축 컬렉션 사진 컬렉션 사진 모음 프린트 컬렉션 스펜서 컬렉션 뉴욕 공립 공연예술 도서관, 도로시 앤 루이스 B. 컬먼 센터 영화 및 테이프 아카이브에 있는 극장 빌리 로즈 극장 부문 제롬 로빈스 댄스 부문 음악 부문 로저스 앤 해머스타인 녹음 자료 아카이브 숄버그 흑인 문화 연구 센터 미술 및 유물 부서 진 블랙웰 허트슨 연구 및 참고 자료 부서 원고, 기록 보관소 및 희귀 도서 부서 동영상 및 녹음음 부문 사진 및 인쇄물 부서 뉴욕 공공 도서관의 연구에 대해 자세히 알아보세요 기록 자료 컬렉션 색인 바바라 골드스미스 보존 부서 연구자 자문 그룹 - ↑ <뉴욕 공공 도서관(NYPL) 리포지토리 API 이용 약관> https://www.nypl.org/help/legal-notices/repository-api
- ↑
<뉴욕 공공 도서관의 공개 서지 메타데이터 정책>
https://www.nypl.org/help/legal-notices/open-metadata
https://digitalcollections.nypl.org/about#public_domain - ↑ https://www.loc.gov/standards/mods/userguide/generalapp.html#top_level
- ↑ NYPL 디지털 컬렉션 API 사용법: 먼저 NYPL 개발자 페이지에서 계정을 등록해 API 인증 토큰을 발급받아야 한다. 보완과 한정된 자원관리를 위해 토큰시스템을 부여한 것으로 보인다. 그럼에도 하루 1만회를 요청할 수 있기 때문에 거의 제한 없이 쓸 수 있다. https://api.repo.nypl.org/api/v2/items/search?q=cats&publicDomainOnly=true API 호출은 브라우저 또는 애플리케이션을 통해 이루어지며, 브라우저에서는 사용자 인증(로그인)을 거치거나, 프로그램에서는 HTTP 헤더에 토큰 코드를 포함하여 요청한다 (api.repo.nypl.org). 예를 들어 다음과 같은 URL로 “고양이(cats)” 키워드를 검색할 수 있다. 사이트내 직접적인 안내가 있다.
- ↑ "MDM 현대화 로드맵의 실행을 주도합니다.", "Microsoft Intune/Entra ID 및 Jamf를 포함한 최신 엔드포인트 관리 플랫폼에 대한 풍부한 리더십 경험을 보유" 등의 역량을 요구하는 직원을 현재 채용공고중
https://nypl.pinpointhq.com/en/postings/da667887-6408-4009-b22f-53f8aa1a3405 - ↑ https://iiif.io/api/index.html
