Linked Jazz
red
Who 누가
Linked Jazz 팀 2019년 기준
- 공동 이사
- M. Cristina Pattuelli M. 크리스티나 파투엘리
- Linked Jazz의 프로젝트 디렉터이자
- 박사 학위 보유
- 뉴욕 프랫 연구소(Pratt institute)의 정보 학교 부교수
- 정보 시스템에 적용된 정보 구성 및 지식 표현 원칙 및 방법 연구
- 현재 문화 유산 자원에 적용되는 시맨틱 웹 기술 연구
- 채플 힐 노스 캐롤라이나 대학교에서 정보 및 도서관 과학을 전공했으며 이탈리아 볼로냐 대학교에서 철학 및 문화 유산 연구를 전공
- Matt Miller 매트 밀러
- Linked Jazz의 기술 책임자이자
- 문화유산 분야에서 일하는 사서 및 기술자
- 프랫 연구소 정보 학교 조교수
- 새로운 기술과 도구의 활용을 통해 문화, 역사 및 지식에 대한 접근을 촉진하는데 노력
- 맨틱 애플리케이션 및 데이터 리서치 책임자로 뉴욕 공공 도서관에서 NYPL 연구소의 일원이었으며 하버드 대학교 도서관 혁신 연구소에서 2017년 연구원으로 일했음
- M. Cristina Pattuelli M. 크리스티나 파투엘리
- 연구 조교
- Taylor Baker 테일러 베이커
- Rose Gold 로즈 골드
- Meghan Lyon 메건 리옹
- EAT 프로젝트 관리자
- Andreas Jonathan 안드레아스 조나단
- Laura Indick 로라 인딕
- 시맨틱 랩 코디네이터
- 연구 위원
- Karen Li-Lun Hwang 카렌 리런 황
- 시맨틱 웹 기술을 커뮤티니 아카이브 및 특별 컬렉션의 자료에 적용함으로써 저평가 된 내러티브 홍보
- Sarah Ann Adams 사라 앤 아담스
- Karen Li-Lun Hwang 카렌 리런 황
제휴사
- Hannah Sistrunk 한나 시스트렁크
- Rockefeller Archive Center의 보조 디지털 보관인
- Hilary Thorsen 힐러리 토르슨
- 프랫 연구소 도서관 및 정보 과학 석사 취득
- 이전엔 Linked Jazz의 프로젝트 관리자로 근무
- 현재 West Coast에서 프로젝트를 홍보하고 메타 데이터 분석을 지원
- Alexandra Provo 알렉산드라 프로보
- 현재 Yale University의 Robert B. Haas Family Arts Library에서 미술 사서로 업무
- Linked Jazz 온톨로지 개발에 기여
- Mary Mann 메리 만
Semantic Lab 시멘틱 연구소
- Linked Jazz의 담당 연구소
- 시맨틱 기술을 도서관, 아카이브 및 박물관에 적용하기 위한 새로운 방법 및 도구 개발을 위한 테스트 베드 및 인큐베이터 역할
- 프로젝트 팀에서 자원 봉사자에 이르기까지 모든 참가자에게 교육 기회를 제공하는 방식으로 연결된 오픈 데이터 리서치를 진행
- 궁극적으로 개방형 데이터 조사 분야에 기여하는 것을 목표
- M. 크리스티나 파투엘리, 매트 밀러 소속
When 언제
2011년 9월, Dublin Core 2011 컨퍼런스에서 Linked Jazz의 Pilot 버전 사이트의 개설을 알리면서 프로젝트는 시작되었다. 그 후, 매년 재즈 아티스트들에 대한 방대한 양의 정보를 효율적으로 정리하기 위한 도구들이 지속적으로 개발되어왔다. 가장 대표적인 Linked Jazz의 기술은 Linked Jazz 52nd st, Network Visualization Tool 등이 있다. 언제 어떠한 도구들이 개발되어 왔는가에 대한 내용은 다음과 같다.
- 2011 : ‘An explanatory pilot‘ 파일럿 프로그램 런칭
- 2012 : Netwrok visualizing Tool 개발
- 2013 : 52nd Street 개발
- 2015 : ECCO! TOOL 개발
위와같은 기술적인 개발 외에도, Linked Jazz팀은 꾸준히 프로젝트와 관련된 출판활동과 세미나, 컨퍼런스 등과 같은 활동들을 계속해왔다. Linked Jazz와 관련된 활동들은 2017년도까지 활발하게 이루어졌다. 2018년부터 현재까지는 Linked Jazz와 관련된 활동 뿐만 아니라 전반적인 공개데이터에 관한 활동들을 꾸준히 지속하고 있다. 2011년부터 2017년도까지의 출판, 세미나 활동들은 다음과 같다.
년도 | Linked Jazz와 관련된 세미나와 출판활동 |
---|---|
2011년 | 사이트 개설 |
2012년 |
|
2013년 |
|
2014년 |
|
2015년 |
|
2016년 |
|
2017년 |
|
Where 어디서
(내용 작성)
What 무엇을
재즈 커뮤니티는 아티스트, 멘토, 라이벌, 연인 및 친구 사이의 관계 때문에 정의된다. 이러한 연결을 노출하고 이들이 생성하는 풍부한 네트워크를 식별할 수 있다면 전례 없는 발견과 이해의 길을 만드는 것이 가능할 것이다. 즉, Linked Jazz는 뮤지션들의 음악적 삶과 개인적인 삶에 대한 서류와 자료 간 의미 있는 연결점을 찾아 더 넓은 환경에서 쓰일 수 있는 도구를 만드는 것을 목표로 한다. 해당 프로젝트는 프랫 연구소의 정보 및 도서관 과학 학교에 기반을 둔 연구 프로젝트로, 열린 공개 데이터를 도서관, 아카이브 및 박물관이 보유하거나 관리하는 자료를 활용한다. 이로써 재즈의 역사에 관한 내용을 디지털 형식으로써 아티스트들의 관계를 밝혀내고 그들의 공동체 생활을 알아보는 것이 프로젝트의 내용이다. 이를 통해 확보한 문화적인 데이터들을 연결하고 또 이들을 자유롭게 조사할 수 있는 환경을 만드는 것은 새로운 해석의 장을 열 수 있을 것이다.
- LOD
Linked Jazz는 디지털 재즈 문화유산에 Linked Open Date(LOD) 기술을 적용하여 재즈 아티스트의 개인 및 직업 생활과 관련된 문서와 데이터 간의 의미 있는 연결을 시각화한다. LOD 활용은 사용자가 디지털화된 아카이브(Archive)를 활용해 뮤지션의 개인적이고 전문적인 관계를 발견할 수 있는 역동적인 디지털 네트워크를 제공한다. 파투 엘리 교수는 이를 “종종 숨겨져 있는 정보에 가시성을 부여하는 가공할 시멘틱 기술”이라고 말했다.
LOD가 적용된 Linked jazz는 서로 크기가 다른 수십 개의 프로필 아이콘으로 이루어져 있다. 예를 들어, John Coltrane존 콜트레인과 Miles Davis마일스 데이비스와 같이 많은 인지도를 보유한 아티스트의 아이콘은 크지만, 덜 알려진 아티스트들은 거의 보이지 않을 정도로 아이콘의 크기가 작다.
개별 프로필에 커서를 갖다 대면 아티스트의 위키피디아 정보와 유튜브에 올라와 있는 연주 영상을 확인할 수 있다. 한 명의 인물을 선택하면 수천 개의 연결고리가 생긴다. 이 연결고리는 재즈 아티스트 상호 간의 연관성을 나타낸다.
사이트 우측 상단에는 사용자가 원하는 정보를 우선적으로 볼 수 있는 네 가지 필터가 있다. 이 필터를 통해 사용자는 아티스트와 아티스트 간의 관계를 확인할 수 있다.
Fixed mode: 외부 둘레에 가장 많이 연결된 개인을 고정하여 보다 명확한 관계를 보여준다.
Gender mode: 네트워크 내의 성별 분포를 보여준다.
Similar mode: 개인이 공유하는 연결 수를 기준으로 그룹화하여 보여준다.
Dynamic mode: 사용자가 개인을 추가하면 그들이 공유하는 연결 관계를 보여준다.
Linked Jazz 개발 초기 단계에는 Free mode가 존재했으나 현재는 삭제되었고, 이후 Gender mode가 추가되었다. 이로써 여성 재즈 아티스트의 존재를 효과적으로 재조명할 수 있게 되었다. Dynamic mode와 Gender mode에서는 특히 잊혀지거나 모호한 아티스트들의 관계, 재즈에서 여성 아티스트의 역사를 더 잘 보이게 해주는 역동적인 대화형 필터로 사용자들이 직접 참여하여 그들만의 재즈 아티스트 지도를 만들 수 있게 도와준다.
- 여성 아티스트
위에서 언급한 것처럼 Linked Jazz 프로젝트는 음악에 관한 여성들의 기여에 초점을 맞추었다. 여성 재즈 뮤지션과의 더 많은 인터뷰를 진행했으며, 이러한 자료는 2015년과 2017년 ‘Women of Jazz Wikipedia Edit-a-thons’ 시리즈 및 Gender mode 제작으로 이어졌다. 다만 프로젝트 팀 측에서는 이를 두고 “성차별이 아닌 모든 재즈의 역사에서 여성의 위치를 재발견하는 것에 의의를 두는 것”이라고 언급했다. 다른 모든 필터와 마찬가지로, Linked Jazz 데이터 맵의 성별 관점은 빨간색과 파란색 선의 거미줄로 연결된 작은 포토 버블에서 남성과 여성 모두를 두드러지게 보이는 점이 이를 뒷받침한다.
인터뷰 녹취록과 이질적인 출처 등을 종합함으로써 Linked Jazz는 디지털 유산에 대한 기록을 보다 풍부하게 만들었다. Zena Latto Project가 대표적인 예이다.
Zena Latto Project
흔적이 거의 없거나 전혀 없는 사람의 이야기에 대한 프로젝트로 Zena Latto 는 역사적으로 거의 영향력과 존재를 잃어버린 아티스트를 대표한다. Linked Jazz팀은 1957년 주최됐지만 제도적인 기록은 없었던 여성 재즈 쇼의 전단지를 발견하고 이를 통해 Zena Latto Project를 착수했다. 재즈 내러티브에서 종종 빠져 나오는 재즈와 덜 알려진 여성 아티스트의 가시성을 높이는 데 특히 중점을 두고 2016년 제나와 연결 및 인터뷰를 진행했으며 프랫의 시멘틱 연구소에서 제나의 온라인 정체성을 부여하는 데 필요한 자료를 수집했다. 이러한 자료들은 디지털화 되어 인터넷 자료실을 통해 공개되었다. 그녀의 기록은 역사적 회복의 가능성을 설명하고 재즈에 있는 다른 소외된 여성을 위한 허브 역할을 할 것이다.
또한, 사용자가 직접 프로젝트에 참여하여 모호하고 잊힌 인물들과 재즈에 등장하는 여성들의 역사를 더욱 잘 보이게 하는 대화형, 역동적인 필터들을 포함하여 재즈에 관한 지식을 설명하는 것이 가능하다.
- 하위 프로젝트
그밖에도 Linked Jazz 팀은 LOD 기술을 통해 ‘Zena Latto Project’를 포함한 하위 프로젝트를 생산했다.
Local 496 Project
지역 496 회원 명부는 1940년대에 만들어진 지역 496 노동조합의 공식 명부로 여기엔 뉴 올리언즈 재즈 뮤지션 연합에서 한 번 분리 된 아프리카계 미국인 조합원의 이름, 주소 및 악기가 포함된다.이 프로젝트는 1969년 백인 아티스트들의 장과 합쳐졌지만, 디렉토리는 일관되고 상호 관련된 아티스트 커뮤니티를 식별하는 데 도움을 준다.
Linking Lost Jazz Shrines
프랫의 시멘틱 연구소는 Collections as Data : Part to Whole에 자금을 지원받아 Weeksville 유산 센터와 공동 작업을 통해, 링크된 개방형 데이터 기술을 WLJSB (Brooklyn Weeksville Lost Jazz Shrines of Brooklyn)의 구술 역사 컬렉션에 적용하려고 한다. 이 컬렉션은 1930년대와 1960년대 사이의 센트럴 브루클린의 문화재 전통 유산을 기록한 2008년 연구 프로젝트의 일부로 만들어졌다. Linking Lost Jazz Shrines는 Linked Jazz 데이터에 연결될 뿐만 아니라 새로운 아티스트, 음악 그룹 및 재즈 공연장을 제공하여 Linked Jazz 네트워크를 강화하고 확장한다.
How 어떻게
- Step 0: 발상, 텍스트 수집
Linked Jazz 프로젝트의 시작은 재즈계의 거장 메리 로우 윌리엄스의 논문을 소장하고 있는 러트거스 대학 재즈학 연구소와의 연결점이다. Linked Jazz 프로젝트 팀은 재즈 아티스트 57인의 모습이 담긴 에스콰이어의 흑백 사진 A Great Day in Harlem(1958)을 보고 재즈 아티스트 개개인의 위키 문서는 있지만, 재즈 아티스트 간의 관계를 다룬 데이터베이스는 없다는 점에 주목한다. 이들은 재즈 아티스트 간의 알려지지 않은 관계를 밝히기 위해 Linked Open Data(LOD)[1] 기술을 재즈 역사 디지털 아카이브에 적용하기로 한다. 크리스티나 파투엘리와 대학원생으로 이루어진 그룹은 재즈 연구소에 보관된 메리 로우 윌리엄스의 인터뷰 녹취록에 대한 초기 실험을 했다. 초기 실험 이후 Linked Jazz와 재즈학 연구소의 관계가 발전했고, 재즈학 연구소의 기록 보관 담당자 안젤라 로렌스가 Linked Jazz 프로젝트 팀에 합류해 긴밀하게 협업하기 시작했다.
이후 본격적으로 활동하기 시작한 Linked Jazz 프로젝트 팀은 미국 전역의 도서관[2]에 남아 있는 재즈와 관련된 구술 역사 자료를 수집한다.
- Step 1: 이름 맵핑(Mapping Names)
Linked Jazz 프로젝트는 재즈 역사 디지털 아카이브에 보관된 구전 역사 기록에서 개인 이름을 추출하는 탐색 프로젝트에서 시작됐다. 이름을 검색하고 기록하기 위해 재즈 디렉토리를 구문 분석하고 녹취록의 각 이름을 검색하는 파이썬 스크립트가 작성되었다. 추출한 이름은 해당 이름의 URI[3]와 연결한다. 이러한 매핑은 9,000개 이상의 재즈 아티스트 이름 및 관련 URI의 데이터 세트를 만들어냈다. LOD는 URI를 연결하는 동시에 의미를 더하는 온톨로지[4]를 사용한다. Linked Jazz 프로젝트에서는 FOAF(Friend of a Friend)온톨로지가 사용되었다. FOAF(Friend of a Friend) 온톨로지는 재즈 아티스트 간의 관계를 가까운 친구, 자녀, 또는 멘토로 정의할 수 있다. 이는 단절되어 있던 데이터를 의미 있는 정보의 영역으로 끌어올리는 작업이다.
이름 데이터 세트를 사용하여 한 아티스트가 인터뷰에서 다른 아티스트를 언급하면 첫 번째 아티스트가 두 번째 아티스트를 알고 있다고 가정하여 아티스트 간의 기본 관계를 판별할 수 있다. 이러한 방식으로 예술가들을 연결하여 기본적인 소셜 네트워크를 만들 수 있다. 이 네트워크는 Linked Jazz Network Visualization Tool을 작성하는 데 사용되었다. 정적 네트워크를 제공하는 것 외에도 이 도구를 사용하여 네트워크와 역동적으로 상호 작용하고, 촘촘히 모여있는 관계망를 확대하여 더 자세히 볼 수 있으며, 음악가의 사회적 관계망을 보기 위해 한 명의 아티스트를 선택하고 특정 개인을 위한 네트워크를 역동적으로 생성할 수 있다.
- Step 2: 크라우드소싱(Crowdsourcing)[5]
Linked Jazz 프로젝트의 두 번째 단계는 데이터 세트에 이름이 명시된 재즈 아티스트의 사회적 및 전문적 관계를 매핑하는 도구 및 방법을 개발하는 것이었다. 기본적인 관계망은 이름을 연결하는 방식으로 나타낼 수 있었지만, 구체적으로 예술가들이 어떠한 종류의 관계를 누구와 가졌는지를 나타내는 더욱 발전된 도구를 개발하게 되었다.
Linked Jazz 프로젝트 팀의 주요 임무는 (1) 사용자를 유치하고 (2) 사용자를 유지하며 (3) 양질의 데이터를 생성하는 크라우드소싱 도구를 구축하는 것이었다. 이러한 목표를 달성하기 위해 크라우드 소싱에 대한 기존 문헌을 조사하고 기존 도구에서 식별 한 모범 사례 중 일부에 도구를 대입했다. 강력한 소셜 네트워크를 생성 할 수 있는 자동화된 기술과 텍스트를 이해하고 그에 기술 된 개인적 및 전문적 관계의 본질을 식별 할 수있는 인간의 능력을 결합한 크라우드소싱을 선택했다. 프로젝트 팀 멤버인 Matt Miller가 만든 도구인 Linked Jazz 52nd Street는 크라우드소싱을 사용하여 재즈 아티스트들이 공유했던 관계망를 관찰할 수 있다. 이 도구는 주로 재즈 거장이 다른 재즈 아티스트를 언급한 짧은 대화 내용을 텍스트로 보여주고, 사용자에게 직접 아티스트 간의 관계를 정의내리고 정보를 추가할 수 있게 한다. 해당 정보는 Linked Jazz 사이트에 연결·제공된다.
- Linked Jazz를 구성하는 5가지 도구
- The Linked Jazz Transcript Analyzer
Linked Jazz Transcript Analyzer를 사용하여 (1) 공개 액세스 아카이브의 인터뷰 녹취록을 업로드하고 Linked Jazz 이름 디렉토리를 활용하여 인터뷰 녹취록에 인용된 개인 이름을 식별한다. (2) 디렉토리에 없는 이름을 찾기 위해 자연어 처리를 사용한다. 새로 발견된 이름은 이름 권한 파일에서 URI와 연관시키거나, 당국에서 이름이 발견되지 않으면 Linked Jazz 네임스페이스에서 호스트하는 새로운 URI를 만든다. (3) 인터뷰 녹취록을 질문과 답변의 개별 세그먼트로 분해하고, 이후 Linked Jazz 52nd Street의 툴로 사용할 수 있다.
- Name Mapping & Curator Tool
이름 매핑 및 큐레이터 도구는 가능한 한 광범위하고 정확한 재즈 아티스트 개인 이름의 디렉토리 작성을 지원하기 위해 개발되었다.
- Ecco!
Ecco!는 신뢰할 수 있는 소스의 URI로 명명된 엔티티를 명확하게 조정하도록 설계된 공개 데이터 애플리케이션이다. Ecco! 시스템은 정확한 일치에서 일대 다 또는 일치하지 않는 다양한 신뢰 수준에 따라 결과의 순위를 자동으로 지정해 각각 그룹화한다. 다수의 매칭이 가능할 때 매치를 검증하거나 정확한 URI를 식별하는 것으로 구성된 인간 명확화를 통해 데이터 출력의 품질을 더욱 개선 할 수 있다. 이처럼 Ecco!는 사용자가 큐레이션에 빠르고 쉽게 기여할 수 있도록 설계되었다. 이 시스템은 커뮤니티가 분산되고 점진적으로 협력 할 수있는 협업 워크 플로우를 지원하는 직관적인 사용자 인터페이스를 제공한다. 자동화 매칭과 인간 큐레이션의 조합은 전통적인 방법으로는 달성 할 수 없는 우수한 품질의 데이터를 생성할 수 있다.
- LodLive
LodLive는 Linked Open Data 이론을 전파하고 RDF 브라우저 기능과 데이터 그래프 표현의 효율성을 연결하는 데 사용할 수 있는 도구를 만들기 위한 실험 프로젝트이다. LodLive는 SPARQL 엔드포인트에만 기반한 RDF 리소스를 사용하는 최초의 네비게이터이다. 의미 웹에 대한 W3C 표준에 의해 발표된 소스가 몇 가지 실행 도구로 쉽게 접근하고 읽을 수 있게 만드는 방법을 입증하는 것을 목표로 한다. 또한 구성된 엔드포인트에 존재하는 리소스를 연결할 수 있으며, LOD 상호 연결 용량을 사용하여 사용자가 한 엔드포인트에서 다른 엔드포인트로 전달할 수 있게 한다.
Why 왜
(내용 작성)
Comment 논평
(내용 작성)
각주
- ↑ 컴퓨터가 읽을 수 있고 웹에서 배포할 수 있는 의미 있는 방법으로 데이터 조각을 연결하는 방법이다. 이 작업은 텍스트 문자열을 고유한 리소스 식별자(URI)에 연결하여 수행된다.
- ↑ 스미소니언, 해밀턴, 캘리포니아 온라인 아카이브, 러트거스, 미시간 대학교 등
- ↑ URI는 URL처럼 보이지만 그와 달리 개인의 신원과 같은 고유한 데이터를 지정하며 시간에 따라 안정적으로 유지된다. URI의 가장 일반적인 소스 중 일부는 Wikipedia의 구조화 된 데이터를 수집하는 Wikipedia의 자매 사이트인 Library of Congress Linked Data Service1 및 DBpedia에서 온 것이다.
- ↑ 온톨로지는 문장에 추가할 수 있는 동사 목록 또는 링크된 열린 데이터 용어로 가능한 술어 목록으로 기능하며, 주체와 객체를 연결해주는 역할을 한다.
- ↑ '대중'(crowd)과 '외부 자원 활용'(outsourcing)의 합성어. 전문가 대신 비전문가인 대중에게 문제의 해결책을 아웃소싱하는 것이다.