행위

"Linked Jazz"의 두 판 사이의 차이

red

(Who 누가)
(How 어떻게)
83번째 줄: 83번째 줄:
  
 
Linked Jazz 프로젝트는 재즈 역사 디지털 아카이브에 보관된 구전 역사 기록에서 개인 이름을 추출하는 탐색 프로젝트에서 시작됐다. 이름을 검색하고 기록하기 위해 재즈 디렉토리를 구문 분석하고 녹취록의 각 이름을 검색하는 파이썬 스크립트가 작성되었다. 추출한 이름은 해당 이름의 URI<ref>URI는 URL처럼 보이지만 그와 달리 개인의 신원과 같은 고유한 데이터를 지정하며 시간에 따라 안정적으로 유지된다. URI의 가장 일반적인 소스 중 일부는 Wikipedia의 구조화 된 데이터를 수집하는 Wikipedia의 자매 사이트인 Library of Congress Linked Data Service1 및 DBpedia에서 온 것이다.</ref>와 연결한다. 이러한 매핑은 9,000개 이상의 재즈 아티스트 이름 및 관련 URI의 데이터 세트를 만들어냈다. LOD는 URI를 연결하는 동시에 의미를 더하는 온톨로지<ref>온톨로지는 문장에 추가할 수 있는 동사 목록 또는 링크된 열린 데이터 용어로 가능한 술어 목록으로 기능하며, 주체와 객체를 연결해주는 역할을 한다. </ref>를 사용한다. Linked Jazz 프로젝트에서는 [https://en.wikipedia.org/wiki/FOAF_(ontology) FOAF(Friend of a Friend)온톨로지]가 사용되었다.  FOAF(Friend of a Friend) 온톨로지는 재즈 아티스트 간의 관계를 가까운 친구, 자녀, 또는 멘토로 정의할 수 있다. 이는 단절되어 있던 데이터를 의미 있는 정보의 영역으로 끌어올리는 작업이다.<br/>
 
Linked Jazz 프로젝트는 재즈 역사 디지털 아카이브에 보관된 구전 역사 기록에서 개인 이름을 추출하는 탐색 프로젝트에서 시작됐다. 이름을 검색하고 기록하기 위해 재즈 디렉토리를 구문 분석하고 녹취록의 각 이름을 검색하는 파이썬 스크립트가 작성되었다. 추출한 이름은 해당 이름의 URI<ref>URI는 URL처럼 보이지만 그와 달리 개인의 신원과 같은 고유한 데이터를 지정하며 시간에 따라 안정적으로 유지된다. URI의 가장 일반적인 소스 중 일부는 Wikipedia의 구조화 된 데이터를 수집하는 Wikipedia의 자매 사이트인 Library of Congress Linked Data Service1 및 DBpedia에서 온 것이다.</ref>와 연결한다. 이러한 매핑은 9,000개 이상의 재즈 아티스트 이름 및 관련 URI의 데이터 세트를 만들어냈다. LOD는 URI를 연결하는 동시에 의미를 더하는 온톨로지<ref>온톨로지는 문장에 추가할 수 있는 동사 목록 또는 링크된 열린 데이터 용어로 가능한 술어 목록으로 기능하며, 주체와 객체를 연결해주는 역할을 한다. </ref>를 사용한다. Linked Jazz 프로젝트에서는 [https://en.wikipedia.org/wiki/FOAF_(ontology) FOAF(Friend of a Friend)온톨로지]가 사용되었다.  FOAF(Friend of a Friend) 온톨로지는 재즈 아티스트 간의 관계를 가까운 친구, 자녀, 또는 멘토로 정의할 수 있다. 이는 단절되어 있던 데이터를 의미 있는 정보의 영역으로 끌어올리는 작업이다.<br/>
이름 데이터 세트를 사용하여 한 아티스트가 인터뷰에서 다른 아티스트를 언급하면 첫 번째 아티스트가 두 번째 아티스트를 알고 있다고 가정하여 아티스트 간의 기본 관계를 판별할 수 있다. 이러한 방식으로 예술가들을 연결하여 기본적인 소셜 네트워크를 만들 수 있다. 이 네트워크는 Linked Jazz Network Visualization Tool을 작성하는 데 사용되었다. 정적 네트워크를 제공하는 것 외에도 이 도구를 사용하여 네트워크와 역동적으로 상호 작용하고, 촘촘히 모여있는 관계망를 확대하여 더 자세히 볼 수 있으며, 음악가의 사회적 관계망을 보기 위해 한 명의 아티스트를 선택하고 특정 개인을위한 네트워크를 역동적으로 생성할 수 있다. <br/>
+
이름 데이터 세트를 사용하여 한 아티스트가 인터뷰에서 다른 아티스트를 언급하면 첫 번째 아티스트가 두 번째 아티스트를 알고 있다고 가정하여 아티스트 간의 기본 관계를 판별할 수 있다. 이러한 방식으로 예술가들을 연결하여 기본적인 소셜 네트워크를 만들 수 있다. 이 네트워크는 Linked Jazz Network Visualization Tool을 작성하는 데 사용되었다. 정적 네트워크를 제공하는 것 외에도 이 도구를 사용하여 네트워크와 역동적으로 상호 작용하고, 촘촘히 모여있는 관계망를 확대하여 더 자세히 볼 수 있으며, 음악가의 사회적 관계망을 보기 위해 한 명의 아티스트를 선택하고 특정 개인을 위한 네트워크를 역동적으로 생성할 수 있다. <br/>
  
  
103번째 줄: 103번째 줄:
 
이름 매핑 및 큐레이터 도구는 가능한 한 광범위하고 정확한 재즈 아티스트 개인 이름의 디렉토리 작성을 지원하기 위해 개발되었다.
 
이름 매핑 및 큐레이터 도구는 가능한 한 광범위하고 정확한 재즈 아티스트 개인 이름의 디렉토리 작성을 지원하기 위해 개발되었다.
  
**'''Linked Jazz 52nd Street '''
+
**'''[https://linkedjazz.org/52ndStreet Linked Jazz 52nd Street]'''
  
  
 
**'''Ecco!'''
 
**'''Ecco!'''
 
+
Ecco!는 신뢰할 수 있는 소스의 URI로 명명된 엔티티를 명확하게 조정하도록 설계된 공개 데이터 애플리케이션이다.
 +
Ecco! 시스템은 정확한 일치에서 일대 다 또는 일치하지 않는 다양한 신뢰 수준에 따라 결과의 순위를 자동으로 지정해 각각 그룹화한다. 다수의 매칭이 가능할 때 매치를 검증하거나 정확한 URI를 식별하는 것으로 구성된 인간 명확화를 통해 데이터 출력의 품질을 더욱 개선 할 수 있다. 이처럼 Ecco!는 사용자가 큐레이션에 빠르고 쉽게 기여할 수 있도록 설계되었다.
 +
이 시스템은 커뮤니티가 분산되고 점진적으로 협력 할 수있는 협업 워크 플로우를 지원하는 직관적인 사용자 인터페이스를 제공한다. 자동화 매칭과 인간 큐레이션의 조합은 전통적인 방법으로는 달성 할 수 없는 우수한 품질의 데이터를 생성할 수 있다.
  
 
**'''LodLive'''
 
**'''LodLive'''

2020년 4월 11일 (토) 21:07 판

Linked Jazz 웹사이트 가기

Who 누가

Linked Jazz 팀 2019년 기준 [1]

  1. 공동 이사
    크리스티나 교수.jpg
    • M. Cristina Pattuelli 크리스티나 파투엘리
      • Linked Jazz의 프로젝트 디렉터이자
      • 박사 학위 보유
      • 뉴욕 프랫 연구소(Pratt institute)의 정보 학교 부교수
      • 정보 시스템에 적용된 정보 구성 및 지식 표현 원칙 및 방법 연구
      • 현재 문화 유산 자원에 적용되는 시맨틱 웹[2] 기술 연구
      • 채플 힐 노스 캐롤라이나 대학교에서 정보 및 도서관 과학을 전공했으며 이탈리아 볼로냐 대학교에서 철학 및 문화 유산 연구를 전공
        매트 교수.jpg
    • Matt Miller 매트 밀러
      • Linked Jazz의 기술 책임자이자
      • 문화유산 분야에서 일하는 사서 및 기술자
      • 프랫 연구소 정보 학교 조교수
      • 새로운 기술과 도구의 활용을 통해 문화, 역사 및 지식에 대한 접근을 촉진하는데 노력
      • 맨틱 애플리케이션 및 데이터 리서치 책임자로 뉴욕 공공 도서관에서 NYPL 연구소의 일원이었으며 하버드 대학교 도서관 혁신 연구소에서 2017년 연구원으로 일했음
  2. 연구 위원
    • Karen Li-Lun Hwang 카렌 리런 황
      • 시맨틱 웹 기술을 커뮤티니 아카이브 및 특별 컬렉션의 자료에 적용함으로써 저평가 된 내러티브 홍보
  • Hannah Sistrunk 한나 시스트렁크
    • Rockefeller Archive Center의 보조 디지털 보관인

When 언제

2011년 9월, Dublin Core 2011 컨퍼런스에서 Linked Jazz의 Pilot 버전 사이트의 개설을 알리면서 프로젝트는 시작되었다. 그 후, 매년 재즈 아티스트들에 대한 방대한 양의 정보를 효율적으로 정리하기 위한 도구들이 지속적으로 개발되어왔다. 가장 대표적인 Linked Jazz의 기술은 Linked Jazz 52nd st, Network Visualization Tool 등이 있다. 언제 어떠한 도구들이 개발되어 왔는가에 대한 내용은 다음과 같다.

  • 2011 : ‘An explanatory pilot‘ 파일럿 프로그램 런칭
  • 2012 : Netwrok visualizing Tool 개발
  • 2013 : 52nd Street 개발
  • 2015 : ECCO! TOOL 개발

Network Visualization Tool API Linked Jazz 52nd st

위와같은 기술적인 개발 외에도, Linked Jazz팀은 꾸준히 프로젝트와 관련된 출판활동과 세미나, 컨퍼런스 등과 같은 활동들을 계속해왔다. Linked Jazz와 관련된 활동들은 2017년도까지 활발하게 이루어졌다. 2018년부터 현재까지는 Linked Jazz와 관련된 활동 뿐만 아니라 전반적인 공개데이터에 관한 활동들을 꾸준히 지속하고 있다. 2011년부터 2017년도까지의 출판, 세미나 활동들은 다음과 같다.

년도 Linked Jazz와 관련된 세미나와 출판활동
2011년 사이트 개설
2012년
  • 미국 정보 과학 기술 협회 (ASIS & T)에서 연례 회의, 볼티모어, MD, 2012 년 10 월 26-30
  • 디지털 아카이브에 대한 링크 된 공개 데이터 : Pattuelli, M.C. (2012) LInked Jazz 프로젝트의 정보 네트워크와 사람들 네트워크 연결에 관한 보고서 작성
2013년
  • Thorsen, H. 및 Pattuelli, M.C. (2013). LInked Jazz 프로젝트의 재즈 음악가의 관계를 분석하기위한 크라우드 소싱 도구 설계에 대한 보고서
2014년
  • Pattuelli, M.C. (2014). LODLAM 커뮤니티 및 LAM 문화, 관행 및 교육 구축.
  • Lange, L. 및 Pattuelli, M.C. (2014, 6 월 30 일). LInked Jazz 프로젝트의 EDUCAUSE 온라인 검토.
2015년
  • Pattuelli, M.C., Provo, A. 및 Thorson, H. (2015). LInked Jazz 프로젝트의 온톨로지 구축 : 실용적인 관점. 도서관 메타 데이터 저널 15권
  • Pattuelli, M.C. 및 Miller, M. (2015). 시맨틱 네트워크 에지 : LInked Jazz 프로젝트의 유형화 된 관계를 나타내는 인간-기계적 접근. 지식 경영 학회지 19권
2016년
  • Thorsen, H.K. 및 Pattuelli, M.C. (2016). LInked Jazz 프로젝트의 문화 유산 연구에 관련된 저널 작성
2017년
  • Pattuelli, C., Hwang, K. & Miller, M (2017). 우연한 발견을 통한 체계적인 연구 : ‘공개 데이터를 활용한 여성 재즈 아티스트에 대한 연구’. 인문학 디지털 저널, 32권, 918–924 쪽.

Where 어디서

(내용 작성)

What 무엇을

(내용 작성)

How 어떻게

  • Step 0: 발상, 텍스트 수집

Linked Jazz 프로젝트의 시작은 재즈계의 거장 메리 로우 윌리엄스의 논문을 소장하고 있는 러트거스 대학 재즈학 연구소와의 연결점이다. Linked Jazz 프로젝트 팀은 재즈 아티스트 57인의 모습이 담긴 에스콰이어의 흑백 사진 A Great Day in Harlem(1958)을 보고 재즈 아티스트 개개인의 위키 문서는 있지만, 재즈 아티스트 간의 관계를 다룬 데이터베이스는 없다는 점에 주목한다. 이들은 재즈 아티스트 간의 알려지지 않은 관계를 밝히기 위해 Linked Open Data(LOD)[3] 기술을 재즈 역사 디지털 아카이브에 적용하기로 한다. 크리스티나 파투엘리와 대학원생으로 이루어진 그룹은 재즈 연구소에 보관된 메리 로우 윌리엄스의 인터뷰 녹취록에 대한 초기 실험을 했다. 초기 실험 이후 Linked Jazz와 재즈학 연구소의 관계가 발전했고, 재즈학 연구소의 기록 보관 담당자 안젤라 로렌스가 Linked Jazz 프로젝트 팀에 합류해 긴밀하게 협업하기 시작했다.
이후 본격적으로 활동하기 시작한 Linked Jazz 프로젝트 팀은 미국 전역의 도서관[4]에 남아 있는 재즈와 관련된 구술 역사 자료를 수집한다.


  • Step 1: 이름 맵핑(Mapping Names)

Linked Jazz 프로젝트는 재즈 역사 디지털 아카이브에 보관된 구전 역사 기록에서 개인 이름을 추출하는 탐색 프로젝트에서 시작됐다. 이름을 검색하고 기록하기 위해 재즈 디렉토리를 구문 분석하고 녹취록의 각 이름을 검색하는 파이썬 스크립트가 작성되었다. 추출한 이름은 해당 이름의 URI[5]와 연결한다. 이러한 매핑은 9,000개 이상의 재즈 아티스트 이름 및 관련 URI의 데이터 세트를 만들어냈다. LOD는 URI를 연결하는 동시에 의미를 더하는 온톨로지[6]를 사용한다. Linked Jazz 프로젝트에서는 FOAF(Friend of a Friend)온톨로지가 사용되었다. FOAF(Friend of a Friend) 온톨로지는 재즈 아티스트 간의 관계를 가까운 친구, 자녀, 또는 멘토로 정의할 수 있다. 이는 단절되어 있던 데이터를 의미 있는 정보의 영역으로 끌어올리는 작업이다.
이름 데이터 세트를 사용하여 한 아티스트가 인터뷰에서 다른 아티스트를 언급하면 첫 번째 아티스트가 두 번째 아티스트를 알고 있다고 가정하여 아티스트 간의 기본 관계를 판별할 수 있다. 이러한 방식으로 예술가들을 연결하여 기본적인 소셜 네트워크를 만들 수 있다. 이 네트워크는 Linked Jazz Network Visualization Tool을 작성하는 데 사용되었다. 정적 네트워크를 제공하는 것 외에도 이 도구를 사용하여 네트워크와 역동적으로 상호 작용하고, 촘촘히 모여있는 관계망를 확대하여 더 자세히 볼 수 있으며, 음악가의 사회적 관계망을 보기 위해 한 명의 아티스트를 선택하고 특정 개인을 위한 네트워크를 역동적으로 생성할 수 있다.


  • Step 2: 크라우드소싱(Crowdsourcing)[7]

Linked Jazz 프로젝트의 두 번째 단계는 데이터 세트에 이름이 명시된 재즈 아티스트의 사회적 및 전문적 관계를 매핑하는 도구 및 방법을 개발하는 것이었다. 기본적인 관계망은 이름을 연결하는 방식으로 나타낼 수 있었지만, 구체적으로 예술가들이 어떠한 종류의 관계를 누구와 가졌는지를 나타내는 더욱 발전된 도구를 개발하게 되었다.

Linked Jazz 프로젝트 팀의 주요 임무는 (1) 사용자를 유치하고 (2) 사용자를 유지하며 (3) 양질의 데이터를 생성하는 크라우드소싱 도구를 구축하는 것이었다. 이러한 목표를 달성하기 위해 크라우드 소싱에 대한 기존 문헌을 조사하고 기존 도구에서 식별 한 모범 사례 중 일부에 도구를 대입했다. 강력한 소셜 네트워크를 생성 할 수 있는 자동화된 기술과 텍스트를 이해하고 그에 기술 된 개인적 및 전문적 관계의 본질을 식별 할 수있는 인간의 능력을 결합한 크라우드소싱을 선택했다. 프로젝트 팀 멤버인 Matt Miller가 만든 도구인 Linked Jazz 52nd Street는 크라우드소싱을 사용하여 재즈 아티스트들이 공유했던 관계망를 관찰할 수 있다. 이 도구는 주로 재즈 거장이 다른 재즈 아티스트를 언급한 짧은 대화 내용을 텍스트로 보여주고, 사용자에게 직접 아티스트 간의 관계를 정의내리고 정보를 추가할 수 있게 한다. 해당 정보는 Linked Jazz 사이트에 연결·제공된다.


  • Linked Jazz를 구성하는 5가지 도구
    • The Linked Jazz Transcript Analyzer

Linked Jazz Transcript Analyzer를 사용하여 (1) 공개 액세스 아카이브의 인터뷰 녹취록을 업로드하고 Linked Jazz 이름 디렉토리를 활용하여 인터뷰 녹취록에 인용된 개인 이름을 식별한다. (2) 디렉토리에 없는 이름을 찾기 위해 자연어 처리를 사용한다. 새로 발견된 이름은 이름 권한 파일에서 URI와 연관시키거나, 당국에서 이름이 발견되지 않으면 Linked Jazz 네임스페이스에서 호스트하는 새로운 URI를 만든다. (3) 인터뷰 녹취록을 질문과 답변의 개별 세그먼트로 분해하고, 이후 Linked Jazz 52nd Street의 툴로 사용할 수 있다.


    • Name Mapping & Curator Tool

이름 매핑 및 큐레이터 도구는 가능한 한 광범위하고 정확한 재즈 아티스트 개인 이름의 디렉토리 작성을 지원하기 위해 개발되었다.


    • Ecco!

Ecco!는 신뢰할 수 있는 소스의 URI로 명명된 엔티티를 명확하게 조정하도록 설계된 공개 데이터 애플리케이션이다. Ecco! 시스템은 정확한 일치에서 일대 다 또는 일치하지 않는 다양한 신뢰 수준에 따라 결과의 순위를 자동으로 지정해 각각 그룹화한다. 다수의 매칭이 가능할 때 매치를 검증하거나 정확한 URI를 식별하는 것으로 구성된 인간 명확화를 통해 데이터 출력의 품질을 더욱 개선 할 수 있다. 이처럼 Ecco!는 사용자가 큐레이션에 빠르고 쉽게 기여할 수 있도록 설계되었다. 이 시스템은 커뮤니티가 분산되고 점진적으로 협력 할 수있는 협업 워크 플로우를 지원하는 직관적인 사용자 인터페이스를 제공한다. 자동화 매칭과 인간 큐레이션의 조합은 전통적인 방법으로는 달성 할 수 없는 우수한 품질의 데이터를 생성할 수 있다.

    • LodLive

Why

(내용 작성)

Comment 논평

(내용 작성)

각주

  1. https://semlab.io/people/
  2. https://ko.wikipedia.org/wiki/%EC%8B%9C%EB%A7%A8%ED%8B%B1_%EC%9B%B9
  3. 컴퓨터가 읽을 수 있고 웹에서 배포할 수 있는 의미 있는 방법으로 데이터 조각을 연결하는 방법이다. 이 작업은 텍스트 문자열을 고유한 리소스 식별자(URI)에 연결하여 수행된다.
  4. 스미소니언, 해밀턴, 캘리포니아 온라인 아카이브, 러트거스, 미시간 대학교 등
  5. URI는 URL처럼 보이지만 그와 달리 개인의 신원과 같은 고유한 데이터를 지정하며 시간에 따라 안정적으로 유지된다. URI의 가장 일반적인 소스 중 일부는 Wikipedia의 구조화 된 데이터를 수집하는 Wikipedia의 자매 사이트인 Library of Congress Linked Data Service1 및 DBpedia에서 온 것이다.
  6. 온톨로지는 문장에 추가할 수 있는 동사 목록 또는 링크된 열린 데이터 용어로 가능한 술어 목록으로 기능하며, 주체와 객체를 연결해주는 역할을 한다.
  7. '대중'(crowd)과 '외부 자원 활용'(outsourcing)의 합성어. 전문가 대신 비전문가인 대중에게 문제의 해결책을 아웃소싱하는 것이다.