Lit Long
red
Who 누가
(내용 작성)
When 언제
(내용 작성)
Where 어디서
(내용 작성)
What 무엇을
(내용 작성)
How 어떻게
- 에든버러에서는 영국 도서관, 스코틀랜드 국립 도서관, 하티 트러스트에서 제공하는 매우 크고 다양한 디지털 서적 컬렉션에 text-mining과 georeferencing을 사용해 왔다. 게다가, 몇몇 출판사와 작가들은 우리와 목록을 공유했다. 우리는 에든버러를 그들의 환경으로 만들려는 모든 징후를 보여주는 텍스트들을 이 컬렉션에서 찾아보았다. 우리는 지명의 사용범위나 빈도에서 에든버러를 그들 작품의 배경으로 한 모든 징후를 보여 주는 이 컬렉션의 텍스트를 찾았다. 알고리즘과 수동 큐레이션[1]의 조합은 그 텍스트들을 필터 처리함으로써 도시를 탐구하기도 하고 활동 배경으로 사용할 수 있는 수백 가지의 작품 데이터 세트를 제공한다. 이 본문에서 언급된 에든버러 지역은 소설이나 회고록에서 이름을 지을 수 있는 매우 다른 방법을 등록하기 위해 만들어진 맞춤형 지명 사전을 사용하여 좌표화되었다.
Why 왜
LitLong을 만든 목적은 에든버러와 같은 문학 도시의 지형이, 많은 책들에서 디지털 독서를 할 수 있게 해준다면 어떤 모습일지 알아보는 것이었다. 에든버러는 많은 작가들과 독자들에 의해 형성된 꽤 잘 알려진 문학사를 가지고 있다. 이 역사는 책, 지도, 도보여행, 그리고 도시의 많은 문학 유적지와 관광지에서 볼 수 있다. 하지만 합창단에서 들을 수 있는 다른 목소리들이 있을까? 다른, 덜 친숙한 이야기?[2] 알고리즘이 읽게 함으로써, 에든버러의 문학사에 대한 친숙한 이야기를 수백 편의 다른 문학 작품들의 생소한 맥락과 연결하려고 노력해 왔다. 이 지도와 앱을 통해 오래된 연결고리를 보여주기를 원하고, 또 쉽게 포착할 수 있었던 수백 편의 문학 작품들 중에서 새로운 연결고리를 구축하기를 원한다.
Comment 논평
- 한계
- 에든버러는 포괄적이지 않다. 비교적 쉽게 텍스트 마이닝(text-mining)을 할 수 있는 디지털화된 텍스트의 코퍼스(말뭉치)를 사용할 필요가 있었다. 또한 저작권 제한, 그리고 시각적 문자 인식과 현재의 텍스트 마이닝 기술이 시(poetry)가 가지고 있는 어려움들에 의해 제약되어 왔다. 더불어 이것은 영어와 스코틀래드어에 국한되어 왔다. – 언어 처리 도구를 게일어[3]에 적응시킬 수 없었다.
- The Phantom Menace
적당한 이름은 까다롭다. 이름처럼 기능할 수 있는 흔한 명사들뿐만 아니라 장소와 개인 이름은 언어학적으로 동일한 경우가 많다. 예를 들어, 축구 감독 저스틴 에든버러가 만약 우리 책들 중 한 권에 나타난다면 우리의 코드는 아마 그를 도시 경계 근처 어딘가에 둘 것이다. 우리가 채굴한 책들에도 등장인물이 많은데, 제목들이 너무 자주 지리적으로 배치되어 있기 때문에, 우리는 가끔 사람을 장소로 잘못 읽어서 우리의 데이터베이스에 유령 항목을 생성했다. 또한 이 지명 사전은 바나 펍, 식당과 같은 종류의 장소를 포함하는데, 때때로 그것들은 The Waiting Room, the Hill Station, and the Golden Rule과 같은 일반적인 문구에서 이름을 따온다. 그래서 이것들 중 몇몇은 다른 문학적이지 않은 장소에 예상치 못한 임의의 문학적인 암시를 주면서 슬금슬금 들어왔다.
- You've missed one...