Lit Long
red
Who 누가
수정중입니다! 'Lit Long: Edinburgh'는 에든버러 대학교의 문학, 언어 및 문화 학교, 정보학 학교, 세인트 앤드류 대학교의 'SACI' 연구 그룹 및 'EDINA' 사이의 AHRC가 지원하는 협력 프로젝트인 Palimpsest의 시각적 대화형 구성 요소다. 이 팀에는 문학자, 텍스트 마이닝을 전문으로 하는 컴퓨터 과학자, 정보 시각화 학자들이 포함되어 있다. [1]
When 언제
(내용 작성)
Where 어디서
(내용 작성)
What 무엇을
- 'Lit-Long'은 문학 에든버러의 독특한 지도다. 그 뒤에는 약 550권의 책(소설, 단편, 편지, 회고록)에서 발췌한 5만권의 데이터베이스가 있다. 발췌문에는 에든버러 장소 이름을 사용하는 것이 특징으로, 각각의 장소에는 좌표를 부여하고 지도에 고정할 수 있다. 데이터베이스는 최신 기술을 사용하여 작성되었다.
- 에든버러를 배경으로 하는 600여 권의 책에 매우 큰 지명 언급(mention) 데이터베이스를 만들었다. 그 후 우리는 각각의 언급을 둘러싼 문장들을 즉시 추출했고, 그것을 발췌해서 우리의 데이터베이스에 포함시켰다. 그 데이터는 장소의 이름 언급을 통해 지도로 만들어졌고, 이것은 모바일 앱과 온라인에서 탐색할 수 있다. LitLong과 함께 당신은 문학 에든버러를 통해 자신만의 길을 걸을 수 있다.
How 어떻게
- 에든버러에서는 영국 도서관, 스코틀랜드 국립 도서관, 하티 트러스트에서 제공하는 매우 크고 다양한 디지털 서적 컬렉션에 text-mining과 georeferencing을 사용해 왔다. 게다가, 몇몇 출판사와 작가들은 우리와 목록을 공유했다. 우리는 에든버러를 그들의 환경으로 만들려는 모든 징후를 보여주는 텍스트들을 이 컬렉션에서 찾아보았다. 우리는 지명의 사용범위나 빈도에서 에든버러를 그들 작품의 배경으로 한 모든 징후를 보여 주는 이 컬렉션의 텍스트를 찾았다. 알고리즘과 수동 큐레이션[2]의 조합은 그 텍스트들을 필터 처리함으로써 도시를 탐구하기도 하고 활동 배경으로 사용할 수 있는 수백 가지의 작품 데이터 세트를 제공한다. 이 본문에서 언급된 에든버러 지역은 소설이나 회고록에서 이름을 지을 수 있는 매우 다른 방법을 등록하기 위해 만들어진 맞춤형 지명 사전을 사용하여 좌표화되었다.
Why 왜
LitLong을 만든 목적은 에든버러와 같은 문학 도시의 지형이, 많은 책들에서 디지털 독서를 할 수 있게 해준다면 어떤 모습일지 알아보는 것이었다. 에든버러는 많은 작가들과 독자들에 의해 형성된 꽤 잘 알려진 문학사를 가지고 있다. 이 역사는 책, 지도, 도보여행, 그리고 도시의 많은 문학 유적지와 관광지에서 볼 수 있다. 하지만 합창단에서 들을 수 있는 다른 목소리들이 있을까? 다른, 덜 친숙한 이야기?[3] 알고리즘이 읽게 함으로써, 에든버러의 문학사에 대한 친숙한 이야기를 수백 편의 다른 문학 작품들의 생소한 맥락과 연결하려고 노력해 왔다. 이 지도와 앱을 통해 오래된 연결고리를 보여주기를 원하고, 또 쉽게 포착할 수 있었던 수백 편의 문학 작품들 중에서 새로운 연결고리를 구축하기를 원한다.
(수빈님! 제가 나름대로 관심법독해...를 해 봤는데 괜찮으시다면 참고해주세요!) 우리가 Lit Long을 만든 목적은 '아주 많은 양의 책을 디지털로 읽을 수 있다면 에든버러와 같은 문학적인 도시의 지형이 어떻게 보일지 알아보기 위해서'였다. 에든버러는 잘 알려진 문학사를 가지고 있으며, 이는 수많은 작가들과 독자들에 의해 수년간 누적되어 정리되어왔다. 실제로 이 역사는 책, 지도, 도보 여행 및 도시의 많은 문학 관련 유적지와 관광 명소에서 찾아볼 수 있다. 그러나 수많은 사람들의 집단지성을 통해서라면 우리는 또 다른, 우리에게는 생소한 이야기들을 찾아낼 수 있을지도 모른다. 따라서 우리는 알고리즘이 독서를 할 수 있도록 설정함으로써 에든버러의 문학사에 대한 친숙한 이야기를 수백 편의 다른 작품들의 생소한 맥락과 연결할 수 있도록 노력했다. 우리는 이 지도와 앱이 우리가 포착할 수 있었던 수백 개의 문학 작품들의 오래된 연결고리들을 설명하고 더 나아가 새로운 연결을 만들어 내길 원한다.
Comment 논평
- 한계
- 에든버러는 포괄적이지 않다. 비교적 쉽게 텍스트 마이닝(text-mining)을 할 수 있는 디지털화된 텍스트의 코퍼스(말뭉치)를 사용할 필요가 있었다. 또한 저작권 제한, 그리고 시각적 문자 인식과 현재의 텍스트 마이닝 기술이 시(poetry)가 가지고 있는 어려움들에 의해 제약되어 왔다. 더불어 이것은 영어와 스코틀래드어에 국한되어 왔다. – 언어 처리 도구를 게일어[4]에 적응시킬 수 없었다.
- The Phantom Menace
적당한 이름은 까다롭다. 이름처럼 기능할 수 있는 흔한 명사들뿐만 아니라 장소와 개인 이름은 언어학적으로 동일한 경우가 많다. 예를 들어, 축구 감독 저스틴 에든버러가 만약 우리 책들 중 한 권에 나타난다면 우리의 코드는 아마 그를 도시 경계 근처 어딘가에 둘 것이다. 우리가 채굴한 책들에도 등장인물이 많은데, 제목들이 너무 자주 지리적으로 배치되어 있기 때문에, 우리는 가끔 사람을 장소로 잘못 읽어서 우리의 데이터베이스에 유령 항목을 생성했다. 또한 이 지명 사전은 바나 펍, 식당과 같은 종류의 장소를 포함하는데, 때때로 그것들은 The Waiting Room, the Hill Station, and the Golden Rule과 같은 일반적인 문구에서 이름을 따온다. 그래서 이것들 중 몇몇은 다른 문학적이지 않은 장소에 예상치 못한 임의의 문학적인 암시를 주면서 슬금슬금 들어왔다.
- You've missed one...
- ↑ 출처: https://ahrc.ukri.org/newsevents/events/calendar/litlongedinburgh/
- ↑ 참고: 빅데이터 분석을 통해 개인 맞춤 정보를 제공하는 행위.
- ↑ 참고: But might there be other voices to hear in the chorus? Other, less familiar stories? - 해석을 어떻게 해야할지 감이 안 잡혀 표시해두었습니다.
- ↑ 참고: Gaelic(스코틀랜드 켈트어) : 고대 켈트어에 뿌리를 둔 언어, 유럽 대부분 지역에서 사용되던 켈트어는 로마제국의 성장과 게르만민족의 발흥에 따라 점차 유럽 서쪽 해안으로 밀려나 어느덧 소수언어로 전락했다.