Lit Long

수정중입니다! 'Lit Long: Edinburgh'는 에든버러 대학교의 문학, 언어 및 문화 학교, 정보학 학교, 세인트 앤드류 대학교의 'SACI' 연구 그룹 및 'EDINA' 사이의 AHRC가 지원하는 협력 프로젝트인 Palimpsest의 시각적 대화형 구성 요소다. 이 팀에는 문학자, 텍스트 마이닝을 전문으로 하는 컴퓨터 과학자, 정보 시각화 학자들이 포함되어 있다. ^[1]

When 언제

(내용 작성)

Where 어디서

(내용 작성)

What 무엇을

'Lit-Long'은 문학 에든버러의 독특한 지도다. 그 뒤에는 약 550권의 책(소설, 단편, 편지, 회고록)에서 발췌한 5만권의 데이터베이스가 있다. 발췌문에는 에든버러 장소 이름을 사용하는 것이 특징으로, 각각의 장소에는 좌표를 부여하고 지도에 고정할 수 있다. 데이터베이스는 최신 기술을 사용하여 작성되었다.
에든버러를 배경으로 하는 600여 권의 책에 매우 큰 지명 언급(mention) 데이터베이스를 만들었다. 그 후 우리는 각각의 언급을 둘러싼 문장들을 즉시 추출했고, 그것을 발췌해서 우리의 데이터베이스에 포함시켰다. 그 데이터는 장소의 이름 언급을 통해 지도로 만들어졌고, 이것은 모바일 앱과 온라인에서 탐색할 수 있다. LitLong과 함께 당신은 문학 에든버러를 통해 자신만의 길을 걸을 수 있다.

How 어떻게

에든버러에서는 영국 도서관, 스코틀랜드 국립 도서관, 하티 트러스트에서 제공하는 매우 크고 다양한 디지털 서적 컬렉션에 text-mining과 georeferencing을 사용해 왔다. 게다가, 몇몇 출판사와 작가들은 우리와 목록을 공유했다. 우리는 에든버러를 그들의 환경으로 만들려는 모든 징후를 보여주는 텍스트들을 이 컬렉션에서 찾아보았다. 우리는 지명의 사용범위나 빈도에서 에든버러를 그들 작품의 배경으로 한 모든 징후를 보여 주는 이 컬렉션의 텍스트를 찾았다. 알고리즘과 수동 큐레이션^[2]의 조합은 그 텍스트들을 필터 처리함으로써 도시를 탐구하기도 하고 활동 배경으로 사용할 수 있는 수백 가지의 작품 데이터 세트를 제공한다. 이 본문에서 언급된 에든버러 지역은 소설이나 회고록에서 이름을 지을 수 있는 매우 다른 방법을 등록하기 위해 만들어진 맞춤형 지명 사전을 사용하여 좌표화되었다.

Why 왜

LitLong을 만든 목적은 에든버러와 같은 문학 도시의 지형이, 많은 책들에서 디지털 독서를 할 수 있게 해준다면 어떤 모습일지 알아보는 것이었다. 에든버러는 많은 작가들과 독자들에 의해 형성된 꽤 잘 알려진 문학사를 가지고 있다. 이 역사는 책, 지도, 도보여행, 그리고 도시의 많은 문학 유적지와 관광지에서 볼 수 있다. 하지만 합창단에서 들을 수 있는 다른 목소리들이 있을까? 다른, 덜 친숙한 이야기?^[3] 알고리즘이 읽게 함으로써, 에든버러의 문학사에 대한 친숙한 이야기를 수백 편의 다른 문학 작품들의 생소한 맥락과 연결하려고 노력해 왔다. 이 지도와 앱을 통해 오래된 연결고리를 보여주기를 원하고, 또 쉽게 포착할 수 있었던 수백 편의 문학 작품들 중에서 새로운 연결고리를 구축하기를 원한다.

(수빈님! 제가 나름대로 관심법독해...를 해 봤는데 괜찮으시다면 참고해주세요!) 우리가 Lit Long을 만든 목적은 아주 많은 양의 책을 디지털로 읽을 수 있다면 에든버러와 같은 문학적인 도시의 지형이 어떻게 보일지 알아보기 위해서였다. 에든버러는 잘 알려진 문학사를 가지고 있으며, 이는 수많은 작가들과 독자들에 의해 수년간 누적되어 정리되어왔다. 실제로 이 역사는 책, 지도, 도보 여행 및 도시의 많은 문학 관련 유적지와 관광 명소에서 찾아볼 수 있다. 그러나 수많은 사람들의 집단지성을 통해서라면 우리는 또 다른, 우리에게는 생소한 이야기들을 찾아낼 수 있을지도 모른다. 따라서 우리는 알고리즘이 독서를 할 수 있도록 설정함으로써 에든버러의 문학사에 대한 친숙한 이야기를 수백 편의 다른 작품들의 생소한 맥락과 연결할 수 있도록 노력했다. 우리는 이 지도와 앱이 우리가 포착할 수 있었던 수백 개의 문학 작품들의 오래된 연결고리들을 설명하고 더 나아가 새로운 연결을 만들어 내길 원한다.

Comment 논평

한계

에든버러는 포괄적이지 않다. 비교적 쉽게 텍스트 마이닝(text-mining)을 할 수 있는 디지털화된 텍스트의 코퍼스(말뭉치)를 사용할 필요가 있었다. 또한 저작권 제한, 그리고 시각적 문자 인식과 현재의 텍스트 마이닝 기술이 시(poetry)가 가지고 있는 어려움들에 의해 제약되어 왔다. 더불어 이것은 영어와 스코틀래드어에 국한되어 왔다. – 언어 처리 도구를 게일어^[4]에 적응시킬 수 없었다.
The Phantom Menace

적당한 이름은 까다롭다. 이름처럼 기능할 수 있는 흔한 명사들뿐만 아니라 장소와 개인 이름은 언어학적으로 동일한 경우가 많다. 예를 들어, 축구 감독 저스틴 에든버러가 만약 우리 책들 중 한 권에 나타난다면 우리의 코드는 아마 그를 도시 경계 근처 어딘가에 둘 것이다. 우리가 채굴한 책들에도 등장인물이 많은데, 제목들이 너무 자주 지리적으로 배치되어 있기 때문에, 우리는 가끔 사람을 장소로 잘못 읽어서 우리의 데이터베이스에 유령 항목을 생성했다. 또한 이 지명 사전은 바나 펍, 식당과 같은 종류의 장소를 포함하는데, 때때로 그것들은 The Waiting Room, the Hill Station, and the Golden Rule과 같은 일반적인 문구에서 이름을 따온다. 그래서 이것들 중 몇몇은 다른 문학적이지 않은 장소에 예상치 못한 임의의 문학적인 암시를 주면서 슬금슬금 들어왔다.

You've missed one...

장소 이름의 문학적 용도를 인식하고 구성하기 위해 지명사전을 만드는 것은 어려운 일이다. 적당한 이름을 사용하여 장소를 확정하는 우리의 일반적인 방법은 상당히 다양하며, 작가들이 위치 이름을 사용하는 모든 방법을 하나의 목록에 담아내기는 쉽지 않다. 게다가, 몇몇 장소는 몇 세기 동안 여러가지의 다른 이름과 다양한 철자를 가져왔다. 그 예로, 에딘버러는 Auld Reekie, Edenborough, Edinborrow, 그리고 Embra가 될 수 있다. 그래서 찾고자 하는 것을 완전히 다른 장소와 연관된 것에서 찾을 수 있을 것이다.

↑ 출처: https://ahrc.ukri.org/newsevents/events/calendar/litlongedinburgh/
↑ 참고: 빅데이터 분석을 통해 개인 맞춤 정보를 제공하는 행위.
↑ 참고: But might there be other voices to hear in the chorus? Other, less familiar stories? - 해석을 어떻게 해야할지 감이 안 잡혀 표시해두었습니다.
↑ 참고: Gaelic(스코틀랜드 켈트어) : 고대 켈트어에 뿌리를 둔 언어, 유럽 대부분 지역에서 사용되던 켈트어는 로마제국의 성장과 게르만민족의 발흥에 따라 점차 유럽 서쪽 해안으로 밀려나 어느덧 소수언어로 전락했다.

[1] 출처: https://ahrc.ukri.org/newsevents/events/calendar/litlongedinburgh/

[2] 참고: 빅데이터 분석을 통해 개인 맞춤 정보를 제공하는 행위.

[3] 참고: But might there be other voices to hear in the chorus? Other, less familiar stories? - 해석을 어떻게 해야할지 감이 안 잡혀 표시해두었습니다.

[4] 참고: Gaelic(스코틀랜드 켈트어) : 고대 켈트어에 뿌리를 둔 언어, 유럽 대부분 지역에서 사용되던 켈트어는 로마제국의 성장과 게르만민족의 발흥에 따라 점차 유럽 서쪽 해안으로 밀려나 어느덧 소수언어로 전락했다.

[1]

[2]

[3]

[4]

Lit Long

red

도지현 (토론 | 기여) 사용자의 2020년 4월 19일 (일) 00:03 판 (→‎Why 왜)

(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

목차

Who 누가

When 언제

Where 어디서

What 무엇을

How 어떻게

Why 왜

Comment 논평

Lit Long

red

도지현 (토론 | 기여) 사용자의 2020년 4월 19일 (일) 00:03 판 (→‎Why 왜) (차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

목차

Who 누가

When 언제

Where 어디서

What 무엇을

How 어떻게

Why 왜

Comment 논평

도지현 (토론 | 기여) 사용자의 2020년 4월 19일 (일) 00:03 판 (→‎Why 왜)

(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)