Lit Long
red
Who 누가
Palimpsest
Palimpsest는 AHRC(Arts and Humanities Research Council)가 후원하고 있는 에딘버러 대학의 문학, 언어, 문화 학부, 정보학부, 세인트 앤드류스 대학의 SACHI 연구 그룹, 그리고 EDINA 데이터 센터의 15개월 협력 프로젝트이다. Palimpsest 팀은 문학자, 텍스트 마이닝 전문 컴퓨터 과학자 및 정보 시각화 학자들이 포함되어 있다. 아래는 Palimpsest의 프로젝트 팀원 목록이다. [1]
- 수석 연구자
- 제임스 록슬리 James Loxley
- 에든버러 대학교 초기 근대 문학 교수
- 제임스 록슬리 James Loxley
- 공동 연구자
- 연구원과 조교
- 베아트리체 알렉스 Beatrice Alex
- 에든버러 대학교 정보학부 텍스트 마이닝 연구 연구원
- 미란다 앤더슨 Miranda Anderson
- 에든버러 대학교 영문학 연구원
- 클레어 그로버 Claire Grover
- 에든버러 대학교 정보 대학원 선임 연구원
- 데이비드 해리스-버틸 David Harris-Birtill
- SACHI의 연구 동료: 세인트 앤드류스 대학의 세인트 앤드류스 컴퓨터-인간 상호작용 연구
- 우타 힌리치 Uta Hinrichs
- SACHI의 연구 동료: 세인트 앤드류스 대학의 세인트 앤드류스 컴퓨터-인간 상호작용 연구
- 바살리스 카라이스코스 Vasalis Karaiskos
- 에든버러 대학교 정보 학부 연구원
- 니콜라 오스본 Nicola Osborne
- 에든버러 대학교 EDINA 소셜 미디어 책임자
- 리사 오티 Lisa Otty
- 에든버러 대학교 영문학 연구원
- 타라 톰슨 Tara Thompson
- 에든버러 대학교 영문학 연구 조교
- 베아트리체 알렉스 Beatrice Alex
When 언제
조사한 바, Lit Long 사이트에 대한 연혁은 찾아볼 수 없었다. 다만 영국 일간지 『더 가디언(The Guardian)』에 올라온 니콜라 데이비스의 2015년 3월 28일자 기사에 따르면, Lit Long은 2015년 3월 23일에 처음 런칭되었다고 한다. 이외에도 Lit Long은 에든버러 대학 신문 『EDIT Magazine』의 2015년 여름호에서 소개된 바 있다.
2015년 7월 6일에 게시된 유튜브 동영상
Where 어디서
What 무엇을
- 에든버러를 배경으로 하는 600여 권의 책에 매우 큰 지명 언급(mention) 데이터베이스를 만들었다. 그 후 우리는 각각의 언급을 둘러싼 문장들을 즉시 추출했고, 그것을 발췌해서 우리의 데이터베이스에 포함시켰다. 그 데이터는 장소의 이름 언급을 통해 지도로 만들어졌고, 이것은 모바일 앱과 온라인에서 탐색할 수 있다. LitLong과 함께 당신은 문학 에든버러를 통해 자신만의 길을 걸을 수 있다.
- 'Lit-Long'은 문학 에든버러의 독특한 지도다. 그 뒤에는 약 550권의 책(소설, 단편, 편지, 회고록)에서 발췌한 5만권의 데이터베이스가 있다. 발췌문에는 에든버러에 있는 장소의 이름이 사용되어 있다는 특징이 있으며, 각각의 장소에는 좌표를 부여하고 지도에 고정할 수 있다. 데이터베이스는 최신 기술을 사용하여 작성되었다.
- 데이터베이스는 최신 기술을 사용하여 작성되었다->(조금 더 구체적으로는)LitLong은 에든버러에서 설정된 문학 작품을 텍스트로 작성하고 결과를 접근 가능한 방식으로 시각화하기 위해 문학 학자들의 정보를 통해 얻은 자연어 처리 기술을 사용했다.
- 우리는 에든버러를 배경으로 하는, 지명이 언급된 600권이 넘는 책을 바탕으로 매우 큰 데이터베이스를 만들었다. 그런 다음 각각의 언급을 둘러싼 문장들을 추출했고, 그렇게 발췌한 문장들을 데이터베이스에 포함시켰다. 그렇게 포함된 데이터는 언급된 장소의 이름을 통해 각각 도시로 매핑되었으며, 이는 모바일 앱과 온라인 인터페이스를 통해 탐색할 수 있다. Lit Long을 사용하면 문학과 에든버러가 공명하고 있는 장소를 통해 자신만의 길을 걸을 수 있다.
- 에든버러를 배경으로 삼고 있는 600여권 이상의 책에 기반해 제작된 거대한 지명-언급(mention) 데이터베이스. 문장에서 지명이 언급될 때마다 그 주변에 있는 문장들도 함께 추출해 발췌문으로 만들어 데이터베이스에 포함시켰고, 이렇게 완성된 데이터는 각각 해당하는 위치에 매핑되어 모바일 앱이나 온라인 인터페이스를 통해 탐색할 수 있다.
How 어떻게
- 에든버러에서는 영국 도서관, 스코틀랜드 국립 도서관, 하티 트러스트에서 제공하는 매우 크고 다양한 디지털 서적 컬렉션에 text-mining과 georeferencing을 사용해 왔다. 게다가, 몇몇 출판사와 작가들은 우리와 목록을 공유했다. 우리는 에든버러를 그들의 환경으로 만들려는 모든 징후를 보여주는 텍스트들을 이 컬렉션에서 찾아보았다. 우리는 지명의 사용범위나 빈도에서 에든버러를 그들 작품의 배경으로 한 모든 징후를 보여 주는 이 컬렉션의 텍스트를 찾았다. 알고리즘과 수동 큐레이션[3]의 조합은 그 텍스트들을 필터 처리함으로써 도시를 탐구하기도 하고 활동 배경으로 사용할 수 있는 수백 가지의 작품 데이터 세트를 제공한다. 이 본문에서 언급된 에든버러 지역은 소설이나 회고록에서 이름을 지을 수 있는 매우 다른 방법을 등록하기 위해 만들어진 맞춤형 지명 사전을 사용하여 좌표화되었다.
- LitLong:Edinburgh는 영국 국립 도서관, 스코틀랜드 국립 도서관, 하티 트러스트 디지털 도서관 등에서 제공받은 방대한 디지털 서적들에 텍스트 마이닝과 지리참조(Georeference)를 사용해 탄생했다. 추가적으로, 몇몇 출판사들과 작가들이 자신들의 목록을 공유해 주기도 했다. 방대한 장서 속에서 지명의 사용 빈도와 범위를 통해 에든버러가 그 책의 배경임을 알 수 있는 텍스트들을 찾아내려고 했으며, 알고리즘과 수동 선별 작업의 혼용 끝에 기준에 맞는 텍스트들을 선별해 도시의 탐구나 실제 활동의 배경으로 이용될 수 있는 데이터셋을 얻을 수 있었다. 또한 지명들은 픽션이나 회고록에서 어떤 장소가 언급될 수 있는 수많은 방식들을 고려해서 제작된 맞춤형 지명 사전을 통해 지도에 등록되었다.
발췌문
지도에서 펜촉 모양의 아이콘을 클릭하면 해당 위치를 언급한 책의 발췌문이 나오며 책의 전문을 읽을 수 있는 링크 또한 제공한다.
파랑색 펜촉의 경우 그 위치가 맞지만 주황색 펜촉은 그 위치와는 상관없이 에든버러 자체가 언급될 경우에 쓰인다.
Why 왜
우리가 Lit Long을 만든 목적은 '아주 많은 양의 책을 디지털로 읽을 수 있다면 에든버러와 같은 문학적인 도시의 지형이 어떻게 보일지 알아보기 위함'이었다. 에든버러는 잘 알려진 문학사를 가지고 있으며, 이는 수많은 작가들과 독자들에 의해 수년간 누적되어 정리되어왔다. 실제로 이 역사는 책, 지도, 도보 여행 및 도시의 많은 문학 관련 유적지와 관광 명소에서 찾아볼 수 있다. 그러나 수많은 사람들의 집단지성을 통해서라면 우리는 또 다른, 우리에게는 생소한 이야기들을 찾아낼 수 있을지도 모른다. 따라서 우리는 알고리즘이 독서를 할 수 있도록 설정함으로써 에든버러의 문학사에 대한 친숙한 이야기를 수백 편의 다른 작품들의 생소한 맥락과 연결할 수 있도록 노력했다. 우리는 이 지도와 앱이 우리가 포착할 수 있었던 수백 개의 문학 작품들의 오래된 연결고리들을 설명하고 더 나아가 새로운 연결을 만들어 내길 원한다.
Comment 논평
- 한계
- 에든버러는 포괄적이지 않다. 비교적 쉽게 텍스트 마이닝(text-mining)을 할 수 있는 디지털화된 텍스트의 코퍼스(말뭉치)를 사용할 필요가 있었다. 또한 저작권 제한, 그리고 시각적 문자 인식과 현재의 텍스트 마이닝 기술이 시(poetry)가 가지고 있는 어려움들에 의해 제약되어 왔다. 더불어 이것은 영어와 스코틀래드어에 국한되어 왔다. – 언어 처리 도구를 게일어[4]에 적응시킬 수 없었다.
- The Phantom Menace
적당한 이름은 까다롭다. 이름처럼 기능할 수 있는 흔한 명사들뿐만 아니라 장소와 개인 이름은 언어학적으로 동일한 경우가 많다. 예를 들어, 축구 감독 저스틴 에든버러가 만약 우리 책들 중 한 권에 나타난다면 우리의 코드는 아마 그를 도시 경계 근처 어딘가에 둘 것이다. 우리가 채굴한 책들에도 등장인물이 많은데, 제목들이 너무 자주 지리적으로 배치되어 있기 때문에, 우리는 가끔 사람을 장소로 잘못 읽어서 우리의 데이터베이스에 유령 항목을 생성했다. 또한 이 지명 사전은 바나 펍, 식당과 같은 종류의 장소를 포함하는데, 때때로 그것들은 The Waiting Room, the Hill Station, and the Golden Rule과 같은 일반적인 문구에서 이름을 따온다. 그래서 이것들 중 몇몇은 다른 문학적이지 않은 장소에 예상치 못한 임의의 문학적인 암시를 주면서 슬금슬금 들어왔다.
- You've missed one...
- ↑ 출처: https://ahrc.ukri.org/newsevents/events/calendar/litlongedinburgh/
- ↑ 인식론자(Epistemics)는 1969년 에든버러 대학 (Edinburgh University)이 주창한 '인식론 학교(School of Epistemics)'를 기초로 만들어진 용어이다. epistemology(인식론)은 지식에 대한 철학적 이론인 반면 epistemics(에든버러 대학의 인식론)은 지식에 대한 과학적 연구를 의미한다는 점에서 epistemology(인식론적 의미)와 구별된다. (이하 등장하는 ‘인식론’은 epistemics를 의미함.) 인식론은 또한 인지과학과 비교된다. 크리스토퍼 룽쥐 히긴스 (Christopher Longuet-Higgins)는 그것을 “지식과 이해가 성취되고 전달되는 지각, 지적 및 언어적 프로세스의 공식적인 모델 구축”이라고 정의했다. 1978년 에세이 “Epistemics: 인식의 규제 이론”에서 알빈 J. 골드만 (Alvin J. Goldman)은 인식론의 방향성을 설명하기 위해 "인식론적(epistemics)"이라는 용어를 만들었다고 주장한다. 골드만은 그의 인식론이 전통적인 인식론과 계속 이어지고 있으며, 새로운 용어는 단지 반대를 피하기 위한 것이라고 주장한다. 골드만의 버전에서 인식론자의 인식론은 인지 심리학과의 결합한다는 점에서 전통적 인식론과는 조금 다르다. 인식론(epistemics)은 지식이나 신념으로 이어지는 정신적 과정과 정보 처리 메커니즘에 대한 상세한 연구를 강조한다. (출처: https://educalingo.com/ko/dic-en/epistemics)
- ↑ 참고: 빅데이터 분석을 통해 개인 맞춤 정보를 제공하는 행위.
- ↑ 참고: Gaelic(스코틀랜드 켈트어) : 고대 켈트어에 뿌리를 둔 언어, 유럽 대부분 지역에서 사용되던 켈트어는 로마제국의 성장과 게르만민족의 발흥에 따라 점차 유럽 서쪽 해안으로 밀려나 어느덧 소수언어로 전락했다.