행위

Lit Long

red

도지현 (토론 | 기여) 사용자의 2020년 4월 19일 (일) 19:41 판 (Who 누가)

Lit Long 웹사이트 가기

Who 누가

수정중입니다! 'Lit Long: Edinburgh'는 에든버러 대학교의 문학, 언어 및 문화 학교, 정보학 학교, 세인트 앤드류 대학교의 'SACI' 연구 그룹 및 'EDINA' 사이의 AHRC가 지원하는 협력 프로젝트인 Palimpsest의 시각적 대화형 구성 요소다. 이 팀에는 문학자, 텍스트 마이닝을 전문으로 하는 컴퓨터 과학자, 정보 시각화 학자들이 포함되어 있다. [1]

  • 제임스 록슬리
  • 존 오벌랜더
  • 제임스 리드
  • 에런 퀴글리
  • 베아트리체 알렉스
  • 미란다 앤더슨
  • 클레어 그로버

When 언제

(내용 작성)

Where 어디서

(내용 작성)

What 무엇을

  • 에든버러를 배경으로 하는 600여 권의 책에 매우 큰 지명 언급(mention) 데이터베이스를 만들었다. 그 후 우리는 각각의 언급을 둘러싼 문장들을 즉시 추출했고, 그것을 발췌해서 우리의 데이터베이스에 포함시켰다. 그 데이터는 장소의 이름 언급을 통해 지도로 만들어졌고, 이것은 모바일 앱과 온라인에서 탐색할 수 있다. LitLong과 함께 당신은 문학 에든버러를 통해 자신만의 길을 걸을 수 있다.



  • 'Lit-Long'은 문학 에든버러의 독특한 지도다. 그 뒤에는 약 550권의 책(소설, 단편, 편지, 회고록)에서 발췌한 5만권의 데이터베이스가 있다. 발췌문에는 에든버러에 있는 장소의 이름이 사용되어 있다는 특징이 있으며, 각각의 장소에는 좌표를 부여하고 지도에 고정할 수 있다. 데이터베이스는 최신 기술을 사용하여 작성되었다.
  • 데이터베이스는 최신 기술을 사용하여 작성되었다->(조금 더 구체적으로는)LitLong은 에든버러에서 설정된 문학 작품을 텍스트로 작성하고 결과를 접근 가능한 방식으로 시각화하기 위해 문학 학자들의 정보를 통해 얻은 자연어 처리 기술을 사용했다.
  • 우리는 에든버러를 배경으로 하는, 지명이 언급된 600권이 넘는 책을 바탕으로 매우 큰 데이터베이스를 만들었다. 그런 다음 각각의 언급을 둘러싼 문장들을 추출했고, 그렇게 발췌한 문장들을 데이터베이스에 포함시켰다. 그렇게 포함된 데이터는 언급된 장소의 이름을 통해 각각 도시로 매핑되었으며, 이는 모바일 앱과 온라인 인터페이스를 통해 탐색할 수 있다. Lit Long을 사용하면 문학과 에든버러가 공명하고 있는 장소를 통해 자신만의 길을 걸을 수 있다.

How 어떻게

  • 에든버러에서는 영국 도서관, 스코틀랜드 국립 도서관, 하티 트러스트에서 제공하는 매우 크고 다양한 디지털 서적 컬렉션에 text-mining과 georeferencing을 사용해 왔다. 게다가, 몇몇 출판사와 작가들은 우리와 목록을 공유했다. 우리는 에든버러를 그들의 환경으로 만들려는 모든 징후를 보여주는 텍스트들을 이 컬렉션에서 찾아보았다. 우리는 지명의 사용범위나 빈도에서 에든버러를 그들 작품의 배경으로 한 모든 징후를 보여 주는 이 컬렉션의 텍스트를 찾았다. 알고리즘과 수동 큐레이션[2]의 조합은 그 텍스트들을 필터 처리함으로써 도시를 탐구하기도 하고 활동 배경으로 사용할 수 있는 수백 가지의 작품 데이터 세트를 제공한다. 이 본문에서 언급된 에든버러 지역은 소설이나 회고록에서 이름을 지을 수 있는 매우 다른 방법을 등록하기 위해 만들어진 맞춤형 지명 사전을 사용하여 좌표화되었다.

Why

우리가 Lit Long을 만든 목적은 '아주 많은 양의 책을 디지털로 읽을 수 있다면 에든버러와 같은 문학적인 도시의 지형이 어떻게 보일지 알아보기 위함'이었다. 에든버러는 잘 알려진 문학사를 가지고 있으며, 이는 수많은 작가들과 독자들에 의해 수년간 누적되어 정리되어왔다. 실제로 이 역사는 책, 지도, 도보 여행 및 도시의 많은 문학 관련 유적지와 관광 명소에서 찾아볼 수 있다. 그러나 수많은 사람들의 집단지성을 통해서라면 우리는 또 다른, 우리에게는 생소한 이야기들을 찾아낼 수 있을지도 모른다. 따라서 우리는 알고리즘이 독서를 할 수 있도록 설정함으로써 에든버러의 문학사에 대한 친숙한 이야기를 수백 편의 다른 작품들의 생소한 맥락과 연결할 수 있도록 노력했다. 우리는 이 지도와 앱이 우리가 포착할 수 있었던 수백 개의 문학 작품들의 오래된 연결고리들을 설명하고 더 나아가 새로운 연결을 만들어 내길 원한다.

Comment 논평

  1. 한계
  • 에든버러는 포괄적이지 않다. 비교적 쉽게 텍스트 마이닝(text-mining)을 할 수 있는 디지털화된 텍스트의 코퍼스(말뭉치)를 사용할 필요가 있었다. 또한 저작권 제한, 그리고 시각적 문자 인식과 현재의 텍스트 마이닝 기술이 시(poetry)가 가지고 있는 어려움들에 의해 제약되어 왔다. 더불어 이것은 영어와 스코틀래드어에 국한되어 왔다. – 언어 처리 도구를 게일어[3]에 적응시킬 수 없었다.
  • The Phantom Menace

적당한 이름은 까다롭다. 이름처럼 기능할 수 있는 흔한 명사들뿐만 아니라 장소와 개인 이름은 언어학적으로 동일한 경우가 많다. 예를 들어, 축구 감독 저스틴 에든버러가 만약 우리 책들 중 한 권에 나타난다면 우리의 코드는 아마 그를 도시 경계 근처 어딘가에 둘 것이다. 우리가 채굴한 책들에도 등장인물이 많은데, 제목들이 너무 자주 지리적으로 배치되어 있기 때문에, 우리는 가끔 사람을 장소로 잘못 읽어서 우리의 데이터베이스에 유령 항목을 생성했다. 또한 이 지명 사전은 바나 펍, 식당과 같은 종류의 장소를 포함하는데, 때때로 그것들은 The Waiting Room, the Hill Station, and the Golden Rule과 같은 일반적인 문구에서 이름을 따온다. 그래서 이것들 중 몇몇은 다른 문학적이지 않은 장소에 예상치 못한 임의의 문학적인 암시를 주면서 슬금슬금 들어왔다.

  • You've missed one...
장소 이름의 문학적 용도를 인식하고 구성하기 위해 지명사전을 만드는 것은 어려운 일이다. 적당한 이름을 사용하여 장소를 확정하는 우리의 일반적인 방법은 상당히 다양하며, 작가들이 위치 이름을 사용하는 모든 방법을 하나의 목록에 담아내기는 쉽지 않다. 게다가, 몇몇 장소는 몇 세기 동안 여러가지의 다른 이름과 다양한 철자를 가져왔다. 그 예로, 에딘버러는 Auld Reekie, Edenborough, Edinborrow, 그리고 Embra가 될 수 있다. 그래서 찾고자 하는 것을 완전히 다른 장소와 연관된 것에서 찾을 수 있을 것이다.
  1. 출처: https://ahrc.ukri.org/newsevents/events/calendar/litlongedinburgh/
  2. 참고: 빅데이터 분석을 통해 개인 맞춤 정보를 제공하는 행위.
  3. 참고: Gaelic(스코틀랜드 켈트어) : 고대 켈트어에 뿌리를 둔 언어, 유럽 대부분 지역에서 사용되던 켈트어는 로마제국의 성장과 게르만민족의 발흥에 따라 점차 유럽 서쪽 해안으로 밀려나 어느덧 소수언어로 전락했다.