"Lit Long"의 두 판 사이의 차이
red
22번째 줄: | 22번째 줄: | ||
적당한 이름은 까다롭다. 이름처럼 기능할 수 있는 흔한 명사들뿐만 아니라 장소와 개인 이름은 언어학적으로 동일한 경우가 많다. 예를 들어, 축구 감독 저스틴 에든버러가 만약 우리 책들 중 한 권에 나타난다면 우리의 코드는 아마 그를 도시 경계 근처 어딘가에 둘 것이다. 우리가 채굴한 책들에도 등장인물이 많은데, 제목들이 너무 자주 지리적으로 배치되어 있기 때문에, 우리는 가끔 사람을 장소로 잘못 읽어서 우리의 데이터베이스에 유령 항목을 생성했다. 또한 이 지명 사전은 바나 펍, 식당과 같은 종류의 장소를 포함하는데, 때때로 그것들은 The Waiting Room, the Hill Station, and the Golden Rule과 같은 일반적인 문구에서 이름을 따온다. 그래서 이것들 중 몇몇은 다른 문학적이지 않은 장소에 예상치 못한 임의의 문학적인 암시를 주면서 슬금슬금 들어왔다. | 적당한 이름은 까다롭다. 이름처럼 기능할 수 있는 흔한 명사들뿐만 아니라 장소와 개인 이름은 언어학적으로 동일한 경우가 많다. 예를 들어, 축구 감독 저스틴 에든버러가 만약 우리 책들 중 한 권에 나타난다면 우리의 코드는 아마 그를 도시 경계 근처 어딘가에 둘 것이다. 우리가 채굴한 책들에도 등장인물이 많은데, 제목들이 너무 자주 지리적으로 배치되어 있기 때문에, 우리는 가끔 사람을 장소로 잘못 읽어서 우리의 데이터베이스에 유령 항목을 생성했다. 또한 이 지명 사전은 바나 펍, 식당과 같은 종류의 장소를 포함하는데, 때때로 그것들은 The Waiting Room, the Hill Station, and the Golden Rule과 같은 일반적인 문구에서 이름을 따온다. 그래서 이것들 중 몇몇은 다른 문학적이지 않은 장소에 예상치 못한 임의의 문학적인 암시를 주면서 슬금슬금 들어왔다. | ||
*You've missed one... | *You've missed one... | ||
− | 장소 이름의 문학적 용도를 인식하고 구성하기 위해 지명사전을 만드는 것은 어려운 일이다. 적당한 이름을 사용하여 장소를 확정하는 우리의 일반적인 방법은 상당히 다양하며, 작가들이 위치 이름을 사용하는 모든 방법을 하나의 목록에 담아내기는 쉽지 않다. 게다가, 몇몇 장소는 몇 세기 동안 여러가지의 다른 이름과 다양한 철자를 가져왔다. 그 예로, 에딘버러는 Auld Reekie, Edenborough, Edinborrow, 그리고 Embra가 될 수 있다. 그래서 찾고자 하는 | + | 장소 이름의 문학적 용도를 인식하고 구성하기 위해 지명사전을 만드는 것은 어려운 일이다. 적당한 이름을 사용하여 장소를 확정하는 우리의 일반적인 방법은 상당히 다양하며, 작가들이 위치 이름을 사용하는 모든 방법을 하나의 목록에 담아내기는 쉽지 않다. 게다가, 몇몇 장소는 몇 세기 동안 여러가지의 다른 이름과 다양한 철자를 가져왔다. 그 예로, 에딘버러는 Auld Reekie, Edenborough, Edinborrow, 그리고 Embra가 될 수 있다. 그래서 찾고자 하는 것을 완전히 다른 장소와 연관된 것에서 찾을 수 있을 것이다. |
2020년 4월 18일 (토) 22:46 판
Who 누가
(내용 작성)
When 언제
(내용 작성)
Where 어디서
(내용 작성)
What 무엇을
(내용 작성)
How 어떻게
(내용 작성)
Why 왜
LitLong을 만든 목적은 에든버러와 같은 문학 도시의 지형이, 많은 책들에서 디지털 독서를 할 수 있게 해준다면 어떤 모습일지 알아보는 것이었다. 에든버러는 많은 작가들과 독자들에 의해 형성된 꽤 잘 알려진 문학사를 가지고 있다. 이 역사는 책, 지도, 도보여행, 그리고 도시의 많은 문학 유적지와 관광지에서 볼 수 있다. 하지만 합창단에서 들을 수 있는 다른 목소리들이 있을까? 다른, 덜 친숙한 이야기?[1] 알고리즘이 읽게 함으로써, 에든버러의 문학사에 대한 친숙한 이야기를 수백 편의 다른 문학 작품들의 생소한 맥락과 연결하려고 노력해 왔다. 이 지도와 앱을 통해 오래된 연결고리를 보여주기를 원하고, 또 쉽게 포착할 수 있었던 수백 편의 문학 작품들 중에서 새로운 연결고리를 구축하기를 원한다.
Comment 논평
- 한계
- 에든버러는 포괄적이지 않다. 비교적 쉽게 텍스트 마이닝(text-mining)을 할 수 있는 디지털화된 텍스트의 코퍼스(말뭉치)를 사용할 필요가 있었다. 또한 저작권 제한, 그리고 시각적 문자 인식과 현재의 텍스트 마이닝 기술이 시(poetry)가 가지고 있는 어려움들에 의해 제약되어 왔다. 더불어 이것은 영어와 스코틀래드어에 국한되어 왔다. – 언어 처리 도구를 게일어[2]에 적응시킬 수 없었다.
- The Phantom Menace
적당한 이름은 까다롭다. 이름처럼 기능할 수 있는 흔한 명사들뿐만 아니라 장소와 개인 이름은 언어학적으로 동일한 경우가 많다. 예를 들어, 축구 감독 저스틴 에든버러가 만약 우리 책들 중 한 권에 나타난다면 우리의 코드는 아마 그를 도시 경계 근처 어딘가에 둘 것이다. 우리가 채굴한 책들에도 등장인물이 많은데, 제목들이 너무 자주 지리적으로 배치되어 있기 때문에, 우리는 가끔 사람을 장소로 잘못 읽어서 우리의 데이터베이스에 유령 항목을 생성했다. 또한 이 지명 사전은 바나 펍, 식당과 같은 종류의 장소를 포함하는데, 때때로 그것들은 The Waiting Room, the Hill Station, and the Golden Rule과 같은 일반적인 문구에서 이름을 따온다. 그래서 이것들 중 몇몇은 다른 문학적이지 않은 장소에 예상치 못한 임의의 문학적인 암시를 주면서 슬금슬금 들어왔다.
- You've missed one...