데이터베이스 구축 및 활용 방안 연구
스위프트입실와조: JJE24KU, SWJ24KU, KJY24KU, HJD24KU, JHW24KU
연구 목적
본 연구는 한국의 문화적 위상이 높아짐에 따라 증가하는 대규모 공연 수요에 비해, 적절한 공연장 정보와 인프라가 부족한 현실적 문제를 해결하고자 한다. 구체적인 목적은 다음과 같다.
첫째, 서울시 소재 5,000석 이상 대규모 공연장에 대한 종합적 데이터베이스를 구축한다. 공연장의 기본 정보(좌석 수, 위치, 개관연도), 운영 정보(운영기관, 대관료), 접근성(주차장, 주변 지하철)과 함께 각 공연장에서 진행된 공연 이력과 패턴을 체계적으로 정리한다.
둘째, 공연장과 공연 간의 상호적합성을 분석한다. 각 공연장에서 진행된 공연들의 공연자와 그 장르별 특성을 분석하여, 특정 유형의 공연이 어떤 공연장 특성과 높은 적합성을 보이는지 도출한다.
셋째, 이를 통해 공연 기획자들이 공연의 성격과 규모에 최적화된 공연장을 효율적으로 선택할 수 있는 실용적 지침을 제공한다. 이는 궁극적으로 공연의 성공적 운영과 관객 만족도 향상에 기여할 것으로 기대된다.
이러한 연구는 서울시 공연 인프라의 효율적 활용을 촉진하고, 나아가 국제적 수준의 공연 문화 발전을 위한 기초 자료로 활용될 것이다.
연구 대상
본 연구는 서울에 위치한 5000석 이상의 공연장을 대상으로 하며, KOPIS 공연예술 통합전산망과 Play DB의 데이터를 활용한다. 시간적 범위는 2018년, 2019년, 2023년, 2024년으로, 코로나19의 영향을 받은 2020년부터 2022년까지는 제외한다.
공연장 정보
기본 정보: 이름, 면적, 좌석 수, 개관연도, 운영기관
시설 특성: 야외/실내 여부, 리모델링 여부
운영 정보: 대관료, 본래 용도
접근성: 주변 주차장 수, 지하철과의 거리, 주소 및 좌표
공연 정보
공연 일시, 티켓 가격
공연자 정보
국적, 직업
이러한 데이터들은 공연장-위치, 아티스트-장르, 공연-아티스트, 공연 장르, 공연장-공연의 관계성을 중심으로 분석되어, 각 공연장의 특성과 공연 패턴을 파악하는 데 활용된다. 이를 통해 공연장별 특성과 적합한 공연 유형을 도출하여 공연 기획자들에게 실질적인 데이터를 제공하고자 한다. 자세한 내용은 후엨 클래스와 속성, 릴레이션 설명에서 서술하겠다.
연구 방법
본 연구는 다음과 같은 단계로 진행된다:
- 데이터 수집 및 정제
- KOPIS와 Play DB에서 공연장, 공연, 공연자 관련 데이터 수집
- 수집된 데이터를 공연장, 공연, 공연자, 장르, 위치의 클래스로 분류하여 정제
- 각 클래스별 세부 속성 정보 구조화
- 그래프 데이터베이스 구축
- Neo4j를 활용하여 데이터 간의 관계성 파악
- 공연장-위치, 아티스트-장르, 공연-아티스트, 공연 장르, 공연장-공연 간의 관계 정의 및 연결
- 온톨로지 기반 데이터 간 연결 관계 구축
- 관계형 데이터 분석
- 구축된 그래프 데이터베이스를 기반으로 공연장별 특성 분석
- 공연장과 공연 유형 간의 연관성 파악
- 공연자 특성과 공연장 선호도 간의 관계 분석
- 시기별, 장르별 공연장과 공연 패턴 도출
이러한 방법을 통해 공연장과 공연 간의 최적 매칭을 위한 실증적 데이터를 도출하고, 이를 체계화하여 공연 기획자들이 활용할 수 있는 형태로 정리한다.
온톨로지(Ontology)
온톨로지 그래프(OntoGraph)
클래스(Class)
| 클래스명 | 한글명 | 설명 |
|---|---|---|
| Venue | 공연장 | 공연장명과 특성 |
| Location | 위치 | 공연장 위치 |
| Performance | 공연 | 공연 |
| Genre | 장르 | 공연 및 아티스트 장르 |
| Artist | 아티스트 | 공연자 |
릴레이션(Relation)
| 영문명 | 한글명 | 정의역 | 치역 | 설명 |
|---|---|---|---|---|
| isLocatedIn | ~에 위치하다 | Venue | Location | 공연장의위치 |
| hosts | ~를 개최하다 | Venue | Performance | 공연장개최공연 |
| belongsTo | ~의 종류를 개최한다 | Performance | Genre | 공연 장르 |
| features | ~가 나온다 | Performance | Artist | 공연 아티스트 |
| isPartOf | ~의 일부이다 | Location | Location | 공연장의 위치 |
| performs | ~을 주로 공연한다 | Artist | Genre | 아티스트의 주 장르 |
속성(Attribute)
| 속성명 | 한글명 | 설명 |
|---|---|---|
| gid | 식별자 | 개별 노드의 식별자 |
| class | 클래스 | 개별 노드가 속하는 클래스 |
| name | 대표명 | 개별 노드의 대표명 |
| refurl | 참고 웹 자원 | 개별 노드의 정보에 대해 참고할 수 있는 웹 자원 |
| area | 면적 | 공연장 연면적, 경기장의 경우 경기장 면적 포함 |
| seats | 좌석수 | 공연장의 좌석수 |
| year | 개관연도 | 공연장의 개관연도 |
| organization | 운영기관 | 공연장의 운영기관 |
| orgfeature | 민간/공공 | 공연장 운영기관 민간, 공공 여부 |
| inOut | 실내/실외 | 공연장의 실내외여부 |
| wdfee | 주말 대관료 | 공연장의 대관료 최솟값과 최댓값 중간 |
| hdfee | 휴일 대관료 | 공연장의 대관료 최솟값과 최댓값 중간 |
| ticketfee | 티켓fee | 공연장의 대관 시 티켓 총수익에서 받는 비용의 비율 |
| opurpose | 본래 용도 | 공연장의 본래 용도, 체육시설과 문화시설로 구분 |
| parking | 주차장 | 공연장 위경도 기준 반경 500m 주차장 개수 |
| subkm | 지하철 | 공연장 위경도 기준 가장 가까운 지하철역 입구와의 거리 |
| address | 주소 | 공연장의 주소 |
| latitude | 위도 | 해당 주소의 위도 |
| longitude | 경도 | 해당 주소의 경도 |
| remodeling | 리모델링 | 리모델링 여부, 했을 경우 마지막 리모델링 연도 |
| 속성명 | 한글명 | 설명 |
|---|---|---|
| gid | 식별자 | 개별 노드의 식별자 |
| class | 클래스 | 개별 노드가 속하는 클래스 |
| name | 대표명 | 개별 노드의 대표명 |
| refurl | 참고 웹 자원 | 개별 노드의 정보에 대해 참고할 수 있는 웹 자원 |
| type | 행정구역 | 장소의 행정구역 상 분류 |
| 속성명 | 한글명 | 설명 |
|---|---|---|
| gid | 식별자 | 개별 노드의 식별자 |
| class | 클래스 | 개별 노드가 속하는 클래스 |
| name | 대표명 | 개별 노드의 대표명 |
| refurl | 참고 웹 자원 | 개별 노드의 정보에 대해 참고할 수 있는 웹 자원 |
| sdate | 공연 일자 | 공연이 시작한 날짜 |
| edate | 공연 일자 | 공연이 끝난 날짜 |
| minprice | 티켓가격 | 공연의 최소 티켓 가격 |
| maxprice | 티켓가격 | 공연의 최대 티켓 가격 |
| 속성명 | 한글명 | 설명 |
|---|---|---|
| gid | 식별자 | 개별 노드의 식별자 |
| class | 클래스 | 개별 노드가 속하는 클래스 |
| name | 대표명 | 개별 노드의 대표명 |
| refurl | 참고 웹 자원 | 개별 노드의 정보에 대해 참고할 수 있는 웹 자원 |
| origin | 국내/해외 | 국내 가수인지 해외 가수인지 여부 |
| job | 직업 | 아티스트의 직업 |
| type | 종류 | 아티스트가 개인인지 팀인지 여부 |
| 속성명 | 한글명 | 설명 |
|---|---|---|
| gid | 식별자 | 개별 노드의 식별자 |
| class | 클래스 | 개별 노드가 속하는 클래스 |
| name | 대표명 | 개별 노드의 대표명 |
| refurl | 참고 웹 자원 | 개별 노드의 정보에 대해 참고할 수 있는 웹 자원 |
데이터 샘플링
연구 데이터
노드 데이터(총 1375건)
- Venue 17건
- Performance 353건
- Location 19건
- Artist 968건
- Genre 18건
링크 데이터(총 3394건)
- V-L (Venue-Location) 17건
- A-G (Artist-Genre) 874건
- L-L (Location-Location) 10건
- P-A (Performance-Artist) 1787건
- P-G (Performance-Genre) 353건
- V-P (Venue-Performance) 353건
연구 결과
(★필수: 문제의식에 맞춰 작성한 Cypher Query와 분석 결과에 대해 서술
필요 시 Neo4j Desktop or bloom or dash or leaflet.js 화면 캡쳐본 삽입할 것)
1. 공연장의 특성이 공연에 미치는 영향 분석
(1) 공연장별 공연 횟수
소제목
소제목
소제목
연구 후기
| JJE24KU | 😛 | 연구 후기를 작성해 주세요 |
| SWJ24KU | 😺 | 연구 후기를 작성해 주세요 |
| KJY24KU | 😄 | 연구 후기를 작성해 주세요 |
| HJD24KU | 🍻 | 연구 후기를 작성해 주세요 |
| JHW24KU | 🙄 | 연구 후기를 작성해 주세요 |
코멘트
가마니있으시조
| SYW24KU | 🐰 | 해당 팀 연구에 대한 코멘트를 작성해 주세요 |
| HCW24KU | 🐯 | 해당 팀 연구에 대한 코멘트를 작성해 주세요 |
| JIH24KU | 🐣 | 해당 팀 연구에 대한 코멘트를 작성해 주세요 |
| KSH24KU | 👍🏻 | 해당 팀 연구에 대한 코멘트를 작성해 주세요 |
| YHW24KU | 🐹 | 해당 팀 연구에 대한 코멘트를 작성해 주세요 |
참고 자료
(참고 자료 및 주석은 출처 표기 규칙 페이지를 참고할 것!)
주석