"2019 겨울방학 스터디 2주차"의 두 판 사이의 차이
seonae's wiki
(→논문 선택) |
(→김바로선생님 특강) |
||
(사용자 2명의 중간 판 12개는 보이지 않습니다) | |||
1번째 줄: | 1번째 줄: | ||
[[2019 겨울방학 스터디 | 스터디 홈]] | [[2019 겨울방학 스터디 | 스터디 홈]] | ||
− | == | + | {{스터디 |
− | *[ | + | |스터디이름 = 2019 겨울방학 스터디 특강 |
− | * | + | |일정 = 2019/1/10 3-6시 |
− | + | |장소 = 강의동 110호 | |
− | + | |참여인원 = 광우,선애,정훈,승진,나라,에릭,인혁 | |
− | + | |내용 = 김바로선생님의 특강 : 네트워크 분석과 텍스트 분석 | |
− | + | }} | |
− | + | ||
− | + | ==김바로선생님 특강== | |
− | + | ===준비하기=== | |
− | + | *[https://cran.seoul.go.kr/ GNU R] | |
− | + | *[https://www.rstudio.com/products/rstudio/download/ RStudio] | |
− | + | *[https://gephi.org/users/download/ gephi] | |
− | + | *[https://www.teamviewer.com/ko/ Teamviewer] | |
− | + | ||
− | + | *참고하기 : [https://www.youtube.com/channel/UC8yvEjmB4qcNr5G4g0FRdEA 유투브 채널 koreaDH] | |
− | + | ||
− | + | ===디지털 인문학=== | |
− | + | 설계 – 구축 – 분석 – 해석 – 시각화 | |
− | + | ontology - xml, rdb - GIS, linguistic analysis, network analysis - - 3D, video, image | |
+ | |||
+ | ===네트워크 분석=== | ||
+ | *중요한 개념 : NODE & LINK | ||
+ | * degree centrality - hub 가장 많은 링크를 갖고 있는 노드. | ||
+ | * betweeness centrality – linker 두 집단을 연결하는 데 꼭 필요한 노드. | ||
+ | * closeness centrality – center 한 노드에서 네트워크의 끝노드까지의 영향력이 가장 큰 것. | ||
+ | |||
+ | |||
+ | *네트워크 표현방법 | ||
+ | **1)source target weight (edge) | ||
+ | **이때 source와 target은 속성이 같아야 하는데, 속성이 다르면 계산이 복잡해지기 때문. but 속성이 다르더라도 2-mode등을 이용한 처리를 할 수는 있음. | ||
+ | **2) 인접행렬 : 표로 표현. but 잘 안씀. | ||
+ | **3) 그래프 | ||
+ | |||
+ | |||
+ | *네트워크 분석 프로그램 | ||
+ | **UCINET : 네트워크 분석프로그램의 조상격. 1세대 | ||
+ | **PAJEK, GEPHI : 요즘 많이쓰는 분석툴. UI가 좋음. | ||
+ | |||
+ | ===텍스트 분석=== | ||
+ | *1) 형태소 분석 : 긴 텍스트를 형태소 단위로 분절하여 분석. 형태소 분석기 필요. | ||
+ | **형태소분석기 :꼬꼬마 분석기(kkma), KoNLp(R)/KoNLpy(python) 등 다양. | ||
+ | *2) 감정 분석 : 긴 텍스트를 분절한 뒤 어휘가 갖는 감정을 분석. 감정사전 필요. | ||
+ | *3) 공기어 분석 : 텍스트 상에서 같이 출현하는 어휘들을 분석. (+군집분석) | ||
+ | |||
+ | => 빈도 수 자체보다 전체 텍스트에서 차지하는 정도가 중요하므로 비율로 환산. | ||
+ | => 언어분석은 언어가 갖는 규칙을 명확히 이해하여 사전을 충실하게 구축하면 질좋은 산출물을 도출할 수 있음. | ||
+ | => 이 산출물에 대해 '''어떻게 해석하느냐'''가 중요한 것. |
2019년 1월 11일 (금) 22:21 기준 최신판
2019 겨울방학 스터디 특강 | |
---|---|
일정 | 2019/1/10 3-6시 |
장소 | 강의동 110호 |
참여인원 | 광우,선애,정훈,승진,나라,에릭,인혁 |
내용 | 김바로선생님의 특강 : 네트워크 분석과 텍스트 분석 |
김바로선생님 특강
준비하기
- 참고하기 : 유투브 채널 koreaDH
디지털 인문학
설계 – 구축 – 분석 – 해석 – 시각화 ontology - xml, rdb - GIS, linguistic analysis, network analysis - - 3D, video, image
네트워크 분석
- 중요한 개념 : NODE & LINK
- degree centrality - hub 가장 많은 링크를 갖고 있는 노드.
- betweeness centrality – linker 두 집단을 연결하는 데 꼭 필요한 노드.
- closeness centrality – center 한 노드에서 네트워크의 끝노드까지의 영향력이 가장 큰 것.
- 네트워크 표현방법
- 1)source target weight (edge)
- 이때 source와 target은 속성이 같아야 하는데, 속성이 다르면 계산이 복잡해지기 때문. but 속성이 다르더라도 2-mode등을 이용한 처리를 할 수는 있음.
- 2) 인접행렬 : 표로 표현. but 잘 안씀.
- 3) 그래프
- 네트워크 분석 프로그램
- UCINET : 네트워크 분석프로그램의 조상격. 1세대
- PAJEK, GEPHI : 요즘 많이쓰는 분석툴. UI가 좋음.
텍스트 분석
- 1) 형태소 분석 : 긴 텍스트를 형태소 단위로 분절하여 분석. 형태소 분석기 필요.
- 형태소분석기 :꼬꼬마 분석기(kkma), KoNLp(R)/KoNLpy(python) 등 다양.
- 2) 감정 분석 : 긴 텍스트를 분절한 뒤 어휘가 갖는 감정을 분석. 감정사전 필요.
- 3) 공기어 분석 : 텍스트 상에서 같이 출현하는 어휘들을 분석. (+군집분석)
=> 빈도 수 자체보다 전체 텍스트에서 차지하는 정도가 중요하므로 비율로 환산. => 언어분석은 언어가 갖는 규칙을 명확히 이해하여 사전을 충실하게 구축하면 질좋은 산출물을 도출할 수 있음. => 이 산출물에 대해 어떻게 해석하느냐가 중요한 것.