데이터로 다시 읽는 조선시대 양반의 생활

지암일기 데이터셋:

지암일기 디지털 인문학 연구 데이터 현황


『지암일기』의 정보를 효과적으로 기술하기 위한 체계는 크게 ①일기 텍스트(본문)를 구성하고 있는 형식 요소(Textual Elements) ②일기 본문의 구체적 문맥에서 추출한 내용 요소(Contextual Elements) ③일기 본문의 문맥을 재구성한 의미 요소(Recon-structed Elements)로 나누어집니다.

데이터 기술 체계의 밑그림

①일기 텍스트를 이루는 형식으로서의 요소는 일기(Diary), 작품(Literature) 그리고 내용(Entry) 세 가지 항목으로 구성됩니다. 일기에 실린 여러 형식의 기록 및 그와 관련된 내용을 분절하고 정리하는 가운데 발생하는 정보들입니다.

②일기 본문의 문맥에서 추출한 내용 요소는 인물(Person), 노비(Slave), 공간(Pla-ce), 물품(Object), 문헌(Book), 용어(Term) 등의 항목입니다. 여기에 해당하는 요소는 모두 일기의 본문에 직접적으로 언급되는 정보들입니다.

③특정한 맥락에서 일기의 내용을 재구성한 의미 요소에는 생활(Lifestyle), 사건(Event), 자료(Reference) 등이 있습니다. 세 항목은 모두 특정한 맥락을 기준으로 일기 내용을 새롭게 구성한 것입니다. 앞서 문맥에서 추출한 내용 요소가 일기의 본문에 언급된 구체적 내용을 근거로 한다면, 재구성한 의미 요소는 일기의 서술 양상에 특정한 ‘의미’를 부여한 정보라는 측면에서 그 성격이 다릅니다.

이 가운데 ‘내용’은 형식 요소에 포함되는 정보로서 여타 정보를 중간에서 매개하는 역할을 합니다. 『지암일기』 텍스트를 이루는 기본 형식으로서 ‘일기’와 ‘작품’을 구분해주는 기준이자, 문맥에서 추출한 ‘인물’, ‘노비’, ‘공간’, ‘물품’, ‘문헌’, ‘용어’ 등이 구체적으로 일기의 내용 어느 부분에서 언급되는지를 제시해주며, ‘생활’, ‘사건’, ‘자료’ 등의 의미 맥락을 중간에서 연결해주는 기능까지 담당합니다.

①, ②, ③의 정보 범주가 각기 그 성격이 다르지만, 서로가 연결되는 형태 즉 시맨틱 데이터 환경을 전제로 그려진 밑그림이기에, 이와 같은 윤곽을 토대로 데이터를 섬세하게 기술할 경우 얻고자 하는 정보의 맥락이 얼마나 구체적인가에 따라 세부적인 층위에까지 접근이 가능합니다. 예컨대, 윤이후가 영위하였던 특정한 ‘생활’과 직접적 관계에 있었던 ‘노비’가 누구이며, 그 노비를 소유한 ‘인물’은 윤이후와 어떠한 관계에 있었는지 그리고 해당 인물과 관련된 큰 ‘사건’이 있었는지, 있었다면 그 사건에 대해 『조선왕조실록』과 『승정원일기』와 같은 ‘자료’는 어떻게 기록하고 있는지 등등 하나의 단서에서 출발해 그와 관련된 수많은 정보에 가 닿을 수 있습니다.

클래스(Class)
객체 속성(Object property)
데이터 속성(Data property)

XML CSV RDF JSON