이창조 / 한국문화예술진흥원 전산개발부
1. 서론
문화는 사람과 시간 그리고 공간의 형상화이며, 문화적 형상화는 시간과 공간적 제약을 받으며, 그 시대의 표현도구와 표현방식의 제약 및 시간의 보편적 지식수준을 반영한다. 또한, 시간적 영향은 한 공간의 문화적 진화를 의미한다. 국제화 시대의 조류에 따라 한 국가의 문화예술정보의 중요성이 더욱 부각되고 있는 가운데 문화예술 정보는 컴퓨터와 접목되어 새로운 문화예술 상품으로 재창조되는 등 고부가가치 산업으로도 자리잡고 있다.
그러나, 문화예술 정보는 다양성 때문에 형식과 내용이 매우 이질적으로 구성되어 있으며, 범위도 너무 광범위하여 정보 구축에 많은 어려움이 따르고 있다. 본 연구는 우리 문화정보의 공유 및 발전을 위한 문화 정보망 구축을 위한 1차적인 연구 결과물로서 연극정보, 국악정보, 한국의 전통미술정보를 구축하였으며, 인터네트를 통한 전세계 홍보 및 국내 사용자와의 공유를 이룩하기 위한 첫 시험무대인 것이다.
현재 구축된 문화예술정보에는 연극, 뮤지컬 등의 공연정보, 박물관에 소장되어 있는 문화재 정보, 미술관의 미술품 정보, 국악정보 중 우리 옛 악기 정보 및 문예진흥원 예술자료관 소장 정보 등이 포함된다.
문화예술 정보 중, 연극, 뮤지컬 등의 공연예술 정보는 공연이 종료됨과 동시에 사장되기가 쉬우며, 정보가 보관되어 있더라도 지역적으로 분산되어 있어서 일반인들이 정보를 획득하기가 어렵다. 이에 한국문화예술진흥원이 소장하고 있는 약 5천 편의 연극 정보를 데이터베이스로 구축하여 일반 국민들에게 신속하고 정확한 정보를 제공하기 위한 연극정보 하이퍼미디어 모델 시스템을 개발하고 있다.
문화예술정보의 처리를 컴퓨터로 처리하기 위해서는 데이터베이스, 키워드 정보검색 등의 검색도구와 멀티미디어 데이터를 연결하기 위한 하이퍼미디어 검색 도구 등이 필요하다.
또한 문화예술정보 가운데 입체형상을 가진 문화재를 3차원형상으로 표현하여 보이지 않는 부분을 볼 수 있도록 이동, 회전 및 확대, 축소 표현이 가능한 3차원 형상정보 데이터베이스를 구축하여야 한다. 이러한 3차원 영상정보 데이터베이스 구축을 위해, 컴퓨터 그래픽스 기술과 인공지능 기술이 복합적으로 구현된 3차원 입체 형상 자동입력 시스템 및 모델링 시스템과 지원 도구 개발을 목표로 진행하고 있다.
본 연구의 2장에서는 본 연구의 대상 정보 중 연극자료를 분석한다. 3장에서는 연극대본 정보검색 시스템의 구성과 색인 및 검색과정을 설명한다. 4장에서는 웹서버 상에서 문화예술정보의 검색을 위한 홈페이지와 검색페이지를 보인다. 마지막으로 5장에서는 결론과 앞으로의 연구방향에 대하여 논의한다.
2. 연극정보 구축
연극 정보 하이퍼미디어 시스템 구축을 위한 연극자료 형태의 형태는 공연 프로그램, 포스터, 연극 대본, 출연진의 스틸사진, 공연장면의 오디오 및 비디오 자료 등으로 분류될 수 있다. 이들 원시자료는 연극정보 하이퍼미디어 구축을 위해 가공되어지게 되며, 가공형태는 텍스트, 이미지, 오디오, 비디오의 멀티미디어 데이터 형태를 갖는다.
구축된 정보현황은 1995년 11월까지 1천 편의 대본 이미지, 서지사항, 줄거리 요약과 4백 편의 공연 프로그램 이미지 및 대본 전문 텍스트 및 16편의 연극(뮤지컬)의 오디오 및 동화상 정보의 구축이 이루어졌으며, 향후 5천 편의 연극 정보를 구축할 계획이다. 구축된 연극 정보는 상용 데이터베이스시스템을 사용하여 정보들을 필드별로 나누어 저장, 검색해 볼 수 있으며 사전과 시소러스를 이용한 키워드 검색을 수행한다.
데이터베이스 서버에는 연극 정보를 스키마로 구성한 후 데이터베이스를 구축하였으며 클라이언트인 워크스테테이션이나 PC에서 하이퍼미디어 문서를 브라우징할 수 있는 웹브라우저인 Mosaic netscape 등을 이용하여서도 검색이 가능하다.
가. 연극정보의 형태
1) 텍스트 정보
연극정보의 원시데이터 중 연극관련 서지정보는 다수의 테그를 갖는 덱스트로서 연극정보 데이터베이스구축을 위한 데이터베이스와 정보검색을 위한 색인어 추출에 사용한다. 서지정보의 태그는 연극 데이터에이스 구축을 위한 필드로서 사용되며 또한 HTML 문서구축을 위한 또한 HTML 문서 구축과정에서 정보서비스를 위한 홈페이지로 구성되게 된다.
2) 이미지 정보
연극정보 하이퍼미디어 시스템 구축을 위한 이미지 정보는 포스터, 연극공연 프로그램, 팜플릿을 스캐닝 하여 가공하여 관련 텍스트 정보와의 크로스링크를 통해 구성한다.
HTML 파일 구성을 위해 이미지데이터는 이미지 편집도구를 사용하여 소이미지와 전체 이미지로 편집하여 저장하며, 이들 데이터는 gif 화일 형태를 갖는다. 또한 연극 전문에 대한 이미지 정보 구축을 위한 이미지데이터베이스 구축에 이용한다.
3) 오디오 및 비디오 정보
연극정보 하이퍼미디어 시스템 구축을 위한 오디오 정보는 공연연극 중 뮤지컬과 같이 배우들의 노래 또는 배경음악 등을 가공하여 HTML내의 크로스 링크를 통해 관련 텍스트 정보로 연결한다. 가공된 오디오 정보의 파일형태는 SUN의 오디오 화일인 au형태를 갖는다.
비디오 정보는 연극공연 장면을 동화상으로 가공하며, 이미지의 효과적인 검색을 위해 mjpeg과 mpeg의 두 종류 동화상 화일형태로 가공하게 되며, 오디오 정보와 같은 방식으로 텍스트 정보와 연결된다.
나. 연극의 분류
연극 정보를 효율적으로 검색하기 위해서는 연극의 분류가 필수적이다. 그러나 연극의 분류는 연극 종류, 분류하는 사람에 따라 다를 수 있으므로 일관성과 공인성을 유지하기가 어렵다. [표 1]은 연극 분류의 한 예를 보인 것이다.
표1 연극 분류 예
분류구분 |
분류 |
예 |
번역여부 |
창작극 번역극 |
아리랑 아리랑 고도를 기다리며 |
형식별 분류 |
무언극 일인극 인형극 일반극 |
임도완 일인극 약장수 바보 얼수 고도를 기다리며 |
대상별 분류 |
아동극 성인극 |
신바드의 모험 북회귀선 |
시대별 분류 |
구극 신파극 현대극 |
별주부전 이수일과 심순애 아리랑 아리랑 |
내용별 분류 |
희극 비극 |
말괄량이 길들이기 햄릿 |
다. 서지사항
연극하이퍼미디어 시스템 구성을 위한 연극 서지사항은 원시자료의 확보과정에서 연극 서지사항에 대한 일관성을 높이기 위해 50개의 태그를 선정하여 원시자료를 확보하여 구성하였다.
태그명의 시작은 ′〔′으로 시작하여 ′〕′으로 종료되며, ′〔′과 ′〕′사이에는 임의의 스트링이 위치할 수 있고 태그 값은 ′〕′과 ′〔′사이의 스트링으로 NULL 값을 가질 수 있다. 다음은 서지정보를 BNF으로 표현한 것이다.
bib_info ∷={′〔′string′〕〔string〕′}
연극대본은 5자리의 정수값으로 구성된 식별자 태그인 〔ID〕, 연극대본의 구성 총페이지수를 표현하는 〔총페이지〕, 연극의 제목을 위한 태그인 〔제목〕, 수동으로 추출된 색인어의 리스트인 〔색인어〕, 극의 구분을 위한 〔구분〕, 공연한 표현하는 〔극단〕 등의 태그로 구성된다.
1) 색인 테이터
색인은 연극텍스트 1천편을 대상으로 서지사항으로 사용된 태그 중 〔제목〕, 〔원제〕,〔부제〕,〔극단〕,〔작가〕,〔국적〕,… 등을 대상으로 색인을 하였으며, 색인에 대한 가중치는 서지사항별로 중요도를 고려하여 가중치를 설정하였다. 〔표 2〕는 태그가 갖는 기본값을 보인 것이다.
표2 태그 기본값
태그명 |
가중치 |
제 목 원 제 극 단 작 가 국 적 번 역 자 각 색 자 연 출 등장인물 구 분 줄 거 리 작품구성 배 경 |
10 5 5 5 3 5 5 5 3 5 1 5 3 |
이 과정에서 단일 문서에서 중복되는 색인어에 대한 가중치의 값은 더하기 연산을 하여 단일 문서에서는 하나의 색인어만 발생하도록 역화일을 구성하였다.
일 예로 문서 00001에서 '제목'으로부터 검출된 색인어 '변강쇠'로부터 추출된 가중치가 1이므로 문서 00001의 색인어 '변강회'의 가중치는 10이고 '줄거리'로부터 추출된 가중치가 1이므로 문서 00001의 색인어 '변강쇠'의 가중치는 11이다.
3. 정보 검색 시스템
정보검색의 성능은 구축되어 있는 연극정보에 종속되므로 주의 깊은 작성이 요구된다. 연극 대본 Full Text 입력과 문화예술관련분야 시소러스 구축과도 긴밀한 관계가 있으므로 공동 연구가 필요한 부분이다. 본 절에서는 지금까지 구축한 사전과 시소러스에 대하여 알아보고 이 작업에서 발생한 문제점을 구축시 주의사항으로 나열해 본다.
연극 하이퍼미디어 모델 시스템은 크게 데이터 검색, 색인어 검색, 연극 하이퍼미디어 검색 등의 검색부분으로 구성되어 있다. 연극 색인 및 검색 구성도는 〔그림 1〕과 같다.
가. 사전 구축
정보검색 과정에서의 색인 및 검색을 위해서는 불용어 사전, 명사전, 동의어 사전 및 인명사전, 시소러스가 사용된다.
1) 불용어 사전
불용어 처리란 색인의 역할을 할 수 없는 어휘(대명사, 부사, 불완전명사 등등)들을 리스트로 가지고 있고, 이들을 초기 단계에서 삭제시킴으로써 저장공간과 처리시간을 절약하는 것이다.
불용어 사전은 현재 경제기획원에서 만든 220여 개의 불용어와 예용희 불용어 그리고 국내문헌과 연극대본에 나타나 있는 불용어 리스트를 작성하여 약 5천 여개의 불용어 수의 증가를 효율적으로 처리하기 위해 우측절단 방법을 많이 사용하고 있다. 즉 '전개되는', '전개하는' 등의 단어들이 불용어로 간주되는 것을 말한다. 〔표 3 〕불용어리스트의 예를 보인 것이다.
표3 불용어 리스트의 예
안고 어려운 해왔* 왔* 하면 지금.
* 표시는 뒤에 어떤 어절이 오더라도 불용어의 범위에 포함시킨다는 우측절단(right truncation)표시
|
2) 명사사전
명사사전은 색인어 추출시 색인어로 명사를 추출하여 구성한다. 명사만을 추출하는 이유는 한국어의 특성상 의미 있는 단어는 주로 명사를 가지고 표현하기 때문이다. 그러므로 명사사전은 색인어 추출시 거의 필수적이라 하겠다. 명사사전은 3만 7천여 개의 리스트로 구성되어 있으며 색인시 최장일치법을 이용하여 색인어로서 명사를 추출한다.
연극대본을 대상으로 색인어 추출시 일반 명사사전만으로는 연극에 관계된 주요어들을 추출하지 못한다. 즉 연극대본에서는 주요어로서 색인어가 될 가치가 있음에도 불구하고 명사사전에 없기 때문에 색인어로서 추출되지 못하는 미등록어 문제가 발생한다. 이 문제를 해결하여 좀 더 정확한 색인어를 추출하고 향후 사전을 확장하기 위하여 미등록어를 대상으로 주요어를 추출하여 3천여 개의 명사 리스트를 사전에 첨가하여 확장시켰다. 확장된 사전을 이용하여 연극대본에서 좀더 정확하고 다양한 색인어를 추출하였다. 명사사전 구축에 대한 상세한 내용은 3.3절의 색인 시스템에서 상세히 기술하기로 한다.
3) 동의어 사전 및 인명 사전
검색시에 동의어이거나 발음상의 혼란을 갖는 용어로 질의어를 구성하였을 때 이런 용어들은 검색될 가능성이 없으므로 이런 문제들을 해결하고 좀 더 효율적인 검색을 위해 연극대본을 대상으로 동의어 사전, 대역어 사전, 그리고 인명사전을 구축하였다.
예를 들어 색인어가 '가로지기'로 되어 있다면 '변강쇠'로 사용자가 질의한다면 '가로지기'와 '변강쇠'가 같은 의미임에도 불구하고 검색할 수 없을 것이다. 그러나 동의어사전을 사용한다면 이 문제가 해결될 수 있을 것이며 대역어사전과 인명사전도 같은 방식으로 사용할 수 있을 것이다.
나. 시소러스
시소러스 thesaurus는 후조합을 위해 설계된 색인언어의 통제어휘집으로, 용어간의 동등관계, 계층관계, 관련관계를 상호 대응시켜 표준화된 관계지시 기호로 명확하게 표시하고 식별할 수 있도록 배열하고 구조화한 것이다.
시소러스는 검색시 검색 질의에 포함되는 키워드에 대하여 관련 용어를 검색함으로써 이용자로 하여금 자시니 원하는 정보를 정확하고, 빠짐없이 찾게 해주는데 이용된다. 시소러스에 포함되는 정보는 〔표 4〕와 같다.
전거어는 전거사전을 따로 두고 관리하는 것이 일반적이나 본 시스템에서는 시소러스에 포함하여 관리한다. 또, 사실 정보 fact information이지만 연극 정보 중 가장 중요하다고 생각되어지는 저작관련 정보를 시소러스에 포함시켜 관리한다. 이는 향후 연출정보나 출연정보 등이 추가될 수 있도록 확장성을 남겨둔다. 시소러스의 예는 〔표 5〕와 같다.
시소러스 작성시 주의사항으로는 시소러스에 등록된 용어는 사전에도 등록시키고 역관계로 유추할 수 있는 정보는 한번만 등록한다. 일예로 NT와 BT는 역관계로 유추되므로 NT 또는 BT중 하나의 관계만을 등록한다. 그 외의 정보는 〔표 6〕에서와 같이 해당 용어들간에 서로 상관관계를 맺도록 관리한다.
표 4. 시소러스 정보
관 계 명 |
기 호 |
동의어 (synonomy. SYN) 상위어 (Broad Term. BT) 하위어 (Narrow Term. NT) 관련어 (Related Term. RT) 전거어 (Authority. AU) 저작관련 (write. WR) |
= < > ∼ ― / |
표5 시소러스의 예
관 계 명 |
예 |
동의어 (synonymy. SYN) |
일인극 =모노드라마 가면무극 =탈춤 |
하위어 (Narrow Trem. NT) |
구성양식 >일반극 >일인극 >무언극 |
관련어 (Related Term. RT) |
뮤지컬 ∼음악극
|
저작관련 (Write. WR) |
셰익스피어 /햄릿 /리어왕 /맥베드 |
전거어 (Authority. AU) |
뮤지컬 ―뮤지칼 로미오와 줄이에트 ―로미오와 줄리엣 |
연극 정보 구축은 초기에는 양적인 면이 중요하나 정보 검색 시스템의 질을 좌우하는 것은 정보의 질적인 문제이므로 많은 주의를 요하며, 연극 전문가의 참여가 반듯이 필요하다.
표6 용어상관관계
A - B ≡ ≡ B - A(RT) A ≡ B ≡ ≡ B ≡ A(SYN) |
다. 색인 시스템
색인은 정보검색의 한 분야로써 컴퓨터 데이터 베이스에 저장되어 있는 수많은 정보에서 관련된 정보를 탐색하기 위하여 문헌을 분석한 후, 주요어를 추출하여 정보와 연관시키는 작업을 말한다.
객인과정에서 주요어를 추출하는 기존의 방식은 대개 색인자 indexer가 정보 자료의 내용을 분석하여 중요한 개념을 적절한 색인어로 표현해 주는 것으로 색인자가 자신의 전문 지식에 기초하여 임의로 색인어를 부여하거나 시소로스를 참조하여 미리 통제된 용어들 가운데서 가장 적당한 색인어를 선택한다.
본 연구에서는 응용 분야가 일차적으로는 연극 서지 정보검색이므로 통제언어 색인방식과 불리안 질의 검색을 선택하였다. 이는 연극이 크게는 문학의 한 분야이므로 어휘 범위가 광범위하다는 점과 연극만의 고유한 전문 용어 및 고유 용어가 존재한다는 데 기인한다. 불리안 질의 검색은 가장 널리 쓰이는 키워드 검색방식이며, 처리가 비교적 용이하다. 불리안 질의 검색 처리는 다음 절에서 상세히 다루기로 하고 본 절에서는 색인 시스템에 대하여 기술한다.
통제 언어 색인에서는 통제 언어로 작용하는 사전의 구축이 매우 중요하다. 사전 정보 구축에 대해서는 검색에 이용되는 시소러스 구축과 함께 다음 장에서 자세히 다룬다. 사전구축은 3만 7천여 개의 명사사전에다 연극대본에서 추출한 3천여 개의 미등록어를 추가하여 양질의 연극 분야 사전이 되도록 구축하였고 앞으로도 계속 확장할 예정이다.
사전은 연극 관계되는 통제 어휘들로 구성된 텍스트화일이다. 이 텍스트 파일을 이용하기 위해서는 어떤 형태로든 주기억장치에 적재하여 패턴 정합을 하여야 한다. 또, 한국어 색인에 있어서 가장 중요한 문제점중의 하나인 복합 명사에 대한 색인은 중간에 공백이 있건 없건 간에 최장일치되는 용어와 중간에 나오는 모든 용어들을 색인어로 취한다. [표 7]은 색인의 예를 보인 것이다.
색인시 가중치 할당은 검색에서의 문서 순위 결정에 매우 중요하다. 따라서 색인 가중치를 가장 널리 쓰이는 [표 8]의 식에 의하여 할당한다.
연극정보 색인시스템은 연극 분야의 대본을 대상으로 구축하였으며, 이를 위해 문서들을 입력받아 각 태그의 특성별로 색인어를 추출하고 줄거리와 배경 분야는 어절 단위로 분리한 뒤 불용어 사전을 이용하여 불용어를 처리한다.
표7. 색인의 예
사전에 등록된 용어: 문화, 예술, 한국, 한국문화예술진흥원 색인대상 문서 문서 1: 한국문화예술진흥원은…… 문서 2: 한국 문화 예술 진흥원은…… 추출된 색인어 문서 1: 한국, 문화, 예술, 한국문화예술진흥원 문서 2: 한국, 문화, 예술, 한국문화예술진흥원
|
표8. 색인 가중치
twij=tf*idfj 여기서, twij : 문서 j에서의 색인어 i의 가중치 tfij : 문서 j에서의 용어 i의 상대 빈도수 idfj : 용어 i의 번역문서빈도수 tfij=freqij/max (freqi) 여기서, freqij : 문서 j에서의 용어 i의 빈도수 max(freqi) :문서 j에서의 용어 최대 빈도수 idfj=log₂/Nnj 여기서, N :총문서수 Nnj :용어 i의 출현 문서수이다.
|
다음 단계는 불용어가 제거된 어절들을 명사사전에 비교하여 최장일치법을 사용하여 색인어인 명사를 추출한다. 이때 명사사전에 등록되지 않는 어절들, 즉 미등록어 문제가 발생하는데 이 문제를 해결하기 위해서 미등록어들을 추출하여 이중에서 색인어가 될 만한 단어를 추출하여 명사사전에 넣어 다시 명사사선에 비교하여 색인어인 명사를 추출하였다.
본 연구에서는 색인어로서 명사만을 추출한다. 명사만을 추출하는 이유는 한국어의 특성상 의미있는 단어는 주로 명사를 가지 표현하기 때문이다. 그리고 사용자가 본 논문에서와 같이 질의어로 불리안 Boolean식을 사용한다면 거의 명사를 가지고 검색을 하기 때문에 색인어로 명사를 추출하는 것이 더욱 적당할 것이다.
높은 검색효율을 위해서는 관련된 정보가 좀더 많이 검색되게 하고, 불필요한 정보의 검색을 줄게 하면 된다. 즉 좀더 정확한 문서검색을 위해, 즉 정확율 precision을 높이기 위해 미등록어를 수동으로 추출하여 이 문제를 개선하였고, 좀더 관련된 문서를 많이 검색하기 위해 즉 재현률 recall을 높이기 위해 질의어의 단어가 검색되지 않는다면 동의어 사전이나 대역어 사전을 검색하였다.
본 연구에서는 효율적인 색인어의 추출을 위해 4만여 단어로 구성된 일반 명사사전에다 3천여 개의 연극 관련 미등록어를 추가하였다. 또한 일반명사 사전과 연극 분야의 미등록어의 단어수가 많고 앞으로도 계속 확장 할 것이므로 탐색시 많은 시간을 필요로 한다.
따라서 사전 데이터를 좀더 빠르게 탐색해야할 필요성이 있다.
라. 검색시스템
본 절에서는 색인에 기반한 검색 설계로 불리안 질의와 동의어 사전과 대역어 사전을 이용한 질의어의 재구성 및 향후 검색 확장 방안에 대하여 서술한다. 확장, 문서 순위 결정 및 향후 검색 확장 방안에 대하여 서술한다.
불리안 질의는 초보자에게는 사용하기 불편한 점이 있으나 일단, 익숙해지면 간단한 불리안 연산자를 사용하여 자신이 원하는 요구를 쉽게 나타낼 수 있다. 본 연구에서는 불리안 질의 방식을 선택하되 질의어의 용어가 역화일에서 탐색되지 않는다면 동의어 사전과 대역어 사전을 이용하여 질의어를 재구성하여 검색한다.
시소러스 참조는 사용자가 원하는 키워드에 대한 관련 어휘를 보여줌으로써 관련 문서를 같이 찾을 수 있게 해주며 사용자의 피드백 정보로서 작용하다.
검색된 문서들은 색인어의 가중치를 이용하여 문서순위를 결정하는데 문서 순위 결정은 사용자 자신이 원하는 질의와 가장 밀접한 관계가 있는 문서부터 사용자에게 보여줌으로써 사용자가 원하는 정보를 가장 빨리 볼 수 있도록 해준다.
불리안 오퍼레이터는 And, Or, Not이 있으며 현 단계에서는 괄호를 이용한 중첩관계는 표현하지 못하나 향후 메뉴 선택방식 외에 불리안 질의 편집을 통한 자유로운 기술이 가능하도록 확장할 계획이다.
문서 순위 결정은 사용자 자신이 원하는 질의와 가장 밀접한 관계가 있는 문서부터 사용자에게 보여줌으로써 사용자가 원하는 정보를 가장 빨리 볼 수 있도록 해준다. 문서순위 결정 방식에는 벡터 스페이스 모델, 확률 모델, 집합 모델, 확장 불리안 모델, 퍼지 집합 모델 등 다양한 방법이 사용되고 있다. 지금까지의 검색에서는 strict 불리안 모델을 사용하여 고전적인 And, Or, Not으로 처리하였다. 이를 수식으로 보이면 [표 9]와 같다.
표9. 불리안 연산
a and b= Da ∪ Db a or b = Da ∩ Db a not b= Da - Db
a, b : 질의에 포함된 용어 Da : 용어 a를 색인어로 가지고 있는 문서의 집합 Db : 용어 b를 색인어로 가지고 있는 문서의 집합이다. |
본 연구에서는 색인 가중치와 불리안 오퍼레이터의 의미를 가미한 질의 가중치를 고려한 확장 집합 모델을 제안한다. 이 모델의 유동성은 실험에 의해 검증되어야 하지만 정보검색의 척도인 재현율과 정확률을 향상시킬 것이다. 질의 가중치는 and와 or의 오퍼랜드인 용어에 대해서는 1의 값을 할당하고, not 뒤에 오는 질의 용어 가중치로 -1 값을 배정한다.
4. 연극정보 하이퍼미디어 시스템
하이퍼미디어 hypermedia란 하이퍼텍스트와 멀티미디어를 조합시킨 형태라고 할 수 있으며 다른 문서 또는 텍스트로의 하이퍼링크가 갖는 하이퍼텍스트 문서이면서, 연결되어 있는 문서의 형태가 음성, 정지화상, 동화상 등의 멀티미디어 데이터라는 점이다[13, 14]. 윕 web 상에서의 하이퍼텍스트 문서의 서비스는 HTTP Hyper Text Transfer Protocol를 통해 클라이언트와 서버가 서로 통신하기 위한 응용프로로토콜이며, 윕서버와 클라이언트간에 전송되는 데이터 특성에 관계없이 시스템은 http를 사용하여 데이터 표현상의 호환성을 갖는다.
가. 연극정보 HTML
HTML이란 하이퍼미디어 문서를 생성하고 인식하기 위해 Web이 사용하는 언어이다. 이는 SGML standard Generation Marking Language라고 하는 문서 형성 언어의 부분집합이라 할 수 있다. 본 절에서는 연극정보 하이퍼미디어를 위한 HTML 파일의 구축을 위해서는 연극의 구성 및 연극의 분류에 대한 정보를 갖는 서지정보와 연극 대본의 전문을 위한 전문정보, 공연장면 또는 연극 팜플렛 정보를 위한 이미지 정보의 원시 데이터로부터 구성된다.
1)서지정보로부터의 HTML화일의 구축
HTML 파일의 구성된 예는 서지사항으로부터 연극에 대한 정보에 대한 요약과 관련정보에 대한 링크 정보를 갖는 메인페이지인 B*.html를 구성한다.
B*.html은 연극 프로그램에 대한 정보를 갖는 'program. html', 연극 제작자에 대한 정보를 갖는 'staff. html', 연극 연출자에 대한 정보를 갖는 'cast. html', 연극 공연에 대한 정보를 갖는 'perform. html', 연극의 일반사항에 대한 정보를 갖는 'playinfo. html', 작품의 배경, 평론 등의 정보를 갖는 'work. html'로 구성된다.
[그림 2]는 연극 서지사항으로부터 구성된 연극정보의 주제페이지를 보인 것이다.
2) 공연 프로그램
연극 공연정보를 갖는 'program. html'은 연극 프로그램에 대한 이미지를 볼 수 있도록 이미지 스캔된 연극프로그램의 페이지를 서비스할 수 있는 정보를 가지며, 사용자는 HTML 상의 설명된 주석에 따라 원하는 페이지를 항해하며 부라우징할 수 있게 된다.
연극에 대한 공연 프로그램에 대한 브라우징은 메인페이지의 '공연프로그램'에 대한 사용자의 선택에 의해 링크된 'program. html'을 통해 가능하다. [그림 3]은 연극 프로그램에 대한 이미지에 대한 정보를 제공하기 위한 공연프로그램의 페이지의 예이다. [그림 3]은 연극 '영혼의 노래'의 공연 프로그램에 대한 24페이지의 이미지와 각 페이지에 대한 주석으로 이루어진다
그림3. 공연프로그램 페이지 예
3) 제작진 정보
연극의 메인페이지로부터 사용자의 선택에 의해 연극 제작진에 대한 정보를 볼 수 있으며 구성된 제작진 페이지의 예는 [그림 4]와 같다.
연극 제작진에 대한 정보를 갖는 staff. html에는 연극을 공연한 극단 및 연출, 조연출, 음향효과 등의 정보와 연극의 작가에 대한 설명에 대한 연결을 위한 HTML 문서에 하이퍼링크를 갖는다.
4) 연극 출연진 정보
연극 출연진에 대한 정보를 갖는 cast. html은 연극에 출연한 인원수와 출연진에 대한 정
로 구성된다. [그림 5]의 연극 출연진 페이지 예에서는 총인원수 43명 중 남자 배우가 25명, 여자 배우가 17명, 아역 배우가 1명으로 구성도는 출연진 정보와 출연배우와 배우의 역 및 성격에 대한 정보를 제공한다.
5) 연극 공연정보
연극공연 정보는 공연에 대한 이력정보와 공연장면의 동화상 정보 및 사운드 정보를 제공한다. 사용자는 소이미지의 카메라와 필름 등의 아이콘을 선택함으로써 관련된 공연정보를 제공받게 된다. [그림 6]은 연극정보 요약페이지의 예를 보인 것이다.
6)연극 작품정보
연극에 대한 작품정보의 제공을 위한 works. html은 연극의 시대적/공간적 배경, 작품에 대한 평론에 대한 정보를 제공한다. [그림 7]은 연극작품정보 페이지의 예를 보인 것이다.
7) 연극 전문정보
연극의 대본정보는 playinfo. html에 의해 제공되며, 연극대본정보는 연극에 대한 구분 및 줄거리 요약과 심의 정보에 대한 선택시의 정보제공을 위한 하이퍼링크를 갖는다. 연극에 대한 요약을 정보로 갖는 abs. html은 연극전문가에 의해 연극전문에 대한 해석 및 요약에 대한 정보를 제공한다.
연극 「영혼의 노래」는 7장으로 구성되며 대본전문에 대한 하이퍼링크에 대한 정보를 제공함으로써 3장에 대한 전문정보를 부라우징하는 경우 play. html내의 #4로 마크업된 위치로 링크되어 정보를 제공한다.
전문정보는 원시전문데이터에 대하 HTML 태깅을 통해 얻어지게 되며, [그림 8]은 전문정보를 제공하기 위한 연극전문정보 페이지의 예를 보인 것이다.
나. 문화예술정보 검색 시스템
문화예술정보 서비스는 윕상의 정보검색을 위해 검색을 위한 페이지를 통해 제공되게 된다. 문화예술정보의 제공을 위해 CGI Common Gateway Interface를 상요하고 있으며, 문화예술정보 검색 시스템에서는 정보검색, 데이터베이스 검색을 위한 응용프로그램을 CGI로서 사용하고 있다. [그림 9]는 문화예술정보 서비스를 위한 홈페이지를 보인 것으로 사용되는 이미지맵을 사용하여 전통미수, 연극정보, 전통악기 검색을 위한 영역을 선택할 수 있다.
[그림 10]은 문화예술정보 서비스를 위한 영문홈페이지를 보인 것으로 사용자는 이미지맵을 사용하여 전통미술과 전통악기에 대한 정보를 부라우징할 수 있다.
[그림 11]은 연극정보의 한글색인 결과의 효과적 검새을 위한 인텍스 페이지를 보인 것이다. [그림 12]는 전통악기 및 전통미술작품의 영문색인 검색을 위한 인텍스 페이지를 보인 것이다.
[그림 13]은 [그림 12]의 영문 인텍스 페이지에서 G를 선택한 검색 결과를 보인 것이다.
[그림 14]는 [그림 13]의 영문인텍스 검색 결과중 가야금에 대한 HTML 문서의 선택 후의 결과 화면이다.
[그림 15]는 연극정보 분양의 검색을 위한 페이지를 보인 것으로 연극 전체에 대한 검색 및 제목, 작가, 극단 등에 대한 검색이 가능하다. 검색을 위한 각 필드에는 불리안 질의가 사용되게 된다.
[그림 16]은 [그림 15]의 질의 페이지의 질의에 의해 검색된 결과를 보인 것으로 검색결과는 검색된 전체 항목과 HTML 파일의 크기 및 HTML 문서에 대한 링크를 포함한다.
5. 결론 및 향후계획
본 연구에서 제안한 하이퍼미디어 모델은 멀티미디어 데이터베이스를 기반으로 한 정보검색이 가능하고 검색된 결과에 대해서는 링크와 노드로 구성된 하이퍼미디어 문서로 볼 수 있도록 하였다. 정보검색 부분에서는 연극 서지사항을 대상으로 색인하고 불리안 질의에 의한 키워드 검색을 통하여 사용자가 검색할 수 있다. 최종 선택된 연극에 대해서는 연극 메타포어에 기반한 연극 하이퍼미디어 문서를 통하여 사용자는 정보항해를 할 수 있다.
또한 문화재 3차원 형상정보 시스템의 개발연구가 진행되는 가운데 3차원 형상정보 시스템은 3차원 형상 자동입력 시스템, 3차원형상 모델링 시스템, 그래픽스 표현 시스템 등이 서브 시스템으로 나누어 개발 중에 있으며, 본 연구는 국내 최초로 국보급 유물데이터의 과학적이고 체계화된 정확한 계측 방법의 적용 시도, 보다 완벽한 입체형상 정보의 보존 방법 개발, 보다 적극적이고 활발한 대 국민 서비스를 제공할 수 있는 기틀을 마련하였다는 데 그 의의가 있다 할 것이다.
본 연구의 결과물 중의 하나인 모델링 된 3차원 데이터베이스를 오픈 환경에서 지원하기 위하여, 현재 SGI 워크스테이션에서 개발중인 GL Graphic Library에 상응하는 그래픽 라이브러리가 PC와 Sun계열의 PC-window와 X-window의 기능을 이용한 3차원 인터페이스의 개발이 이루어져야 하며, 3차원 입체형상 정보를 정확하게 추출하면, 시각적인 평가가 자유롭게 진행될 수 있으며, 3차원 계측으로 인하여 유물의 치수와 면적, 그리고 부피 등을 과학적으로 측정 가능하게 되어 유물의 복원 및 형상보존 그리고 대국민 멀티미디어 서비스를 2차원에서 3차원으로 확장시키는 것이 가능하게 된다.
향후 연구과제로는 연극 데이터의 확장, 연극 대본내의 전문검색, 효율적인 검색을 위한 연극 지식(사전, 시소러스)확장과 효과적인 시소러스 관리 시스템 등이 필요하다. 향후 연극 정보와 문화재 정보의 대량구축 및 미술 정보, 음악 정보 등 전자문화정보 시스템 개발로 확대해 나아갈 것이며, 초고속 정보통신망의 실현과 더불어 다양한 문화정보를 제공하기 위한 문화정보방 구축의 기반을 조성하고자 한다.