논문 상세보기

한국정보처리학회> 정보처리학회논문지D> 데이터베이스 : 전자책 표준간의 컨텐츠 변환에 관한 연구

데이터베이스 : 전자책 표준간의 컨텐츠 변환에 관한 연구

Database : A Study of Standard eBook Contents Conversion

고승규 ( Seung Kyu Ko ) , 손원성 ( Won Sung Sohn ) , 임순범 ( Soon Bum Lim ) , 최윤철 ( Yoon Chul Choy )
  • : 한국정보처리학회
  • : 정보처리학회논문지D 10권2호
  • : 연속간행물
  • : 2003년 04월
  • : 267-276(10pages)
정보처리학회논문지D

DOI


목차


					

키워드 보기


초록 보기

전자책은 디지털화의 여러 장점으로 인해 향후 급성장할 것으로 예측되고 있으며, 세계 각국에서는 이런 전자책 시장을 선점하기 위하여 각국의 환경에 적합한 전자책 표준을 발표하고 있다. 미국에서는 전자책 포럼(OEBF)에서 전자책 분배와 출력을 위한 OEB PS를 발표하였고, 일본에서는 일본전자책출판협의회(Jepa)에서 전자책 저장과 교환을 목적으로 JepaX를 발표하였다. 국내에서도 지난 2001년에 한국 전자책 컨소시엄(EBK)에서 전자책의 명확한 교환을 위해서 EBKS를 발표하였다. 발표된 세 전자책 표준은 전부 XML에 기반하고 있으며, 각국의 전자책 환경에 적합한 나름대로의 문서구조를 정의하고 있다. 그런데 이러한 문서구조의 상이성은 각 표준을 따르는 전자책 교환시 명확한 교환을 어렵게 한다. 그러므로 명확하게 전자책 컨텐츠를 교환하기 위해서는 각 표준에서 정의하고 있는 문서의 논리적인 구조를 고려한 변환이 필요하다. 이에 본 논문에서는 한국의 전자책 표준을 중심으로 전자책 컨텐츠 표준간의 변환에 관해 연구하였다. 본 논문에서는 전자책 컨텐츠 변환을 위해서 각 표준의 논리적인 구조와 특징을 분석하여 각 표준에 적합한 대응관계를 정의하였다. 또한 명확한 변환을 위해서 기존의 XML 변환과 달리 대응관계 정의시 경로와 네임스페이스(namespace)를 이용하였다. 따라서 세밀하게 구조 정보를 지정할 수 있고, 각 구조의 출처를 밝힘으로써 컨텐츠에 대한 일관성 있는 해석이 가능하다. 또한 본 논문에서는 정의된 대응관계를 이용하여 변환 스크립트를 정의하고 실제 전자책 컨텐츠에 적용하였다. 그리고 전자책 표준간의 변환을 구조 정보 측면에서 자동, 반자동, 수동으로 분류하였다. 제안된 분류는 전자책 컨텐츠 뿐 아니라 일반 XML 문서간의 변환에도 적용 가능하다.
Many countries have established eBook standards adequate to their environments. In USA, OEB PS is announced for distribution and display of eBooks, in Japan, JepaX is announced for storage and exchange, and in Korea, EBKS is made for clear exchange of eBook contents. These diverse objectives lead to different content structures. These variety of content structure will cause a problem in exchanging them. To correctly exchange eBook contents, the content structure should be considered. So, in this paper, we study conversion methods of standard eBooks contents based on Korean eBook standard, with contemplating content structure. To convert contents properly, the mapping relations should be clearly defined. For this, we consider standard´s structure and extension mechanisms, and use path notations and namespaces for precise description. Moreover, through analysis of each mapping relationships, we classify conversion cases into automatic, semi-automatic, and manual conversions. Finally we write up conversion scripts and experiment with them.

UCI(KEPA)

I410-ECN-0102-2009-000-003759295

간행물정보

  • : 공학분야  > 전자공학
  • :
  • :
  • : 격월
  • : 1598-2866
  • :
  • : 학술지
  • : 연속간행물
  • : 2001-2012
  • : 1097


저작권 안내

한국학술정보㈜의 모든 학술 자료는 각 학회 및 기관과 저작권 계약을 통해 제공하고 있습니다.

이에 본 자료를 상업적 이용, 무단 배포 등 불법적으로 이용할 시에는 저작권법 및 관계법령에 따른 책임을 질 수 있습니다.

19권4호(2012년 08월) 수록논문
최근 권호 논문
| | | |

1한글 형태소 및 키워드 분석에 기반한 웹 문서 분류

저자 : 이석룡 ( Seok Lyong Lee ) , 박단호 ( Dan Ho Park ) , 최원식 ( Won Sik Choi ) , 김홍조 ( Hong Jo Kim )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 19권 4호 발행 연도 : 2012 페이지 : pp. 263-270 (8 pages)

다운로드

(기관인증 필요)

초록보기

최근 초고속 인터넷과 대용량 데이터베이스 기술의 발전으로 웹 문서의 양이 크게 증가하였으며, 이를 효과적으로 관리하기 위하여 문서의 주제별 자동 분류가 중요한 문제로 대두되고 있다. 본 연구에서는 한글 형태소 및 키워드 분석에 기초한 문서 특성 추출 방법을 제안하고, 이 를 이용하여 웹 문서와 같은 비구조적 문서의 주제를 예측하여 문서를 자동으로 분류하는 방법을 제시한다. 먼저, 문서 특성 추출을 위하여 한 글 형태소 분석기를 사용하여 용어를 선별하고, 각 용어의 빈도와 주제 분별력을 기초로 주제 분별 용어인 키워드 집합을 생성한 후, 각 키워 드에 대하여 주제 분별력에 따라 점수화한다. 다음으로, 추출된 문서 특성을 기초로 상용 소프트웨어를 사용하여 의사 결정 트리, 신경망 및 SVM의 세 가지 분류 모델을 생성하였다. 실험 결과, 제안한 특성 추출 방법을 이용한 문서 분류는 의사 결정 트리 모델의 경우 평균 Precision 0.90 및 Recall 0.84 로 상당한 정도의 분류 성능을 보여 주었다.


With the current development of high speed Internet and massive database technology, the amount of web documents increases rapidly, and thus, classifying those documents automatically is getting important. In this study, we propose an effective method to extract document features based on Hangeul morpheme and keyword analyses, and to classify non-structured documents automatically by predicting subjects of those documents. To extract document features, first, we select terms using a morpheme analyzer, form the keyword set based on term frequency and subject-discriminating power, and perform the scoring for each keyword using the discriminating power. Then, we generate the classification model by utilizing the commercial software that implements the decision tree, neural network, and SVM(support vector machine). Experimental results show that the proposed feature extraction method has achieved considerable performance, i.e., average precision 0.90 and recall 0.84 in case of the decision tree, in classifying the web documents by subjects.

2TK-Indexing: NoSQL 기반 SNS 데이터 색인 기법

저자 : 백두권 ( Doo Kwon Baik ) , 심형남 ( Hyung Nam Shim ) , 김정동 ( Jeong Dong Kim ) , 설광수 ( Kwang Soo Seol )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 19권 4호 발행 연도 : 2012 페이지 : pp. 271-280 (10 pages)

다운로드

(기관인증 필요)

초록보기

현재 소셜 네트워크 서비스(Social Network Service: SNS)의 이용자 수가 늘어나면서 SNS에서 생성되는 콘텐츠 데이터의 양도 기하급수적 으로 늘어나고 있다. 이러한 SNS는 개인의 근황, 관심사를 전달하기 위해 사용하고, 친목도모, 엔터테인먼트, 제품 마케팅, 최신 뉴스 공유, 1인 미디어 등 다양한 목적으로 활용하고 있다. SNS가 스마트폰에서 사용 가능해지면서 사용자들은 언제, 어디서나 실시간으로 사회의 주요쟁점이 나 사회구성원들의 주 관심사와 같은 콘텐츠를 기존 미디어 매체보다 빠르게 생성하고 확산시킨다. 기존 웹 콘텐츠 색인 기법은 색인대상이 다 양하고 정확성에 중점을 두어 색인하므로 실시간으로 대량 생성되는 SNS 콘텐츠를 색인하는 기법으로 한계가 있다. 이러한 문제를 해결하기 위하여 관계형 DBMS기반 실시간 색인 기법이 있으나 색인대상의 축소와 색인 절차의 복잡성이 높다는 단점이 있다. 따라서 본 논문에서는 실 시간으로 생성된 SNS콘텐츠를 색인하기 위하여 NoSQL기반 SNS 콘텐츠 생성시간과 키워드를 각각 색인하는 TK-Indexing 기법을 제안하여 기존 색인 기법의 복잡성을 개선한다.


Currently, contents generated by SNS services are increasing exponentially, as the number of SNS users increase. The SNS is commonly used to post personal status and individual interests. Also, the SNS is applied in socialization, entertainment, product marketing, news sharing, and single person journalism. As SNS services became available on smart phones, the users of SNS services can generate and spread the social issues and controversies faster than the traditional media. The existing indexing methods for web contents have limitation in terms of real-time indexing for SNS contents, as they usually focus on diversity and accuracy of indexing. To overcome this problem, there are real-time indexing techniques based on RDBMSs. However, these techniques suffer from complex indexing procedures and reduced indexing targets. In this regard, we introduce the TK-Indexing method to improve the previous indexing techniques. Our method indexes the generation time of SNS contents and keywords by way of NoSQL to indexing SNS contents in real-time.

3UML 상태 기계를 이용한 임베디드 소프트웨어의 소모 전력 분석

저자 : 홍장의 ( Jang Eui Hong ) , 이재욱 ( Jae Wuk Lee )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 19권 4호 발행 연도 : 2012 페이지 : pp. 281-292 (12 pages)

다운로드

(기관인증 필요)

초록보기

스마트 폰과 같은 모바일 기기에서 동작하는 응용 소프트웨어는 제한된 배터리 용량으로 인하여 안정적인 서비스를 지속적으로 제공하는데 어려움을 갖는다. 과거에는 배터리의 수명을 연장 시키거나 소모전력이 적은 하드웨어 장치들을 개발하는 것으로 모바일 기기의 소모전력을 관 리하였다. 그러나 시스템에 탑재되는 소프트웨어가 복잡해짐에 따라 소프트웨어에 대한 소모전력 분석 연구도 관심을 갖게 되었다. 이러한 연 구들 중에서 모델 기반의 소모전력 분석은 코드가 개발되기 이전에 미리 소모전력을 분석하고, 분석 결과를 기반으로 소프트웨어를 개발한다는 측면에서 소모전력 감소를 위한 하나의 중요한 전략으로 인식되어 오고 있다. 따라서 본 논문에서는 소프트웨어의 행위 모델인 UML의 상태 기계(State Machine) 다이어그램을 이용하는 소모전력 분석 기법을 제안한다. 제안하는 분석기법은 상태기계 다이어그램을 페트리 넷으로 변환 하고, 이의 시뮬레이션을 통해 소모전력을 예측하게 된다.


A wide variety of smartphone applications is increasing the usage time of smartphone. Due to the increased time, it becomes difficult to providing stable services to users with limited battery capacity. The past works have been performed the power management of mobile device toward long-lasting battery development or low-power electric devices. However as the complexity of software embedded into system are increased, the research interests of the software power analysis is also increased. Among these studies on the software power analysis, model-based analysis technique is one of major interests because it can be able to analyze the power consumption before the development of source codes, then the analysis result can be used in the development of the software system, This paper suggests a model-based power analysis technique using UML state machine diagram. Our proposed technique estimates the power consumption by the simulation of Perti-net which is transformed from the state machine diagram.

4레퍼런스 흐름에 기반한 디자인 패턴의 확장 지점 식별

저자 : 이형원 ( Hyung Won Lee ) , 김희천 ( Hee Chern Kim ) , 박찬진 ( Chan Jin Park ) , 김택수 ( Taek Su Kim ) , 유찬우 ( Chan Woo Yoo )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 19권 4호 발행 연도 : 2012 페이지 : pp. 293-298 (6 pages)

다운로드

(기관인증 필요)

초록보기

디자인 패턴은 기존 소프트웨어의 설계 정보를 추상화하는 단위로 사용될 수 있다. 소프트웨어의 기능을 확장하기 위해 설계를 파악하고자 할 때 디자인 패턴의 인스턴스를 파악하는 것 만으로는 충분치 않을 수 있는데, 이는 기능의 확장이 일어나는 지점이 패턴 인스턴스 바깥에 존 재할 수 있기 때문이다. 본 논문에서는 디자인 패턴의 핵심적인 구조를 구성하는 과정으로서 레퍼런스 흐름을 정의하였으며, 레퍼런스 흐름을 이용하여 패턴의 확장 지점을 찾아내는 방법을 제시하였다.


Design patterns is a kind of abstraction that represents design information of software. Sometimes it is not sufficient to identify design pattern instances for extension of software, because the extension points exist outside of the instances. We define reference flows, which is a process of composing an intrinsic structure of design patterns, and suggest an analysis method based on reference flows for identifying the extension points.

5웹 서비스 합성 구성을 위한 QoS고려 서비스 선택 기법

저자 : 김윤희 ( Yoon Hee Kim ) , 윤경아 ( Kyoung A Yoon )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 19권 4호 발행 연도 : 2012 페이지 : pp. 299-306 (8 pages)

다운로드

(기관인증 필요)

초록보기

웹 서비스 합성은 기존 단일 서비스들을 합성해서 제공하는 방식으로, 사용자의 다양한 요구를 만족시키기 위해서 새로운 웹 서비스를 만들 기보다는 재사용과 효율성 측면에서 고려되고 있다. 그러나 유사 기능을 제공하지만 다른 서비스 품질을 제공하는 서비스의 수가 증가함에 따 라, 서비스 합성 문제는 사용자의 전역 제약 조건과 합성서비스의 QoS를 만족시키기 위해서 어떤 구성 서비스들을 선택해야 하는지에 대한 선 택 문제가 되었다. 합성 서비스의 수행은 구성 서비스의 수행에 의해 결정되므로, 합성 서비스에 포함될 구성 서비스 선택을 위해서는 가격, 지 속성, 응답시간과 같은 QoS에 대한 고려는 필수적이다. 본 논문에서는 합성 서비스 선택 시 QoS를 고려한 기법으로 합성 유전자 알고리즘을 적용하였다. 유전자 알고리즘에 지역 탐색 방법을 결합하여 빠른 시간 안에 합성 서비스의 전반적인 QoS뿐만 아니라 구성 서비스의 품질을 향 상 시킬 수 있는 서비스 선택 기법을 제시한다. 본 연구는 실제 웹상에 존재하는 실제 데이터를 이용하여 서비스 증가에 따른 시간 측정 및 최 적화 정도를 비교 분석을 통해 선택 알고리즘의 유효성을 검증하였다.


To fulfill the complex user requirement, composition web service comprised of existing services is considered from the efficient and reusable point of view instead of making entirely new web service. However, with the growing the number of web services which provide the same functionality but differ in quality value, the service composition becomes a decision problem on which component services should be selected such that end-to-end QoS constraints by the client and overall QoS of the composition service are satisfied. QoS of service aspects is a determinant factor for selecting the services, since the performance of the composed service is determined by the performance of the involved component web service. In this paper, hybrid genetic algorithm is presented to select component services to take part in the QoS-aware composition. The local search method is used to be combined with the genetic algorithm to improve the individuals (component service) in population as well as composed service. The paper also presents a set of experiments conducted to evaluate the efficiency of selection algorithm using the real web service data.

1
권호별 보기
같은 권호 다른 논문
| | | | 다운로드

1데이터베이스 : 모바일 지도 서비스를 위한 에이전트 기반의 공간 데이터 캐쉬의 설계 및 구현

저자 : 임덕성 ( Duk Sung Lim ) , 이재호 ( Jai Ho Lee ) , 홍봉희 ( Bong Hee Hong )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 10권 2호 발행 연도 : 2003 페이지 : pp. 175-186 (12 pages)

다운로드

(기관인증 필요)

초록보기

PDA와 같은 무선 단말기에서 지도 데이터에 대한 검색 및 접근을 위해 영역단위의 캐쉬와 R-tree 기반의 공간 색인이 필요하다. 그러나 서버로부터 낮은 저장용량의 무선 단말기에 전송되는 공간 객체는 캐쉬된 공간 객체와 중복되는 문제가 있다. 또한 추가되는 데이터를 저장하고, 효율적인 공간 질의를 위한 색인 재구축 비용은 낮은 컴퓨팅 파워를 가진 무선 단말기에 부하를 준다. 따라서 낮은 컴퓨팅 파워를 가진 무선 단말기의 부하를 분산시키는 방법과 중복 객체의 처리 기법이 필요하다. 이 논문에서는 먼저 캐슁시 중복 객체에 대한 처리 기법을 분류하고, 클리핑 기법을 사용한 공간 객체 저장과 색인 재구성 방법을 분석한다. 또한, 무선 단말기에 집중된 부하를 분산시키기 위해 색인 구성 및 클리핑 작업을 에이전트에서 처리하는 에이전트 기반 캐슁 시스템을 제시한다. 그리고, 제시한 시스템을 설계 및 구현하고 성능을 평가한다.

2데이터베이스 : 실시간 검색을 위한 다중 사용자용 주기억장치 자료저장 시스템 개발

저자 : 권오수 ( Oh Su Kwon ) , 홍동권 ( Dong Kweon Hong )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 10권 2호 발행 연도 : 2003 페이지 : pp. 187-194 (8 pages)

다운로드

(기관인증 필요)

초록보기

주기억장치 자료저장 시스템은 실시간 트랜잭션에 충분한 여유 시간을 부여하여 실시간 트랜잭션의 성능을 높여준다. 이런 특성으로 인하여 주기억장치를 이용한 데이터관리 시스템들이 이동 통신 관리 시스템의 가입자 위치 관리와 같은 여유시간이 급박한 실시간 트랜잭션에 많이 활용되고 있다. 본 논문에서는 다중 사용자용 멀티쓰레드 방식의 실시간 검색 시스템 개발의 일환으로 대량의 실시간 검색 트랜잭션과 자료 변경 트랜잭션이 주기억장치 자료저장 시스템의 자료를 검색, 변경하는 환경에서 주기억장치 자료저장 시스템을 설계, 구현하였다. 구현된 시스템은 기존의 디스크 데이터베이스 시스템과 상호 보완적인 형태로 사용되는 내장형 방식으로 다중 쓰레드 방식으로 동작되며, 동시성 제어는 주기억장치의 특성을 살려 복잡한 잠금 방식이 아닌 래치를 사용한다. 주기억장치 자료저장 시스템에는 가장 최근의 데이터만을 저장하며, 동기화 기법으로는 디스크 데이터베이스 시스템에서 변경 트랜잭션이 발생하는 경우에 구현 시스템의 데이터를 갱신하는 방법을 사용한다. 시스템은 검색 및 변경 쓰레드의 비율을 제한하여 실시간 검색의 최소 성능을 보장할 수 있게 하였다.

3데이터베이스 : 다차원 색인구조를 위한 동시성제어 기법 및 회복기법

저자 : 송석일 ( Seok Il Song ) , 유재수 ( Jae Soo Yoo )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 10권 2호 발행 연도 : 2003 페이지 : pp. 195-210 (16 pages)

다운로드

(기관인증 필요)

초록보기

이 논문에서는 다차원 색인구조의 동시성을 최대화하는 동시성제어 알고리즘과 이를 위한 회복기법을 제안한다. 다차원 색인구조에서 동시성을 저하는 가장 큰 요인은 MBR 변경연산과 분할 연산이다. 제안하는 알고리즘은 먼저 MBR 변경연산으로 인한 동시성 저하를 최소화하기 위해서 PLC(Partial Lock Coupling) 기법을 제안한다. 이 기법은 기존 방법에 비해 잠금결합을 사용하는 회수를 크게 줄여 동시성을 높인다. 또한, MBR 변경의 수행 중에도 탐색자들이 해당 노드를 접근할 수 있도록 하는 MBR 변경 방법을 제안한다. 분할로 인한 동시성 저하를 해결하기 위해서 노드 분할로 인한 탐색자의 지연 시간을 최소화 할 수 있는 새로운 분할방법을 제안한다. 제안하는 알고리즘을 BADA-4 DBMS의 저장시스템인 MiDAS-3에서 구현하여 성능평가를 수행한다. 다양한 실험을 통해 제안하는 방법이 기존 방법보다 우수함을 보인다. 마지막으로, 이 논문에서는 제안하는 동시성제어 방법에 적절한 회복기법을 제안한다. 회복기법은 동시성을 최대한 보장할 수 있도록 설계되었으며 빠른 회복시간을 보장한다.

4데이터베이스 : 3차원 공간 위상 관계 연산자의 설계

저자 : 김상호 ( Sang Ho Kim ) , 강구 ( Goo Kang ) , 류근호 ( Keun Ho Ryu )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 10권 2호 발행 연도 : 2003 페이지 : pp. 211-220 (10 pages)

다운로드

(기관인증 필요)

초록보기

지리정보시스템은 3차원 위상정보를 표현함으로써 사용자에게 정확하고 정교한 서비스를 제공한다. 이 때에 3차원 위상정보연산을 위해 차원변경방식과 서로 이질적인 공간모델을 사용해야 하는데, 이 방식을 사용할 때는 공간 연산이 어려울 뿐 아니라 서로 호환성이 부족한 문제가 발생한다. 따라서 이 논문에서는 이 문제를 해결하기 위하여 2차원 공간 객체 모델을 수용하는 3차원 공간 객체 모델을 제안하였고, 타당성을 보이기 위하여 구현하여, 그 실행을 보였다. 3차원 공간 위상 관계 연산자를 위하여 DE-9IM 방식을 3차원 개념으로 정의한 DE-9IM을 이용해서 설계하였고, 객체지향 개념을 지원하는 컴포넌트 환경에서 3차원 공간 위상 연산자를 구현하였다. 이 논문에서 제안된 3차원 공간 위상 연산자는 타 시스템과의 상호 운용성을 보장하며, 구현된 공간 위상 관계 연산을 이용하여, 3차원 공간 객체에 대한 효율적인 공간 질의를 수행할 수 있다.

5데이터베이스 : 관계형 데이터베이스에서 XML 뷰 기반의 질의 처리 모델

저자 : 정채영 ( Chai Young Jung ) , 최규원 ( Kyu Won Choi ) , 김영옥 ( Young Ok Kim ) , 김영균 ( Young Kyun Kim ) , 강현석 ( Hyun Syug Kang ) , 배종민 ( Jong Min Bae )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 10권 2호 발행 연도 : 2003 페이지 : pp. 221-232 (12 pages)

다운로드

(기관인증 필요)

초록보기

본 논문은 XML 기반의 데이터베이스 통합 방법론 중에서 관계형 데이터베이스 모델에 대한 랩퍼 시스템의 질의어 처리에 대하여 논한다. 관계형 데이터베이스의 내용은 W3C에서 제안된 XML Schema로 표현되며, 사용자는 XML Schema에 대하여 XML 질의어인 XQuery로써 질의를 한다. 그리고, 개발된 랩퍼 시스템은 사용자가 정의한 XML 뷰를 지원한다. XML 뷰 정의 언어는 XQuery이다. 이러한 환경에서 본 논문은 새로운 XML 질의 처리 모델을 제시한다. XML 뷰와 사용자 질의어의 합성 알고리즘, XQuery를 SQL로 변환하는 알고리즘, 그리고 XML 문서 생성을 위한 템플릿 구성 알고리즘을 제시한다.

6데이터베이스 : 메타데이터 레지스트리 기반의 분산 정보 통합 시스템 설계 및 구현

저자 : 김종환 ( Jong Hwan Kim ) , 박혜숙 ( Hea Sook Park ) , 문창주 ( Chang Joo Moon ) , 백두권 ( Doo Kwon Baik )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 10권 2호 발행 연도 : 2003 페이지 : pp. 233-246 (14 pages)

다운로드

(기관인증 필요)

초록보기

중개기 기반 정보 통합 시스템은 서로 다른 지역 정보 시스템의 유연한 통합을 지원하나, 질의 처리시 최적화 측면과 지역 스키마 정보에 관한 메타데이터 표준화 측면에는 그리 큰 비중을 두지 않았다. 이러한 점을 개선하기 위해 제안된 분산 정보 통합 시스템은 질의 처리시 최적화 측면을 위해 질의 캐싱을 사용하며, 지역 스키마 정보에 관한 메타데이터 표준화 측면을 위해 ISO/IEC 11179 기반의 메타데이터 레지스트리를 사용한다. 이 시스템은 분산된 이기종의 비즈니스 정보 시스템들을 논리적으로 통합하여 사용자가 필요로 하는 통합된 정보를 웹 기반으로 제공한다. 이러한 시스템을 시스템 재사용성의 향상과 유지보수의 용이함을 위해 계층적 패턴을 사용하여 3계층 표현 방식 아키텍처로 표현하였고, 3계층 아키텍처의 핵심 요소들의 기능성과 흐름을 효과적으로 표현하기 위하여 UML 방법론을 확장한 EPEM 방법론을 이용하여 설계하였다. 또한 제안한 시스템의 구체적인 한 예로서, 공급망 관리 도메인에 적용하여 웹 기반으로 구현하였다. 따라서 분산 정보 통합 시스템은 질의 처리 속도 향상을 위해 질의 함수 관리기와 질의 함수 저장소를 통하여 질의 캐싱 기능을 제공하였고, 의미 이질성 해결을 위해 ISO/IEC 11179 기반의 메타데이터 레지스트리와 스키마 레파지토리를 이용함으로써 스키마 이질성과 데이터 이질성을 해결하였다.

7데이터베이스 : MDR과 온톨로지를 결합한 3계층 정보 통합 시스템

저자 : 백두권 ( Doo Kwon Baik ) , 최요한 ( Yo Han Choi ) , 박성공 ( Sung Kong Park ) , 이정욱 ( Jeong Oog Lee ) , 정동원 ( Dong Won Jeong )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 10권 2호 발행 연도 : 2003 페이지 : pp. 247-260 (14 pages)

다운로드

(기관인증 필요)

초록보기

한 도메인 내에서 다양한 데이터베이스의 데이터를 공유하고 표준화하기 위해 MDR(Metadata Registry)을 이용하여 정보를 통합할 수 있다. 그러나 MDR을 구축하는 조직간 데이터요소 표현의 불일치 때문에 MDR간 광역적인 정보를 통합하는데 어려움이 있다. 또한 웹과 같은 다양한 데이터베이스가 존재하는 환경에서 통합된 정보를 검색하고자 하는 사용자는 각각의 데이터베이스 스키마 정보를 확보하기엔 한계가 있다. 따라서 본 논문에서는 MDR과 온톨로지(Ontology)를 결합한 3계층 정보 통합 시스템을 제안한다. MDR간 데이터요소의 관계를 사상 시키고 표현의 불일치를 해결하기 위해 MDR의 표준성기능과 온톨로지의 개념과 관계기능을 결합한 정보 통합 모델을 정의하고 에이전트 기술을 적용한 계층적이고 독립적인 정보 통합 아키텍처를 제안한다. 온톨로지는 사용자의 질의에서 개념을 추출하기 위한 의미망(semantic network)의 역할과 MDR간의 데이터요소 관계를 설정하기 위한 기능으로 적용되었다. MDR과 지식베이스(Knowledge Base)는 데이터요소간 표현 불일치를 해결하기 위해 적용하였다. 이러한 핵심요소를 고려하여 제안된 아키텍처를 사용하여 MDR과 온톨로지를 결합한 3계층 정보 통합 시스템을 구현하였다.

8데이터베이스 : 서열 데이터마이닝을 통한 단백질 서열 예측기법

저자 : 조순이 ( Sun I Cho ) , 이도헌 ( Do Heon Lee ) , 조광휘 ( Kwang Hwi Cho ) , 원용관 ( Yong Gwan Won ) , 김병기 ( Byoung Ki Kim )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 10권 2호 발행 연도 : 2003 페이지 : pp. 261-266 (6 pages)

다운로드

(기관인증 필요)

초록보기

단백질은 아미노산의 선형 중합체(linear polymer)로서 생체의 조직을 구성하고 각종 생화학 반응을 조절하는 역할을 하는 가장 중요한 생체 분자에 속한다. 이러한 단백질의 특성과 기능은 해당 단백질을 구성하는 아미노산의 서열에 의해 결정되기 때문에, 주어진 단백질의 서열을 알아내는 것은 단백질 기능 연구의 출발점이다. 본 논문은 기존의 생화학적 단백질 서열 결정 방법의 단점을 극복할 수 있는 데이터 마이닝 기반 단백질 서열 예측 기법을 제안한다. 복수개의 단백질 절단효소(protease)를 적용함으로써, 서로 중첩된 단백질 조각을 얻어내고, 각 조각의 질량 정보와 단백질 데이타베이스를 이용하여 후보 서열을 식별한다. 얻어진 후보 서열의 조립을 통해 전체 서열을 결정하기 위한, 다중 분할 그래프(multi-partite graph) 구축 및 경로 탐색 기법을 제안한다. 아울러, 대표적인 단백질 서열 데이타베이스인 SWISS-PROT을 이용한 실험을 통해 제안한 방법의 성능을 평가한다.

9데이터베이스 : 전자책 표준간의 컨텐츠 변환에 관한 연구

저자 : 고승규 ( Seung Kyu Ko ) , 손원성 ( Won Sung Sohn ) , 임순범 ( Soon Bum Lim ) , 최윤철 ( Yoon Chul Choy )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 10권 2호 발행 연도 : 2003 페이지 : pp. 267-276 (10 pages)

다운로드

(기관인증 필요)

초록보기

전자책은 디지털화의 여러 장점으로 인해 향후 급성장할 것으로 예측되고 있으며, 세계 각국에서는 이런 전자책 시장을 선점하기 위하여 각국의 환경에 적합한 전자책 표준을 발표하고 있다. 미국에서는 전자책 포럼(OEBF)에서 전자책 분배와 출력을 위한 OEB PS를 발표하였고, 일본에서는 일본전자책출판협의회(Jepa)에서 전자책 저장과 교환을 목적으로 JepaX를 발표하였다. 국내에서도 지난 2001년에 한국 전자책 컨소시엄(EBK)에서 전자책의 명확한 교환을 위해서 EBKS를 발표하였다. 발표된 세 전자책 표준은 전부 XML에 기반하고 있으며, 각국의 전자책 환경에 적합한 나름대로의 문서구조를 정의하고 있다. 그런데 이러한 문서구조의 상이성은 각 표준을 따르는 전자책 교환시 명확한 교환을 어렵게 한다. 그러므로 명확하게 전자책 컨텐츠를 교환하기 위해서는 각 표준에서 정의하고 있는 문서의 논리적인 구조를 고려한 변환이 필요하다. 이에 본 논문에서는 한국의 전자책 표준을 중심으로 전자책 컨텐츠 표준간의 변환에 관해 연구하였다. 본 논문에서는 전자책 컨텐츠 변환을 위해서 각 표준의 논리적인 구조와 특징을 분석하여 각 표준에 적합한 대응관계를 정의하였다. 또한 명확한 변환을 위해서 기존의 XML 변환과 달리 대응관계 정의시 경로와 네임스페이스(namespace)를 이용하였다. 따라서 세밀하게 구조 정보를 지정할 수 있고, 각 구조의 출처를 밝힘으로써 컨텐츠에 대한 일관성 있는 해석이 가능하다. 또한 본 논문에서는 정의된 대응관계를 이용하여 변환 스크립트를 정의하고 실제 전자책 컨텐츠에 적용하였다. 그리고 전자책 표준간의 변환을 구조 정보 측면에서 자동, 반자동, 수동으로 분류하였다. 제안된 분류는 전자책 컨텐츠 뿐 아니라 일반 XML 문서간의 변환에도 적용 가능하다.

10데이터베이스 : MCMC 결측치 대체와 주성분 산점도 기반의 SOM을 이용한 희소한 웹 데이터 분석

저자 : 전성해 ( Sung Hae Jun ) , 오경환 ( Kyung Whan Oh )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지D 10권 2호 발행 연도 : 2003 페이지 : pp. 277-282 (6 pages)

다운로드

(기관인증 필요)

초록보기

웹으로부터 유용한 정보를 얻기 위한 연구는 현재 많이 진행되고 있다. 본 논문에서는 특히 웹 로그 데이터의 희소성에 대한 문제 해결과 이를 통한 웹 사용자의 군집화 방안에 대하여 연구하였다. MCMC 방법의 베이지안 추론에 의한 결측치 대체 기법을 이용하여 웹 데이터의 희소성을 제거하였고, 주성분에 의한 산점도를 통하여 형상지도의 차원을 결정한 자기 조직화지도를 이용하여 웹 사용자의 군집화를 수행하였다. 제안 기법은 기존의 방법들에 비해 모형의 정확도와 빠른 학습 시간을 제공하여 주었다. KDD Cup 데이터를 이용한 실험을 통하여 제안 방법에 대한 문제 해결 절차 및 성능 평가를 객관적으로 확인하였다.

12
발행기관 최신논문
자료제공: 네이버학술정보
발행기관 최신논문
자료제공: 네이버학술정보

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기