논문 상세보기

한국정보처리학회> 정보처리학회논문지B> 영상처리 : 문자 별 특징 모델을 이용한 한글 문서 영상에서 키워드 검색

영상처리 : 문자 별 특징 모델을 이용한 한글 문서 영상에서 키워드 검색

Keyword Spotting on Hangul Document Images Using Character Feature Models

박상철 ( Sang Cheol Park ) , 김수형 ( Soo Hyung Kim ) , 최덕재 ( Deok Jai Choi )
  • : 한국정보처리학회
  • : 정보처리학회논문지B 12권5호
  • : 연속간행물
  • : 2005년 10월
  • : 521-526(6pages)
정보처리학회논문지B

DOI


목차


					

키워드 보기


초록 보기

본 논문에서는 저 품질의 한글 문서 영상에서 OCR 기반 검색 시스템의 대안으로 키워드 검출 시스템(Keyword Spotting)을 제안하고 OCR 기반 문서 검색 시스템과 비교한다. 제안 시스템은 문자 분할, 키워드 특징 추출 그리고 단어 매칭으로 구성된다. 문자 분할 단계에서는 인접한 두 문자간의 연결을 효과적으로 분리하면서 문자 넓이 값의 분산이 최소가 되도록 하는 문자 분할 방법을 제안한다. 키워드 특징은 서체별 문자 모델의 결합으로 구성한다. 단어 매칭 단계에서는 문자 매칭에 기반한 단어 대 단어 매칭 방법을 적용한다. 본 논문에서 제안한 키워드 검출 시스템의 성능을 평가하기 위해 한글 문서 영상을 대상으로 OCR 기반 문서 검색 시스템과 비교하였다. 그 결과 한글 글자 크기가 작고 문서의 상태가 좋지 않은 경우 제안한 키워드 검출 시스템에 의한 검색 성능이 OCR 기반 검색 시스템 보다 우수함을 입증하였다.
In this paper, we propose a keyword spotting system as an alternative to searching system for poor quality Korean document images and compare the proposed system with an OCR-based document retrieval system. The system is composed of character segmentation, feature extraction for the query keyword, and word-to-word matching. In the character segmentation step, we propose an effective method to remove the connectivity between adjacent characters and a character segmentation method by making the variance of character widths minimum. In the query creation step, feature vector for the query is constructed by a combination of a character model by typeface. In the matching step, word-to-word matching is applied base on a character-to-character matching. We demonstrated that the proposed keyword spotting system is more efficient than the OCR-based one to search a keyword on the Korean document images, especially when the quality of documents is quite poor and point size is small.

UCI(KEPA)

I410-ECN-0102-2009-000-001676437

간행물정보

  • : 공학분야  > 전자공학
  • :
  • :
  • : 격월
  • : 1598-284x
  • :
  • : 학술지
  • : 연속간행물
  • : 2001-2012
  • : 939


저작권 안내

한국학술정보㈜의 모든 학술 자료는 각 학회 및 기관과 저작권 계약을 통해 제공하고 있습니다.

이에 본 자료를 상업적 이용, 무단 배포 등 불법적으로 이용할 시에는 저작권법 및 관계법령에 따른 책임을 질 수 있습니다.

19권4호(2012년 08월) 수록논문
최근 권호 논문
| | | |

1적응적 다중 시드 영역 확장법을 이용한 구조적 패턴의 보도 영역 검출

저자 : 최형일 ( Hyung Il Choi ) , 원선희 ( Sun Hee Weon ) , 주성일 ( Sung Il Joo ) , 나현숙 ( Hyeon Suk Na )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 19권 4호 발행 연도 : 2012 페이지 : pp. 209-220 (12 pages)

다운로드

(기관인증 필요)

초록보기

본 논문에서는 보행자에 장착된 카메라로부터 입력된 자연영상에서의 구조적 패턴 변화에 강인한 적응적인 보도 영역 검출 기법을 제안한 다. 제안하는 방법에서는 다양한 패턴을 가지는 보도 환경에서 안정적으로 보도 영역을 분할하기 위해 첫 번째 단계에서는 소실점에 기반하는 VRay를 이용한 방사형 영역 분할법을 통해 보도의 경계선을 검출하여 보도의 후보영역을 분리하며, 두 번째 단계에서는 분리된 후보영역 내에 서의 시드 영역 확장법(SRG)을 개선한 적응적 다중 시드 영역 확장법(A-MSRG)를 통해 구조적 패턴이 반복되는 보도 영역을 실시간으로 검 출하는 방법을 수행한다. 성능평가를 위해 제안된 방사형 영역 분할법과 A-MSRG와의 결합에 의한 영역 검출 결과의 효율성을 측정한다. 기존 의 SRG, MSRG 방법과의 비교 수행을 통해 제안된 방법의 타당성을 입증하였다.


In this paper, we propose an adaptive pavement region detection method that is robust to changes of structural patterns in a natural scene. In order to segment out a pavement reliably, we propose two step approaches. We first detect the borderline of a pavement and separate out the candidate region of a pavement using VRays. The VRays are straight lines starting from a vanishing point. They split out the candidate region that includes the pavement in a radial shape. Once the candidate region is found, we next employ the adaptive multi-seed region growing(A-MSRG) method within the candidate region. The A-MSRG method segments out the pavement region very accurately by growing seed regions. The number of seed regions are to be determined adaptively depending on the encountered situation. We prove the effectiveness of our approach by comparing its performance against the performances of seed region growing(SRG) approach and multi-seed region growing(MSRG) approach in terms of the false detection rate.

2복수객체의 윤곽추출을 위한 스네이크 분리 및 연결 알고리즘의 실험적 분석

저자 : 장종환 ( Jong Whan Jang ) , Guo Cui , 황재용 ( Jae Yong Hwang )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 19권 4호 발행 연도 : 2012 페이지 : pp. 221-224 (4 pages)

다운로드

(기관인증 필요)

초록보기

복수객체의 윤곽추출을 위해 스네이크를 분리하고 연결하는 대표적인 방법이 스네이크 포인트의 거리를 이용한 최소거리방법이다. 이 방법 은 객체 위상에 따라 스네이크를 분리하지 못하는 경우가 발생한다. 본 논문에서는 스네이크를 분리하지 못하는 경우를 실험적으로 증명하고 스네이크 세그먼트의 벡터를 이용한 새로운 방법이 스네이크를 성공적으로 분리 및 연결함을 실험적으로 보임으로써 최소거리방법의 문제점을 해결하였다. 하나의 영상 안에 3개 및 5개 객체가 있는 실험영상에 실험을 하여 제안한 방법이 우수하다는 것을 보여준다.


The most famous algorithm of splitting and connecting Snake for extracting the boundary of multiple objects is the nearest method using the distance between snake points. It often can`t split and connect Snake due to object topology. In this paper, its problem was discussed experimentally. The new algorithm using vector between Snake segment is proposed in order to split and connect Snake with complicated topology of objects. It is shown by experiment of two test images with 3 and 5 objects that the proposed one works better than the nearest one.

3시각장애인을 위한 사물 감지 기술 연구

저자 : 김병규 ( Byung Gyu Kim ) , 정연규 ( Yeon Kyu Jeong ) , 이정배 ( Jeong Bae Lee )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 19권 4호 발행 연도 : 2012 페이지 : pp. 225-230 (6 pages)

다운로드

(기관인증 필요)

초록보기

본 논문에서는 초음파센서와 버튼들로 구성된 초음파 단말기와 카메라 센서를 융합한 시각 장애인들을 위한 사물 감지 기술을 소개한다. 초 음파 단말기의 초음파센서로 4m 이내의 사물을 감지하면 웹캠으로 사물을 촬영하고 얼굴검출과정을 통해 그 사물이 장애물인지 사람인지 구별 한다. 검출결과를 음성으로 사용자에게 이어폰을 통하여 알려준다. 본 논문에서 개발된 기술을 통하여 시각장애인이 흰 지팡이와 같이 보조적으로 사용이 가능하며, 좀 더 보완한다면 흰 지팡이의 대체품으로 사용이 가능할 것이다. 검출 범위는 사용자가 착용 시 3m내에서 사람이나 사 물인식 실험 결과 약 88%이상의 인식률을 나타내었다.


In this paper, a blind person using a white cane as an adjunct of the things available sensing technology has been implemented. Sensing technology to implement things ultrasonic sensors and a webcam was used to process the data from the server computer. Ultrasonic sensors detect objects within 4meter people distinguish between those things that if the results based on the results will sound off. In this study, ultrasonic sensors, object recognition and human perception with the introduction of techniques and technologies developed for detecting objects in the lives of the visually impaired is expected to be greater usability.

4제품유형에 따른 웹쇼핑 소비자의 조절초점성향 분류

저자 : 이수원 ( Soo Won Lee ) , 백종범 ( Jong Bum Baik ) , 한정석 ( Chung Seok Han ) , 장은영 ( Eun Young Jang ) , 김용범 ( Yong Bum Kim ) , 최자영 ( Ja Young Choi )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 19권 4호 발행 연도 : 2012 페이지 : pp. 231-236 (6 pages)

다운로드

(기관인증 필요)

초록보기

소비자 행동이론에 따르면 사람의 성향은 향상초점과 예방초점이라는 두 가지 조절초점 유형으로 나누어지며, 이 두 가지 성향은 다양한 영 역에 있어서 소비자의 의사결정에 많은 영향을 미치는 것으로 알려져 있다. 본 연구에서는 개인화 추천에서 Cold Start 문제의 최소화 및 추천 알고리즘 성능 개선을 위하여 조절초점이론을 적용한다. 이를 위하여, 웹쇼핑 로그로부터 소비자 별 행동변수, 정보탐색활동성 지수를 추출하고 이를 활용한 소비자 조절초점성향 분류 방법을 제안한다. 본 연구는 사회과학/IT 융합 연구로서 소비자행동 이론의 시스템화 가능성을 입증하 였다는 점에 있어서 의의를 지니며, 향후 다양한 분야의 이론들을 적용한 IT 서비스에 대한 연구로 확장하고자 한다.


According to consumer behavior theory, human propensity can be divided into two regulatory focus types: promotion and prevention. These two types have much influence on the consumer`s decision in many diverse areas. In this research, we apply regulatory focus theory to personalized recommendation to minimize the cold start problem and to improve the performance of recommendation algorithms. To achieve this goal, we extract the consumer behavior variables and information exploration activity index from web shopping logs. We then use them for classifying regulatory focus of the consumer. This research has the contribution to show the possibility of systematization of consumer behavior theory as an interdisciplinary research tool of social science and information technology. Based on this attempt, we will extend the research to IT services adapting theories on other areas.

5Modified ECCD 및 문서별 범주 가중치를 이용한 문서 분류 시스템

저자 : 이수원 ( Soo Won Lee ) , 한정석 ( Chung Seok Han ) , 박상용 ( Sang Yong Park )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 19권 4호 발행 연도 : 2012 페이지 : pp. 237-242 (6 pages)

다운로드

(기관인증 필요)

초록보기

웹 문서 정보 서비스는 관리자의 효율적 문서관리와 사용자의 문서검색 편의성을 위해 문서 분류 시스템을 필요로 한다. 기존의 문서 분류 시스템은 분류하고자 하는 문서 내 선택된 자질어의 개수가 적거나, 특정 범주의 문서 비율이 높아 그 범주에서 대부분의 자질어가 선택되어 모델이 생성된 경우 분류 정확도가 저하되는 문제점을 가진다. 이러한 문제점을 해결하기 위해 본 논문에서는 ``Modified ECCD`` 기법 및 ``문서 별 범주 가중치`` 특징 변수를 사용한 문서 분류 시스템을 제안한다. 실험 결과, 제안 방법인 ``Modified ECCD`` 기법이  및 ECCD 기법에 비해 높은 분류 성능을 보였으며, ``문서별 범주 가중치`` 특징 변수를 ``Modified ECCD`` 기법으로 선택된 자질어 변수에 추가하여 학습하였을 경우에 더 높은 분류 성능을 보였다.


Web information service needs a document classification system for efficient management and conveniently searches. Existing document classification systems have a problem of low accuracy in classification, if a few number of feature words is selected in documents or if the number of documents that belong to a specific category is excessively large. To solve this problem, we propose a document classification system using ``Modified ECCD`` feature selection method and ``Category Weight for each Document``. Experimental results show that the ``Modified ECCD`` feature selection method has higher accuracy in classification than  and the ECCD method. Moreover, combining the ``Category Weight for each Document`` feature value and ``Modified ECCD`` feature selection method results better accuracy in classification.

6GPU 병렬성을 이용한 문서 유사도 계산 성능 개선

저자 : 강승식 ( Seung Shik Kang ) , 박일남 ( Il Nam Park ) , 배병걸 ( Byung Gurl Bae ) , 임은진 ( Eun Jin Im )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 19권 4호 발행 연도 : 2012 페이지 : pp. 243-248 (6 pages)

다운로드

(기관인증 필요)

초록보기

정보검색 분야에서 벡터 모델, 문서 클러스터링 등은 입력 문서 개수가 증가할수록 유사도 계산 속도가 시스템의 성능에 많은 영향을 미치 고 있다. 본 논문에서는 문서 유사도 계산 성능을 향상시키기 위하여 유사도를 계산하는 연산을 CPU 대신에 GPU를 이용하는 CUDA 프레임 워크에서 병렬처리 기법으로 구현하는 방법을 제안하였다. 이 방법은 보편적인 방식인 CPU 환경에서 구현했을 때와 비교할 때 최대 15배까지 성능이 향상되었다. 또한, 기존의 CUDA 라이브러리인 CUBLAS와 Thrust를 사용한 방법보다도 각각 5.2배, 3.4배의 성능 개선 효과가 있음을 확인하였다.


In the information retrieval systems like vector model implementation and document clustering, document similarity calculation takes a great part on the overall performance of the system. In this paper, GPU parallelism has been explored to enhance the processing speed of document similarity calculation in a CUDA framework. The proposed method increased the similarity calculation speed almost 15 times better compared to the typical CPU-based framework. It is 5.2 and 3.4 times better than the methods by using CUBLAS and Thrust, respectively.

1
권호별 보기
같은 권호 다른 논문
| | | | 다운로드

1영상처리 : 인덱스 변환 함수를 이용한 벡터 양자화 기반의 견고한 다중 워터마킹 방법

저자 : 배성호 ( Sung Ho Bae ) , 송근원 ( Kun Woen Song )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 12권 5호 발행 연도 : 2005 페이지 : pp. 513-520 (8 pages)

다운로드

(기관인증 필요)

초록보기

본 논문에서는 인덱스 변환 함수를 이용한 벡터양자화 기반의 견고한 다중 워터마킹 방법을 제안한다. 기존의 워터마크 삽입 방법들은 단지 하나의 워터마크를 원영상에 삽입하는데 비해 제안한 방법에서는 저작권 보호를 위하여 여러 개의 워터마크를 삽입한다. 제안한 방법은 다양한 공격에서도 벡터양자화 인덱스들의 변화를 최소화시키는 인덱스 변환 함수를 사용하여 견고성을 효과적으로 개선시킨다. 실험을 통하여 제안한방법이 기존의 벡터양자화 기반의 다중 워터마킹 방법과 비교하여 다양한 공격에서도 견고성이 우수함을 확인하였다.

2영상처리 : 문자 별 특징 모델을 이용한 한글 문서 영상에서 키워드 검색

저자 : 박상철 ( Sang Cheol Park ) , 김수형 ( Soo Hyung Kim ) , 최덕재 ( Deok Jai Choi )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 12권 5호 발행 연도 : 2005 페이지 : pp. 521-526 (6 pages)

다운로드

(기관인증 필요)

초록보기

본 논문에서는 저 품질의 한글 문서 영상에서 OCR 기반 검색 시스템의 대안으로 키워드 검출 시스템(Keyword Spotting)을 제안하고 OCR 기반 문서 검색 시스템과 비교한다. 제안 시스템은 문자 분할, 키워드 특징 추출 그리고 단어 매칭으로 구성된다. 문자 분할 단계에서는 인접한 두 문자간의 연결을 효과적으로 분리하면서 문자 넓이 값의 분산이 최소가 되도록 하는 문자 분할 방법을 제안한다. 키워드 특징은 서체별 문자 모델의 결합으로 구성한다. 단어 매칭 단계에서는 문자 매칭에 기반한 단어 대 단어 매칭 방법을 적용한다. 본 논문에서 제안한 키워드 검출 시스템의 성능을 평가하기 위해 한글 문서 영상을 대상으로 OCR 기반 문서 검색 시스템과 비교하였다. 그 결과 한글 글자 크기가 작고 문서의 상태가 좋지 않은 경우 제안한 키워드 검출 시스템에 의한 검색 성능이 OCR 기반 검색 시스템 보다 우수함을 입증하였다.

3영상처리 : 상대거리-곡률 특징 공간을 이용한 형태 기술 및 인식

저자 : 김민기 ( Min Ki Kim )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 12권 5호 발행 연도 : 2005 페이지 : pp. 527-534 (8 pages)

다운로드

(기관인증 필요)

초록보기

영상에 회전이나 크기 변형이 가해지면 영상을 구성하는 점들의 좌표값들이 변경되어 형태 기술 및 인식이 어렵게 된다. 그러나 영상을 구성하는 점들 간의 위치관계나 무게중심과의 위치 관계는 변하지 않는다. 따라서 x-y 좌표계로 기술되는 영상 공간의 점들을 회전 및 크기 변형에 불변하는 새로운 좌표계로 사상할 수 있다면, 형태 기술 및 인식의 문제는 보다 수월해진다. 본 논문에서는 영상 공간의 점들을 회전 및 크기 변형에 무관한 새로운 특징 공간으로 사상하여 형태를 기술하는 방법을 제안한다. 특징 공간을 나타내는 새로운 좌표계는 무게중심으로부터의 상대거리와 윤곽선 세그먼트 곡률을 두 축으로 하는 직교 좌표계이다. 상대거리는 윤곽선 상의 임의의 한 점이 무게중심에서 얼마나 멀리 벗어나 있는지를 나타내는 값이고, 윤곽선 세그먼트 곡률은 세그먼트의 굴곡도를 나타내는 값이다. 특징 공간에 사상된 점들의 형태 기술은 메쉬 특징을 통해 이루어진다. 실험을 통해 제안된 형태 기술 방법이 회전 및 크기 변형에 강건함을 확인하였다.

4영상처리 : 과학적 가시화를 위한 증강 협업 환경 디자인에 관한 연구

저자 : 박경신 ( Kyoung Shin Park )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 12권 5호 발행 연도 : 2005 페이지 : pp. 535-542 (8 pages)

다운로드

(기관인증 필요)

초록보기

증강 협업 환경은 지리적으로 떨어진 그룹과 그룹간의 사용자들이 함께 어려운 문제를 풀 수 있도록 도와주는 다수의 디스플레이를 활용하는 작업 환경이다. 본 논문은 실시간 협력 작업 환경의 특징적인 공유 작업 공간 모델을 살펴본다. 그리고 과학적 가시화를 위한 증강 협업 환경의 공유 작업 공간 모델을 검증하는 반복적인 디자인 실험연구를 설명하고 있다. 이 연구에서 원거리 사용자들의 협업을 향상시키기 위한 증강 협업 환경의 디스플레이 기술 설정을 바꿔가며 사용자 평가 실험이 진행되었다. 각 실험에서 두 개의 방에 두 명씩 분산된 그룹들에게 협업 가시화를 이용한 집중적인 분석 작업을 시켰다. 그 결과 다른 사람들의 작업 내용을 쉽게 볼 수 있는 고화질 작업환경의 항시 가시성이 분산된 구성원들 간의 상호 인지도와 협력에 도움이 되어 협업 능률을 향상시켰다.

5영상처리 : 유동적인 배경 텍스쳐 분석을 통한 DSA 기반의 관상동맥 검출

저자 : 박성호 ( Sung Ho Park ) , 이중재 ( Joong Jae Lee ) , 이근수 ( Geun Soo Lee ) , 김계영 ( Gye Young Kim )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 12권 5호 발행 연도 : 2005 페이지 : pp. 543-552 (10 pages)

다운로드

(기관인증 필요)

초록보기

본 논문은 조영 영상에서 유동적인 배경의 텍스쳐 분석을 통한 DSA(Digital subtraction Angiography: 디지털 혈관조영술)기반의 관상동맥 검출방법에 대해 기술한다. DSA 방법은 조영제를 투입하기 전에 촬영된 마스크 영상과 조영제 투입 후의 혈관 대비가 나타나는 라이브 영상과의 차이를 이용하여 빠르게 혈관 영역만을 검출하는 방법이다. 이 방법의 큰 단점은 배경의 움직임에 민감하고, 두 영상간의 지역적인 배경 명암 분포의 변화에 따라 오검출이 발생할 수 있다. 따라서 본 논문에서는 배경 텍스쳐의 유사도를 분석하여 움직임의 차이가 가장 작은 영상을 선택함으로써 배경의 움직임으로 인한 구조적인 문제를 해결하고, 선택된 영상의 지역적 명암 보정을 통해 혈관 영역만을 효과적으로 추출할 수 있는 방법을 제안한다. 실험 결과에서는 성능 평가를 위하여 다섯 환자의 임상 관상동맥 조영 영상을 사용 하였다. 제안하는 방법은 기존의 방법보다 배경을 혈관으로 인식하는 오 인식률에서 약 2%정도의 안정적인 결과를 보여주며, 정확도는 증가하였음을 알 수 있다.

6영상처리 : 복부 CT 영상에서 비장의 웨이브 형태를 이용한 비장 비대의 자동 진단

저자 : 성원 ( Won Seong ) , 박종원 ( Jong Won Park )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 12권 5호 발행 연도 : 2005 페이지 : pp. 553-560 (8 pages)

다운로드

(기관인증 필요)

초록보기

일반적으로 간경변에 동반된 비장은 비대한 것으로 알려져 있다. 본 연구는 간경변을 보유한 환자의 복부 CT 영상을 이용하여 비장의 웨이브 패턴(wave pattern)을 관찰하였는데 정상간을 보유한 사람의 복부 CT 영상과 차이가 있음을 발견하였다. 간경변을 가지고 있는 환자의 복부 CT 영상에서 비장은 왼쪽 측면에 깊은 웨이브 부분이 존재하였다. 정상간의 경우에도 왼쪽 측면에 웨이브가 존재하기도 하나 깊이가 깊지 않음을 알 수 있다. 그러므로, 간경변을 가진 비장의 웨이브 부분들의 면적의 합이 정상간을 가진 비장의 웨이브 면적보다 크다는 것을 알 수 있다. 나아가, 간경변을 보유한 영상에서 비장의 웨이브 부분을 추출하여 원형성(circularity)을 살펴보았을 때 정상간에 수반된 비장의 웨이브 부분보다 더 원형에 가깝다는 것을 알 수 있었다. 본 논문은 위와 같이 관찰된 원리를 바탕으로 복부 CT 영상에서 비장의 웨이브 패턴을 이용하여 비장 비대를 효과적으로 진단하는 새로운 방법을 제시한다. 이는 단순히 비장의 크기만을 이용하지 않고 비장의 형태 변화로써 국소적 비장 비대를 자동 판정해 낼 수 있음을 말해주는 것이다.

7영상처리 : 화소 및 이동 정보를 이용한 골프 스윙 궤도 추적 알고리즘

저자 : 이홍로 ( Hong Ro Lee ) , 황치정 ( Chi Jung Hwang )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 12권 5호 발행 연도 : 2005 페이지 : pp. 561-566 (6 pages)

다운로드

(기관인증 필요)

초록보기

본 논문에서는 기존의 모델 기반 추적 기법에서의 중심점 고정 문제를 해결하기 위한 비디오 프레임의 화소 정보와 골프채의 이동정보를 이용한 추적 알고리즘을 제안한다. 모델기반의 추적 기법은 골프채의 위치와 스윙 속도에 대한 정보를 4차, 6차 다항식 함수로 모델링하여 고정된 축을 중심으로 궤도를 계산해낸다. 실제 자세 교정이 필요한 골프 초심자의 경우 중심이 많이 움직이는 경우가 많으므로 중심점을 고정하여 스윙 궤도를 모델링하는 모델 기반의 추적 기법을 직접 적용하기에는 어려운 문제점이 따른다. 따라서 본 논문에서는 이러한 문제점을 해결하기 위해 프레임 간의 화소 정보를 이용하여 모션을 검출한 후, 검출된 모션으로부터 골프채가 평행인 두개의 직선으로 이루어져있다는 특성과 업스윙과 다운스윙 시 이동하는 골프채의 위치를 분석하여 클럽 헤드와 손의 위치를 추출해 낸다. 또한 얼굴의 중심점과 양 발을 잇는 직선의 중심을 추적함으로써 사용자의 중심점을 추적해낼 수 있다. 중심점의 이동정보에 종속되지 않는 강인함을 증명하기 위해 중심점의 이동이 큰 초심자의 데이터를 가지고 실험을 하였으며, 그 결과 실제 클럽 헤드와 손, 그리고 중심점의 궤도를 정확히 추적해 낼 수 있었다.

8영상처리 : 정형체의 투사 선분의 오차 최소화에 의한 영상기반 모델링

저자 : 박종승 ( Jong Seung Park )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 12권 5호 발행 연도 : 2005 페이지 : pp. 567-576 (10 pages)

다운로드

(기관인증 필요)

초록보기

다중영상으로부터 투사 선분을 이용하여 3D 모델을 생성하고 각 면의 텍스쳐를 획득하는 구조 복원 기법을 제안한다. 사용자는 매우 단순한 절차를 통해 정확한 3D 모델 데이터를 획득할 수 있다. 모델 파라메터 추정을 위해 내재된 비선형 최적화 방법은 사용자 지정 영상 선분과 모델의 투사 선분의 거리를 최소화하는 방법에 기반하고 있다. 모델링 기법의 기능적 주요 목표는 형상이 포함된 다중 영상으로부터 그 형상의 3차원 구조를 복원하고 각 면의 텍스쳐를 생성하는 것이다. 본 연구에서는 3D 정형체를 사용하여 사용의 편리성을 증대시킬 수 있고 정형체의 파라메터의 오차를 최소화하여 복원된 구조의 정확성을 높이는 방법을 제시한다. 제안된 방법은 유한 선분에 기반한 오차 함수를 도입하여 무한 직선에 기반한 방법보다 정확한 모델링이 가능하다. 제안된 방법을 다양한 실제 영상에 적용한 실험 결과를 제시하고 다중 영상기반 모델링 도구의 개발 과정에서의 기술적인 문제점과 해결책을 기술한다.

9영상처리 : 데이터와 적용되는 알고리즘의 연관성을 이용한 클러스터링 기법

저자 : 한우연 ( Woo Yeon Han ) , 남미영 ( Mi Young Nam ) , 이필규 ( Phill Kyu Rhee )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 12권 5호 발행 연도 : 2005 페이지 : pp. 577-586 (10 pages)

다운로드

(기관인증 필요)

초록보기

영상 처리와 패턴 인식 그리고 컴퓨터 비젼 분야의 가장 성공적인 응용들 중 하나인 얼굴 인식을 위해 많은 알고리즘이 제안되었고, 최근에는 얼굴의 어떤 속성이 대상을 인식하는 것을 더 쉽거나 어렵게 만드는지에 대한 연구가 진행되고 있다. 본 논문에서는 얼굴의 속성(조명, 표정)에 따라 각각의 알고리즘의 인식 성능이 달라지는 점에 착안해서, 얼굴 데이터와 적용된 알고리즘과의 연관성을 이용하여 인식 성능을 높이는 클러스터링 방법을 제안하였다. 실험에서는 인식 알고리즘으로 n-tuple, PCA 그리고 가보 웨이블릿이 사용되었고, 세 가지 벡터화 방법이 제안되었다. 우선 학습 데이터를 k-means 알고리즘을 이용하여 클러스터링하고 각각의 클러스터에 대한 세 가지 인식 알고리즘의 적합도를 평가한 후, 같은 알고리즘을 선택한 클러스터들을 통합하여 새로운 클러스터를 구성한다. 그리고 테스트 데이터에서 새로운 클러스터에 대한 유사도를 평가하여 가장 가까운 클러스터가 선택한 알고리즘으로 인식을 수행한다. 그 결과 클러스터링 과정을 거치지 않고 단일 알고리즘을 사용하여 인식했을 때보다 인식 성능이 향상된 것을 관찰할 수 있다.

10영상처리 : 지역적 엔트로피 기반 전이 영역에서 퍼지 클러스터링 알고리즘을 이용한 Multi-Level Thresholding

저자 : 오준택 ( Jun Taek Oh ) , 김보람 ( Bo Ram Kim ) , 김욱현 ( Wook Hyun Kim )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지B 12권 5호 발행 연도 : 2005 페이지 : pp. 587-594 (8 pages)

다운로드

(기관인증 필요)

초록보기

본 논문은 전이 영역에서 퍼지 클러스터링 알고리즘을 이용한 multi-level thresholding 방법을 제안한다. 대부분의 임계치 기반 영상 분할은 영상의 히스토 그램 분포를 기반으로 임계치를 결정한다. 그러므로 많은 처리시간과 기억공간을 요구할 뿐만 아니라 복잡하고 무분별한 히스토그램 분포를 가지는 실영상에서의 임계치 결정에는 어려움이 있다. 본 논문에서는 영상의 대표적인 성분들로 구성된 전이 영역을 추출한 후 퍼지 클러스터링 알고리즘에 의해 최적의 임계치를 결정한다. 전이 영역을 추출하기 위해 이용되는 지역적 엔트로피는 잡음에 강건하며 영상에 내재된 정보를 잘 표현한다는 특성을 가진다. 그리고 퍼지 클러스터링 알고리즘은 복잡하고 무분별한 분포의 실영상에 대해서도 정확히 임계치를 설정할 수 있으며 multi-level thresholding으로 쉽게 확장이 가능하다. 다양한 실영상을 대상으로 실험한 결과, 제안한 방법이 기존의 방법보다 향상된 성능을 가짐을 보였다.

12
발행기관 최신논문
자료제공: 네이버학술정보
발행기관 최신논문
자료제공: 네이버학술정보

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기