본 연구는 인간의 심리 상태가 특정 행동의 동기나 원인이 될 수 있다는 심리학과 사회학의 모델을 바탕으로, 중국 상하이시 여성들의 피부에 대한 인식, 피부 관리에 대한 태도, 피부만족도, 자존감 및 자기효능감 등 심적 상태로부터 그들의 피부관리 행위를 예측하기 위한 모델을 구축하고자 하였다. 이를 위해 상하이시에 거주하는 20세에서 50세 사이의 여성들을 대상으로 설문조사를 실시하였으며, 수집된 데이터를 바탕으로 셀프관리, 전문가관리, 메디컬관리에 대해 그라디언트 부스팅 알고리즘을 적용하여 예측 모델을 구축하였다. 구축한 모델의 검증은 오차 및 재현율 확인, 그리고 구조방정식을 활용하였다. 연구 결과, 그라디언트 부스팅 모델은 셀프, 전문가, 메디컬 관리 행위 결정계수(R²)가 각각 0.87, 0.88, 0.90으로 높은 정확도를 보였는데, 이는 모델이 데이터를 잘 설명하고 있음을 의미한다. 모델 실행 결과로부터 선별된 주요 변수들은 구조방정식을 통한 추가검증 과정을 거쳤고, 그 CFI, TLI, RMSEA 값이 각각 0.982, 0.956, 0.077로 높은 적합도를 나타내어, 그라디언트 부스팅 모델의 예측 일관성을 간접적으로 증명할 수 있었다. 또한 구조방정식의 파라미터 추정값을 통해 그라디언트 부스팅 모델만으로는 발견하기 어려웠던 변수들 사이의 관계를 확인함으로써 모델을 보완할 수 있었다. 이러한 연구결과는 피부 관리 및 미용 분야에서 소비자의 선호와 행동을 더 깊이 이해하는 데 기여할 뿐만 아니라, 해당 분야에서 의사 결정을 지원하는 데 실질적인 도움이 될 수 있을 것으로 기대한다. 그러나 예측 모델의 일반화 가능성의 제한, 고차원 데이터에서 발생할 수 있는 과적합 문제, 그리고 정량적 데이터에만 의존한 접근의 한계가 있어, 추후 연구를 통한 보완이 필요하다.
The purpose of this paper is to establish a prediction model to predict the skincare behaviors of women in Shanghai, from the psychological states such as skin perceptions, attitudes toward skin care, self-esteem, and self-efficacy. A questionnaire survey was conducted among women aged 20 to 50 years old living in Shanghai, and a gradient boosting algorithm was used to build a prediction model and evaluate its performance for three types of skin care behaviors: self-care, professional care, and medical care based on the collected data. The validation of the constructed model was confirmed by checking the error and the reproduction rate, and by means of structural equation modeling(SEM). As a result of the study, the gradient boosting model(GBM) showed high accuracy, with R² of 0.87, 0.88, and 0.90 for self, professional and medical care, respectively, which means that the model explained the data well. The main variables selected from the model were fitted to the structural equation model, with CFI, TLI, and RMSEA values showing a good fit of 0.982, 0.956, and 0.077, respectively, providing indirect evidence of the consistency of the GBM’s predictions. The parameter estimates of the SEM complemented the model by identifying relationships between variables that were difficult to find through the GBM alone. These findings not only contribute to a broader understanding of consumer preferences and behaviour in the skin care and beauty sector, but can also be of practical use in supporting decision-making in this area. However, there are limitations to the generalisability of the predictive model, overfitting problems that may occur with high-dimensional data, and the limitations of the approach based solely on quantitative data, which need to be addressed in future research.