본문 바로가기
데이터/데이터

[내 머리로 텍스트분석] 감정분석의 종류와 방법 - Liu Hu, Vader 외

by 단단_SINCE 2023 2025. 2. 16.

 

 


📚 텍스트 분석이란?

텍스트 분석은 컴퓨터에게 사람들이 쓴 글을 읽고 이해하도록 가르치는 것과 같다. 🖥️💬
이런 기술은 소셜 미디어 게시물, 고객 리뷰, 이메일 등에서 의미와 감정을 찾아내는 데 사용된다.


예시
👉 탐정 🕵️‍♀️🕵️‍♂️ 이 되어 고객이 쓴 리뷰에서 감정을 찾아내는 것과 비슷하다.

 

  • 긍정적인 리뷰 😊: “이 제품 너무 좋아요! 다시 살 거예요!”
  • 부정적인 리뷰 😡: “이거 완전 실망이에요. 절대 추천하지 않아요.”

그렇다면 감정 분석에는 어떤 방법들이 있는지 살펴보자 🔍


🎯 감정 분석의 주요 유형

1️⃣ Liu Hu 감정 사전 기반 분석

Liu Hu 모델은 **감정 사전(lexicon)**을 사용해 글에서 긍정부정의 단어를 찾는 방식. 📖
감정 사전이란, 긍정적인 단어와 부정적인 단어가 미리 정리된 단어 목록이다.

  • 긍정 단어 😊: 행복, 사랑, 기쁨
  • 부정 단어 😞: 슬픔, 분노, 실망

💡 장점: 단순하고 빠르게 결과를 얻을 수 있음.
💡 단점: 문맥을 고려하지 못하기 때문에, 같은 단어가 다른 의미로 쓰이면 오해할 수 있음.


2️⃣ VADER(Valence Aware Dictionary and sEntiment Reasoner)

VADER소셜 미디어 분석에 강한 감정 분석 도구. 특히 짧은 문장이나 이모티콘까지 잘 이해한다. 📊
예를 들어, 이모지와 강도 표현도 분석할 수 있음.

  • "이 제품 좋아요!!! 😊😊" → 매우 긍정적
  • "별로... 😒" → 부정적

💡 장점: 이모티콘, 느낌표(!!!), 대문자(VERY GOOD!) 등 비언어적 요소도 고려.
💡 단점: 긴 문장이나 복잡한 문맥에는 약할 수 있음


3️⃣ 다국어 감정 분석(Multi-language Sentiment Analysis) 🌍

다국어 감정 분석은 다양한 언어로 된 텍스트에서 감정을 분석하는 기술


예시

  • 영어: "I love this place!" → 긍정적
  • 한국어: "이 음식 정말 맛있어요!" → 긍정적
  • 스페인어: "¡Es increíble!" → 긍정적

💡 장점: 전 세계 다양한 언어의 텍스트를 분석할 수 있음
💡 단점: 언어마다 어휘와 문법이 달라 정확도에 차이가 생길 수 있음


4️⃣ 커스텀 감정 분석(Custom Sentiment Analysis) 🛠️

커스텀 감정 분석특정 산업이나 상황에 맞춰 직접 모델을 만드는 방식
예를 들어, 쇼핑몰 리뷰에서는 “가성비” 같은 특별한 키워드를 추가하거나 게임 리뷰에서는 “그래픽”이나 “버그” 같은 단어를 중점적으로 볼 수 있다 🎮🛍️

 

💡 장점: 맞춤형 분석이 가능해서 특정 문제에 대해 더 깊이 있는 결과를 얻을 수 있음.
💡 단점: 모델을 설계하고 훈련하는 데 시간이 걸릴 수 있음.

 


📋 감정 분석 방법 요약 표

방법 장점 단점 주로 사용되는 상황

Liu Hu - 간단하고 빠르게 결과 확인 가능 - 감정 사전(lexicon)을 기반으로 분석 정확도 높음 - 문맥 고려 부족 - 중립적 감정을 판단하기 어려움 리뷰 분석, 기본적인 긍·부정 분류
VADER - 소셜 미디어 데이터 분석에 최적화 - 이모티콘, 대문자, 느낌표도 감정 분석 가능 - 긴 문장이나 복잡한 문맥 분석에 약함 트위터, 인스타그램, 짧은 텍스트 분석
다국어 감정 분석 - 다양한 언어의 텍스트 분석 가능 - 글로벌 서비스에서 유용 - 언어별 문법과 표현 차이로 인해 정확도 차이 발생 글로벌 고객 리뷰, 다국어 SNS 분석
커스텀 감정 분석 - 특정 산업이나 문제에 맞춤형 분석 가능 - 높은 분석 정밀도 - 데이터 준비와 모델 훈련에 시간과 자원 소모 특정 산업(쇼핑, 금융 등) 맞춤 분석

📌 주로 사용되는 상황

1️⃣ Liu Hu 감정 분석:

  • 고객 리뷰 분석, 기본적인 긍정/부정 분류에 많이 사용.
  • 예: 온라인 쇼핑몰 리뷰, 설문 조사 결과

2️⃣ VADER:

  • 소셜 미디어 감정 분석에 최적화.
  • 예: 트위터, 페이스북, 인스타그램 등의 짧고 구어체 텍스트

3️⃣ 다국어 감정 분석:

  • 글로벌 서비스에서 여러 언어로 된 데이터를 분석할 때 유용.
  • 예: 글로벌 e-커머스 리뷰, 다국어 뉴스 기사

4️⃣ 커스텀 감정 분석:

  • 특정 비즈니스나 산업에 맞춤형 분석이 필요할 때 사용.
  • 예: 게임 리뷰에서 버그 언급 추출, 주식 뉴스의 긍·부정 분석