기업과 CEO의 평판 분석#

개요#

디지털 투명성 시대에는, 기업과 CEO의 명성이 조직의 성공을 주도하는 중추적인 역할을 차지하고 있다. 이러한 무형 자산인 평판은 고객의 충성도, 직원의 참여, 투자자의 신뢰, 그리고 규제 결과와 같은 매우 다양한 요소에 영향을 미친다. 그러므로, 평판의 측정 및 해석 과정에서 발행하는 복잡한 관계를 체계적으로 분석하는 것이 필요하다.

전통적으로, 평판에 대한 연구는 주로 설문조사와 직접 데이터 수집 방법에 기반을 두었다. 그러나 디지털 혁명과 소셜 미디어 등 디지털 플랫폼의 등장으로 데이터 기반의 방법론에 대한 패러다임 전환이 일어났다. 이러한 최신의 방법론은 자연어처리와 머신러닝 알고리즘을 활용하여 기업이나 브랜드에 대한 대중의 평가에 대한 더욱 섬세한 통찰력을 제공한다. 텍스트 데이터의 감정 극성을 결정하는 기술인 감성 분석은 이러한 인사이트를 제공하는데 크게 기여했지만, 평판을 형성하는 다양한 측면의 미묘한 늬앙스를 포착하는데는 한계가 있다. 기존 방법론의 문제점은 CEO의 평판과 기업의 평판을 분리하는 능력이다. CEO와 기업은 그들의 행동과 행동에 따라 다양한 복합적인 대중의 평가를 받을 수 있다. 예를 들어, 기업은 우수한 제품과 서비스 때문에 우수한 평판을 받을 수 있지만, CEO는 논란의 여지가 있는 개인 행동 때문에 부정적으로 인식될 수 있다. 반면에, 기업이 제품이나 서비스가 부족하여 평판이 나쁠지라도 CEO는 비전을 제시하는 리더십으로 인해 존경받을 수 있다.

CEO가 기업의 평판에 미치는 영향을 고려하면서, CEO와 기업의 각각의 평판을 분리하는 것이 중요하다. 이러한 평판의 분리는 기업과 CEO의 개별적인 성과에 대한 보다 섬세한 이해를 가능하게 하고, 개선의 가능성이 있는 영역을 파악하는 데 도움을 준다. 그러나, CEO의 평판과 기업의 평판을 구분하는 과정에는 많은 어려움에 존재한다. 기업과 그 CEO의 평판은 종종 밀접하게 연결되어 있어, 둘을 분리하는 것은 어렵다. 또한, 대중과 미디어는 종종 두 개체(엔티티)를 통합하여, 각각에 대한 감정을 할당하는 작업을 복잡하게 만든다. 리더십의 변화, 기업의 부도덕한 행동, 대중의 여론 변화, 그리고 기업의 구조와 운영의 본질적인 복잡성이 평판의 분리와 측정을 더욱 복잡하게 만든다.

이러한 문제에 대한 방안으로, ‘Aspect-Based Sentiment Analysis (ABSA)’라는 기술이 가능성을 보여주고 있다. ABSA는 기업과 CEO의 평판을 구분하는데 여러 단계의 과정을 거쳐 이루어지며, 이는 감성 추출, 의견 대상 추출, 감성 분석을 포함한다. 본 연구는 ABSA를 활용하여, GPT와 같은 시스템을 사용하는 생성적 언어 모델링 방법론을 제안한다. 이 방법론은 CEO와 밀접하게 관련된 측면(aspect)을 대상으로 하여, 기업의 전체적인 평판과 구별되는, CEO에 대한 더욱 정확한 평판 지표를 제공한다.

ABSA를 사용하여 기엄과 CEO의 평판 점수를 얻은 후, 본 연구에서는 특정 주제에 대한 일련의 문서에서 그것들의 진화와 상호 작용을 분석하는 신호 모델을 제안한다. 확률 밀도 함수와 확률 과정 이론의 원칙을 사용하여 감정의 시간 진화를 정의한다. 엔트로피와 상호 정보의 개념은 엔티티와 연관된 정보를 정량화하고, 두 쌍의 무작위 변수 간의 상호 종속성을 사용한다. 본 연구는 기업과 그 CEO를 분리된 엔티티로 취급하고 각 엔티티를 언급하는 기사에서의 감성 점수를 활용하여 그들 각각의 평판을 계산한다. 기업과 CEO의 평판에 영향을 미치는 주요 이벤트나 주제를 식별하여 전후의 기업과 CEO의 감성 점수 변화를 분석하여 상호 인과관계를 파악한다. 주요 이벤트 파악을 위해서는 Latent Dirichlet Allocation (LDA)와 같은 토픽 모델링을 사용한다.

본 연구에서 제안하는 방법론은 다양한 활용 분야를 가지고 있다. 기업에게는, 리스크와 기회를 파악하고 전략적 계획을 수립하는데 도움이 되는 평판 관리 도구를 제공한다. 투자자는 이를 활용하여 기업의 평판을 평가하고 정보에 근거한 결정을 내릴 수 있다. 규제자는 기업의 평판을 모니터링하여 규정 준수를 보장할 수 있으며, 미디어 부서는 홍보 전략을 위해 감성 추세를 추적할 수 있다.

방법론#

Aspect-Based Sentiment Analysis#

Aspect-Based Sentiment Analysis (ABSA)는 특정 텍스트 내에서 특정 측면에 대한 감정을 세부적으로 분석하는 감성 분석의 복잡한 하위 분야이다. 이 방법론은 매우 효과적일 수 있지만, Aspect Extraction (AE)과 Aspect Sentiment Analysis (ASA)라는 두 가지 중요한 단계에 연관된 여러 독특한 문제점을 야기한다.

AE 단계에서는 텍스트에서 정확한 측면을 결정하는 것이 매우 어렵다. 예를 들어, 단어가 함께 자주 등장하면 하나의 측면을 나타낸다고 가정하는 공존 관계를 이해하는 것은 잘못된 측면 식별로 이어질 수 있다. 또한, 의미론적 및 구문론적 연속성에 기반한 의미 있는 관계를 추출하는 과정은 언어의 복잡성과 정확한 계층 구조 요구로 인해 상당한 도전을 제기한다.

ASA 단계에서는 데이터 객체 간의 내재적 상호작용이 도전과제를 제기한다. 측면과 감성을 내포하는 용어 간의 관련성을 포착하는 것은 신경망 모델을 사용할 때 부정확성을 초래할 수 있다. 또한, 여러 측면을 포함하는 문장은 복잡성을 관리하고 정확성을 보장하기 위해 보다 복잡한 모델을 필요로 한다. LSTM, GRU와 같은 기법들은 종종 단어 간의 긴 연속성을 포착하고 정확하게 주의 점수를 배포하는 데 어려움을 겪으며, 이는 문맥-의미 정보를 처리하는데 어려움을 초래한다.

생성적 언어 모델 기반 ABSA#

GPT와 같은 생성적 언어 모델은 ABSA와 관련된 문제점을 해결하는 데 있어 가능성을 제기한다. 이러한 모델은 ABSA 작업에 맞게 조정되면, 측면 추출과 감성 분석과 관련된 어려움을 크게 완화할 수 있다.

생성적 언어 모델의 주요 기능은 단어의 연속성에 대한 확률 분포를 추정하는 것이다. 이들은 주어진 단어의 연속성에 따라 가장 가능성이 높은 다음 단어를 예측하도록 훈련된다. 이는 다음의 목표 함수를 최적화함으로써 이루어진다:

\[ \max_{\theta} \sum_{i=1}^{N} log P(x_i | x_{<i}; \theta) \]

위의 함수에서, \(N\)은 말뭉치의 총 단어 수를 나타내며, \(x_i\)\(i\)-번째 단어를 나타내고, \(x_{<i}\)\(i\)-번째 단어 이전의 단어의 연속성을 나타내며, \(θ\)는 모델의 매개변수를 나타낸다.

이 기본 메커니즘을 수정함으로써, 생성적 언어 모델은 ABSA 문제점에 대응하는 방식으로 조정될 수 있다. 생성적 언어 모델은 다음 단어 뿐만 아니라 단어나 구문이 측면인지 여부도 예측하도록 훈련될 수 있다. 이런 방식으로, 측면 추출 작업에 대한 모델의 목표 함수는 다음과 같이 정의될 수 있다:

\[ \max_{\theta} \sum_{i=1}^{N} log P(x_i, y_i | x_{<i}; \theta) \]

이 함수에서 \(y_i\)\(i\)-번째 단어가 측면인지를 나타낸다. 모델에 측면을 예측하도록 강제함으로써, 이는 측면의 내재적 구조와 의미를 배우게 되어 측면 추출 문제를 해결한다.

측면이 식별되면, 생성적 언어 모델은 각 측면에 대한 감성 극성을 예측하도록 수정할 수 있다. 감성 극성 예측을 포함하는 목표 함수를 수정함으로써, 우리는 다음과 같은 목표 함수를 얻을 수 있다:

\[ \max_{\theta} \sum_{i=1}^{N} log P(x_i, y_i, z_i | x_{<i}, y_{<i}; \theta) \]

여기서 \(z_i\)\(i\)-번째 단어의 감성 극성을 나타낸다. 이 방식은 모델이 문장에서 여러 측면을 처리하고 다중 측면 감성을 관리할 수 있게 해주며, 이는 측면 감성 분석에 내재된 여러 도전 과제를 해결한다.

예를 들어, “새로운 소프트웨어는 놀랍지만, CEO의 최근의 개인정보에 대한 발언은 부적절했다.”라는 문장에서 전통적인 감성 분석은 소프트웨어와 CEO의 발언과 관련된 감성을 구분하지 않는 혼합된 감성 점수를 제공한다. 그러나 ABSA에 맞게 미세 조정된 생성적 언어 모델을 사용함으로써, 이 제한을 극복할 수 있다. 먼저, 생성 모델은 텍스트 내의 측면을 식별하고 추출한다. 여기서 “새로운 소프트웨어”는 회사와 관련되어 있고, “CEO의 최근의 개인정보에 대한 발언”은 CEO와 관련되어 있다. 이 분리는 회사의 다른 부분과 CEO에 연결된 감성에 대한 세밀한 이해를 가능하게 한다. 측면이 추출된 후, 생성 모델은 각 측면에 대한 감성 극성을 예측한다. “새로운 소프트웨어”에 대해, 이것은 “놀라운”이라는 단어에서 긍정적인 감성을 식별하고, “CEO의 최근의 개인정보에 대한 발언”에 대해서는 “부적절한”이라는 용어에서 부정적인 감성을 감지한다.