본문 바로가기
IT 기타/SI 회사생활

옛날 SI 회사 생활 이야기(6) - 뉴스에 왜 감정분석(긍정,부정,중립)을 해야 합니까? 그런건 모르겠고 나는 행복합니다. feat 양만춘

by W.C. 2023. 5. 22.
728x90

이 이야기는 개인적인 회사 생활 경험을 바탕으로 좀 더 재미있게 각색한 내용입니다. 사실과 다른 내용도 많습니다.

 

python 설치라는 첫 번째 임무를 훌륭하게 한 후... 두 번째로 내려진 임무는 감정분석 프로그램을 만드는 것이었다. 어떤 공기업에 프로그램을 납품했다고 했는데 기존의 기능 외에 추가적으로 감정분석 기능이 필요하다는 것이었다.

 

정확한 요구사항은 인터넷에 있는 뉴스를 긁어서 그 뉴스가 긍정적인 것인지 부정적인지 중립적인지를 판단하는 프로그램이었다.

 

이때는 BERT, GPT라는 언어 모델이 나오기 전 이었다. TRANSFORMER 모델도 나오기 전이었고 나도 솔직히 ML이니 인공지능이니 잘 모르는 상태였다.

 

다행히 우리 팀의 데이터사이언스가 속성(?)으로 교육을 해줬고

이런 일은 정말 IT SI에서는 흔히 일어나는 일이다. JAVA를 모르는 사람에게 JAVA 책을 사주며 프로젝트에 바로 투입시키기도 하고 프로그램을 할 줄 몰라도 그냥 맨먼스를 맞추기 위해 넣는 경우도 허다하다.

 

속성 교육이 정말 큰 힘이 되었다. 그 친구가 이미 대부분의 이론적인 구현은 다 한 상태였다.

우리가 사용하기로 한 모델은 TEXTCNN이었다. CNN은 ML을 시작하면 제일 먼저 배우는 MODEL이라고 보면 될 텐데 간단히 설명하자면 이미지를 작은 단위로 쪼개서 학습시켜서 어떤 이미지인지 판별하는 모델이라고 보면 되겠다.

 

이것을 테스트에 적용시켜서 문장을 분류할 때 사용하는게 TEXTCNN 모델이다. 하지만 이 모델을 적용 시켜 신문 기사를 긍정, 부정, 중립으로 분류하려면 답안지가 필요했다. 즉 뉴스를 보고 긍정, 부정, 중립을 라벨링 한 데이터가 아주 많이 있어야 한다는 것이다.

 

여기서 난 수많은 의문이 들 수밖에 없었다. 그래서 당시 우리 쪽 PM을 맞고 있던 안씨성 양만춘 장군에게 나의 머릿속에 많은 의문을 이야기했다.

뉴스는 대부분 중립적으로 쓰일 텐데 긍정, 부정, 중립 구분이 왜 필요한가요?

 

'글쎄요 고객이 원하시니 해드리는 거죠'

이거 라벨링은 도대체 누가 하죠?

 

'음... 알바를 쓰시죠! 한 20명 정도 뽑아서 2주 정도 라벨링 하면 되지 않을까요?'

이게 긍정, 부정, 중립 판단이란 게 개인적인 주관이 들어갈 수밖에 없는데... 라벨링이 제대로 될까요? 동일한 기사를 보고 이게 사람마다 느끼는 차이가 있을 텐데... 어떻게 하실 건가요?

 

'음.......... 글세요... 좋은 아이디어 있을까요?'

아르바이트생들에게는 말하지 말고 두 쌍씩 동일한 뉴스를 라벨링 하도록 하시죠... 두 명이 동일하게 판단한 데이터만 쓰도록 하는데... 이것도 정확한 라벨링은 안 될 것 같습니다.

 

'오! 아주 좋은 방법입니다. 그렇게 하시죠!'

정확한 라벨링도 안될 거고 그리고 이게 대부분 중립으로 라벨링이 될 것 같은데... 고객이 이렇게 학습된 모델의 결과를 받아들일까요?

 

'뭐 어쩔 수 없죠.. 그건 제가 잘 해결해 보겠습니다.'

 

 

난 아직 안씨성 양만춘 장군의 어투를 파악하지 못했기 때문에 그때는 몰랐지만.. 지금 돌이켜 생각해 보니 그분의 대답은 이렇게 해석할 수 있다.

 

'글세요 고객이 원하시니 해드리는 거죠' -> '아 모르겠고 그냥 고객이랑 대화하기 싫어'

'음... 알바를 쓰시죠! 한 20명 정도 뽑아서 2주 정도 라벨링 하면 되지 않을까요?' -> '회사에 경비 요청하는 건 내가 전문이지'

'음.......... 글세요... 좋은 아이디어 있을까요?' -> '그냥 하면 안 되나? 귀찮네'

'오! 아주 좋은 방법입니다. 그렇게 하시죠!' -> '그래 네가 알아서 해'

'뭐 어쩔 수 없죠.. 그건 제가 잘 해결해 보겠습니다.' -> '뭐 어떻게든 되겠지'

 

내가 추가로 해당 작업에 투입되기 전에 이미 양만춘 장군과 후에 YES맨이 되는 짐캐리, 그리고 입사한 지 1년 정도 된 사원 한 명이 투입되어서 일을 하고 있는 상태였다.

 

프로젝트 의뢰 기업이 지방에 있어 나머지 두 사람은 입사 후 잘 만나지 못했는데 같이 프로젝트를 하면서 몇 번 대화를 하게 되었다.

 

두 사람은 서로를 그렇게 좋게 평가하지는 않았는데... 안씨성 양만춘 장군이야기가 나오면 의기투합하여 분노를 쏟아 냈다.

 

그들의 분노 이유는 역시나 양만춘 장군의 자기 보호 본능 때문이다.

 

IT SI에서는 원래 계약에 없던 요구 사항들이 자주~~~ 아주 자주~~~ 고객의 요청으로 들어온다. 이것을 잘 정리하여 해줄 건 해주고 끊어야 할 건 끊어야 하는데... 양만춘 장군은 그렇지 못하다. PM이란 고객과 자주 커뮤니케이션하면서 싸울 건 싸우고 해야 하는데... 

 

자기 보호가 너무 강한 나머지 고객의 요구 사항을 전달받아 그대로 개발자에게 토스한다.

일정 고려! 그런 것 없다!

기존 아키택쳐 고려! 그런 것 없다!

 

그렇게 자신의 스트레스를 최소화하고 개발자들이 반발하면

'아 제가 내일 가서 혼구녕을 내주고 오겠습니다.'

이런 누가 들어도 전혀 진실하지 않은 영혼 없는 말을 뱉고는 다른 사람의 말 역시 흘려버린다.

 

이러니... 중간에서 아무런 중재자 역할을 하지 않다 보니

 

고객에게서 신뢰도 잃고 개발자한테도 신뢰를 잃고... 하지만 자신은 즐거운 회사 생활을 영유하는 상황이 되다 보니

 

분노에서 증오가 되어 버린 상황이 온 것이다.