nlp, 

Sooftware NLP - 혐오는 이제 그만! St. Patrick

St. Patrick, the original safety engine by TUNiB, checks if the user text includes any toxic expressions or personal information and provides detailed reports.

Sooftware NLP - 혐오는 이제 그만! St. Patrick

혐오는 이제 그만! St. Patrick

남녀간의 성혐오, 게이, 레즈비언 등의 성소수자에 대한 혐오, 특정 종교에 대한 혐오 등 요즘 한국 사회는 ‘혐오의 시대’라는 말이 어울리는 것 같습니다. 어쩌면 이런 혐오가 항상 존재했지만 인터넷, 스마트폰이 발달이 충분히 돼서 더욱 대두되는 문제일수도 있을 것 같습니다. 요즘은 페이스북, 유튜브, 뉴스 기사 등 댓글창을 보면 꼭 특정 집단에 대해 차별적이고 혐오적인 발언들을 많이 볼 수 있는 것 같습니다.

그렇다면 이런 혐오 댓글, 채팅들을 자동으로 필터링할수는 없을까요?

자동으로 필터링해주는 기술을 가장 접하기 쉬운 경우가 게임 채팅이 아닐까 싶습니다. 다들 게임하시다가 상대방의 채팅 혹은 내 채팅이 일부 가려져서 보인 경험이 있을겁니다.

야 이 씨발새끼야 → 야 이 ** **야

하지만 적어도 현재까지의 게임 채팅 필터링의 경우, 단순히 ‘혐오 사전’을 구축하고 이를 적용해서 혐오 사전에 포함된 표현이 있는 경우 필터링하는 룰 기반의 방식을 사용하고 있습니다.

그래서 아래와 같은 의도하지 않은 필터링이 적용될 때가 있습니다.

이게 시발점이 될 거 같아 → 이게 **점이 될 거 같아

바로 위의 예시처럼, 단순히 룰 기반으로는 이 문제를 해결하기 어렵습니다. 그렇다고 모든 채팅을 사람이 일일이 보면서 체크할 수도 없는 노릇이죠. 그래서 현재 기준으로 이 문제를 풀기 가장 좋은 방법은 인공지능을 이용하는 방법일 것 같습니다. 룰 기반보다는 유연하게 대처가 가능하면서도, 사람이 일일이 대응하는것보다 훨씬 경제적입니다. 물론, 사람보다 정확성 면에서는 떨어지겠지만요.

그럼 인공지능을 쓰면 문제가 해결되는거네요?

항상 그렇듯, 인공지능은 절대 100%라는 것을 보장하지 않습니다. 또한 인공지능은 가르친대로 일을 수행하기 때문에 인공지능을 가르쳐야합니다. 그렇다면 잘 가르치려면 어떻게 해야할까요? 혐오 표현에 대한 정확한 정의와 학습 데이터의 일관성, 다양한 케이스의 데이터가 필요할 것 같습니다. 하지만, 혐오에 대한 정확한 정의와, 학습 데이터의 일관성, 다양한 케이스의 데이터 모두 하나같이 쉽지 않습니다.

나는 가영이가 머리 풀면 섹시하더라

나는 *** 대통령이 일을 잘 한건지 모르겠어.

여러분은 위에 문장이 어떻게 느껴지시나요? 성희롱/정치 성향 혐오로 보이시나요? 아니면 단순한 개인의견으로 보이시나요?

누군가는 위에 예시를 혐오로 느끼고, 누군가는 개인의견 정도로 넘어갈 수 있을 것 같습니다. 이처럼 이 ‘혐오’라는게 무짜르듯이 딱 잘라지지 않고, 개인마다 모두 의견이 다르기 때문에 이를 혐오다 / 아니다로 단순히 이진 분류로 정의하기에는 다소 어려운 것 같습니다.

St. Patrick

그래서 저희 팀에서는 이 혐오 문제를 혐오다 / 아니다로 문제를 정의하기 보다는 보다 더 세분화해서 구분했습니다.

image

[없음(혐오 없음), 주의(혐오 가능성 있음), 명백(혐오 가능성 높음), 심각(혐오 심각)]와 같이 4단계로 구분했습니다. 또한 혐오 표현의 종류를 [욕설, 모욕, 폭력위협/범죄조장, 외설, 성혐오, 연령차별, 인종 차별/지역혐오, 장애인 혐오, 종교 혐오, 정치 성향 혐오, 직업 혐오] 11개로 정의했습니다.

image

위는 실제로 St. Patrick 데모입니다. 정의된 11개의 혐오에 대해서 0-3의 Likert 척도로 예측하며, 혐오 표현 부분에 대해서 하이라이팅을 해주고 있습니다.

아직 St. Patrick이 성능이 아주 우수하다! 라고 말하기에는 부족한 면이 있지만, 올해 4월에 v0.1 공개를 시작으로 현재 v0.3.3까지 차근차근 꾸준히 성능을 개선해나가며 버젼업을 하고 있습니다. 또한 이번 포스팅에서는 설명을 생략했지만, 주민번호, 전화번호, 주소 등의 개인 정보도 아래와 같이 잡아주는 기능이 탑재되어 있습니다.

image

이 외에도, 더 다양한 기능 제공을 위해 연구/개발 중이며, 빠른 시일내에 추가 공개될 예정이니 [St. Patrick 링크] 많은 사용 부탁드리며, 사용관련해서 피드백 혹은 문의사항이 있는 경우, kaki.ai@tunib.ai로 연락주시면 감사하겠습니다 :)

Subscribe to SOOFTWARE

Get the latest posts delivered right to your inbox