악성 댓글 분류 시스템 모니터링 연구: 네이터 클린봇 분석

유지웅, 황보유정, 손동성, 이경전, 악성 댓글 분류 시스템 모니터링 연구: 네이터 클린봇 분석, 2020 한국지능정보시스템학회 춘계학술대회, 2020.

Abstract

인공지능 기기의 오작동 및 편향성 문제 등 여러 부정적 영향에 대해 우려하는 목소리가 적지 않다. 본 논문에서는 네이버의 악성 댓글 분류기 ‘클린봇’을 분석하여 안정적으로 악성 댓글을 분류하는지 확인한다. 네이버 뉴스에서 댓글과 답글을 포함한 90,541건의 댓글을 수집하였고, 악성 댓글 분류 시스템 모니터링 절차에 따라 분석하여 안정성을 확인하였다.
수집된 댓글 중 클린봇에 의해 차단된 댓글은 총 1802건이다. 하지만 연구원들이 직접 분류한 결과 False Positive는 2864건으로 클린봇이 882건의 악성 댓글을 차단하지 못한 것을 알 수 있었다. 또한 False Negative는 8건이 잘못 차단되었다. 즉, 클린봇은 댓글을 대체로 과소하게 차단한다고 추측할 수 있다. Verification단계에서는 클린봇이 어떤 모델을 사용하고 있는지 추론하였으며, 같은 댓글임에도 불구하고 다른 결과가 나타나는 것을 통해 확정적인 규칙 기반 모델을 사용하지는 않은 것으로 판단하였다. 모델의 안정성을 평가하기 위해 댓글에서 사용된 비속어를 수집하여 비속어 사전을 구축하고, 이를 기반으로 변형된 비속어를 클린봇모델이 안정적으로 차단했는지 확인한 결과 변형된 비속어를 포함하는 악성 댓글의 차단율은 약 26.83%로 나타났다.

이미지 기반 품질 관리 기법의 스마트 팩토리 현장 적용 이슈와 전략

이경전, 권준우, 이미지 기반 품질 관리 기법의 스마트 팩토리 현장 적용 이슈와 전략 (Issues and Strategy for Deploying Image-Based Quality Management for Smart Factory), Entrue Journal of Information Technology Vol.17, No.1 / December 2019. (Pdf)

Abstract

콘볼루션 신경망 기술의 발전이 영상 기반 품질 경영에서의 전처리 부담을 많이 줄여주는 의미가 있지만, 콘 볼루션 신경망의 발전이 전처리 노력을 완전히 제거해주지는 못한다. 그러나, 조금만 훈련받으면 컴퓨터 비전 전문가가 아니더라도 영상 기반의 품질 관리를 할 수 있으며, 이에 기반하여 가변적인 생산체계에 빠르게 적응 할 수 있다. 스마트 팩토리에서 자동화된 품질관리를 현실에서 실제 적용하는 것은, 이 방법론들을 이해하고, 이를 일부 구현하여 적용하거나, 통합적으로 구현하여 완전 자동화하는 형태로 진행된다. 이 논문은 스마트 팩토리 환경에서 자동화된 품질 검사를 위한 이미지 기반 품질 관리 기법들을 개관하고 현실에 이러한 기법을 실제 적용하는 데에서 나타나는 이슈와 전략에 대해 토론한다.

제조분야 자동 품질 검사를 위한 딥러닝 기반 대형 이미지 분류시스템 개발 및 구축

김진호, 권준우, 황보유정, 이경전, 제조분야 자동 품질 검사를 위한 딥러닝 기반 대형 이미지 분류시스템 개발 및 구축 사례, 2018 한국지능정보시스템학회 추계학술대회, 2018. (Pdf)

Abstract

딥러닝 알고리즘의 발전에 따라, 다양한 산업분야에서의 딥러닝의 도입이 가속되고 있다. 제조분야의 경우 딥러닝을 적용하는데 있어 기존 적용 기술의 정확도를 상회해야 하며, 제안 된 시간내에 프로세스가 완료되어야 한다. 본 연구에서는 나사 제조 분야에서의 제약 조건 및 성능 조건을 만족하는 딥러닝 기반 대형 이미지 분류 시스템을 구축하였다. 결품 분류 공정 중 획득할 수 있는 대형 이미지 사진을 기반으로, 요구 조건인 분류 정확도 95%와 연산시간 0.2초를 만족할 수 있는 딥러닝 모형을 구현하였다. 이미지의 전처리를 위해 Hough Circle과 PCA를 사용하고, VGG 모형을 기반으로 CNN의 구조를 설계하였으며, 연산 속도 0.2초 내에 분류 정확도 99% 가 가능함을 확인하였다.

스마트 커넥티드 제품 기업의 인공지능 기반 Data to Money 비즈니스 모델 개발 : 가전회사 사례

권준우, 김진호, 황보유정, 이경전, 스마트 커넥티드 제품 기업의 인공지능 기반 Data to Money 비즈니스 모델 개발: 가전회사 사례, 2018 한국경영정보학회 추계학술대회, 2018. (Pdf)

Abstract

스마트 커넥티드 제품에서는 고객이 제품을 사용함 에 따라 발생한 데이터를 Edge Computing으로 구축 된 AI가 처리한다. 앞단에서 발생한 데이터는 기업 의 어플리케이션을 통해 사용자의 동의하에 기업의 데이터센터에 축적된다. 제품들을 통해 각 기업에서 는 센서 데이터 등 다양한 제품 데이터들이 수집 가 능하게 되었지만, 기업에서는 수집된 데이터를 통해 제품의 성능 업그레이드 등 내부 개선에만 사용되고 있다. 본 연구에서는 스마트 커넥티드 제품에서 획 득한 데이터를 기반으로 Data to Money 모델 (D2M) 을 정의하고 데이터 사업 모델의 유형을 6가지로 분 류하였다. D2M은 Card(1983)의 이론을 근거로 하여, Perceptual 모듈, Cognitive 모듈, Action 모듈로 구성하 였다. Perceptual 모듈은 데이터 분석을 통해 상황을 인지하는 모듈이다. Cognitive 모듈은 Perceptual 모듈 에서 인지한 상황을 통해 대응 방법을 결정하는 모 듈로, 고객의 컨텍스트를 유추한다. 마지막으로 Action 모듈은 Perceptual 모듈 또는 Cognitive 모듈의 결과를 기반으로 상황에 근거한 행동을 수행하는 모 듈이다. 본 연구에서는 다양한 비즈니스 문제를 정 의하고, 각 문제에 맞게 D2M을 적용하였고, B2B/B2C 기업, 공공기관 등에 판매하는 비즈니스 모델을 제 시하였으며, 스마트 커넥티드 기업이 AI 기반 O2O 플랫폼 회사로 나아가야 함을 제시하였다.

접근 이력 기반의 하이브리드 세런디피티 추천 시스템

김영현, 한재윤, & 이경전. (2015). 접근 이력 기반의 하이브리드 세렌디피티 추천 시스템. 한국지능정보시스템학회 학술대회논문집, 28-28. (link)

ABSTRACT

본 연구에서는 사용자의 아이템 접근 이력에 기반한 하이브리드 세렌디피티 추천 시스템을 제안한다. 사용자가 접근하지 않은 아이템에 대한 선호도 예측에 관한 연구는 활발히 진행되었으나, 사용자에게 세렌디피티를 느낄 수 있게 하는 추천 시스템에 대한 연구는 여전히 해결해야 할 과제이다. 또한 아마존이나 넷플릭스와 같은 다양한 분야에서 널리 활용되고 있는 협업 필터링 기법은 새로운 사용자나 새로운 아이템을 추천 결과에 반영할 수 없는 콜드 스타트 (cold start) 문제를 가지고 있다. 따라서 본 연구에서는 콜드 스타트 문제를 해결함과 동시에 세렌디피티 추천 서비스를 가능하게 하는 하이브리드 세렌디피티 추천 시스템을 제안한다. 본 시스템은 두 가지의 추천 기법으로 이뤄지고, 각각은 사용자의 주위 환경에 따라 최적의 아이템을 추천하는 상황 기반 추천 기법과, 사용자의 최근의 아이템 접근 이력에 기반한 아이템 접근 이력 기반 추천 기법으로 동작한다. 다시, 접근 이력 기반 추천 기법에서는 사용자들의 아이템 접근 이력에 따라 각각의 사용자가 세렌디피티 서비스를 즐기는 사용자인지 아닌지를 판단하여, 사용자의 특징에 따라 추천하는 아이템을 다르게 설계한다. 본 연구에서 제안한 기법은 오픈 소스 (open source)인 Apache Mahout과 Apache Hadoop을 이용하여 개발하였으며, 시뮬레이션 결과 본 연구의 주요 목적 중 하나인 세렌디피티 성능은 기존의 일반적인 추천 기법보다 적어도 2배 이상으로 향상된 것을 확인하였다.

비즈니스 챗봇 성공 사례 연구

허미리, & 이경전. (2017). 비즈니스 챗봇 성공 사례 연구. 한국지능정보시스템학회 학술대회논문집, 16-16. (link)

ABSTRACT

주요 글로벌 기업들의 인공지능 기반 챗봇 서비스 출시와 함께, 모바일 메신저의 대화형 커머스 플랫폼이 확장을 시도하고 있다. 챗봇이란, 음성이나 텍스트로 대화를 하는 프로그램(a computer program which conducts a conversation via auditory or textual method)으로, 인공지능기술을 탑재하고 메신저와 결합하는 형태로 발전하면서 많은 기업들에게 새로운 기회를 창출할 가능성을 제공하고 있다. 기업은 챗봇에 기반한 서비스를 고객에게 제공함으로써 비용절감과 매출증대 등의 효과를 기대하고 있으며, 고객은 시간대에 구애받지 않고, 대화형태로 각종 문의와 주문 등을 할 수 있다.는 장점을 기대한다. 그러나, 완벽한 대화를 가능하게 하는 인공지능 기술이 아직 개발되지 않은 상황에서, 기술 현황을 잘 이해하지 못하는 대중이나 기업들의 과도한 기대 그리고 챗봇 관련 기업들의 과장된 마케팅이 혼재하고 있는 상황이다. 본 연구에서는 국내 검색 포털사이트인 네이버에서 출시한 비즈니스 챗봇인 네이버 톡톡 사례를 수집하고 네이버 톡톡의 형태가 어떻게 변모, 발전해 왔는가를 통시적으로 고찰하면서 과거 제공된 서비스 상황이 어떠한 영향을 미쳤는가를 중심으로 사례를 수집하고, 챗봇 개발과 경영에서의 문제점을 제시하고 시사점을 도출하여 향후 연구 방향을 논의한다.

금융 시장 예측을 위한 앙상블 접근: 스태킹과 롤링 윈도우를 중심으로

한재윤, & 이경전. (2017). 금융 시장 예측을 위한 앙상블 접근. 한국지능정보시스템학회 학술대회논문집, 54-55. (link)

ABSTRACT

금융시장을 예측하는 것은 학문적, 실무적으로 큰 가치를 지니고 있지만 큰 어려움을 지니고 있다. 이를 해결하고자 최근 기계학습을 도입하였으며, 다양한 연구들이 진행되고 있다. 그러나 대부분의 연구는 단일 모델의 성능에 초점을 맞추고 있으며, 여러 모델을 결합하는 앙상블 접근법을 활요한 수는 매우 적다. 본 연구에서는 다양한 기계학습 모델들의 성능을 확인하고, 앙상블 기법으로는 스태킹(stacking)을 사용해 예측을 시도했다. 이 때, 데이터에 포함되어 있는 금융 시장의 변동성의 영향을 줄이기 위해, 로그 수익률과 타임래그 등의 데이터 전처리를 하였다. 또한 금융시장의 변동성에 의해 생기는 문제를 해결하기 위해 롤링 윈도우 기법을 사용하였고, 이는 모델 성능 향상에 큰 기여를 하였다. 실험 결과, 스태킹을 사용한 모델의 성능이 다른 단일 모델보다 뛰어났다. 또한 정확도, 결정계수, RMSE, MAPE 등의 다양한 평가의 관점에서 각각의 평가 기준에 대해 더 좋은 성능을 보이는 타임 래그와 윈도우 크기가 존재한다는 사실을 확인하였다.

앙상블 모델을 통한 인간과 인공지능 간의 최적 운용 시스템 제안: 투자회사를 중심으로

황보유정, 김진호, & 이경전. (2017). 앙상블 모델을 통한 인간과 인공지능 간의 최적 운용 시스템 제안. 한국지능정보시스템학회 학술대회논문집, 14-15. (link)

ABSTRACT

빅데이터 시대가 도래하면서, 다양한 데이터에서 규칙이나 패턴을 통해 의를 찾아내는 연구가 진행되고 있다. 다양한 머신러닝 기법들과 대용량 데이터 분석에 각광받고 있는 딥러닝 기법까지 빅데이터를 기반으로 연구되고 있다. 이렇게 다양한 방ㅂ버을 통하여 예측 모델을 만들어 사용하는 연구는 학계와 산업계에서 많이 연구되고 있다. 하지만 하나의 모델을 만드는 방법은 많이 연구되었지만, 다양한 모델들이 있을 때 어떤 모델을 사용해야하는가에 관한 연구는 많이 진행되지 않았다.

이에 본 연구에서는 다양한 예측 모델들이 있을 때 모델 선택(Decision) 관점과 모델 운영(Operation) 관점을 나누어서 연구하였다. 투자 회사의 예측 모델 선택과 운영 관점을 중심으로 18 개의 주가 지수를 사용하여, 다음날의 주가를 예측하는 예측력이 서로 다른 모델ㅇ르 3 개를 가지고 앙상블 연구를 진행하였다. LSTM, Ridge, LASSO Regression 3 가지 모델을 DNN (Deep Neural Network) 앙상블을 통해 예측력을 높일 수 있는지를 도출하고, 더 나아가 다양한 모델들이 있을 때 모델을 선택하고, 선택한 모델의 진출입까지 머신러닝 방법 중 하나인 의사결정나무 (Decision Tree)로 구현하고자 하였다.