CNN5
-
한국어 챗봇에서의 오류에 강건한 한국어 문장 분류를 위한 어절 단위 임베딩
시작하며 카카오엔터프라이즈 AI Lab(최동현, 박일남, 신명철, 김응균)이 성균관대학교(신동렬)와 함께 쓴 논문 ‘한국어 챗봇에서의 오류에 강건한 한국어 문장 분류를 위한 어절 단위 임베딩’이 제31회 한글 및 한국어정보처리 학술대회에 실렸습니다. 한글날을 맞이해 매년 10월마다 열리는 한글 및 한국어정보처리 학술대회는 전산언어학과 언어학, 인공지능과 관련된 다양한 주제의 연구 논문을 다루고 있습니다. AI Lab은 오류를 포함하는 한국어 문장 분류 시스템의 성능을 높이고자 새로운 통합 어절 임베딩 방식을 제안했습니다. 이 방식은 여러 가지 다른 단위의 임베딩을 하나로 통합하고 데이터에 자동으로 노이즈를 추가하는 방식으로 오류를 포함한 문장 분류 성능을 높입니다. 자체 실험 결과, 기존 시스템과 비교해..
AI Research 2020. 12. 30. -
오픈도메인 질의문 자동 분류를 위한 주석 말뭉치 구축 연구
시작하며 카카오엔터프라이즈 AI Lab(안애림, 이서진, 최동현, 김응균)이 한국외국어대학교(남지순)와 함께 쓴 논문 ‘오픈도메인 질의문 자동 분류를 위한 주석 말뭉치 구축 연구’가 제31회 한글 및 한국어정보처리 학술대회에 실렸습니다. 한글날을 맞이해 매년 10월마다 열리는 한글 및 한국어정보처리 학술대회는 전산언어학과 언어학, 인공지능과 관련된 다양한 주제의 연구 논문을 다루고 있습니다. 이번 논문에서 AI Lab은 오픈도메인 자연어 질의문에서 비명시적인 의미자질을 고려한 질문 초점(Question Focus) 기반 질의문 유형 분류 기준을 제시했습니다. 이 기준에 따라 구축된 112,856개 문장의 주석 말뭉치를 학습한 기계학습(CNN) 기반 문장 분류 시스템은 F1-Score 97.72% 성능을 ..
AI Research 2020. 12. 22. -
한국어 질의응답에서의 화제성을 고려한 딥러닝 기반 정답 유형 분류기
시작하며 카카오엔터프라이즈 AI Lab(조승우, 최동현, 김응균)이 쓴 논문 ‘한국어 질의응답에서의 화제성을 고려한 딥러닝 기반 정답 유형 분류기’가 제31회 한글 및 한국어정보처리 학술대회에 실렸습니다. 한글날을 맞이해 매년 10월마다 열리는 한글 및 한국어정보처리 학술대회는 전산언어학과 언어학, 인공지능과 관련된 다양한 주제의 연구 논문을 다루고 있습니다. 이번 논문에서 AI Lab은 한국어 질의응답 시스템의 입력 질의 문장을 단답형/서술형으로 분류하는 모델을 제안했습니다. 모델의 분류 성능을 높이고자 육하원칙 정보와 포털 서비스 쿼리에서 추출한 화제성을 가진 주제어와 속성 표현도 함께 입력하는 방식으로 모델의 분류 성능을 높였습니다. 실험 결과, AI Lab이 제안한 추가 정보를 모두 적용한 모델의..
AI Research 2020. 10. 21. -
정답 유형을 분류하는 딥러닝 기술
시작하며 현대인은 자신이 원하는 정보를 찾는 데 점차 많은 어려움을 느끼고 있습니다. 언제 어디서나 경제적인 부담없이 편리하게 정보를 습득할 수 있는 인터넷이 가진 장점과는 별개로, 유용한 정보에 접근하는 데에는 물리적인 한계가 존재하기 때문입니다. 모르거나 모를 수밖에 없는 정보량이 압도적으로 많이 생산되고 있어 특정 상황과 조건에 따른 답을 파악하기가 쉽지 않죠. 이런 이유로 부정확하거나 잘못된 정보를 습득할 가능성도 이전보다 더 높아짐은 물론, 검색 정보를 이해하고 활용하는 수준이 낮아서 발생하는 새로운 형태의 불평등도 야기되고 있습니다. 카카오엔터프라이즈 AI Lab(이하 AI Lab)이 자사 인공지능 기술을 집약한 플랫폼인 '카카오 i'의 대화 엔진 을 고도화하는 이유는 사용자에게 도움이 될만한..
Our Story 2020. 7. 24. -
신경망 번역 모델의 진화 과정
이 글은 2017년 카카오 AI 브런치에 게재된 포스팅을 가져온 것으로, 본문에서 설명하고 있는 모델 성능, 번역 결과 등은 모두 2017년 당시 자료를 바탕으로 합니다. 2017년까지의 신경망 기반 기계번역(Neural Machine Translation, NMT)의 히스토리를 정리했고, 현재는 대세가 된 NMT 모델 Transformer에 대한 전망 또한 담겨 있습니다. 이를 통해 기계번역의 발전 흐름을 이해하고 향후 발전 방향성에 대해서도 생각해볼 수 있는 시간을 가질 수 있을 것이라 생각합니다. 시작하며 End-to-End 방식의 신경망 기반 기계번역(Neural Machine Translation, 이하 NMT)이 통계 기반 기계 번역(Statistical Machine Translation, ..
Tech Log 2020. 4. 24.