본 강좌는 AI, 딥러닝, 자연어 처리 등과 관련된 분야에서 다양한 활동을 하는 교수와 강사, 현업 개발자들이 자연어 처리의 기본이라고 할 수 있는 워드 임베딩에 대해 관련 개념부터 상세하고도 쉽게 설명해드립니다. 자연어 처리 분석을 시작하고자 한다면 단어를 적절하게 표현하는 방법을 학습하는 것이 필수적입니다. 이 부분에 대해 본 강좌에서는 관련 용어 정리부터 자세하게 알려드립니다.
⚠ 잠깐, 정의를 알고 갈까요?
자연어란 무엇일까요?
: 인간이 대화를 통해 일상적으로 사용하는 언어입니다.
자연어 처리(NLP)란 무엇일까요?
: 자연어를 컴퓨터가 이해하도록 데이터화해서 기계가 처리하는 방법에 대해 연구하는 것이죠.
그중 자연어를 벡터로 바꿔줌으로써 사람의 언어를 컴퓨터가 처리할 수 있도록 하는 것을 워드 임베딩이라고 합니다.
왜 배워야 할까요?
컴퓨터가 자연어를 잘 이해하고, 효율적으로 처리할 수 있도록 하기 위해서는
컴퓨터가 이해할 수 있게 자연어를 적절히 변환해야 합니다.
자연어 처리의 성능은 단어를 표현하는 방법에 따라서
크게 달라질 수 있기 때문에 이와 관련된 많은 연구가 있어왔고,
그에 대한 결과로 여러 방법들이 개발되어 사용되었습니다.
자연어 처리의 성능을 향상시킬 수 있도록 단어를 표현하는 방법이 워드 임베딩이며,
특히 Word2Vec와 glove는 전통적 방법의 한계를 개선시켰습니다.
이번 강좌에서는 워드 임베딩의 주요 기법들을 학습함으로써 다양한 표현 방법을 알아보고,
성능을 향상시킬 수 있는 방법을 찾아볼 수 있습니다.
어떤 내용을 배우는지
살펴볼까요?
🔘 본 강좌에서는 자연어 처리에서의 성능을 향상시킬 수 있도록
적절하게 단어를 표현하는 방법에 대해 설명드립니다.
🔘 워드 인코딩과의 차이를 설명함으로써 워드 임베딩의 개념을 설명하고,
워드 임베딩의 전반적인 개요에 대해 설명드립니다.
🔘 단어의 의미를 벡터화할 수 있는 방법인 Word2Vec와 기존의 방법의 단점을 보완하는
Glove와 같은 워드 임베딩의 주요 기법에 대해서도 설명드립니다.
🔘 캐글 실습 중 워드 임베딩과 관련된 부분의 코딩 내용에 대해 설명해드립니다.
안녕하세요 :) <데이터사이언스> 분야의 클래스와 동영상을 추천하는 두런AI입니다. 데이터사이언스 분야에 관심이 있으시다면 저를 자주 마주치게 될 거 에요. 😁 저는 여러분들이 시청했던 동영상의 내용과 패턴을 학습합니다. 그리고 마침 딱! 필요했던 클래스를 만날 수 있도록 도와드립니다. “누구나 쉽게 배운다” 라는 두런의 미션을 위해 두런AI는 끊임없이 성장할 것입니다.