ML DL AI

TMNLP

melitina 2025. 5. 22. 14:50

text 전처리

https://deeppago.tistory.com/92

 

[ML] 텍스트 전처리(텍스트 정규화)

-목차- 1. 텍스트 정규화란? 2. 클렌징(Cleansing) 3. 텍스트 토큰화(Text Tokenization) 3.1 문장 토큰화(Sentence Tokenization) 3.2 단어 토큰화(Word Tokenization) 4. 스톱 워드 제거 5. 어근 추출(stemming과 Lemmatization) 1.

deeppago.tistory.com

 

https://isaac-christian.tistory.com/entry/NLP-%ED%85%8D%EC%8A%A4%ED%8A%B8-%EC%A0%84%EC%B2%98%EB%A6%AC-Sentence-Tokenization-Cleaning-Stemming-Encoding-Sorting-PaddingSimilarity-1

 

[NLP] 텍스트 전처리: Sentence, Tokenization, Cleaning, Stemming, Encoding, Sorting, Padding/Similarity

💡텍스트 전처리텍스트 전처리는 자연어를 컴퓨터가 이해하고 처리할 수 있는 형태로 변환하는 과정이다. 이를 통해 기계는 자연어를 이해하고, 인공지능은 텍스트 데이터를 학습할 수 있게

isaac-christian.tistory.com

 

https://dataengineerstudy.tistory.com/73

 

자연어처리(텍스트 전처리, 감성분석)

텍스트 분석 텍스트 분석이란? 다양한 형태의 텍스트 (문자열 타입의 데이터)를 컴퓨터를 이용하여 수집하고, 이를 통계 혹은 기계학습 등의 방법을 사용해서 분석하는 것. 텍스트 분석을 통해

dataengineerstudy.tistory.com

 

 

 

'ML DL AI' 카테고리의 다른 글

Google Colab 런타임 끊김 방지  (0) 2025.05.24
LDA Topic Modeling  (0) 2025.05.23
CS231n  (0) 2025.05.06
TF-IDF Word2Vec Embedding RNN  (0) 2025.05.05
Google Colaboratory Web Crawling Selenium  (0) 2025.03.22