ML DL AI 9

LDA Topic Modeling

https://velog.io/@mare-solis/LDA-%ED%86%A0%ED%94%BD-%EB%AA%A8%EB%8D%B8%EB%A7%81%EC%9C%BC%EB%A1%9C-%EC%BD%98%ED%85%90%EC%B8%A0-%EB%A6%AC%EB%B7%B0%EB%A5%BC-%EB%B6%84%EC%84%9D%ED%95%98%EC%9E%90 LDA 토픽 모델링으로 콘텐츠 리뷰를 분석하자LDA 토픽 모델링은 다른 분석들 보다도 어떤 주제에 대해 여론이 형성되었지 확인하기 편리해서 특히 연구를 시작하는 단계에서 한번 해볼만한 분석이죠. 물론 토픽모델링 자체로도 하나의 연구velog.io https://wikidocs.net/30708 21-02 잠재 디리클레 할당(Latent Dirichlet Allocati..

ML DL AI 2025.05.23

TMNLP

text 전처리https://deeppago.tistory.com/92 [ML] 텍스트 전처리(텍스트 정규화)-목차- 1. 텍스트 정규화란? 2. 클렌징(Cleansing) 3. 텍스트 토큰화(Text Tokenization) 3.1 문장 토큰화(Sentence Tokenization) 3.2 단어 토큰화(Word Tokenization) 4. 스톱 워드 제거 5. 어근 추출(stemming과 Lemmatization) 1.deeppago.tistory.com https://isaac-christian.tistory.com/entry/NLP-%ED%85%8D%EC%8A%A4%ED%8A%B8-%EC%A0%84%EC%B2%98%EB%A6%AC-Sentence-Tokenization-Cleaning-Stemm..

ML DL AI 2025.05.22

TF-IDF Word2Vec Embedding RNN

https://wikidocs.net/31698 04-04 TF-IDF(Term Frequency-Inverse Document Frequency)이번에는 DTM 내에 있는 각 단어에 대한 중요도를 계산할 수 있는 TF-IDF 가중치에 대해서 알아보겠습니다. TF-IDF를 사용하면, 기존의 DTM을 사용하는 것보다 보다 많…wikidocs.net https://mingchin.tistory.com/7 [파이썬/Python] 자연어처리 _ TfidfVectorizerCountVectorizer를 통해 자연어를 벡터화하는 경우 발생할 수 있는 문제점(의미 없이 자주 사용되는 단어의 가중치의 증가 등)을 해결하기 위한 방법 중 하나가 TfidfVectorizer다. TfidfVectorizer Tf, idf ..

ML DL AI 2025.05.05

Google Colaboratory Web Crawling Selenium

https://goodsarah.tistory.com/entry/%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D-%EC%9B%B9-%ED%81%AC%EB%A1%A4%EB%A7%81Web-Crawling-%EA%B8%B0%EC%B4%88-%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EC%BD%94%EB%9E%A9 [데이터분석] 웹 크롤링(Web Crawling) 기초 (파이썬, 코랩)웹 크롤링의 기초에 대해서 알아보겠습니다. 1. 웹 크롤링(Web Crawling) / Selenium 라이브러리 / Selenium의 webdriver 웹 크롤링(Web Crawling)이란? - 웹 크롤링은 인터넷 상의 웹 페이지들을 자동으로 탐색하goodsarah.tistory.c..

ML DL AI 2025.03.22