如何計(jì)算TF-IDF值
TF-IDF(Term Frequency-Inverse Document Frequency)是一種用于衡量一個(gè)詞在文檔集合中的重要程度的統(tǒng)計(jì)方法,可以幫助確定一個(gè)詞對(duì)于特定文檔的重要性。TF-IDF 的計(jì)算公式如下: TF(t, d) = (t 在文檔 d 中出現(xiàn)的次數(shù)) / (文檔 d 中的總詞數(shù)) IDF(t, D) = log(文檔集合 D 的總文檔數(shù) / (包含詞 t 的文檔數(shù)
查看詳情