Tag: 自然言語処理 Python
Doc2Vecは任意の長さの文章を固定長のベクトルに変換する技術です
Doc2Vecは、任意の長さの文書をベクトル化する技術で、文やテキストに対して分散表現(Document Embeddings)を獲得することができる。
Doc2Vecによる文書ベクトル推論の問題点 1. 同一文書に対するinfer_vector() の実行毎に得られるベクトルが異なる。
日本語のdoc2vecの学習済みモデルは探した限り容易に利用できるものがなかったこともあり、せっかくなので作成したモデルを配布します。