#author("2022-11-29T12:38:10+00:00","default:hotate","hotate") #author("2023-10-22T08:52:49+00:00;2022-11-29T12:38:10+00:00","default:hotate","hotate") #contents &tag( Python,可視化,自然言語処理); &tag(Python,可視化,自然言語処理); * 情報 [#bd5f734a] - [[共起ネットワークの作り方と考察方法|KH CoderとPythonでの手順を丁寧に解説します>https://d-cubed-lab.com/khcoder-python-co-occurrence-network-analysis]] (2022/04/12) 今回は、「青空文庫」に掲載されている小説を題材として、KH CoderやPythonを使って共起ネットワークを作る方法を解説します。 - [[Pythonでテキストアナリティクス 〜『テキストアナリティクス入門』に沿い共起ネットワークなど描いてみた〜 - Qiita>https://qiita.com/hima2b4/items/5619e617c34f588b418a]] (2022/08/07) この書籍にインタラクティブな動的共起ネットワークが紹介されていました。 -- [[書籍]]:[[Pythonではじめるテキストアナリティクス入門 - Amazon>https://amzn.to/3Sz7oAX]] 観光/金融・経済/ソーシャルメディアの分析事例をていねいに解説 --- https://github.com/tksakaki/kspub_ds_text_analytics --- [[macOS]] 12.6 ([[Monterey]])では[[Python3]].9にて動作した。(2022/10/02) --- [[GiNZA 5 (=SudachiPy >= 0.6)で49149 bytes以上のテキストをTokenizeする>https://zenn.dev/hyga2c/articles/ginza5_largetext]] 入力ファイルの分割が推奨とのことだったので、text を.readlinesで一行ずつ読み込み list に格納。 --- https://github.com/tksakaki/kspub_ds_text_analytics/blob/main/Others/SudachiPy.md SudachiPy 0.6.x以降は,Rustで実装されています 正式には0.6.x以降はsudachi.rsと呼ばれます(以下,sudachi.rs)と呼びます) - [[Pythonのpyvisライブラリーでキーワードの共起語ネットワーク図を作成して、SEO対策へのキーワードに優先度をつけてみた。 | HarumakiBlog>https://harumakiii.com/archives/747]] ([[2021]]/10/10) 人間の手ではとてもまとめられないので、「共起語ネットワーク」を作成するべく、プログラムを組みました。今回は、その奮闘記をお伝えします。 - [[Pythonを使って文章から共起ネットワークを作る 〜テキストマイニングでの可視化〜 - 見習いデータサイエンティストの隠れ家>https://www.dskomei.com/entry/2019/04/07/021028]] 共起ネットワークは、同時に出現する単語の組み合わせをエッジで繋ぎ、単語間の関係をネットワークで表したものです。これにより、文章内の単語の関連性を可視化できます。 - [[3. Pythonによる自然言語処理 2-1. 共起ネットワーク - Qiita>https://qiita.com/y_itoh/items/7aa33ba0b1e30b3ea33d]] 共起(co-location:コロケーション)は、対象とする単位(文)の中で単語が共に出現する回数をカウントします。 * 関連 [#i51af256] #related #taglist(tag=自然言語処理)