白猫のメモ帳

C#とかJavaとかJavaScriptとかHTMLとか機械学習とか。

自然言語処理

fastTextでニュースをカテゴリごとに分類する

こんばんは。暑かったり暑くなかったり、晴れだったり雨だったり。 日によって全然気候が違いますね。関東もそろそろ梅雨入りでしょうか。さて、fastTextによる単語のベクトル表現を試してからまたずいぶんと間が空いてしまいましたが、 今回は分類をやって…

fastTextで単語のベクトル演算

こんにちは。随分と空いてしまいました。 3月なのに今年最初のエントリってどういうことじゃい…。以前、fastTextのインストールをしましたが、実際に使っていなかったので、 今回は適当な文章から単語のベクトルを学習させて、その演算を試してみます。ちな…

fastTextをインストールしてみる

こんばんは。寒さに負けて早くもムートンブーツを出してしまったのですが、 もっと寒くなったらどんな格好をすれば良いのでしょうか。さて、今日はFacebookの公開している自然言語処理ライブラリ「fastText」を使ってみたいので、 その環境構築をしてみます…

TF-IDFでニュースを要約する

こんばんは。猫様に椅子を取られて座るところがありません。さて、今回はTF-IDFを使って文章要約を試してみます。 要約と謳ってはいますが、重要な文を抜き出すだけなのでご注意を。 TF-IDFってなんだ 今回のポイント、TF-IDFについて簡単に説明します。TF-I…

JavaでTwitterBotをつくってみたよ

こんばんは。最近VBAが多くて、あまりJavaを書いていない気がするわたしです。 あ、このブログのプロフィール欄をTwitterとかで使っている名前と写真に合わせました。 なんか混乱してきたので。さてさて、 結構前にさくらVPSにJavaやらMySQLやらJenkinsやら…

ベイジアンフィルタでニュースのカテゴリ分けをしてみる

こんばんは。ここ数日は涼しい日が続きましたが、明日からまた暑いようですね。 秋の気配は微妙でも、お店の品揃えはあっという間に秋モードです。 さて、今日はベイジアンフィルタを使って文章のカテゴリ分けをしてみようかと思います。迷惑メールフィルタ…