白猫のメモ帳

C#とかJavaとかJavaScriptとかHTMLとか機械学習とか。

YahooニュースのRSSがいつのまにかHTTPで取得できなくなっているみたい?

こんばんは。

日が長くなりましたね。
何となく暗くなってきて、もうこんな時間だ!みたいになります。


はてさて。
お遊びで自由に生きているTwitter BOTくんが数日前から死んでいることを発見しました。
Jenkinsにエラー通知付けときなさいよという話ですが、まぁそれはそれということで。

f:id:Shiro-Neko:20170324174530p:plain


このBOTくんはいくつかのRSSを拾いに行って、
記事の本文を形態素解析⇒収集⇒無意味に文章を作るという仕組みなのですが、
どうやら拾いに行っているRSSのうち、Yahooニュースの解析でこけているようでした。

とりあえず、ブラウザにRSSのURLを打ち込んでみても普通に表示されます。

f:id:Shiro-Neko:20170324172202p:plain


が、java.net.URL経由で取得したものを見てみると、

f:id:Shiro-Neko:20170324173958p:plain

ありゃ…XMLを取得したのにエラーのHTMLが取れてる。


何か設定が変わったのかと思ったのですが、
よく見るとブラウザのURLがHTTPSにリダイレクトされています。

f:id:Shiro-Neko:20170324173519p:plain


URLの設定をHTTPSに変えたら何事もなく動くようになりました。
いや、まぁいいんですが、そんな告知ありました?


P.S. 集中線ツール楽しいです

集中線追加ツール